Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailemVyřešeno PDF exchange editor vs.OCR

Dobrý večer,dnes som si zakúpil a stiahol prehliadač pdf dokumentov PDF exchange editor verzia 8 s OCR.No a zaujímalo by čo je to vlastne to OCR.Našiel som o tom na youtube nejaké video s týmto softverom,ale tak rýchlo tam pán ukazuje že vobec neviem o čo ide.Prosím čo je to vlastne to OCR aby som to pochopil aj ja ako laik.Ďakujem,pekný večer

Jsou zobrazeny jen nové odpovědi. Zobrazit všechny
Předmět Autor Datum
Už som na to asi prišiel.Mám tlačiareň,taktiež mám vytlačený nejaký dokument na papiery.Ten som cez…
pista 54 14.12.2020 22:20
pista 54
Pokud ten text o Vánocích už máš pomocí OCR převeden z obrázku do vektorů, pak ano. Zvol Editor, vyb…
L-Core 15.12.2020 07:37
L-Core
Dikens nový
pista 54 15.12.2020 11:07
pista 54
Dobrý večer,vid váš obrázok mne to tak vobec nefunguje.S možností vyberiem Editácia obsahu - rozklik… nový
pista 54 15.12.2020 19:40
pista 54
Mám nejaké staršie poznámky v zošite to myslíš jako psané rukou? Tak to umí jen některé OCR program… nový
jirka44 16.12.2020 08:01
jirka44
OCR je nutný jen na převod bitmapy do textu. Nějaké pdf manuály nejsou kromě fotek bitmapy, tam stač…
Karel04 14.12.2020 23:17
Karel04
Případně existují i plnohodnotné manuály, https://help.tracker-software.com/ nový
L-Core 15.12.2020 07:48
L-Core
Dikens,a čo konkrétne je tá bitmapa,alebo ako to vypadá.Može to byť napr.PDF faktúra Orange?Ďakujem nový
pista 54 15.12.2020 11:09
pista 54
Bitmapa je prostě obrázek, třeba fotka nebo scan. Složená z jednotlivých bodů-pixelů. Tu nemůžeš něj… nový
Karel04 15.12.2020 11:30
Karel04
ďakujem všetkým za rady nový
pista 54 13.01.2021 19:09
pista 54
Je to jednoduché, stačí jenom pochopit, že obrázek "A" je jenom obrázek a počítač si jej neztotožní… poslední
jege 13.01.2021 20:25
jege

Už som na to asi prišiel.Mám tlačiareň,taktiež mám vytlačený nejaký dokument na papiery.Ten som cez skener tlačiarne dal do notebooku a následne prehnal cez OCR a čuduj sa svete možem si s tým dokumentom už v OCR robiť čo chcem,napr.digitálne podpísať,zvýrazniť text,kopírovať napr.do word.Len neviem či je možné v tom dokumente aj niečo mazať,myslím keď to už mám v tom OCR.Dajme tomu je tam veta Vianoce sú tu zas......toto chcem zmazať a napísať tam príklad Vianoce sú až o rok.

Dobrý večer,vid váš obrázok mne to tak vobec nefunguje.S možností vyberiem Editácia obsahu - rozkliknem mám tam je to po anglicky: All Content,Text,Images,Shapes a Edit text a elements as blocks.Potom je tam Selection - rozkliknem - Transformovať výber,Duplicate,Vystrihnúť,Kopírovať,Zmazať,Deselect,Zoom to selection,New stamp from selection,New document from selection,OCR selected region.Mám nejaké staršie poznámky v zošite,ktoré som oskenoval,a na skúšku som tam chcel prepísať text napr.V meste to zmazať a napísať V dedine.Mam v Editácii obsahu zaškrtnuté Text,orámujem to ako je to na vašom obrázku,no a mne to V meste rovno píše V dedine,proste to prekrije,dokument uložím,výsledok nečítatelné.

Bitmapa je prostě obrázek, třeba fotka nebo scan. Složená z jednotlivých bodů-pixelů. Tu nemůžeš nějak třeba přepisovat nebo vnitřně upravovat.
https://www.google.com/search?client=firefox-b-d&q=bitmapa
Faktury a jiné dokumenty jsou vektory, tam lze přepisovat text, upravovat a měnit i části, jako třeba ve Wordu fonty písma, velikost, barvu, mezery apod.
Ale i v těchto dokumentech můžeš vložit bitmapy- obrázek, graf apod. a pak to vše uložit jako jeden soubor.
A OCR je na převod textu viditelného v bitmapách na vektory, které si můžeš pak upravit jak chceš.
Jednoduše: když máš uložený text, můžeš si s ním v počítači dělat co chceš a pak třeba vytisknout. Když ho ale pak ofotíš, je ta fotka už bitmapa a upravit v ní text nejde. Kromě gumování, výřezů apod.triků. OCR program to převede zpět na text, který můžeš opět editovat. Co přečte blbě, musíš opravit ručně.

Je to jednoduché, stačí jenom pochopit, že obrázek "A" je jenom obrázek a počítač si jej neztotožní s písmenem A. Ovšem v dnešní době už jsou rozpoznávací algoritmy na takové úrovni, že obrázek "A"
ve standardním fontu umí rozeznat a ztotožnit s písmenem A. Čím je font standardnější, tím je takové rozpoznání jednodušší, rychlejší a přesnější. U nestandardních fontů a ručně psaného písma rychlost a úspěšnost rozpoznávání rapidně klesá. Stejně tak funguje i rozpoznávání registračních značek aut u mýtných brán, vah a měření rychlosti.

U PDF je to složitější, daný formát se používá pro publikování a může obsahovat jak text, tak i obrázky. Text se dá běžně kopírovat, pokud to není zakázáno autorem při generování PDF dokumentu, ale často je i text vložený jako obrázek, takže jej kopírovat nejde, byť je to PDF. Je to vlastně grafika v PDF obálce. Často takto fungují jednodušší generátory PDF, které celou stránku dokumentu interně "oskenují" a daný obrázek zabalí do PDF obálky, takže byť je původní dokument v textové podobě a výsledek v PDF, meziprodukt je grafika a text z takového PDF již nelze zkopírovat, ale max. jenom rozpoznat OCR programem.

Zpět do poradny Odpovědět na původní otázku Nahoru