Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailemVyřešeno PDF exchange editor vs.OCR

Dobrý večer,dnes som si zakúpil a stiahol prehliadač pdf dokumentov PDF exchange editor verzia 8 s OCR.No a zaujímalo by čo je to vlastne to OCR.Našiel som o tom na youtube nejaké video s týmto softverom,ale tak rýchlo tam pán ukazuje že vobec neviem o čo ide.Prosím čo je to vlastne to OCR aby som to pochopil aj ja ako laik.Ďakujem,pekný večer

Jsou zobrazeny jen nové odpovědi. Zobrazit všechny
Předmět Autor Datum
Je to jednoduché, stačí jenom pochopit, že obrázek "A" je jenom obrázek a počítač si jej neztotožní… poslední
jege 13.01.2021 20:25
jege

Je to jednoduché, stačí jenom pochopit, že obrázek "A" je jenom obrázek a počítač si jej neztotožní s písmenem A. Ovšem v dnešní době už jsou rozpoznávací algoritmy na takové úrovni, že obrázek "A"
ve standardním fontu umí rozeznat a ztotožnit s písmenem A. Čím je font standardnější, tím je takové rozpoznání jednodušší, rychlejší a přesnější. U nestandardních fontů a ručně psaného písma rychlost a úspěšnost rozpoznávání rapidně klesá. Stejně tak funguje i rozpoznávání registračních značek aut u mýtných brán, vah a měření rychlosti.

U PDF je to složitější, daný formát se používá pro publikování a může obsahovat jak text, tak i obrázky. Text se dá běžně kopírovat, pokud to není zakázáno autorem při generování PDF dokumentu, ale často je i text vložený jako obrázek, takže jej kopírovat nejde, byť je to PDF. Je to vlastně grafika v PDF obálce. Často takto fungují jednodušší generátory PDF, které celou stránku dokumentu interně "oskenují" a daný obrázek zabalí do PDF obálky, takže byť je původní dokument v textové podobě a výsledek v PDF, meziprodukt je grafika a text z takového PDF již nelze zkopírovat, ale max. jenom rozpoznat OCR programem.

Zpět do poradny Odpovědět na původní otázku Nahoru