

Skenování do OCR - začátečnický dotaz
Potřebuji naskenovat a přeložit delší text v němčině,chci ho naskenovat a převést do OCR.
Známý má skener s OCR,tuším Samsung,skenovat umí,ale OCR nikdy nedělal. Návod má,ale tuším že na cd v AJ.
Dá se takto na dálku předem poradit,jak postupovat a na co si dát pozor - rozlišení atd ?
Děkuji.
Není na tom nic, čeho byste se měli bát. Hlavně nastavte správný jazyk pro rozpoznávání (každý jazyk má specifické znaky, němčina např. "ostré S").
1. Tiff! V žádném případě jpeg!
2. Text "dvoubitová" hloubka - "perokresba", atp. Pochopitelně pokud není kombinován text a obrázky.
3. Upravit jas kontrast už v náhledu před skenováním.
4. Rozlišení není až tak důležité, často stačí 300×300, případně 600×600[dpi].
Nejlépe vyzkoušet na jedné stránce a hledat optimální nastavení. Záleží též na kvalitě OCR.
Pro OCR jsou lepší odstíny šedi než B/W
Záleží na předloze. Podle mých zkušeností třeba s knihami se s B/W dá lépe pracovat.
Pokud jde o modení kvalitní písmo tisknuté na čistém papíru, pak ano. Ale jakmile jsou v papíru kousky dřeva a písmena jsou nepravidelně otisknutá, pak černobílý sken způsobí spoustu nečistot a neúplných písmen. Ale to se asi fakt týká starších knih nebo tisků na nějakém několikrát recyklovaném papíru.
má zkušenost je stejná jako u Jafiho - grayscale vychází většinou lépe.
Já jsem měl v zaměstnání skener (asi HP, typ už nevím) a ten měl ve volbách přímo převod skenovaného lejstra do textu, tak jsem nemusel řešit, jestli tif nebo jpg. Pokud mohu soudit, byl to docela kvalitní převod, poradil si i s azbukou. Možná by kolega mohl poslat PrintScreen nabídky skeneru.
Rozlišení nejméně 300dpi. Pokud to není barevné, pak skenovat do odstínů šedi, ne černobíle.
Je třeba předlohu co nejvíc připlácnout na sklo scanneru - to bývá u knih problém u hřbetu. Pokud jsou to samostatné listy, pak není problém.
Doporučuji skenovat pouze oblast s textem - čím víc bude plochy okolo, tím víc se tam mohou objevit nějaké vady na papíru apod.
Předpokladem fungujícího OCR je jeho správné nastavení. Než spustíš OCR, nastav minimálně němčinu jako jazyk pro OCR. Programy pro OCR často využívají slovníky z MS Word, takže třeba doinstalování německé kontroly pravopisu do Office by mohlo pomoci. OCR ptobíhá tak, že dojde k rozpoznání jednotlivých znaků a následně se pak výsledek kontroluje proti slovníku.
Počítej s tím, že po OCR nebude výsledek 100% a bude potřeba text opravit.
AUTOR DOTAZU :
Díky všem za rady,zařídím se dle toho,kdyby byl nějaký problém tak se ozvu.