Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailemVyřešeno Skenování do OCR - začátečnický dotaz

Potřebuji naskenovat a přeložit delší text v němčině,chci ho naskenovat a převést do OCR.

Známý má skener s OCR,tuším Samsung,skenovat umí,ale OCR nikdy nedělal. Návod má,ale tuším že na cd v AJ.

Dá se takto na dálku předem poradit,jak postupovat a na co si dát pozor - rozlišení atd ?

Děkuji.

Jsou zobrazeny jen nové odpovědi. Zobrazit všechny
Předmět Autor Datum
1. Tiff! V žádném případě jpeg! 2. Text "dvoubitová" hloubka - "perokresba", atp. Pochopitelně pokud… nový
ms 10.05.2014 18:21
ms
Pro OCR jsou lepší odstíny šedi než B/W nový
Jan Fiala 10.05.2014 18:23
Jan Fiala
Záleží na předloze. Podle mých zkušeností třeba s knihami se s B/W dá lépe pracovat. nový
ms 10.05.2014 18:28
ms
Pokud jde o modení kvalitní písmo tisknuté na čistém papíru, pak ano. Ale jakmile jsou v papíru kous… nový
Jan Fiala 10.05.2014 18:43
Jan Fiala
má zkušenost je stejná jako u Jafiho - grayscale vychází většinou lépe. nový
touchwood 12.05.2014 16:11
touchwood
1. Tiff! V žádném případě jpeg! Já jsem měl v zaměstnání skener (asi HP, typ už nevím) a ten měl ve… poslední
Yarda 12.05.2014 16:47
Yarda
Rozlišení nejméně 300dpi. Pokud to není barevné, pak skenovat do odstínů šedi, ne černobíle. Je třeb… nový
Jan Fiala 10.05.2014 18:22
Jan Fiala
AUTOR DOTAZU : Díky všem za rady,zařídím se dle toho,kdyby byl nějaký problém tak se ozvu. nový
tomcat5 12.05.2014 15:28
tomcat5

1. Tiff! V žádném případě jpeg!
2. Text "dvoubitová" hloubka - "perokresba", atp. Pochopitelně pokud není kombinován text a obrázky.
3. Upravit jas kontrast už v náhledu před skenováním.
4. Rozlišení není až tak důležité, často stačí 300×300, případně 600×600[dpi].

Nejlépe vyzkoušet na jedné stránce a hledat optimální nastavení. Záleží též na kvalitě OCR.

Pokud jde o modení kvalitní písmo tisknuté na čistém papíru, pak ano. Ale jakmile jsou v papíru kousky dřeva a písmena jsou nepravidelně otisknutá, pak černobílý sken způsobí spoustu nečistot a neúplných písmen. Ale to se asi fakt týká starších knih nebo tisků na nějakém několikrát recyklovaném papíru.

1. Tiff! V žádném případě jpeg!

Já jsem měl v zaměstnání skener (asi HP, typ už nevím) a ten měl ve volbách přímo převod skenovaného lejstra do textu, tak jsem nemusel řešit, jestli tif nebo jpg. Pokud mohu soudit, byl to docela kvalitní převod, poradil si i s azbukou. Možná by kolega mohl poslat PrintScreen nabídky skeneru.

Rozlišení nejméně 300dpi. Pokud to není barevné, pak skenovat do odstínů šedi, ne černobíle.
Je třeba předlohu co nejvíc připlácnout na sklo scanneru - to bývá u knih problém u hřbetu. Pokud jsou to samostatné listy, pak není problém.
Doporučuji skenovat pouze oblast s textem - čím víc bude plochy okolo, tím víc se tam mohou objevit nějaké vady na papíru apod.
Předpokladem fungujícího OCR je jeho správné nastavení. Než spustíš OCR, nastav minimálně němčinu jako jazyk pro OCR. Programy pro OCR často využívají slovníky z MS Word, takže třeba doinstalování německé kontroly pravopisu do Office by mohlo pomoci. OCR ptobíhá tak, že dojde k rozpoznání jednotlivých znaků a následně se pak výsledek kontroluje proti slovníku.

Počítej s tím, že po OCR nebude výsledek 100% a bude potřeba text opravit.

Zpět do poradny Odpovědět na původní otázku Nahoru