Skenování do OCR - začátečnický dotaz

Potřebuji naskenovat a přeložit delší text v němčině,chci ho naskenovat a převést do OCR.

Známý má skener s OCR,tuším Samsung,skenovat umí,ale OCR nikdy nedělal. Návod má,ale tuším že na cd v AJ.

Dá se takto na dálku předem poradit,jak postupovat a na co si dát pozor - rozlišení atd ?

Děkuji.

Jsou zobrazeny jen nové odpovědi. Zobrazit všechny

Předmět	Autor	Datum
1. Tiff! V žádném případě jpeg! 2. Text "dvoubitová" hloubka - "perokresba", atp. Pochopitelně pokud… nový ms 10.05.2014 18:21	ms	10.05.2014 18:21
Pro OCR jsou lepší odstíny šedi než B/W nový Jan Fiala 10.05.2014 18:23	Jan Fiala	10.05.2014 18:23
Záleží na předloze. Podle mých zkušeností třeba s knihami se s B/W dá lépe pracovat. nový ms 10.05.2014 18:28	ms	10.05.2014 18:28
Pokud jde o modení kvalitní písmo tisknuté na čistém papíru, pak ano. Ale jakmile jsou v papíru kous… nový Jan Fiala 10.05.2014 18:43	Jan Fiala	10.05.2014 18:43
má zkušenost je stejná jako u Jafiho - grayscale vychází většinou lépe. nový touchwood 12.05.2014 16:11	touchwood	12.05.2014 16:11
1. Tiff! V žádném případě jpeg! Já jsem měl v zaměstnání skener (asi HP, typ už nevím) a ten měl ve… poslední Yarda 12.05.2014 16:47	Yarda	12.05.2014 16:47
Rozlišení nejméně 300dpi. Pokud to není barevné, pak skenovat do odstínů šedi, ne černobíle. Je třeb… nový Jan Fiala 10.05.2014 18:22	Jan Fiala	10.05.2014 18:22
AUTOR DOTAZU : Díky všem za rady,zařídím se dle toho,kdyby byl nějaký problém tak se ozvu. nový tomcat5 12.05.2014 15:28	tomcat5	12.05.2014 15:28

1. Tiff! V žádném případě jpeg!
2. Text "dvoubitová" hloubka - "perokresba", atp. Pochopitelně pokud není kombinován text a obrázky.
3. Upravit jas kontrast už v náhledu před skenováním.
4. Rozlišení není až tak důležité, často stačí 300×300, případně 600×600[dpi].

Nejlépe vyzkoušet na jedné stránce a hledat optimální nastavení. Záleží též na kvalitě OCR.

Pro OCR jsou lepší odstíny šedi než B/W

Záleží na předloze. Podle mých zkušeností třeba s knihami se s B/W dá lépe pracovat.

Pokud jde o modení kvalitní písmo tisknuté na čistém papíru, pak ano. Ale jakmile jsou v papíru kousky dřeva a písmena jsou nepravidelně otisknutá, pak černobílý sken způsobí spoustu nečistot a neúplných písmen. Ale to se asi fakt týká starších knih nebo tisků na nějakém několikrát recyklovaném papíru.

má zkušenost je stejná jako u Jafiho - grayscale vychází většinou lépe.

1. Tiff! V žádném případě jpeg!

Já jsem měl v zaměstnání skener (asi HP, typ už nevím) a ten měl ve volbách přímo převod skenovaného lejstra do textu, tak jsem nemusel řešit, jestli tif nebo jpg. Pokud mohu soudit, byl to docela kvalitní převod, poradil si i s azbukou. Možná by kolega mohl poslat PrintScreen nabídky skeneru.

Rozlišení nejméně 300dpi. Pokud to není barevné, pak skenovat do odstínů šedi, ne černobíle.
Je třeba předlohu co nejvíc připlácnout na sklo scanneru - to bývá u knih problém u hřbetu. Pokud jsou to samostatné listy, pak není problém.
Doporučuji skenovat pouze oblast s textem - čím víc bude plochy okolo, tím víc se tam mohou objevit nějaké vady na papíru apod.
Předpokladem fungujícího OCR je jeho správné nastavení. Než spustíš OCR, nastav minimálně němčinu jako jazyk pro OCR. Programy pro OCR často využívají slovníky z MS Word, takže třeba doinstalování německé kontroly pravopisu do Office by mohlo pomoci. OCR ptobíhá tak, že dojde k rozpoznání jednotlivých znaků a následně se pak výsledek kontroluje proti slovníku.

Počítej s tím, že po OCR nebude výsledek 100% a bude potřeba text opravit.

AUTOR DOTAZU :

Díky všem za rady,zařídím se dle toho,kdyby byl nějaký problém tak se ozvu.

Zpět do poradny Odpovědět na původní otázku Nahoru