Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailemVyřešeno převod jpg do txt

Hledám nějaký software,který mi převede dokument s koncovkou jpg do txt..Chci totiž text upravovat ve Wordu,ale s koncovkou jpg to nejde..Děkuji

Jsou zobrazeny jen nové odpovědi. Zobrazit všechny
Předmět Autor Datum
cus chci nejakej program co mi prevede jpeg z PC do wordu... potrebuju si oskenovany text upravit a…
JPEG do DOC 12.12.2011 19:11
JPEG do DOC
Třeba ABBYY Fine Reader. Ale formát JPG není zrovna ideální pro rozpoznávání textu.
host 12.12.2011 19:16
host
Proč není JPG ok pro rozpoznávání textu? Komprese? Nebo v čom je problém?
Redsnake 11.05.2013 13:15
Redsnake
Neřekl bych, že jpg je nevhodný, ale faktem je, že se jedná o jeden z nejméně vhodných formátů. Dův…
Flash_Gordon 11.05.2013 13:22
Flash_Gordon
Takže abych tomu rozuměl, OCR má u jpg problém rozpoznat kontury textu a potom logicky má problém i…
Redsnake 11.05.2013 13:56
Redsnake
OCR zna dalo by se rici jen dve barvy, cernou a bilou. Pokud ti z principu JPG diky ztratove kompres… nový
RedMaX 11.05.2013 15:13
RedMaX
Ano tak to bylo mysleno. Jpg nielen rozmazava ale dokonca vytvara artefakty v okoli pismen, viz napr… nový
MM.. 11.05.2013 15:20
MM..
ok, už to chňápu:) Díky, zas jsem o něco chytřejší. To OCR online je super, asi využiju. poslední
Redsnake 11.05.2013 15:31
Redsnake

Neřekl bych, že jpg je nevhodný, ale faktem je, že se jedná o jeden z nejméně vhodných formátů.

Důvodem je způsob, jakým pracuje jpg - ukládá podobné barvy do oblasti pod stejnou barvou a toto není pro detekční analýzu příhodné.

Nejlepší formát je BMP nebo PNG (pomiňme teď vlastní velikosti).
Zlepšit vlastnosti jpg pro textovou analýzu je možné zvětšením rozlišení a snížením komprese.

OCR zna dalo by se rici jen dve barvy, cernou a bilou. Pokud ti z principu JPG diky ztratove kompresi "rozmazne okraje pisma na sedou", bude dosahovat o neco horsich vysledku nez format s neztratovou kompresi, ktery nic nerozmazne.

Ano tak to bylo mysleno. Jpg nielen rozmazava ale dokonca vytvara artefakty v okoli pismen, viz napr. http://upload.wikimedia.org/wikipedia/commons/6/6d /Sego_lily_cm-150.jpg
Je to kvoli tomu ze jpeg kompresia vzdy rozdeli obrazok na male stvorce a pre kazdy stvorec sa snazi najst vhodny jpeg "obrazec". Pre pismena logicky neexistuju presne obrazce ale len take vselijake s artefaktami. Cim vyssia kompresia je nastavena tym vacsie stvorceky a tym silnejsie artefakty.
P.S. a neni to kvoli podobnym farbam, artefakty vzniknu aj pri kompresii ciernobieleho obrazca (ktory mal originalne len farby 0,1)

Zpět do poradny Odpovědět na původní otázku Nahoru