převod jpg do txt
Hledám nějaký software,který mi převede dokument s koncovkou jpg do txt..Chci totiž text upravovat ve Wordu,ale s koncovkou jpg to nejde..Děkuji
Hledám nějaký software,který mi převede dokument s koncovkou jpg do txt..Chci totiž text upravovat ve Wordu,ale s koncovkou jpg to nejde..Děkuji
Zpět do poradny Odpovědět na původní otázku Nahoru
Nemušíš instalovat software, na to stačí online služba:
ascii.php
EDIT: pardon, přehlídl jsem, že v tom jpg má být text. Na to potřebuješ OCR (viz Kráťa).
Já už se u notifikačního e-mailu lekl, že OCR někdo poskytuje on-line, tak sem rychle běžím a on je tu edit://...
Pro tazatelku. Pokud jde jen o nějaký nápis (ne třeba oskenovaný dokument), je na to lepší, co píšou kolegové nade mnou (editor na obrázky).
www.free-ocr.com
Díky 586x. Převedlo to bezchybně i veškerou diakritiku. To nemá chybu!
A dost obstojně to vzalo i útok internetem
Tak to je ale dokonalý.
A o té stránce se hodí vědět, převádí moc dobře.
cus chci nejakej program co mi prevede jpeg z PC do wordu... potrebuju si oskenovany text upravit a ty online verze mi nefungujou ci co.... dik...
Třeba ABBYY Fine Reader. Ale formát JPG není zrovna ideální pro rozpoznávání textu.
Proč není JPG ok pro rozpoznávání textu? Komprese? Nebo v čom je problém?
Neřekl bych, že jpg je nevhodný, ale faktem je, že se jedná o jeden z nejméně vhodných formátů.
Důvodem je způsob, jakým pracuje jpg - ukládá podobné barvy do oblasti pod stejnou barvou a toto není pro detekční analýzu příhodné.
Nejlepší formát je BMP nebo PNG (pomiňme teď vlastní velikosti).
Zlepšit vlastnosti jpg pro textovou analýzu je možné zvětšením rozlišení a snížením komprese.
Takže abych tomu rozuměl, OCR má u jpg problém rozpoznat kontury textu a potom logicky má problém i s rozpoznáváním textu? Tak to bylo myšleno?
OCR zna dalo by se rici jen dve barvy, cernou a bilou. Pokud ti z principu JPG diky ztratove kompresi "rozmazne okraje pisma na sedou", bude dosahovat o neco horsich vysledku nez format s neztratovou kompresi, ktery nic nerozmazne.
Ano tak to bylo mysleno. Jpg nielen rozmazava ale dokonca vytvara artefakty v okoli pismen, viz napr. http://upload.wikimedia.org/wikipedia/commons/6/6d /Sego_lily_cm-150.jpg
Je to kvoli tomu ze jpeg kompresia vzdy rozdeli obrazok na male stvorce a pre kazdy stvorec sa snazi najst vhodny jpeg "obrazec". Pre pismena logicky neexistuju presne obrazce ale len take vselijake s artefaktami. Cim vyssia kompresia je nastavena tym vacsie stvorceky a tym silnejsie artefakty.
P.S. a neni to kvoli podobnym farbam, artefakty vzniknu aj pri kompresii ciernobieleho obrazca (ktory mal originalne len farby 0,1)
ok, už to chňápu:)
Díky, zas jsem o něco chytřejší.
To OCR online je super, asi využiju.