Čím překonvertovat PDF do HTML...
... tak, aby to bylo použitelné. Několik hodin jsem zkoušel všechny možné free programy co vyplivnul Google a výsledek je vždy naprosto nepoužitelný.
Jedná se konkrétně o tento dokument:
http://www.hp.cz/spotrebak/pdf/Kompatibilita-HP_Ink jet_inkoustove_%20kazety_08-06.pdf
Zkoušel jsem i on-line konverzi přímo na Adobe, ale výsledek se ani po pár hodinách žádný nedostavil.Pořád to řve Please wait... Zřejmě mám čekat navěky.
Údajně to jde v pohodě udělat v plné verzi - Adobe Acrobat, ten ale nemám a krást to kvůli jednomu převodu nechci.
Nenašel by se prosím někdo, kdo má Adobe Acrobat nainstalovaný, kdo by ten soubor uložil do html a poslal na mejl jirka.povolny@seznam.cz?
Zkus druhý odkaz v Google :
www.slunecnice.cz/product/Advanced-PDF-to-HTML-conv erter/
a vlastně :
http://www.google.com/search?hl=cs&q=pdf+to+html&bt nG=Hledat&lr=
Myslím, že jsem to zkoušel, na tom dokumentu si to vylámalo zuby.
Je to hrozně obludná tabulka.
Nedavno jsem bojoval s jednim obludnym dokumentem a nakonec jsem skoncil u Adobe Acrobatu, kde export do HTML i Excelu - byla to taky tabulka - byl bez problemu.
Kde se v Adobe Acrobatu 7 dá udělat převod přímo do Excelu?
Nemůžu to nikde najít a převod do html udělá sice html soubor, jenže obsah to vloží jako obrázek - čili úplně nepoužitelně. Co dělám špatně?
Ona je možná celá ta tabulka jako nějaký obrázek. Zkoušel jsem to nejdříve PDF > Word a následně Word > HTML, ale také se to udělalo jako obr.
Není to obrázek, z toho původního pdf se dá sejmout obsah jako text.
Což je ovšem nepoužitelné, protože se ztratí vazby mezi sloupci a řádky.
Pravda, blbě jsem se vyjádřil. On to není obrázek, ale není to tabulka.
Jednoduse - Copy/Paste
Pokud se bavime skutecne o plnem Acrobatu, ta je tam volba "Ulozit jako", kde to muzes ulozit do RTF, DOC, HTML, ....
Cvičně jsem to vyzkoušel.
Copy/Paste do Excelu vloží jen samotné texty narvané do prvního sloupce.
Uložit jako v případě uvedené tabulky vloží do html obrázek.
Původní tabulka v každém případě nikde.
A delas to v Adobe Reader nebo plne verzi Adobe Acrbat, ktera umoznuje PDF editovat ?
Ja nemluvim o Readeru.
Aha, asi máš pravdu, kopírování jsem zkoušel jen v Readeru.
V plné verzi jsem udělal ten neúspěšný export, kdy jsem místo tabulky dostal obrázek a kopírování přes schránku jsem nezkoušel.
Tak ne, vloží to jen řádky, stejně jako Reader.
Situace se má takto - nainstaloval vyzkoušel jsem plno různých zaručených postupů a instaloval spoustu více či méně nechutných programů. Zkoušel jsem i Adobe Acrobat 6 a Adobe Acrobat 7, zkoušel udělat i menší výřezy z dokumentu.
Výsledek je zcela nulový - vždycky z toho vyleze absolutní paskvil.
Všechny jiné pdf dokumenty jsem v pohodě uložil jako html, ale tenhle prostě ne.
Otázka zní:
Najde se tady někdo, kdo to nějak dokáže převést do nějakého lidského formátu?
Zkus mi to poslat, ale podivam se ti na to az zitra v praci.
Posli to na support(na)pspad(bodka)com
Poslal jsem to tam, díky za ochotu.
Takže závěr je ten, že tento dokument prostě převést do nějakého normálního formátu NEJDE!
Jenže - ono to nejde ani vytiskout v nějakém použitelném stavu - velikost je na jednu stránku a výsledkem jsou jakési nečitelné tečky (původně znaky) v hustém rastru.
Otázka zní - jak to mám vytisknout aby to bylo čitelné?
Jsem já totální blb, nebo jsou blbci u HP, kteří na své oficiální stránce uveřejní tabulku kompatibility, která je zcela nepoužitelná?
Zkousel to p.J.Fiala v tom Adobe Acrobatu? Pokud ano, tak nic, pokud ne, tak bych se na to mohl podivat (byt to zas az tak casto neprovadim, ale Acrobat tu mam, tak bych to zkusil).
M.
Zkoušel a zjistil to co já - že převést to prostě nejde. To jsem vzdal.
Teď už bych se spokolil s tím, kdyby se to dalo alespoň vytisknout čitelně na běžné laserové tiskárna formátu A4. Bohužel jsem nepřišel na žádnou možnost, jak to tisknout na čtyři nebo šest stran - jako to dovede třeba Excel.
Co si to v AR zvětšit na čitelnou úroveň, nasnímat si obrazovky a pak to dát třeba do Wordu jako obrázky a to si vytisknout?
Na to jsem taky myslel, potíž je v tom, že takhle můžeš udělat okraj a záhaví, kde je jasná návaznost. Ale ne ten vnitřek - to jsou jenom křížky, nedá se dodatečně zjistit, o kterou část se vlastně jedná. Tudy cesta bohužel nevede.
Nie je až tak ťažké napísať program, ktorý z toho tie dáta nejako dostane: urobiť screenshot, prejsť políčka, skontrolovať, či sú zaškrtnuté a uložiť do súboru (v C# je to na 48 riadkov ).
Pošli mi e-mail alebo napíš na ICQ, kam Ti mám poslať ten dokument vo formáte CSV (dá sa otvoriť v Exceli).
// edit: Nič posielať nemusíš, nabudúce si lepšie prečítam celú otázku...
Problém vyřešen - mejlem jsem právě dostal převedený soubor ve formátu csv i html - přesně v podobě, jak jsem potřeboval.
Velmi děkuji za pomoc a zůstávám dlužníkem.