Kódování češtiny - převod PDB do TXT
Dobrý den,známý mi poslal eknihu, která je ve formátu PDB. Abych ji mohl převést do mé čtečky PocketBook - Aqua2 tak jí potřebuji převést na jiný formát prostřednictvím programu Calibre.
Uvedená kniha TXT je v kódování UTF-2 a tedy při převodu mi tam chybí písmena ě,š,č apd.
a proto bych jí měl převést na kódování CP 1250 nebo ISO 8859-2.
Když provedu tento převod,tak i nadále mi tam písmena ě,š,č apd chybí.
Prosím,poradíte mi jak na to na nebo kde dělám chybu ?
Předem mnohokráte děkuji a přeji hezký den.
Změna předmětu, původně: Kódování češtiny (JaFi)
UTF-2 neznám. Jen UTF-8 a 16. Dost pochybuju, že v PDB bude UTF.
Máte pravdu - já se omlouvám,že jsem se přepsal. Převedl jsem PDB do TXT a tam jsem přečetl,že je to kódování UTF - 8 .
Jaké je kódování v PDB,ale neumím nijak zjistit. Poradíte ?
Děkuji a ještě jednou se omlouvám za mé přepsání.
V PDB se normálně používá ANSI kódování, to znamená CP-1250
Stahni si tohle (psal jsem to kdysi):
https://dl.dropbox.com/s/8u8zhe6vahtugaz/pdbconvert.zip?dl=0
Zajímat tě bude PDB2TXT. Dej to do složky s PDB soubory a spusť.
Přímo v programu si řekneš, jestli to chceš v CP 1250 nebo v UTF-8
Povedlo se - mnohokrát děkuji !!!
Ještě by to šlo přímo prostředky Calibre, pomocí utility ebook-convert.exe, která je ve složce s Calibre.
Ale výsledek bude mnohem tragičtější než přes tu mou utilitku.
Psal jsi to kdysi, ale funguje to stále, bleskově a perfektně.Díky.
Použij PSPad, v něm otevři ten PDB soubor a ulož jako text. TXT pak otevři ve Wordu a uprav si dle libosti. V Calibre převeď do epub.
Lepší je najít na netu danou knihu v modernějším formát než je PDB.
Také moznost.
Me spis prekvapuje ze mu to nejde primo v Calibre.
Kdyz jsem se se stejnym problémem potkal, tak pri formatu z PBD do ePUB (ktery bych uprednostil pred TXT) character encoding sel na vystupu upresnit (jen ho bylo zapoteby oznacit v pravém menu pred kliknutim na "format")
Zdena7676
TiP ~ Jako alternativu ctacky bych ti doporucil bych ti nainstalovat Koreader (ma i cestinu) na cteni knih, tam muzes character encoding nastavit primo v nastaveni pisma a zobrazeni knihy.
* Také umoznuje mimo vice moznosti a nastaveni spoustu slovniku, ma i statistiky cteni tak jak to nabizi treba KOBO.
PS: Ten nastroj od Jan Fiala neznam, ale vypada ze problém vyresil a svuj JOB udelal.
V Calibre to jde, ale musíš určit kódování. PDB v sobě informaci nemá.
PDB je textový formát (čistý text) + komprese. Je to zneužitá Palm Database na uložení textu.
Modernější formát ti přinese obrázky, styly písma, ale pro obyčejné čtení se bez toho dá obejít.
Ten nástroj jsem si napsal pro hromadné konverze z PDB, podobně jako i ten druhý, který zase TXT nebo Word formáty převede do PDB a při tom to ještě ve Wordu před převodem trochu upraví.
- Jako ty sam ? (ted jsem ho zkousel a fungovat to funguje)
- Jsem si ten PBDConvert stahl a ulozil, takle je-li tomu opravdu tak by mi to priste mohlo usetrit spoutu casu.
- Sice neznam presny duvod tazatelky proc formatuje .PDB → .TXT, ale jestli ji jde o znaky / diaktriku tak jdou nastavit primo v ctcecce, nebyl jsem si tim jist tak jsem to rano zkusil a PocketBook tuto moznost pro souboru .PDB ma :
Kde by tazatelce stacilo jen kliknou na :
• Menu
• Znakova sada
• A nasledovne zvolit jen pozadovany character :
* Tato moznost se v menu zobrazi jen pro soubory .PDB
* Zpravidla uvedené nastaveni nechavam na "AUTO", kde asi z 'header' vycte o jaky jde jazyk a podle toho ho aplikuje.
Calibre umí samo překódovat z čehokoliv do jinéhokoliv. Vstupní kódování se zadává v kartě "Vhled a chování", ucho "Text", položka "Vstupní kódování znaků" a výstupní se zadá v kartě "Vástup xxx", položka "Kódování výstupu". Pakli tam chybí uvedená písmena, je vstup v ISO 8859-2 a měl bys převádět do UTF-8. Poznámka: Čtečka PocketBook by měla formát PDB umět. Pakli jsou blbě uvedené znaky, změn font, nezná češtinu. Někdy se musí české fonty doinstalovat. Konkretní čtečku ale neznám.
Uvedené je pro Calibre 5.5.0, které mám nainstalováno.
Calibre to umí, ale blbě řádkuje (vkládá prázdné řádky), blbě pracuje s oddělením kapitol apod.
Lepší vysledky má ta řádková utilita, která je součástí Calibre - ebook-convert.exe, ale taky to, co se formátování týká není žádná hitparáda.
V žádném případě nepotřebuji převádět PDB do TXT, ale převod jiných formátu funguje dobře a správně.
Dřív to mělo nejaké nedostatky a neduhy tak jako každý SW, ale s příchodem V.5 a výše si Calibre prošlo mimo přechod na Python3 docela řadou významných změn a oprav na SW urovni https://calibre-ebook.com/whats-new .
Nejvíc používám převod z ePUB do .Kepub nebo .Azw , řádkování zachování odstavců, rozestup mezi písmeny je bez chyb v podstatě je to deklarované na základě CSS ( letter-spacing, vertical-align, text-align), tak jak u "TXT do ePUB" Calibre aplikuje své universální, vygenerované základní CSS šablony pro vytvoření základního layout knihy.
Dnes stejně spousta lidí když potřebuje převést jednu, dvě knihy použijí : https://convertio.co/pdb-txt/
Ten tvůj pbconvert si ale nechávám bokem :) Jeden nikdy neví a tech 455 Ko me neubude ..