

Nástroj pro konverzi textových souborů
Zdar,
hledam program, ktery by mi zkonvertoval textove soubory v UTF-8 na kodovani CP1250.
Naschval jsem to zvyraznil a jeste jednou k tomu, opravdu potrebuju mit vystup v CP1250. Zduraznuju to proto, ze ani Google tohle neumi a pokousel se mi podstrcit opak, teda prevod do UTF-8, ale to nechci, to bych zvladl i bez Googlu.
Mam proste programek, ktery potrebuju pouzit, ale on umi otevirat jen CP1250.
Program muze byt psany i pro linux, bylo by to vyhodou, ale kdyz ne, pouziju Wine, takze ani program pro Windows neni problem.
To dulezite je, aby ten program umel idealne automaticky zkonvertovat vic souboru nebo aby to slo nejak jednoduse. Ja na tohle znam jedinej program a to PSPad. Jenze tam je to hrozne uzivatelsky neprivetivy, neni tam nastroj pro hromadnej prevod a ani neumi klavesovy zkratky, takze se musi do menu a vybirat mysi a pri zamyslenem prevodu asi stovky textaku bych to delal nekolik hodin.
Nezna nekdo nejakou lepsi alternativu?
ZKus tohle:
cp-converter
Vubec se v tom nevyznam, zadna napoveda, neco snad jsou zdrojove kody a nejaky exe co tam byl se mi nepodarilo pres Wine spustit.
Ve Windows 7 to funguje normálně.
K tomu přece nápověda není nutná. FILE - přidáš soubor, pak zvolíš výchozí a cílové kódování.
Problém je nejspíše v tom, co jsi vlastně na té stránce omylem stahoval.
Zkus toto: Problems with the download? Please use this direct link, or try another mirror.
www.qwerty.cz
www.motobit.com
Ta prvni stranka ten iconv nefunguje, placa to nesmysly, ze "nepovolena vstupni sekvence".
Ta druha stranka je na nic, dotaz nebyl jak to udelat, ale jak to udelat rychleji nez v PsPadu a to urcite rychlejsi online konvertorem neni.
Ty mas Linux? Proc tedy nepouzijes primo iconv?
iconv
Zdrojovy soubor aaaa.srt je v UTF-8
Obracene to funguje, kdyz chci neco prevest z CP1250 na UTF-8, takze jsem usoudil, ze to opak z UTF-8 na CP1250 neumi.
---
Ze jsem tak smelej, neudelal bys, az budes mit nekdy cas, do PsPadu editor klavesovych zkratek nebo nepridelil kodovanim z menu format nejake klavesove zkratky?
Ja sa spolieham na VS mám aj Community 2015 aj Code a myslím že je omnoho lepší než PsPad (sry Ján Fiala). Ale VS je fakt dobrej, vlastne z dielne microsoftu nejlepší produkt. Ovšem nevie či dokáže to čo potrebuješ, možno,... ja také neriešil nikdy,... No je pre VS vela doplnkov, a možno medzi nimi najdeš aj toto.
Klávesové zkratky asi ne, vzhledem k tomu, co zamýšlím s kódováním, ale můžu rozšířit skriptování o změnu CP souboru. Pak by to šlo jednoduše spustit třeba na všechny otevřené soubory - změnit kódování a uložit.
S Linuxom Ti nepomôžem, ale na Win som si robil testovací program, ktorý niečo také robil...
Po menšej úprave to vie prevádzať súbory *.txt z UTF-8 do ANSI (CP1250)...
Program v prílohe.
Vyskúšaj náhodné súbory a daj vedieť ako Ti to funguje.
Tak vypada to, ze to funguje dobre, ale aby to bylo rychlejsi nez naklikani v PsPadu, tak by se to muselo hodne vylepsit a ja to nemam na zadny komercni ucely, ze bych ti za to mohl cokoli zaplatit.
Ja v podstate do budoucna premyslim, ze problem vyresim vlastnim programem, ktery bude ukladat do UTF-8, spis jsem myslel, ze treba nekdo bude vedet neco k pouziti hned, protoze konvertoru obracenym smerem z CP1250 na UTF-8 je habadej. Ale zda se, ze naopak je to slozitejsi. Kazdopadne dekuju.
Ak budem mať chviľku chuť, spravím Ti hromadný prevod "zadara". Ak máš záujem, napíš do privátnej správy.
mohol by si to poslať aj mne.... zišlo by sa nekdy.
píš do pm, dohodneme ako to má vyzerať...
ok, diky, jeste to zkusim poresit a kdyz tak se ozvu.
iconv normálne funguje, a je aj pre Windows: http://gnuwin32.sourceforge.net/packages/libiconv. htm
v kombinácii s forfiles, alebo for je to riešenie na jeden riadok do baťáku
a podobne napr iconv v php
Co tam teda je spatne?
Je ten prikaz dobre? Jestli ano, tak zkusim nejaky jiny UTF-8, protoze nechapu co mu tam vadi.
A určitě jde od utf-8?
napísané je to dobre, len by som doplnil: iconv -f UTF-8 -t CP1250 < vstup.txt > vystup.txt
neviem, možno je vadný súbor, skús iný, alebo mi ho skús poslať..
ešte by som doplnil, možno máš nejakú starú verziu iconv, mne to žerie utf8 s aj bez BOM, ale treba si uvedomiť že je to konverzia väčšieho rozsahu do menšieho
Není tam náhodou na začátku BOM? To jsou identifikační bajty pro UTF-8 kódování? Asi ano.
Tady řeší něco podobného a docela se to komplikuje...
http://unix.stackexchange.com/questions/312655/why -cant-i-convert-a-utf-8-to-ms-ansi-using-iconv
Na konci je to, co bys mohl použít:
funguje to s BOM aj bez, je pravda že v minulosti bol BOM štandard, tak ho tam môže niekto očakávať.
Diky nastuduju to teda.
Nevim, jestli je vstupni soubor UTF-8, vychazel jsem z toho, ze ho ten programek nebral a on UTF-8 nebere a z toho, ze PsPad psal, ze to je UTF-8.
Zkusil jsem v PsPadu vytvorit soubor UTF-8 a kdyz to prozenu pres iconv, tak k zadne chybe nedojde, ale PsPad nasledne pise, ze je to furt UTF-8.
Myslím že PsPad ti spoľahlivo povie aké kódovanie tam je, ak nie ten tak Notepad++ určite, Takisto vie konvertovať medzi formátmi.
Ale netreba nič študavať, ak by si to srt poslal, tak už máš odpoveď.
Dikes vsem, vyreseno.
iconv to resi.
Prvni problem byla spatna syntaxe prikazu iconv, je potreba jak psal citatel:
A druha vec, ze z nejakeho duvodu, u toho vstupniho souboru, ikdyz byl UTF-8, tak to neslo. PsPad ho videl jako UTF-8 a Notepad++ jako UTF-8-BOM.
Asi s tim BOM, nevim teda co to je, je nejaky problem, protoze moje UTF-8 soubory hlasil Notepad++ jen jako UTF-8 a ty uz ted sly zkonvertovat dobre.
Pak jsem teda koukal na ten iconv a nasel parametr -c, ktery preskakuje chyby.
Takze takhle uz to beha i s tim souborem, co jsem potreboval:
Dopsat tomu nejakou automatizaci uz bude hracka.