
Špatné kódování názvů měst, jak s tím naložit?
Ahoj,
potřeboval bych poradit, jak správně číst data.
Mám soubor s městy (csv): http://leteckaposta.cz/328697335
V souboru se vyskytuje pár špatných (špatné kódování) názvů měst.
Příklad - Na řádku 2410 je: "562408|EG|Egypt|AbŹ® Shunaynah|AbŹ® Shunaynah||30.81669998|29.16670036"||
Ale asi by mělo být Abū Shunaynah - podle google.
Jak s tím naložit a správně to přečíst/konvertovat?
Chci to číst v nodejs, ale opravit to můžu čímkoliv.
Nějaký návody?
Kódování nerozumím moc a trošku sem si o tom studoval, ale stále nevím co s tím.
Díky a rady.
Normálně to otevřeš v českém programu PSPad:
http://www.pspad.com/cz/download.htm
Tam zaklikneš někde nahoře v MENU typ kódování
A které? Proklikal jsem snad všechny a nic se nezměnilo.
Jj. taky se na to pro zajímavost dívám.
Vypadá to, že už je to blbě vygenerované či přeuložené v tom zdroji.
Děkuji za pomoc.
No tak to je na H.
Existuje nějaký způsob, jak to opravit?
Ručně.
Podle mě to přečíst pude. Je to jen o tom přijít na to, jak k tomu zmršení došlo, protože ta informace tam pořád je.
Mne sa to z leteckej pošty stiahnuť nedá, preto netuším o aký problém ide...
Nejaká databáza miest je aj tu (CSV a Excel):
https://simplemaps.com/data/world-cities
Mně to stáhnout šlo. Tak můžeš mrknout.
Čo bude mrkať, je to sprznené v samotnom Excel, a s tým nič nikto nespraví.
Co nadělám, díky za rady.
A mou odpověď jsi četl? Psal jsem, že to nejspíš pude. Třeba to tvé u je hex 8F AE, stačí zjistit jakým způsobem to mrší. Například nějakým převodem z jedno kódování do druhého.