Windows 10 verz. 1903 - nastaviť notepad na UTF-8 s BOM
C:\Windows\notepad.exe.
Notepad s najnovším updatom Windows 1903 (May 2019 Update) zmenil defaultné ukládanie *.txt súborov do kódovania UTF-8 . Do Windows 10 verz. 1809 vrátane notepad defaultne ukladal *.txt súbory do kódovania UTF-8 s BOM. Od Windows 1903 je východzím formátom ukládání do kódovania UTF-8 (bez toho BOM). Pri vytvorení nového textového súboru je v notepade text zobrazovaný správne aj s diaritikou takto: U Hluché zmije; Stejné ženy, stejní muži; Má milá; Tělo. Prehliadanie textových súborov s diakritikou však spôsobuje problémy v tom, že písmena s diakritikou sa rozpadnú a prehliadaný text vyzerá takto: U HluchĂŠ zmije; StejnĂŠ Ĺženy, stejnĂ muĹži; MĂĄ milĂĄ; TÄ?lo.
OTÁZKA:
- ako nastaviť notepad vo Windows 10 verz. 1903 tak, aby defaultne ukladal nové textové súbory do kódovania UTF-8 s BOM, alebo do kódovania ANSI?
Tobe taky Dobry den.
- Zde by jsi mohl najit (doufam) moznou odpovedt na tvuj problém :
1) Výchozí kódování UTF-8 pro nové dokumenty programu Poznámkový blok
2) Změna výchozí ANSI na UTF-8 v poznámkovém bloku
Ďakujem za informáciu - nepomohlo.
Tento postup fungoval vo verziach do Windows 10 ver. 1809 - teda do mája 2019.
Vo Windows 10 ver. 1903 už tento postup nefunguje.
Nejak nerozumiem kde a prečo sa rozpadne tá diakritika. V notepade asi určite nie, či s BOM alebo bez. Windows BOM nepotrebuje. Ja osobne by som BOM nepoužíval.
Prípadne pošli ukážky správneho a nesprávneho .txt súboru.
Tuná je txt súbor vytvorený notepadom vo Windows 10 Home (x64), ver. 1903,
defaultne kódovaný v režime UTF8.
- v režime úpravy (F4) je v Altap Salamander v tomto súbore diakritika zobrazená správne:
ľščťžýáíé
ĽŠČŤŽÝÁÍÉ
=========================================
- v režime prehliadania (F3) sú v Altap Salamander v tomto súbore písmena s diakritikou rozhádzané:
ĞťÄ?żŞýåĂĂŠ
ĽŠÄ?ŤŽĂ?Ă?Ă?Ă?
V Total commander sa tento problém nevyskytuje a *.txt súbor je s diakritikou zobrazovaný aj v režime úpravy (F4) a aj v režime prehliadanie (F3).
Tieto veci však neriešim. Riešim problém, ako vo Windows 10 verz. 1903 - nastaviť notepad tak, aby defaultne ukladal textové súbory s kódovaním UTF-8 s BOM a nie ako od mája 2019 s kódovaním UTF8 (teda bez BOM)
Čo je to za prehliadač? Nepoznám ho, ale podľa všetkého je naprd. V titulke má nesprávne zistené kódovanie.
F3 v Total Commanderi funguje správne, a aj akýkoľvek normálny textový editor.
Napiš tvůrcům Altap Salamander aby jejich program správně zobrazoval UTF8 txt!
Tieto veci riešim. Teraz potrebujem iba vyriešiť problém, ako vo Windows 10 verz. 1903 - nastaviť notepad tak, aby defaultne ukladal textové súbory s kódovaním UTF-8 s BOM a nie ako od mája 2019 s kódovaním UTF8 (teda bez BOM) - bez ohľadu na Altap Salamander.
Důvod?
Absence BOM dělá hodně editorům problém.
Hodně špatným editorům. Tak používej jen dobré editory.
nebo:
https://notepad-plus-plus.org/features/replace-notepad.html
Ďakujem za snahu, ale odporúčaný postup spôsobuje chybové hlásenie a *.txt súbor nejde upravovať a ani prehliadať. Bližšie chybové hlásenie po snahe otvoriť *.txt súbor:
Vrátil som zmeny späť a prepol som to na notepad.
Tieto veci však neriešim. Už dočasne používam Notepad++, ktorý mám nastavený tak, aby nové textové súbory ukladal s kódovaním UTF-8 s BOM. Prehliadanie takto vytvorených súborov v notepad je už zobrazované správne. Riešim problém, ako vo Windows 10 verz. 1903 - nastaviť notepad tak, aby defaultne ukladal textové súbory s kódovaním UTF-8 s BOM a nie ako od mája 2019 s kódovaním UTF8 (teda bez BOM)
Nechci ti do toho kecat, ale Notepad, Pruzkumnik - WTF?
Notepad++ a Total Commander bez problemu.
Všetci sa BOMu zbavujú, tak to nerob naopak..
https://stackoverflow.com/questions/2223882/whats-the-difference-between-utf-8-and-utf-8-without-bom/2223926#2223926
BOM u UTF-8 smysl má. Jinak musíš poznávat obsah posle znaků - to znamená provést analýzu textu, říct si, že by to mohl být UTF-8 a pak to jako UTF-8 otevřít.
Pokud soubor neobsahuje znaky s diakritikou, pak se soubor uložený jako ANSI a UTF-8 nijak neliší. Takže takový soubor otevřeš, otevře se jako ANSI, dopíšeš něco s diakritikou a co dál? Uloží se jako ANSI...
To, že HTML stránky a PHP neobsahuje BOM je dané tím, že to máš na web serveru nastaveno a jiné kódování použít nemůžeš.
A co dál? Dál poďla predvoleného formátu..
Veď podľa akej značky spoznáš napr kódovanie win1250 alebo iso8859-2? Tiež to musíš zistiť.. Tak to je asi jedná výhoda tej BOM značky, inak nemá žiadny význam a len prekáža. Nie je to unicode dokument, nepotrebuje byte order informáciu.
To je proste daň za taký bajtový hybrid. Lepšie by možno používať unicode.
Čo sa týka webu, tam typ a kódovanie určuje http hlavička. Veď skús vytvoriť php utf-8 súbor s BOM, a možno získaš rovnaký pohľad :)
U ANSI kódování zabírají znaky 1 bajt. U UTF-8 je znak 1-3 bajty. Je to kódované podle matematických pravidel.
Když otevřeš špatně ANSI soubor, vidíš špatně jednotlivé znaky. Pokud to samé uděláš s UTF-8, pak je to mnohem horší.