Windows 10 verz. 1903 - nastaviť notepad na UTF-8 s BOM

C:\Windows\notepad.exe.
Notepad s najnovším updatom Windows 1903 (May 2019 Update) zmenil defaultné ukládanie *.txt súborov do kódovania UTF-8 . Do Windows 10 verz. 1809 vrátane notepad defaultne ukladal *.txt súbory do kódovania UTF-8 s BOM. Od Windows 1903 je východzím formátom ukládání do kódovania UTF-8 (bez toho BOM). Pri vytvorení nového textového súboru je v notepade text zobrazovaný správne aj s diaritikou takto: U Hluché zmije; Stejné ženy, stejní muži; Má milá; Tělo. Prehliadanie textových súborov s diakritikou však spôsobuje problémy v tom, že písmena s diakritikou sa rozpadnú a prehliadaný text vyzerá takto: U HluchĂŠ zmije; StejnĂŠ Ĺženy, stejnĂ muĹži; MĂĄ milĂĄ; TÄ?lo.

OTÁZKA:
- ako nastaviť notepad vo Windows 10 verz. 1903 tak, aby defaultne ukladal nové textové súbory do kódovania UTF-8 s BOM, alebo do kódovania ANSI?

Jsou zobrazeny jen nové odpovědi. Zobrazit všechny

Předmět	Autor	Datum
nebo: https://notepad-plus-plus.org/features/replace-notepad.html lední brtník 09.07.2019 23:52	lední brtník	09.07.2019 23:52
Ďakujem za snahu, ale odporúčaný postup spôsobuje chybové hlásenie a *.txt súbor nejde upravovať a a… Ansam 10.07.2019 07:54	Ansam	10.07.2019 07:54
Všetci sa BOMu zbavujú, tak to nerob naopak.. https://stackoverflow.com/questions/2223882/whats-the… pozorovateľ 10.07.2019 09:42	pozorovateľ	10.07.2019 09:42
BOM u UTF-8 smysl má. Jinak musíš poznávat obsah posle znaků - to znamená provést analýzu textu, říc… Jan Fiala 10.07.2019 10:41	Jan Fiala	10.07.2019 10:41
A co dál? Dál poďla predvoleného formátu.. Veď podľa akej značky spoznáš napr kódovanie win1250 aleb… pozorovateľ 10.07.2019 11:10	pozorovateľ	10.07.2019 11:10
U ANSI kódování zabírají znaky 1 bajt. U UTF-8 je znak 1-3 bajty. Je to kódované podle matematických… poslední Jan Fiala 10.07.2019 12:30	Jan Fiala	10.07.2019 12:30

nebo:
https://notepad-plus-plus.org/features/replace-notepad.html

Ďakujem za snahu, ale odporúčaný postup spôsobuje chybové hlásenie a *.txt súbor nejde upravovať a ani prehliadať. Bližšie chybové hlásenie po snahe otvoriť *.txt súbor:

[notepad3.jpg]

Vrátil som zmeny späť a prepol som to na notepad.

Tieto veci však neriešim. Už dočasne používam Notepad++, ktorý mám nastavený tak, aby nové textové súbory ukladal s kódovaním UTF-8 s BOM. Prehliadanie takto vytvorených súborov v notepad je už zobrazované správne. Riešim problém, ako vo Windows 10 verz. 1903 - nastaviť notepad tak, aby defaultne ukladal textové súbory s kódovaním UTF-8 s BOM a nie ako od mája 2019 s kódovaním UTF8 (teda bez BOM)

Všetci sa BOMu zbavujú, tak to nerob naopak..

https://stackoverflow.com/questions/2223882/whats-the-difference-between-utf-8-and-utf-8-without-bom/2223926#2223926

BOM u UTF-8 smysl má. Jinak musíš poznávat obsah posle znaků - to znamená provést analýzu textu, říct si, že by to mohl být UTF-8 a pak to jako UTF-8 otevřít.

Pokud soubor neobsahuje znaky s diakritikou, pak se soubor uložený jako ANSI a UTF-8 nijak neliší. Takže takový soubor otevřeš, otevře se jako ANSI, dopíšeš něco s diakritikou a co dál? Uloží se jako ANSI...

To, že HTML stránky a PHP neobsahuje BOM je dané tím, že to máš na web serveru nastaveno a jiné kódování použít nemůžeš.

A co dál? Dál poďla predvoleného formátu..
Veď podľa akej značky spoznáš napr kódovanie win1250 alebo iso8859-2? Tiež to musíš zistiť.. Tak to je asi jedná výhoda tej BOM značky, inak nemá žiadny význam a len prekáža. Nie je to unicode dokument, nepotrebuje byte order informáciu.

To je proste daň za taký bajtový hybrid. Lepšie by možno používať unicode.

Čo sa týka webu, tam typ a kódovanie určuje http hlavička. Veď skús vytvoriť php utf-8 súbor s BOM, a možno získaš rovnaký pohľad :)

U ANSI kódování zabírají znaky 1 bajt. U UTF-8 je znak 1-3 bajty. Je to kódované podle matematických pravidel.
Když otevřeš špatně ANSI soubor, vidíš špatně jednotlivé znaky. Pokud to samé uděláš s UTF-8, pak je to mnohem horší.

Zpět do poradny Odpovědět na původní otázku Nahoru