Windows 10 verz. 1903 - nastaviť notepad na UTF-8 s BOM

C:\Windows\notepad.exe.
Notepad s najnovším updatom Windows 1903 (May 2019 Update) zmenil defaultné ukládanie *.txt súborov do kódovania UTF-8 . Do Windows 10 verz. 1809 vrátane notepad defaultne ukladal *.txt súbory do kódovania UTF-8 s BOM. Od Windows 1903 je východzím formátom ukládání do kódovania UTF-8 (bez toho BOM). Pri vytvorení nového textového súboru je v notepade text zobrazovaný správne aj s diaritikou takto: U Hluché zmije; Stejné ženy, stejní muži; Má milá; Tělo. Prehliadanie textových súborov s diakritikou však spôsobuje problémy v tom, že písmena s diakritikou sa rozpadnú a prehliadaný text vyzerá takto: U HluchĂŠ zmije; StejnĂŠ Ĺženy, stejnĂ muĹži; MĂĄ milĂĄ; TÄ?lo.

OTÁZKA:
- ako nastaviť notepad vo Windows 10 verz. 1903 tak, aby defaultne ukladal nové textové súbory do kódovania UTF-8 s BOM, alebo do kódovania ANSI?

Předmět	Autor	Datum
Tobe taky Dobry den. - Zde by jsi mohl najit (doufam) moznou odpovedt na tvuj problém : 1) Výchozí… XoXoChanel 09.07.2019 12:35	XoXoChanel	09.07.2019 12:35
Ďakujem za informáciu - nepomohlo. Tento postup fungoval vo verziach do Windows 10 ver. 1809 - teda… Ansam 09.07.2019 13:59	Ansam	09.07.2019 13:59
Nejak nerozumiem kde a prečo sa rozpadne tá diakritika. V notepade asi určite nie, či s BOM alebo be… pozorovateľ 09.07.2019 22:42	pozorovateľ	09.07.2019 22:42
Tuná je txt súbor vytvorený notepadom vo Windows 10 Home (x64), ver. 1903, defaultne kódovaný v reži… Ansam 10.07.2019 07:40	Ansam	10.07.2019 07:40
Čo je to za prehliadač? Nepoznám ho, ale podľa všetkého je naprd. V titulke má nesprávne zistené kód… pozorovateľ 10.07.2019 09:25	pozorovateľ	10.07.2019 09:25
Napiš tvůrcům Altap Salamander aby jejich program správně zobrazoval UTF8 txt! kacikac 10.07.2019 10:31	kacikac	10.07.2019 10:31
Tieto veci riešim. Teraz potrebujem iba vyriešiť problém, ako vo Windows 10 verz. 1903 - nastaviť no… Ansam 10.07.2019 10:41	Ansam	10.07.2019 10:41
Důvod? kacikac 10.07.2019 11:13	kacikac	10.07.2019 11:13
Absence BOM dělá hodně editorům problém. Ansam 10.07.2019 11:26	Ansam	10.07.2019 11:26
Hodně špatným editorům. Tak používej jen dobré editory. kacikac 10.07.2019 11:49	kacikac	10.07.2019 11:49
nebo: https://notepad-plus-plus.org/features/replace-notepad.html lední brtník 09.07.2019 23:52	lední brtník	09.07.2019 23:52
Ďakujem za snahu, ale odporúčaný postup spôsobuje chybové hlásenie a *.txt súbor nejde upravovať a a… Ansam 10.07.2019 07:54	Ansam	10.07.2019 07:54
Nechci ti do toho kecat, ale Notepad, Pruzkumnik - WTF? Notepad++ a Total Commander bez problemu. RMX 10.07.2019 09:18	RMX	10.07.2019 09:18
Všetci sa BOMu zbavujú, tak to nerob naopak.. https://stackoverflow.com/questions/2223882/whats-the… pozorovateľ 10.07.2019 09:42	pozorovateľ	10.07.2019 09:42
BOM u UTF-8 smysl má. Jinak musíš poznávat obsah posle znaků - to znamená provést analýzu textu, říc… Jan Fiala 10.07.2019 10:41	Jan Fiala	10.07.2019 10:41
A co dál? Dál poďla predvoleného formátu.. Veď podľa akej značky spoznáš napr kódovanie win1250 aleb… pozorovateľ 10.07.2019 11:10	pozorovateľ	10.07.2019 11:10
U ANSI kódování zabírají znaky 1 bajt. U UTF-8 je znak 1-3 bajty. Je to kódované podle matematických… poslední Jan Fiala 10.07.2019 12:30	Jan Fiala	10.07.2019 12:30

Tobe taky Dobry den.

- Zde by jsi mohl najit (doufam) moznou odpovedt na tvuj problém :
1) Výchozí kódování UTF-8 pro nové dokumenty programu Poznámkový blok
2) Změna výchozí ANSI na UTF-8 v poznámkovém bloku

Ďakujem za informáciu - nepomohlo.
Tento postup fungoval vo verziach do Windows 10 ver. 1809 - teda do mája 2019.
Vo Windows 10 ver. 1903 už tento postup nefunguje.

Nejak nerozumiem kde a prečo sa rozpadne tá diakritika. V notepade asi určite nie, či s BOM alebo bez. Windows BOM nepotrebuje. Ja osobne by som BOM nepoužíval.

Prípadne pošli ukážky správneho a nesprávneho .txt súboru.

Tuná je txt súbor vytvorený notepadom vo Windows 10 Home (x64), ver. 1903,
defaultne kódovaný v režime UTF8.

- v režime úpravy (F4) je v Altap Salamander v tomto súbore diakritika zobrazená správne:
ľščťžýáíé
ĽŠČŤŽÝÁÍÉ

[notepad1.jpg]

=========================================
- v režime prehliadania (F3) sú v Altap Salamander v tomto súbore písmena s diakritikou rozhádzané:
ÄžĹĄÄ?ĹĽĹžĂ˝ĂĄĂĂŠ
Ä˝Ĺ Ä?Ĺ¤Ĺ˝Ă?Ă?Ă?Ă?

[notepad2.jpg]

V Total commander sa tento problém nevyskytuje a *.txt súbor je s diakritikou zobrazovaný aj v režime úpravy (F4) a aj v režime prehliadanie (F3).

Tieto veci však neriešim. Riešim problém, ako vo Windows 10 verz. 1903 - nastaviť notepad tak, aby defaultne ukladal textové súbory s kódovaním UTF-8 s BOM a nie ako od mája 2019 s kódovaním UTF8 (teda bez BOM)

Čo je to za prehliadač? Nepoznám ho, ale podľa všetkého je naprd. V titulke má nesprávne zistené kódovanie.
F3 v Total Commanderi funguje správne, a aj akýkoľvek normálny textový editor.

Napiš tvůrcům Altap Salamander aby jejich program správně zobrazoval UTF8 txt!

Tieto veci riešim. Teraz potrebujem iba vyriešiť problém, ako vo Windows 10 verz. 1903 - nastaviť notepad tak, aby defaultne ukladal textové súbory s kódovaním UTF-8 s BOM a nie ako od mája 2019 s kódovaním UTF8 (teda bez BOM) - bez ohľadu na Altap Salamander.

Důvod?

Absence BOM dělá hodně editorům problém.

Hodně špatným editorům. Tak používej jen dobré editory.

nebo:
https://notepad-plus-plus.org/features/replace-notepad.html

Ďakujem za snahu, ale odporúčaný postup spôsobuje chybové hlásenie a *.txt súbor nejde upravovať a ani prehliadať. Bližšie chybové hlásenie po snahe otvoriť *.txt súbor:

[notepad3.jpg]

Vrátil som zmeny späť a prepol som to na notepad.

Tieto veci však neriešim. Už dočasne používam Notepad++, ktorý mám nastavený tak, aby nové textové súbory ukladal s kódovaním UTF-8 s BOM. Prehliadanie takto vytvorených súborov v notepad je už zobrazované správne. Riešim problém, ako vo Windows 10 verz. 1903 - nastaviť notepad tak, aby defaultne ukladal textové súbory s kódovaním UTF-8 s BOM a nie ako od mája 2019 s kódovaním UTF8 (teda bez BOM)

Nechci ti do toho kecat, ale Notepad, Pruzkumnik - WTF?

Notepad++ a Total Commander bez problemu.

Všetci sa BOMu zbavujú, tak to nerob naopak..

https://stackoverflow.com/questions/2223882/whats-the-difference-between-utf-8-and-utf-8-without-bom/2223926#2223926

BOM u UTF-8 smysl má. Jinak musíš poznávat obsah posle znaků - to znamená provést analýzu textu, říct si, že by to mohl být UTF-8 a pak to jako UTF-8 otevřít.

Pokud soubor neobsahuje znaky s diakritikou, pak se soubor uložený jako ANSI a UTF-8 nijak neliší. Takže takový soubor otevřeš, otevře se jako ANSI, dopíšeš něco s diakritikou a co dál? Uloží se jako ANSI...

To, že HTML stránky a PHP neobsahuje BOM je dané tím, že to máš na web serveru nastaveno a jiné kódování použít nemůžeš.

A co dál? Dál poďla predvoleného formátu..
Veď podľa akej značky spoznáš napr kódovanie win1250 alebo iso8859-2? Tiež to musíš zistiť.. Tak to je asi jedná výhoda tej BOM značky, inak nemá žiadny význam a len prekáža. Nie je to unicode dokument, nepotrebuje byte order informáciu.

To je proste daň za taký bajtový hybrid. Lepšie by možno používať unicode.

Čo sa týka webu, tam typ a kódovanie určuje http hlavička. Veď skús vytvoriť php utf-8 súbor s BOM, a možno získaš rovnaký pohľad :)

U ANSI kódování zabírají znaky 1 bajt. U UTF-8 je znak 1-3 bajty. Je to kódované podle matematických pravidel.
Když otevřeš špatně ANSI soubor, vidíš špatně jednotlivé znaky. Pokud to samé uděláš s UTF-8, pak je to mnohem horší.

Zpět do poradny Odpovědět na původní otázku Nahoru