Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailem Windows 10 verz. 1903 - nastaviť notepad na UTF-8 s BOM

C:\Windows\notepad.exe.
Notepad s najnovším updatom Windows 1903 (May 2019 Update) zmenil defaultné ukládanie *.txt súborov do kódovania UTF-8 . Do Windows 10 verz. 1809 vrátane notepad defaultne ukladal *.txt súbory do kódovania UTF-8 s BOM. Od Windows 1903 je východzím formátom ukládání do kódovania UTF-8 (bez toho BOM). Pri vytvorení nového textového súboru je v notepade text zobrazovaný správne aj s diaritikou takto: U Hluché zmije; Stejné ženy, stejní muži; Má milá; Tělo. Prehliadanie textových súborov s diakritikou však spôsobuje problémy v tom, že písmena s diakritikou sa rozpadnú a prehliadaný text vyzerá takto: U HluchĂŠ zmije; StejnĂŠ Ĺženy, stejnĂ­ muĹži; MĂĄ milĂĄ; TÄ?lo.

OTÁZKA:
- ako nastaviť notepad vo Windows 10 verz. 1903 tak, aby defaultne ukladal nové textové súbory do kódovania UTF-8 s BOM, alebo do kódovania ANSI?

Předmět Autor Datum
Tobe taky Dobry den. - Zde by jsi mohl najit (doufam) moznou odpovedt na tvuj problém : 1) Výchozí…
XoXoChanel 09.07.2019 12:35
XoXoChanel
Ďakujem za informáciu - nepomohlo. Tento postup fungoval vo verziach do Windows 10 ver. 1809 - teda…
Ansam 09.07.2019 13:59
Ansam
Nejak nerozumiem kde a prečo sa rozpadne tá diakritika. V notepade asi určite nie, či s BOM alebo be…
pozorovateľ 09.07.2019 22:42
pozorovateľ
Tuná je txt súbor vytvorený notepadom vo Windows 10 Home (x64), ver. 1903, defaultne kódovaný v reži…
Ansam 10.07.2019 07:40
Ansam
Čo je to za prehliadač? Nepoznám ho, ale podľa všetkého je naprd. V titulke má nesprávne zistené kód…
pozorovateľ 10.07.2019 09:25
pozorovateľ
Napiš tvůrcům Altap Salamander aby jejich program správně zobrazoval UTF8 txt!
kacikac 10.07.2019 10:31
kacikac
Tieto veci riešim. Teraz potrebujem iba vyriešiť problém, ako vo Windows 10 verz. 1903 - nastaviť no…
Ansam 10.07.2019 10:41
Ansam
Důvod?
kacikac 10.07.2019 11:13
kacikac
Absence BOM dělá hodně editorům problém.
Ansam 10.07.2019 11:26
Ansam
Hodně špatným editorům. Tak používej jen dobré editory.
kacikac 10.07.2019 11:49
kacikac
nebo: https://notepad-plus-plus.org/features/replace-notepad.html
lední brtník 09.07.2019 23:52
lední brtník
Ďakujem za snahu, ale odporúčaný postup spôsobuje chybové hlásenie a *.txt súbor nejde upravovať a a…
Ansam 10.07.2019 07:54
Ansam
Nechci ti do toho kecat, ale Notepad, Pruzkumnik - WTF? Notepad++ a Total Commander bez problemu.
RMX 10.07.2019 09:18
RMX
Všetci sa BOMu zbavujú, tak to nerob naopak.. https://stackoverflow.com/questions/2223882/whats-the…
pozorovateľ 10.07.2019 09:42
pozorovateľ
BOM u UTF-8 smysl má. Jinak musíš poznávat obsah posle znaků - to znamená provést analýzu textu, říc…
Jan Fiala 10.07.2019 10:41
Jan Fiala
A co dál? Dál poďla predvoleného formátu.. Veď podľa akej značky spoznáš napr kódovanie win1250 aleb…
pozorovateľ 10.07.2019 11:10
pozorovateľ
U ANSI kódování zabírají znaky 1 bajt. U UTF-8 je znak 1-3 bajty. Je to kódované podle matematických… poslední
Jan Fiala 10.07.2019 12:30
Jan Fiala

Tuná je txt súbor vytvorený notepadom vo Windows 10 Home (x64), ver. 1903,
defaultne kódovaný v režime UTF8.

- v režime úpravy (F4) je v Altap Salamander v tomto súbore diakritika zobrazená správne:
ľščťžýáíé
ĽŠČŤŽÝÁÍÉ

[notepad1.jpg]

=========================================
- v režime prehliadania (F3) sú v Altap Salamander v tomto súbore písmena s diakritikou rozhádzané:
ĞťÄ?żŞýåíÊ
ĽŠÄ?ŤŽĂ?Ă?Ă?Ă?

[notepad2.jpg]

V Total commander sa tento problém nevyskytuje a *.txt súbor je s diakritikou zobrazovaný aj v režime úpravy (F4) a aj v režime prehliadanie (F3).

Tieto veci však neriešim. Riešim problém, ako vo Windows 10 verz. 1903 - nastaviť notepad tak, aby defaultne ukladal textové súbory s kódovaním UTF-8 s BOM a nie ako od mája 2019 s kódovaním UTF8 (teda bez BOM)

Ďakujem za snahu, ale odporúčaný postup spôsobuje chybové hlásenie a *.txt súbor nejde upravovať a ani prehliadať. Bližšie chybové hlásenie po snahe otvoriť *.txt súbor:

[notepad3.jpg]

Vrátil som zmeny späť a prepol som to na notepad.

Tieto veci však neriešim. Už dočasne používam Notepad++, ktorý mám nastavený tak, aby nové textové súbory ukladal s kódovaním UTF-8 s BOM. Prehliadanie takto vytvorených súborov v notepad je už zobrazované správne. Riešim problém, ako vo Windows 10 verz. 1903 - nastaviť notepad tak, aby defaultne ukladal textové súbory s kódovaním UTF-8 s BOM a nie ako od mája 2019 s kódovaním UTF8 (teda bez BOM)

BOM u UTF-8 smysl má. Jinak musíš poznávat obsah posle znaků - to znamená provést analýzu textu, říct si, že by to mohl být UTF-8 a pak to jako UTF-8 otevřít.

Pokud soubor neobsahuje znaky s diakritikou, pak se soubor uložený jako ANSI a UTF-8 nijak neliší. Takže takový soubor otevřeš, otevře se jako ANSI, dopíšeš něco s diakritikou a co dál? Uloží se jako ANSI...

To, že HTML stránky a PHP neobsahuje BOM je dané tím, že to máš na web serveru nastaveno a jiné kódování použít nemůžeš.

A co dál? Dál poďla predvoleného formátu..
Veď podľa akej značky spoznáš napr kódovanie win1250 alebo iso8859-2? Tiež to musíš zistiť.. Tak to je asi jedná výhoda tej BOM značky, inak nemá žiadny význam a len prekáža. Nie je to unicode dokument, nepotrebuje byte order informáciu.

To je proste daň za taký bajtový hybrid. Lepšie by možno používať unicode.

Čo sa týka webu, tam typ a kódovanie určuje http hlavička. Veď skús vytvoriť php utf-8 súbor s BOM, a možno získaš rovnaký pohľad :)

Zpět do poradny Odpovědět na původní otázku Nahoru