

Encodovani webove stranky pro UTF-8
Dobry den,
Nedavno jsem se rozhodl vytvorit program v c# pro parsovani webove stranky 171.
Parsovaní mi jde v pohodě, ale narazil jsem ale na problém s encodováním znaků.
Pokud si zobrazíte zdrojový kód zmíněné stránky, pak lze v tagu <title> vidět text: Zelenina Zastráň - bedýnky.cz.
Chtel bych se zeptat, zda-li někdo nevi, co to muze zpusobovat takovou špatnou reprezentaci textu UTF8, když při normalním prohlížení stránek je vše kódováno správně.
Děkuji za odpovědi
Radcove sli spat.
Teraz som tu len ja ako nocny vratnik. Skus rano.
Jakym zpusobem stranku nacitas? Bud primo pri nacteni nebo po nacteni ji preved z UTF-8 do ANSI nebo unicode.
Prohlizec to take dela, aby ti ji zobrazil - z hlavicky stranky si precte informaci o kodovani a pred zobrazenim ji prevede a zobrazi.
nacitam pres tridu WebClient, tomu nastavim manualne encodovani na UTF8 a pak jej vlozim do stringu
Ty jsi autor toho webu?
Chyba je v rozdílu znakových sad stránky (UTF-8) a kódování editoru, ve kterém byla stránka napsaná.
nene prave nejsem autor, chtel jsem pomoct sestre, ktera ma za ukol vypsat informace o vsech podnicich, aby to nemusela manualne otrocky vypisovat
- Prave o to tam de

- Jeste k tomu, kdyz clovek pise ten, dejme tomu HTML (nebo jestli c# v Asp.net) kod sam, tak muze a najde rychleji popripadnou chybu a celkove je to prehlednejsi.
- Takovou malou stranku, bych zas tak otrocky nevidel
Dá se to "opravit" celkem jednoduše (alespoň u mě to fungovalo).
Stránku si ulož do počítače - otevři ji - a zdroják se pak zobrazí už normálně.
I když jsi to už označil jako Vyřešené...
- Tutu stranku/toto vlakno, sleduju uz od vcerejska, - Konfirmuji funguje to -
To je tak těžké napsat do googlu "WebClient utf-8 Encoding"?
v jednom z predchozich prispevku jsem psal, ze encodovani mam nastaveno..
Tak zpět, jsem slepý. Tohle se encodováním vůbec nesouvisí. Jsou tam použité HTML Entity.
entity-vsechny.html
Len doplním, že na dekódovanie sa dá použiť napríklad metóda WebUtility.HtmlDecode, prípadne pre staršie FW HttpUtility.HtmlDecode.