

Encodovani webove stranky pro UTF-8
Dobry den,
Nedavno jsem se rozhodl vytvorit program v c# pro parsovani webove stranky 171.
Parsovaní mi jde v pohodě, ale narazil jsem ale na problém s encodováním znaků.
Pokud si zobrazíte zdrojový kód zmíněné stránky, pak lze v tagu <title> vidět text: Zelenina Zastráň - bedýnky.cz.
Chtel bych se zeptat, zda-li někdo nevi, co to muze zpusobovat takovou špatnou reprezentaci textu UTF8, když při normalním prohlížení stránek je vše kódováno správně.
Děkuji za odpovědi
Ty jsi autor toho webu?
Chyba je v rozdílu znakových sad stránky (UTF-8) a kódování editoru, ve kterém byla stránka napsaná.
nene prave nejsem autor, chtel jsem pomoct sestre, ktera ma za ukol vypsat informace o vsech podnicich, aby to nemusela manualne otrocky vypisovat
Dá se to "opravit" celkem jednoduše (alespoň u mě to fungovalo).
Stránku si ulož do počítače - otevři ji - a zdroják se pak zobrazí už normálně.
I když jsi to už označil jako Vyřešené...
- Tutu stranku/toto vlakno, sleduju uz od vcerejska, - Konfirmuji funguje to -
Tak zpět, jsem slepý. Tohle se encodováním vůbec nesouvisí. Jsou tam použité HTML Entity.
entity-vsechny.html
Len doplním, že na dekódovanie sa dá použiť napríklad metóda WebUtility.HtmlDecode, prípadne pre staršie FW HttpUtility.HtmlDecode.