Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailemVyřešeno Encodovani webove stranky pro UTF-8

Dobry den,
Nedavno jsem se rozhodl vytvorit program v c# pro parsovani webove stranky 171.

Parsovaní mi jde v pohodě, ale narazil jsem ale na problém s encodováním znaků.

Pokud si zobrazíte zdrojový kód zmíněné stránky, pak lze v tagu <title> vidět text: Zelenina Zastr&aacute;ň - bedýnky.cz.

Chtel bych se zeptat, zda-li někdo nevi, co to muze zpusobovat takovou špatnou reprezentaci textu UTF8, když při normalním prohlížení stránek je vše kódováno správně.

Děkuji za odpovědi

Jsou zobrazeny jen nové odpovědi. Zobrazit všechny
Předmět Autor Datum
Ve&scaron;ker&aacute; nab&iacute;zen&aacute; produkce je na&scaron;&iacute; v&yacute;roby, vyjma med…
IQ37 19.12.2014 09:20
IQ37
nene prave nejsem autor, chtel jsem pomoct sestre, ktera ma za ukol vypsat informace o vsech podnici…
hajnis 19.12.2014 11:03
hajnis
Dá se to "opravit" celkem jednoduše (alespoň u mě to fungovalo). Stránku si ulož do počítače - otevř… nový
IQ37 19.12.2014 18:35
IQ37
Stránku si ulož do počítače - otevři ji - a zdroják se pak zobrazí už normálně. - Tutu stranku/toto… poslední
CoCoChanel 19.12.2014 18:40
CoCoChanel
To je tak těžké napsat do googlu "WebClient utf-8 Encoding"? http://msdn.microsoft.com/cs-cz/librar… nový
Wikan 19.12.2014 11:14
Wikan
v jednom z predchozich prispevku jsem psal, ze encodovani mam nastaveno.. nový
hajnis 19.12.2014 11:22
hajnis
Tak zpět, jsem slepý. Tohle se encodováním vůbec nesouvisí. Jsou tam použité HTML Entity. entity-vse… nový
Wikan 19.12.2014 11:29
Wikan
Len doplním, že na dekódovanie sa dá použiť napríklad metóda WebUtility.HtmlDecode, prípadne pre sta… nový
los 19.12.2014 11:36
los

Ve&scaron;ker&aacute; nab&iacute;zen&aacute; produkce je na&scaron;&iacute; v&yacute;roby, vyjma medu, kter&yacute; vyr&aacute;b&iacute; n&aacute;&scaron; soused, jeho piln&eacute; včeličky n&aacute;m na farmě pom&aacute;h&aacute;j&iacute;.

Ty jsi autor toho webu?
Chyba je v rozdílu znakových sad stránky (UTF-8) a kódování editoru, ve kterém byla stránka napsaná.

Dá se to "opravit" celkem jednoduše (alespoň u mě to fungovalo).
Stránku si ulož do počítače - otevři ji - a zdroják se pak zobrazí už normálně.
I když jsi to už označil jako Vyřešené...

Zpět do poradny Odpovědět na původní otázku Nahoru