

Jak získat a zpracovat data z webu strava.cz?
Uff, problém.
Na webu strava.cz si lze po vybrání příslušné jídelny obrazit jídelníček na měsíc. Hledám způsob, jak tyto data z webu získat a následně je zpracovat.
Co jsem vyzkoušel:
1) Hledal jsem nějakou zmínku o API, ale zjevně nic takovýho veřejně neexistuje.
2) Podíval jsem se do zdrojáku vygenerované stránky s jídelníčkem, nicméně žádná elegantní struktura se nekoná (data jsou v divech).
3) Zkoušel jsem data zpracovat ručně, ale je s tím spousta práce, protože bych musel pokaždé ručně dělat úpravy ve "formátu" dat, ať už v Excelu nebo v něčem podobným.
4) Díval jsem se na webu na tutoriály typu exportování dat z Google Spreadsheet do JSON formátu, jenže to stejně vyžaduje ruční úpravy dat (jak je zmíněno v bodu 3).
Co mne napadlo:
Ručně data zkopírovat, ručně upravit a publikovat je jako JSON formát, např. na myjson. Ovšem, ta ruční úprava dat je trochu opruz. Pak už mi nápady došly.
Jak by se k tomuto problému postavili místní programátoři? Jsem si vědom toho, že jsem nezmínil programovací jazyk, pak tedy: javascript.
Stáhnout stránku a třeba pomocí jQuery vyzobat potřebné věci z DOM. Pro inspiraci mrkni na detrollizer, který je na debaty.net.
Aha, tak tady narížíme na moje limity. S JQuery neumím (občas trochu fušuju do Angularu). Co je DOM to vím, ale tímhle (tebou naznačeným) způsobem jsem s ním nepracoval.
Každopádně děkuju za pomoc, ale tohle asi nebude jen tak schůdná cesta.
Jen dodám, že data by se snadněji vyzobávala z tiskové verze (bez hlavičky, menu, atd.).
ukázka: http://www.strava.cz/Strava/Stravnik/Jidelnicky?ti sk&zarizeni=0994
Tak už se mi to povedlo.
Šel jsem na to oklikou přes Google Spreadsheet (tabulka Google). Obsahuje zajímavé funkce ImportXML a ImportHTML, viz článek o parsování dat na maxiorel.cz
V spreadsheetu jsem založil dva listy, do jednoho jsem importoval část stránky strava.cz; do druhýho listu jsem si z toho vyzobal dílčí info. Taky jsem mu nastavil, aby se samo-updatoval kdykoli při změně zdroje (tj. při změně na strava.cz).
Nechal jsem ten spreadsheet sdílet a exportovat jeden list.
V (mobilní) aplikaci pak ten soubor (vyexportovanej list) načtu protokolem http (get, url, ...) a data zpracuju a zobrazím. A je to
Zní to banálně, ale dalo mi to zabrat, než jsem to všechno zfackoval do slušné podoby.