Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailemVyřešeno Jak získat a zpracovat data z webu strava.cz?

Uff, problém.

Na webu strava.cz si lze po vybrání příslušné jídelny obrazit jídelníček na měsíc. Hledám způsob, jak tyto data z webu získat a následně je zpracovat.

Co jsem vyzkoušel:
1) Hledal jsem nějakou zmínku o API, ale zjevně nic takovýho veřejně neexistuje.
2) Podíval jsem se do zdrojáku vygenerované stránky s jídelníčkem, nicméně žádná elegantní struktura se nekoná (data jsou v divech).
3) Zkoušel jsem data zpracovat ručně, ale je s tím spousta práce, protože bych musel pokaždé ručně dělat úpravy ve "formátu" dat, ať už v Excelu nebo v něčem podobným.
4) Díval jsem se na webu na tutoriály typu exportování dat z Google Spreadsheet do JSON formátu, jenže to stejně vyžaduje ruční úpravy dat (jak je zmíněno v bodu 3).

Co mne napadlo:
Ručně data zkopírovat, ručně upravit a publikovat je jako JSON formát, např. na myjson. Ovšem, ta ruční úprava dat je trochu opruz. Pak už mi nápady došly.

Jak by se k tomuto problému postavili místní programátoři? Jsem si vědom toho, že jsem nezmínil programovací jazyk, pak tedy: javascript.

Předmět Autor Datum
Stáhnout stránku a třeba pomocí jQuery vyzobat potřebné věci z DOM. Pro inspiraci mrkni na detrolliz… nový
MaSo 29.12.2014 17:59
MaSo
Aha, tak tady narížíme na moje limity. S JQuery neumím (občas trochu fušuju do Angularu). Co je DOM… nový
Pavel 29.12.2014 18:11
Pavel
Jen dodám, že data by se snadněji vyzobávala z tiskové verze (bez hlavičky, menu, atd.). ukázka: ht… nový
host 29.12.2014 18:26
host
Tak už se mi to povedlo. Šel jsem na to oklikou přes Google Spreadsheet (tabulka Google). Obsahuje… poslední
Pavel 23.07.2016 22:20
Pavel

Aha, tak tady narížíme na moje limity. S JQuery neumím (občas trochu fušuju do Angularu). Co je DOM to vím, ale tímhle (tebou naznačeným) způsobem jsem s ním nepracoval.

Každopádně děkuju za pomoc, ale tohle asi nebude jen tak schůdná cesta.

Tak už se mi to povedlo.

Šel jsem na to oklikou přes Google Spreadsheet (tabulka Google). Obsahuje zajímavé funkce ImportXML a ImportHTML, viz článek o parsování dat na maxiorel.cz

V spreadsheetu jsem založil dva listy, do jednoho jsem importoval část stránky strava.cz; do druhýho listu jsem si z toho vyzobal dílčí info. Taky jsem mu nastavil, aby se samo-updatoval kdykoli při změně zdroje (tj. při změně na strava.cz).

Nechal jsem ten spreadsheet sdílet a exportovat jeden list.

V (mobilní) aplikaci pak ten soubor (vyexportovanej list) načtu protokolem http (get, url, ...) a data zpracuju a zobrazím. A je to :-)

Zní to banálně, ale dalo mi to zabrat, než jsem to všechno zfackoval do slušné podoby.

Zpět do poradny Odpovědět na původní otázku Nahoru