Neblbněte kucí, podle mě to není unreal. Jen se zadá kolik vstupů tvoří jeden relativně ověřený celek a na základě toho se bude jen dohledávat. Při zadání xx totožných vstupů se tomu vytvoří kategorie. A informace které chci třídit a analyzovat se vyskytují v relativně pravidelném formátu. Když máš auto, taky můžeš popisovat jen "pár" vlastností, barvu, motor, chod, jízdní vlastnosti, etc.
Fakt to je unreal?
EDIT: jj, php, mysql a možná nějaký java klient pro přidávání údajů bez nutnosti chodit na "web"