Reakce na odpověď

Já se ptal AI jaká může být velikost fulltex indexu databáze, AI mi napsala i několikanásobná.

Já se ptal AI, a povedala mi toto:

V tomto sporu je pravda někde uprostřed, ale z technického hlediska máš **blíže k pravdě ty**, i když tvůj oponent má jeden platný (byť extrémní) argument.
Tady je rozbor toho, jak se věci mají v reálném vývoji:
---
### 1. Velikost Fulltext indexu vs. Data
Tvůj argument, že index nemůže být „několikanásobně větší než zbytek dat“, je ve většině běžných případů správný.
* **Standardní situace:** Fulltextový index (např. v MySQL nebo PostgreSQL) obvykle zabírá **30 % až 100 %** velikosti samotných textových dat. Pokud má tabulka 1 GB, index může mít dalších 0,5–1 GB. To rozhodně není „několikanásobek“ celé databáze.
* **Výjimka:** Oponent by mohl mít pravdu pouze v případě, že databáze obsahuje minimum metadat (jen ID a text) a on používá extrémně agresivní indexaci (každé slovo, n-gramy, různé jazykové mutace). Ale i tak je tvrzení o „několikanásobném zmenšení celého provozu“ smazáním indexu přehnané.
### 2. "Levnější provoz a záchrana poradny"
Tady oponent hodně přestřeluje.
* **Úložiště je levné:** Disk (GB dat) je dnes ta nejlevnější položka. To, co stojí peníze, je **RAM a CPU**.
* Fulltext index sice žere RAM, ale jeho odstranění „nezachrání poradnu“ před krachem. Pokud poradna krachuje kvůli nákladům na databázi o velikosti pár gigabajtů, je problém v byznys modelu, ne v indexech.
### 3. Ta absurdní cena (100 Kč / 4 € za hledání)
V tomhle máš absolutní pravdu ty. V roce 2026 (i dávno předtím) je fulltextové vyhledávání **naprosto základní standard**.
* Představa, že uživatel zaplatí 100 Kč za jedno vyhledání v databázi, je v éře Google a AI vyhledávačů (které prohledají celý internet za milisekundy zdarma) naprosto mimo realitu.
* Tvůj sarkasmus s placením za emoji a paging je trefný – pokud začneš zpoplatňovat základní funkce DB (jako je hledání), v podstatě tu službu zabiješ.
---
### Shrnutí
| Bod sporu | Kdo má pravdu? | Verdikt |
| --- | --- | --- |
| **Velikost indexu** | **Ty** | Index málokdy tvoří většinu objemu DB. Většinu tvoří data, logy a další režie. |
| **Vliv na cenu** | **Ty** | Smazání indexu ušetří pár korun za disk, ale zničí použitelnost webu. |
| **Logika modelu** | **Ty** | Pokud indexy „bobtnají“ neovladatelně, je špatně navržené schéma nebo zvolený nevhodný nástroj (např. nevhodné použití GIN indexů). |
| **Zpoplatnění** | **Ty** | 4 € za search je ekonomická sebevražda. |
**Verdikt:** Tvůj oponent pravděpodobně narazil na problém, kdy mu „nafouknutá“ databáze shazuje levný hosting, a vyvodil z toho chybný závěr, že za všechno může fulltext. Ty máš pravdu v tom, že kvalitní architektura (model) takový problém nemá a že jeho řešení (smazat hledání nebo ho šíleně zpoplatnit) je nesmysl.
**Chceš, abych ti pomohl zformulovat technický argument o tom, jak efektivně indexovat text, aniž by to „sežralo“ celou databázi?**

Gemini https://gemini.google.com/share/e68645fffb45

keď už hovoríme o náhodnom generátore slov, čo po každé čo sa spýtaš ti dá iné číslo.

a to hovorí o "priemerne optimalizovanom riešení". Keďže tiež som softvérový Inžinier, tak viem ako databázy bobtnajú a vážne táraš... v prípade poradne by som indexovanie vedeľ jednoducho zraziť na 15% veľkosti zvyšku dát.

Proč poradna jede na starém softwaru?