Nalezení shody u podobných slov
Ahoj,
nemá někdo zkušenost s nějakou knihovnou pro porovnávání podobných slov?
Opravdu nemyslím stejných, ale podobných.
Ideálně v .NET (C#).
Kterou byste mohli doporučit ?
Díky
Ahoj,
nemá někdo zkušenost s nějakou knihovnou pro porovnávání podobných slov?
Opravdu nemyslím stejných, ale podobných.
Ideálně v .NET (C#).
Kterou byste mohli doporučit ?
Díky
Na tohle se hodí "Levenshtein Distance".
Online třeba zde: https://planetcalc.com/1721/
Je to docela známe, zdroják určitě půjde doogooglit.
Jak to funguje se dozvíš třeba na wiki - nebo zde https://www.algoritmy.net/article/1699/Levenshteinova-vzdalenost
Zpět do poradny Odpovědět na původní otázku Nahoru
Co myslíš tím "podobných slov"
Například, že Coca-cola je podobná CocaCola a podobně.
Dá se to představit, jako když zadáš do Googlu třeba servis ata a on ti najde servis auta.
Ale jak tak jsem už na toto téma Googloval, tak je to hrozná kravina.
Jako myslím to zadání, z hlediska algoritmizace.
Je ticho po pěšině, tak je to jen takový uživatelsko-laický exces.
Zdá se, že požadovat toto může jen člověk bez znalosti algoritmizace.
Značím, řešení (schůdné) neexistuje.
Ale Gouglí takový algoritmus zřejmě má. Žeby tajné nouhau?
Ale na Gouglího nemá. Asi si to dám patentovat.
To asi ano, ale je otázkou:
- Jak velká databáze podobných slov je na pozadí dostupná
- Jak velký tým lidí na tom dělal, a jaký, patentovaný algoritmus s umělou inteligencí to řeší
Nechci spekulovat, ale lidé dělají často podobné překlepy, takže google možná má k dispozici předchozí (fail) hledání a potom to opravené.
Fakt nevím, proto se ptám.
Pamatuju si ze jsem kdysi v praci resil neco podobnyho, tenkrat jsem to resil velkou databazi se slovy, kterou jsem mel rozdelenou na useky a pak mi jen metoda vyhodila podobny slova pomoci tzv levenshteina
Na tohle se hodí "Levenshtein Distance".
Online třeba zde: https://planetcalc.com/1721/
Je to docela známe, zdroják určitě půjde doogooglit.
Jak to funguje se dozvíš třeba na wiki - nebo zde https://www.algoritmy.net/article/1699/Levenshteinova-vzdalenost
Na tom odkaze do Wikipedie je i funkce na to v C++.
A na tvém odkaze koukám je to v Javě.
Takže to není úplná hloupost.
Díky.
Má tu různé mutace a vylepšení, to už ale neznám. V google to určitě dělaj pomocí nějaké AI a kombinace tohoto algoritmu (vsadím se), ale nevím