
Program na porovnavánie textov
Ahoj hľadám nejaký prográm na analizovanie textov a hľadanie ich duplicít v dokumentoch. Mám množstvo duplicitných súborov s koncovkou .odt. Potreboval by som niečo čo by odstránilo duplicitný text v nich samotných. Porovnalo by obsahy suborov a poprípade by vymazalo duplicity v nich. Lebo v súboroch sú často zapísané dosť chaotický.
Skús tento nástroj: www.prestosoft.com
Vypisuje chybu zakažým keď chcem porovnať 2 súbory. Vypíše error a hlášku súbory nie sú rovnaké i keď obsahujú duplicity.
rovnaky subor a subor obsahujuci duplicity su 2 uplne odlisne veci.
To co chces je fakt takmer nemozne, ty by si chcel porovnavat vsetko so vsetjkym, a to u vacsieho mnozstva dat ma exponencialne vypoctove naroky. Zrovnaj si tie dokumenty mozgom, to je najjednoduchsie.
Problém že tých Dokumentov je vyše 800 a položiek v nich je vyše 300 000 a sú to dôležité data. Konečne môžem dať dohromady všetky súbory a poviedky.