Program na porovnavánie textov
Ahoj hľadám nejaký prográm na analizovanie textov a hľadanie ich duplicít v dokumentoch. Mám množstvo duplicitných súborov s koncovkou .odt. Potreboval by som niečo čo by odstránilo duplicitný text v nich samotných. Porovnalo by obsahy suborov a poprípade by vymazalo duplicity v nich. Lebo v súboroch sú často zapísané dosť chaotický.
toto nemá vůbec žádný smysl.
čekal bych, že originály budeš uchovávat v neformátovaném .txt, a teprve podle aktuálního použití to proženeš nějakým "word editorem", odstavcovým corelem, sázecím latexem, webovým html wysiwygem, php importem, nebo sql dotazem z databáze.
ale chytit se pro archivaci dementního formátu, naprosto nevhodného pro strojní třídění - to ti poradil který blb?
Text som mal v txt ale prekopíroval som do .odt prave kôli jeho formátovacím možnostiam. Pred tým som mal 300 ale po použití je ich už len 50 ale i to je ešte veľa. A ja by som potreboval vyhľadať duplicity v textovych záznamoch.
přes schránku nebo export z toho udělej zpátky obyčejné txt dokumenty, pak má smysl tam něco hledat.
nebo googlu taky podstrkáváš texty s odsazením, řádkováním, barvou, velikostí písma, fontem či jeho tučným řezem?
Ahoj objavil som program PSPad lebo predošlí nefungoval funguje pri porovnávaní dvoch súborov ale je to pomalé. A vlastne len manuálne lebo otvori 2 políčka ako v total comandery a zobrazí obsah súborov. Stále tomu chýba nejaká automatika. Poradíte ešte niečo iné?
Skús tento nástroj: www.prestosoft.com
Vypisuje chybu zakažým keď chcem porovnať 2 súbory. Vypíše error a hlášku súbory nie sú rovnaké i keď obsahujú duplicity.
rovnaky subor a subor obsahujuci duplicity su 2 uplne odlisne veci.
To co chces je fakt takmer nemozne, ty by si chcel porovnavat vsetko so vsetjkym, a to u vacsieho mnozstva dat ma exponencialne vypoctove naroky. Zrovnaj si tie dokumenty mozgom, to je najjednoduchsie.
Problém že tých Dokumentov je vyše 800 a položiek v nich je vyše 300 000 a sú to dôležité data. Konečne môžem dať dohromady všetky súbory a poviedky.