Asi to stále nechápeš. Stejně nakonec budeš muset vše udělat ručně (vyjma vyhození bitově identických duplikátů - což jsem ti už psal). Nic automatického neexistuje a existovat nebude, protože úloha má příliš mnoho stupňů volnosti. To je termín z automatizace (vědní obor).
No a to je vše, více s tím nemám v úmyslu ztrácet čas, protože i kdybys nakrásně použil fuzzy apod., tak skončíš s určitou mírou nejistoty, žes buď zahodil něco unikátního, nebo naopak s duplikáty. A jak správně píše MM, dostat se do takové situace svědčí o tom, že někdo při vytváření dokumentového skladu nemyslel, nebo si zjednodušil práci.