jen pro tvou informaci:
add = anglické slovo s významem "přidat, přičíst"
ad = latinské slovo s významem "k (věci), co se týká (věci)" (má ještě další významy)
(propříště, až zase budeš chtít použít cizí termity, tak abys znal i jejich význam )
A co se týká tvého problému: rád bych tě upozornil, že 2x nasnímaná totožná stránka na scanneru nebude nikdy stejná, totéž platí i pro OCR - zde se vyskytují chyby rozpoznání, přidané mezery, jinak pochopené formátování textu.
DiffPDF je nesmysl, který můžeš provést v libovolném textovém editoru - sice ne tak komfortně, ale víceméně s podobným výsledkem.