toto nemá vůbec žádný smysl.
čekal bych, že originály budeš uchovávat v neformátovaném .txt, a teprve podle aktuálního použití to proženeš nějakým "word editorem", odstavcovým corelem, sázecím latexem, webovým html wysiwygem, php importem, nebo sql dotazem z databáze.
ale chytit se pro archivaci dementního formátu, naprosto nevhodného pro strojní třídění - to ti poradil který blb?