Optimální velikost souboru *.doc
Právě převádím jednu z objemných knih, kterou mám v souborech *.pdf (do textu bez dalšího nepřevoditelných), do formátu MS *.doc. Protože ty stránky jsou i s ilustracemi, rozdělil jsem původní 20MB pdf-soubor na 25-stránkové segmenty, přičemž každý z nich má cca 2 MB. Tento soubor naskenuji, přejedu OCR a vytvořím *.doc soubor opět o velikosti cca 2 MB. Uvedený postup jsem zvolil proto, abych ty texty mohl zaindexovat a fulltextově v nich vyhledávat.
Teď by mě zajímalo, jak mohu zmíněné docové soubory spojovat, aby výsledný měl optimální velikost, zejména pro účely shora uvedeného indexování (programem Archivarius 3000) a případného zobrazování (buď přímo Wordem nebo nějakým prohlížečem typu WordViever). Zatím mám subjektivní dojem, že ony 2MB soubory jsou tak akorát. Budu s nimi laborovat na strojích s procesory Pentium 4 kolem 3 GHz a pamětí ne nižší 1 GB, vše na XP (v budoucnu na Vistě).
Díky za případné odpovědi.