ad chunk velký 1B: co když ten jeden bajt odděluje chunky větší, které mají potom shodný obsah?
ad 64kB: je to OpenSource, takže efekt zřejmě nebude tak dobrý, jako u 10+ let vyvíjeného komerčního řešení. Celé kouzlo je totiž v umění "správně" určit velikost chunku na základě dodaných dat.
ad deduplikační poměr: jenže to je právě to, k čemu je deduplikace určena - k zálohám opakujících se dat. Je to nástroj, kterým dokážeš odzálohovat data celé firmy a nezaplatíš za to těžké peníze za úložiště.
ad spolehlivost: je samozřejmě důležitá. Nicméně když se dnes koukneš na moderní SANy, tak tam je taky základem nějaký dual-blade s Linuxem - těch chyb se dá nasekat spousta a různě, i mimo proces zálohování.
ad Windows: o tom píšu v druhém díle článku. Deduplikaci nad FS podporuje i Linux a BSD.
ad 7zip: OK, zkus si takhle zabalit těch 900GB - třeba každou sobotu. Pojede to celý víkend a ještě si budeš muset poradit s tím, jak takové zálohy držet alespoň 2-3 zpátky, protože na méně než 500GB se téměř jistě nedostaneš.