
Editace PDF - začernění textu
Zdravím
Kvůli ochraně osobních údajů na webu obce řeším, jak v existujících scanovaných PDF dokumentech začernit osobní údaje tak, aby se z dokumentu nedaly nijak vyčíst.
Zkoušel jsem některé nástroje, ale výsledek je takový, že PDF obsahuje scan dokumentu jako jeden vektorový objekt a černé obdélníky jsou extra objekty, takže při pomalém načítání z internetu se prvně načte nahý dokument a zakrývající černé obdélníky až později.
Prosím o tip na sw, nejlépe v češtině, klidně i placený za rozumnou cenu, kterým by se daly ty osobní údaje začernit a spojit do jedné vrstvy.
Dost nerad bych postupoval podle tipu z ministerstva, který říká: vytisknout - začernit fixem - naskenovat.
Děláme to pomoci X-Change editoru (lze instalovat jako free).
https://www.pdfxchange.cz/produkty/pdf-xchange-editor-plus/
Je tam jedna podmínka - když to v něm uložíš jako PDF, tak to zase v něm po otevření toho PDF můžeš odstranit.
Musíš to výsledné PDF přehnat přes nějakou tu virtuální PDF tiskárnu...je i součásti W10.
To je nějaké divné.
Mám PDF-XChange Editor Plus a pokud v dokumentu označím obsah pro anonymizaci a tu v dalším kroku potvrdím, daný obsah se začerní a to co je pod tím definitivně a nenávratně zmizí. Vrátit se to nedá a není to tam, ověřoval jsem to třeba ve vektorovém editoru Affinity Designer (a jde to také ověřit třeba v adobě Illustrator).
Nic ukládat oklikou přes virtuální tisk netřeba, stačí uložit.
Netuším, jak to ale případně má ta neplacená verze.
Devět z deseti paranoiků preferuje tisk, černění, opětovný sken. Jistota.
Sice s odstupem času, ale musím to sem napsat. Paradoxně tento postup v kombinaci s neznalým úředníkem zajistí "obrázek v PDF" a člověka pak není plný internet. Pokud nemají nastavné OCR při skenu, tak to uvedené lidi chrání. Důvody uvádím níže.
Bohužel tento postup nezajistí "strojově čitelný" obsah, takže není použitelný pro úřední věci jako registr smluv apod.
Uvedenému rozumím. Přesto to z mé praxe to vidím dvěma pohledy.
Například zareaguji na zveřejněný návrh obce. Obec chce prodat pozemek. Uvede podmínky. Pozemek získá nejvyšší nabídka. Pak se to projedná u komise, zastupitelstvo učiní zápis ze zasedání zastupitelstva a ten zveřejní (po OCR obsahuje textovou vrstvu). Otázka zní, co je komu do toho, jaký občan podal návrh a proč zveřejňují cenu? Proč má být občas dohledatelný díky OCR? Kupní smlouvu přeci taky nezveřejní. Přitom by stačilo uvést komu a proč to prodají a za jakou cenu. Běžnou praxí ovšem je, že zveřejní veškeré zájemce včetně cenových nabídek. Člověk jde v takové situaci nechat se proprat obcí a na internet jako "to je ten co na to má tolik peněz" a nebo "to je ten co se tak moc zadluží". Domnívám se, že by měli zveřejňovat pouze iniciály jmen zájemců, neuvádět adresy atd. K iniciálům lze uvést cenu, protože pokud tím splní neidentifikovatelnost osoby, tak je to v pořádku. Tohle je záležitost právního pohledu. Pokud někdo chce, nechť pokračuje v právní poradně s odkazem ta na tento post. Jak to vidíte vy?