Přidat otázku mezi oblíbenéZasílat nové odpovědi e-mailem Editace PDF - začernění textu

Zdravím

Kvůli ochraně osobních údajů na webu obce řeším, jak v existujících scanovaných PDF dokumentech začernit osobní údaje tak, aby se z dokumentu nedaly nijak vyčíst.
Zkoušel jsem některé nástroje, ale výsledek je takový, že PDF obsahuje scan dokumentu jako jeden vektorový objekt a černé obdélníky jsou extra objekty, takže při pomalém načítání z internetu se prvně načte nahý dokument a zakrývající černé obdélníky až později.

Prosím o tip na sw, nejlépe v češtině, klidně i placený za rozumnou cenu, kterým by se daly ty osobní údaje začernit a spojit do jedné vrstvy.

Dost nerad bych postupoval podle tipu z ministerstva, který říká: vytisknout - začernit fixem - naskenovat.::)

Předmět Autor Datum
Dost nerad bych postupoval podle tipu z ministerstva, který říká: vytisknout - začernit fixem - nask…
mif 30.05.2021 18:12
mif
Prevest ty obrazkove PDF na bitmapu teda nejaky format ala BMP, TIFF, PNG, JPG, provest zacerneni v…
RedMaX 30.05.2021 18:24
RedMaX
Děláme to pomoci X-Change editoru (lze instalovat jako free). https://www.pdfxchange.cz/produkty/pdf…
Abox 30.05.2021 18:31
Abox
je takové začernění funkční? když to označím jako text a zkopíruju do schránky, nejspíš dostanu půvo…
lední brtník 30.05.2021 19:09
lední brtník
Jako text to asi neoznačíš: PDF obsahuje scan dokumentu jako jeden vektorový objekt Navíc tam je d…
host 30.05.2021 19:32
host
To je nějaké divné. Mám PDF-XChange Editor Plus a pokud v dokumentu označím obsah pro anonymizaci a…
L-Core 30.05.2021 19:30
L-Core
Devět z deseti paranoiků preferuje tisk, černění, opětovný sken. Jistota.
mif 30.05.2021 19:33
mif
Sice s odstupem času, ale musím to sem napsat. Paradoxně tento postup v kombinaci s neznalým úředník…
Time 19.11.2021 21:19
Time
Bohužel tento postup nezajistí "strojově čitelný" obsah, takže není použitelný pro úřední věci jako…
Jan Fiala 20.11.2021 06:57
Jan Fiala
PDF X-Change Editor Plus: jednoduše, rychle, zájemci můžou zkoušet odčernit. Bez šance. Existují i…
L-Core 20.11.2021 08:10
L-Core
To byla reakce na vytisknuti, zacerneni a naskenovani obrazku. Takovy dokument neni pro registr smlu…
Jan Fiala 20.11.2021 08:28
Jan Fiala
Já vím, dal jsem to tu jako příklad správně anonymizovaného dokumentu - prostě jsem jen začernil, co…
L-Core 20.11.2021 08:33
L-Core
Uvedenému rozumím. Přesto to z mé praxe to vidím dvěma pohledy. Například zareaguji na zveřejněný ná… poslední
Time 20.11.2021 10:33
Time
Tam byl, co si vzpomínám, problém v tom, že při tom uložení ten Editor udělal na tom PDF vlastně jak…
Abox 30.05.2021 19:38
Abox
Na webu, kde je zverejnovani do registru smluv je i nastroj na anonymizaci PDF. Zvladne to v existuj…
Jan Fiala 30.05.2021 19:16
Jan Fiala
Dobrý den, teď jsem zkoušel PDF 24 Tools, je zdarma. Stáhl jsem si ho do počítače, abych nemusel dok…
Adam Pulec 18.11.2021 12:08
Adam Pulec
Abbyy Fine Reader
iVP 18.11.2021 17:21
iVP
Chci varovat před nešvarem, se kterým jsem se v minulosti několikrát setkal. Zdrojové, již upravené…
Time 19.11.2021 21:15
Time
To vypovídá jen o tom, že používají k anonymizaci nefunkční postup. PDF X-Change (viz výše), a předp…
L-Core 20.11.2021 05:46
L-Core

To je nějaké divné.

Mám PDF-XChange Editor Plus a pokud v dokumentu označím obsah pro anonymizaci a tu v dalším kroku potvrdím, daný obsah se začerní a to co je pod tím definitivně a nenávratně zmizí. Vrátit se to nedá a není to tam, ověřoval jsem to třeba ve vektorovém editoru Affinity Designer (a jde to také ověřit třeba v adobě Illustrator).

Nic ukládat oklikou přes virtuální tisk netřeba, stačí uložit.

Netuším, jak to ale případně má ta neplacená verze.

Sice s odstupem času, ale musím to sem napsat. Paradoxně tento postup v kombinaci s neznalým úředníkem zajistí "obrázek v PDF" a člověka pak není plný internet. Pokud nemají nastavné OCR při skenu, tak to uvedené lidi chrání. Důvody uvádím níže.

To byla reakce na vytisknuti, zacerneni a naskenovani obrazku. Takovy dokument neni pro registr smluv pripustne.

Takovou smlouvu nemusis nikam davat, protoze je uplne k nicemu (pokud to tedy nemel byt priklad, jak zacerneni funguje) verejne dostupne udaje - jmeno firmy, IC, jmeno druhe strany apod. zacernovat nemas.

Já vím, dal jsem to tu jako příklad správně anonymizovaného dokumentu - prostě jsem jen začernil, co mě napadlo, nejedná se o nějaký oficiální dokumentv. V textu v *pdf jen myší označuji text, položku za položkou, kterou chci odstranit, pak jeden klik v menu a je to. Schovaná data jsou definitivně pryč.

Uvedenému rozumím. Přesto to z mé praxe to vidím dvěma pohledy.
Například zareaguji na zveřejněný návrh obce. Obec chce prodat pozemek. Uvede podmínky. Pozemek získá nejvyšší nabídka. Pak se to projedná u komise, zastupitelstvo učiní zápis ze zasedání zastupitelstva a ten zveřejní (po OCR obsahuje textovou vrstvu). Otázka zní, co je komu do toho, jaký občan podal návrh a proč zveřejňují cenu? Proč má být občas dohledatelný díky OCR? Kupní smlouvu přeci taky nezveřejní. Přitom by stačilo uvést komu a proč to prodají a za jakou cenu. Běžnou praxí ovšem je, že zveřejní veškeré zájemce včetně cenových nabídek. Člověk jde v takové situaci nechat se proprat obcí a na internet jako "to je ten co na to má tolik peněz" a nebo "to je ten co se tak moc zadluží". Domnívám se, že by měli zveřejňovat pouze iniciály jmen zájemců, neuvádět adresy atd. K iniciálům lze uvést cenu, protože pokud tím splní neidentifikovatelnost osoby, tak je to v pořádku. Tohle je záležitost právního pohledu. Pokud někdo chce, nechť pokračuje v právní poradně s odkazem ta na tento post. Jak to vidíte vy?

Tam byl, co si vzpomínám, problém v tom, že při tom uložení ten Editor udělal na tom PDF vlastně jakoby druhou vrstvu.
Takže se pak dalo v tom Editoru následně tu vrstvu zase odebrat. Ale je to už nějaký pátek, možná, že už to teď vylepšili.
Proto jsme to proháněli tehdy ještě PDF Creatorem (pod W7).

Dobrý den, teď jsem zkoušel PDF 24 Tools, je zdarma. Stáhl jsem si ho do počítače, abych nemusel dokumenty podléhající mlčenlivosti zasílat na jejich server. Potřebuji zakrýt část textu naskenovaného dokumentu. V programu sice nelze označit text, ale dají se tam nakreslit obdélníky libovolné barvy, použil jsem šedé, aby bylo vidět, že je tam něco zakrytého (u bílé by to nemuselo být jasné), ale aby to neplýtvalo barvu tiskárně (pokud bych začernil třetinu strany). Nastavil jsem si obdélník na výšku řádku a ten pak kopíroval a měnil jeho šířku. Zvolíte si, co chcete s dokumentem dělat. Poprvé jsem vybral "Začernit PDF soubor", výsledný soubor byl rozmazaný. Podruhé jsem vybral "Úprava PDF", jsou tam ty samé nástroje jako v první variantě, avšak i další. Výsledný soubor měl shodnou kvalitu jako originál.

Chci varovat před nešvarem, se kterým jsem se v minulosti několikrát setkal.
Zdrojové, již upravené PDF stačilo otevřít v editoru a černá pole vymazat. Ti dobráci pod nimi nechali veškeré údaje. Lidi jsou někdy fakt naivní a když se to potká v kombinaci s neschopnými úředníky a lidmi z IT, tak chudák občan, nehledě na to v jaké je situaci.

Zpět do poradny Odpovědět na původní otázku Nahoru