Ik vond Acrobalypse wel aardig gevonden voor lekkende PDF's - maar kennelijk leidt dat tot minder ophef dan mijn advies ;-)
Serieus dan maar weer: PDF is een complex format waar je met gangbare tools (zoals een zip-programma en een teksteditor bij .docx bestanden, of een hex-editor) niet snel achterhaalt wat daarin is opgenomen.
O.a. Didier Stevens heeft een aantal tools geschreven voor het spitten naar malware in PDF's (
https://blog.didierstevens.com/programs/pdf-tools/) waar je mogelijk ook gemaskeerde tekstfragmenten mee kunt opsporen, maar zekerheid geven doen ook deze tools niet.
Het fundamentele probleem is dat,
tenzij een tool alle ins en outs van de gebruikte PDF-versie (met niet uit te sluiten ongedocumenteerde PDF-writer-specifieke extensies en/of implementatiefouten) kent,
én die tool volledig en bugvrij is,
én die tool géén informatie achterhoudt die de maker oninteressant leek, je nooit zeker weet of er informatie in een bestand verstopt zit die
jij niet ziet - maar een ander mogelijk wel zichtbaar kan maken.
Door zo'n bestand af te drukken kun je
zelf, met je eigen ogen, zien welke informatie een ontvanger van een naar PDF (evt. met OCR) omgezette scan zal zien (los van evt. fouten als OCR wordt toegepast).
Nb. zelfs
dat sluit niet uit dat er bewust aangebrachte patronen (steganografie) in de tekst "gesmokkeld" worden, maar dat was in dit geval niet het risico (het ging om het verwijderen van persoonsgegevens die de doelgroep niets aangaan). Als je
tevens het "naar buiten smokkelen" van vertrouwelijke informatie wilt voorkómen, heb je een nóg grotere uitdaging (en geen enkele garantie dat je alles vindt).
Met de door anderen in deze pagina voorgestelde
puur digitale oplossingen heb je simpelweg minder zekerheid (behoudens screenshots maken en die naar PDF converteren, maar dat lijkt mij meer werk; bovendien zie ik op papier regelmatig dingen die ik op een scherm over het hoofd zie). En bij SaaS-oplossingen loop je ook nog eens het risico dat
derden potentieel toegang hebben tot mogelijk aanwezige vertrouwelijke informatie in documenten die jij wilt "schoonpoetsen".
Kortom: digitaal maskeren, afdrukken en die afdruk (na visuele inspectie) weer scannen naar PDF, is wellicht niet de snelste en milieuvriendelijkste oplossing voor het onderhavige probleem, maar wel de zekerste. Waarbij "
[...] shred je documenten meteen" m.i. wél een goed advies is.