Beim Erstellen von Office- und PDF-Dokumenten werden neben den direkt sichtbaren Inhalten auch verschiedene sog. Metadaten gespeichert, darunter Namen von Autoren, Dateipfade oder Zeitstempfel der Erstellung. Das betrifft ebenso alle in diese eingebettete Dokumente, also bspw. eingefügte Bilder, die wiederum ihre eigene Möglichkeit zum Speichern von Metadaten bieten. Wenn die unbewusste Weitergabe von sensiblen und häufig auch personenbezogenen Daten vermieden werden soll, unterscheidet sich die empfohlene Vorgehensweise je nach Typ des zu bereinigenden Dokuments:

Microsoft Office

Für Dokumente, die mit Microsoft Office 2016 und neuer (Word, Excel, PowerPoint usw.) erstellt wurden, pflegt die Zentrale Datenschutzstelle der baden-württembergischen Universitäten (ZENDAS) eine Website Versteckte Daten in Microsoft Office 2016 Dokumenten (außerhalb des Campusnetzes nur mit Shibboleth-Login via DFN-AAI zugänglich) als Übersicht zu in den Dokumenten enthaltenen potentiell sensiblen Daten und Möglichkeiten der Löschung. Speziell in Microsoft Word, Excel, PowerPoint und Visio können die meisten versteckten Daten mit der integrierten Dokumentprüfung bereinigt werden. Die ZENDAS stellt hierfür ebenfalls eine ausführliche Anleitung bereit. Microsoft pflegt ebenfalls eine eigene Anleitung zur Nutzung der Dokumentprüfung im Support-Artikel Entfernen von ausgeblendeten Daten und persönlichen Informationen durch Überprüfen von Dokumenten, Präsentationen oder Arbeitsmappen.

PDFs

PDF-Dateien können Metadaten und eingebettete Dokumente enthalten, die vor der Weitergabe auf sensible Daten zu prüfen sind. Adobe bietet eine ausführliche Anleitung zum Entfernen von Vertraulichen Inhalten aus PDF-Dateien an. Für die dort genannten Schritte ist jedoch zwingend eine Lizenz von Adobe Acrobat Pro erforderlich.

Als kostenfreie und datenschutzfreundliche Alternative kann der PDF24 Creator genutzt werden, der rudimentäre Werkzeuge zum Schwärzen und Entfernen von Metadaten aus Dokumenten bereitstellt. Bitte nutzen Sie diesen nur über die direkt auf Ihren Rechner herunterladbare Version und verzichten Sie auf das Bearbeiten von sensiblen Dokumenten in der Cloud.

Für eine pauschale automatisierte Bereinigung von potentiell sensiblen Metadaten stellt das TUD-CERT den Webservice docleaner (nur aus dem Campusnetz der TUD ereichbar) zur Verfügung, mit dem PDF-Dokumente automatisiert von potentiell sensiblen Metadaten befreit werden können. Nach der Verarbeitung eines Dokuments erhalten Sie eine kurze Übersicht der vorhandenen und entfernten Metadaten sowie eine Downloadmöglichkeit des bereinigten PDFs. Ihre hochgeladenen Dokumente werden auf dem Server für eine kurze Zeit vorgehalten und anschließend wieder automatisch entfernt.