Artikel über eine Anonymisierungspipeline für Open Data zu COVID-19 veröffentlicht

In Zusammenarbeit mit dem LEOSS-Register haben wir einen Datenanonymisierungsprozess entwickelt, implementiert und evaluiert, der es ermöglicht, Daten von an COVID-19 erkrankten Patient*innen zu teilen.

Das Register „Lean European Open Survey on SARS-CoV-2 Infected Patients“ (LEOSS) sammelt Daten zur Epidemiologie und zum klinischen Verlauf von COVID-19. LEOSS verfolgt einen Open-Science-Ansatz, bei dem Open Data in Echtzeit der Öffentlichkeit zugänglich gemacht wird. Dazu wurde in Zusammenarbeit mit unserer Arbeitsgruppe eine Datenanonymisierungspipeline entwickelt, die die Privatsphäre der in das Register eingeschlossenen Patient*innen schützt und eine sichere Veröffentlichung der Daten mit nur geringen Auswirkungen auf dessen Qualität ermöglicht. Im Rahmen der Entwicklung haben wir qualitative und quantitative Risikoanalysen durchgeführt und quantitative Anonymisierungsverfahren implementiert, die auf mathematischen und statistischen Modellen basieren. Als Grundlage diente die Datenanonymisierungssoftware ARX, die ebenfalls von unserer Arbeitsgruppe entwickelt wird. Da es an klaren Richtlinien für die Datenanonymisierung und an Beschreibungen von praktischen Anwendungen von Anonymisierungsverfahren mangelt, denken wir, dass unsere Arbeit andere Forschende bei ähnlichen Herausforderungen unterstützen kann. 

Der vollständige Artikel ist hier verfügbar.
Informationen zum ARX Anonymization Tool finden Sie hier.