Kriterien für Open Data

Für die Zuweisung der Open Data Incentivierung als zusätzlicher Indikator der LOM (Leistungsorientierte Mittelvergabe) an der Charité bzw. der analogen Mittel für das offene Teilen von Forschungsdaten am MDC müssen die untenstehenden daten- und publikationsbezogenen Kriterien erfüllt sein. Im Fall der Charité hinzukommende Kriterien für die LOM-Berechtigung der jeweiligen Person sind hier nicht berücksichtigt. Die Kriterien für die Open Data Incentivierung sind Stand 2020 (siehe hierzu weiter unten) wie folgt:

  • Forschungsdaten wurden von Forscherinnen und Forschern der Charité bzw. des MDC veröffentlicht und im Sinne der Open Definition frei zugänglich gemacht
  • Dabei kann es sich um Rohdaten, Primärdaten oder Sekundärdaten (z.B. aus Analysen frei verfügbarer Datensätze, Meta-Analysen oder Health technology assessments) handeln; die Daten würden somit eine analytische Replikation (Nachvollziehung der Analyseschritte) zumindest eines Teils der Ergebnisse der Studie ermöglichen; die Nennung statistischer Zahlenwerte (Mittelwerte, Standardabweichungen, p-Werte etc.) reicht hierfür nicht aus
  • Falls eine Lizenz vergeben wurde, muss diese die freie Nachnutzung ermöglichen (im Falle von CC-Lizenzen CCO, CC-BY oder CC-BY-SA)
  • Daten wurden zu einer Artikelpublikation geteilt; somit fallen für sich stehende Datensätze ohne Artikelbezug nicht darunter
  • In der Publikation wurde explizit auf die Datensätze hingewiesen; ein Verweis auf z.B. Supplementary Materials ohne weitere Erläuterung reichte nicht aus
  • Die Daten sind tatsächlich zugänglich und können zum Zeitpunkt der Überprüfung abgerufen werden
  • Die Daten wurden in einem maschinenlesbaren Format geteilt; für Tabellen z.B. CSV-, Excel- oder Word-Dateien, nicht jedoch PDFs oder Bildformate

Nicht unter die hier angewendete Definition von Open Data fallen:

  1. Analyseskripte, Computerprogramme und andere Methoden, Materialien oder Protokolle, auch wenn ihre Entwicklung Ziel des Forschungsprojekts war und/oder ihre Darstellung Hauptgegenstand der Publikation ist; wenn für die Entwicklung oder Validierung Daten erhoben und geteilt wurden, können diese jedoch unter die Open Data-Definition fallen.
  2. Daten im Artikeltext selbst, sofern es sich nicht um eingebettete Tabellen handelt, die zugleich auch als für sich stehende digitale Objekte abgerufen werden können
  3. Bildliche, audiovisuelle und andere Daten, die primär der Illustration dienen
  4. Daten zu Fallberichten (case reports), sofern sie nicht in Repositorien (Archiven) aus der jeweiligen Fachdisziplin abgelegt wurden
  5. Daten, die nur auf Nachfrage oder bei Erfüllung von Voraussetzungen verfügbar sind, unabhängig von der Art der Daten, des verwendeten Zugangsmechanismus und der Begründung dieser Maßnahme
  6. Aufgrund einiger aufgetretener Missverständnisse bitten wir zudem darum, Open Data nicht mit Open Access (offene Zugänglichkeit zu Artikelpublikationen) zu verwechseln

Die Anwendung obiger Kriterien ergibt immer auch Grenzfälle. Wenn Sie der Meinung sind, dass eine Publikation von Ihnen oder Ihrer Einrichtung zu Unrecht nicht als Open Data eingestuft wurde, schicken Sie bitte eine kurze Erläuterung an quest@bihealth.de, und wir werden dies prüfen und uns mit Ihnen in Verbindung setzen. Darüber hinaus erfolgt die semi-automatisierte Suche nach Open Data ausschließlich für englischsprachige Fachartikel. Wenn Sie Daten zu Artikeln in anderen Sprachen geteilt haben, dann weisen Sie uns bitte darauf hin.

Die Ein- und Ausschlusskriterien sind gültig für die LOM-Ausschüttung 2020 (Publikationszeitraum 2016-2018). Sie bedürfen einer kontinuierlichen Anpassung, und werden sich in den kommenden Jahren entsprechend weiterentwickeln. Dabei sollen unter anderem weitergehende Kriterien der Nachnutzbarkeit der Daten im Sinne der FAIR-Kriterien angelegt werden und/oder zugangsbeschränkt geteilte Daten belohnt werden, sofern die Zugangsbeschränkung begründbar ist und es einen klaren Zugangsmechanismus gibt.