Die Identifikation von Open Data im institutionellen Publikationskorpus erfolgt semi-automatisiert unter Verwendung eines von QUEST entwickelten Algorithmus (ODDPub) (siehe ODDPub Link, Weitere Informationen finden Sie auch auf der OSF-Projektseite) und anschließender manueller Überprüfung der Publikationen. Datengrundlage für die Zuordnung der Open Data LOM/ IOM 2024 sind bestätigte Publikationen von Erst-, Letztautoren mit LOM/IOM-Berechtigung (Charité bzw. BIH) (Stichtag 30.06.2023) im Publikationszeitraum 2020–2022. Des Weiteren müssen die Volltexte über den institutionellen Zugang verfügbar sein. Kriterien für Open Data sind die freie Verfügbarkeit der Originaldaten, maschinenlesbares Format und ein eindeutiger Verweis auf Open Data im Volltext.
Kriterien im Detail
Für die Zuweisung der Open-Data-Incentivierung als zusätzlicher Indikator der LOM bzw. IOM Forschung müssen die untenstehenden daten- und publikationsbezogenen Kriterien erfüllt sein. Allgemeine Kriterien für die LOM/IOM-Berechtigung der jeweiligen Person finden Sie auf der Intranetseite unter Interne Forschungsförderung. Die Kriterien für die Open-Data-Incentivierung sind wie folgt (Stand 2023):
Forschungsdaten wurden von Forscherinnen und Forschern der Charité frei zugänglich gemacht
ODER die Daten wurden zugangsbeschränkt geteilt und erfüllen die folgenden Voraussetzungen:
- Die Daten sind in einem externen Repositorium (bzw. Archiv, Datenbank, Register) abgelegt
- Es ist ein standardisierter Zugangsweg benannt, d.h. die Zugangsvoraussetzungen, der Ablauf eines Antrags und die verantwortlichen Personen bzw. Stellen sind beschrieben
- Der Grund für den beschränkten Zugang wird genannt oder ist unmittelbar aus dem Personenbezug ersichtlich
- Der Zugang ist für alle akademisch Forschenden - mindestens des Europäischen Wirtschaftsraums - möglich
- Ko-Autor:innenschaft bei entstehenden Fachartikeln wird nicht zur Bedingung für die Bereitstellung der Daten gemacht
- Die Bereitstellung erfolgt kostenlos oder gegen Aufwandsentschädigung
Es kann sich um Rohdaten, Primärdaten oder Sekundärdaten (z.B. aus Analysen frei verfügbarer Datensätze, Meta-Analysen oder Health Technology Assessments) handeln; die Daten würden somit eine analytische Replikation (Nachvollziehung der Analyseschritte) zumindest eines Teils der Ergebnisse der Studie ermöglichen; die Nennung statistischer Zahlenwerte (Mittelwerte, Standardabweichungen, p-Werte etc.) reicht hierfür nicht aus.
Daten wurden zu einer Artikelpublikation geteilt; somit fallen für sich stehende Datensätze ohne Artikelbezug nicht darunter.
Die Daten sind auch unabhängig von der Publikation auffindbar; somit sind Supplementary Materials nur zulässig, wenn sie in einem Repositorium (Archiv) abgelegt und auch über dieses Repositorium auffindbar sind. In der Publikation wurde explizit auf die Datensätze hingewiesen; ein Verweis auf z.B. Supplementary Materials ohne weitere Erläuterung reicht nicht aus, ebenso wie der Verweis auf eine Datenbank ohne Nennung von Datensatz, "accession code" oder genauen Sucheinstellungen.
Die Daten sind tatsächlich zugänglich und können zum Zeitpunkt der Überprüfung abgerufen werden (bei Daten unter Embargo muss dieses spätestens zum 31.07. ablaufen).
Die Daten wurden in einem maschinenlesbaren Format geteilt; für Tabellen z.B. CSV-, Excel- oder Word-Dateien, nicht jedoch PDFs oder Bildformate.
Im Folgenden fassen wir einige Aspekte zusammen, die nicht unter unsere Definition von Open Data fallen:
- Analyseskripte, Computerprogramme, Modelle und andere Methoden, Materialien oder Protokolle, auch wenn ihre Entwicklung Ziel des Forschungsprojekts war und/oder ihre Darstellung Hauptgegenstand der Publikation ist. Wenn für die Entwicklung oder Validierung Daten erhoben und geteilt wurden, können diese jedoch unter die Open-Data-Definition fallen, sofern sie für sich stehend nachvollziehbar und nachnutzbar sind.
- Daten im Artikeltext selbst, sofern es sich nicht um eingebettete Tabellen handelt, die zugleich auch als für sich stehende digitale Objekte abgerufen werden können.
- Bildliche, audiovisuelle und andere Daten, die primär der Illustration dienen.
- Daten zu Fallberichten (case reports), sofern sie nicht in Repositorien aus der jeweiligen Fachdisziplin abgelegt wurden.
- Bei Systematic Reviews und Meta-Analysen: Listen mit Quellenangaben oder andere allgemeine Informationen zu den untersuchten Studien wie Erhebungsmethode oder Teilnehmendenzahl (LOM- bzw. IOM-fähig sind dagegen neu aus der Originalliteratur zusammengesetzte Datensätze, die eine Nachvollziehbarkeit der Analyse sicherstellen, wie z.B. extrahierte Textstellen oder statistische Werte).
- Daten, die nur auf Nachfrage und/oder bei Erfüllung von Voraussetzungen verfügbar sind, es sei denn, es handelt sich um personenbezogene oder anderweitig sensible Daten, die über einen standardisierten Nachfrageweg verfügbar sind (darunter fällt z.B. nicht die Verfügbarkeit "upon request").
- Daten aus Datensammlungen von Konsortien ("Datenpools"), wenn unklar ist, ob die Autor:innen selbst einen Beitrag zum Pool geleistet haben.
- Daten, für die nur ein "private link" geteilt wird, so dass sie nicht im Repositorium gefunden werden können, sondern ausschließlich über die Publikation zugänglich sind.
- Daten, die vor dem betrachteten LOM/IOM-Zeitraum geteilt wurden (hierdurch soll sichergestellt werden, dass nur eine begrenzte Zahl von Artikeln für das Teilen eines bestimmten Datensatzes belohnt werden kann).
Open Data im Rahmen dieser LOM/IOM bedeutet das freie Verfügbarmachen und die Zugänglichkeit der Originaldaten und ist nicht mit Open Access (offene Zugänglichkeit zu Artikelpublikationen) zu verwechseln.
Die Anwendung obiger Kriterien ergibt immer auch Grenzfälle. Wenn Sie der Meinung sind, dass eine Publikation von Ihnen oder Ihrer Einrichtung zu Unrecht nicht als Open Data eingestuft wurde, schicken Sie bitte eine kurze Erläuterung an quest@bih-charite.de, und wir werden dies prüfen und uns mit Ihnen in Verbindung setzen. Darüber hinaus erfolgt die semi-automatisierte Suche nach Open Data ausschließlich für englischsprachige Fachartikel. Wenn Sie Daten zu Artikeln in anderen Sprachen geteilt haben, dann weisen Sie uns bitte darauf hin.
Sie bedürfen einer kontinuierlichen Anpassung und werden sich in den kommenden Jahren entsprechend weiterentwickeln. Dabei könnten unter anderem weitergehende Kriterien der Nachnutzbarkeit der Daten im Sinne der FAIR-Kriterien (Findable, Accessible, Interoperable, Re-usable) angelegt werden und/oder es könnte das Teilen von Forschungssoftware ("open code") ergänzt werden.