Über “Rechte an Forschungsdaten” und “Lizenzierung von Forschungsdaten” sind viele Mythen und auch Falschinformationen im Umlauf. Für Praktiker/innen im Forschungsdatenmanagement, insbesondere, wenn sie mit der Publikation von Forschungsdaten betraut sind, führt das oft zu langen, langweiligen und meistens nutzlosen Diskussionen mit Forschern, die irgendwo etwas über Creative Commons Lizenzen gelesen, oder bei einem Open Science – Event aufgeschnappt haben.
Dieser Beitrag ist ein Versuch, die wichtigsten Punkte möglichst kurz und einfach zu präsentieren, um das interessierte Publikum hoffentlich davon zu überzeugen, dass es falsch ist, Forschungsdaten mit einer CC-BY-Whatever Lizenz zu veröffentlichen. Komplikationen, die z.B. durch transnationales Recht oder den Unterschied zwischen unserem Urheberrechtsbegriff und dem anglo-amerikanische Begriffs des “Copyright” verursacht werden, werden absichtlich ignoriert, da die Schlussfolgerungen robust genug sind, um von solchen Betrachtungen nicht beeinträchtigt zu werden.
Ich habe keine juristische Ausbildung, in diesem Sinne sind die Ausführungen nicht autoritativ. Ich freue mich masslos über jede/n Jurist[ie]n, der/die Korrekturen, Verbesserungen, Verrisse, oder sogar Betätigendes drunter schreibt.
Recht & Gesetz
1. Forschungsdaten fallen nicht unter das Schweizer Urheberrecht
… und auch nicht unter internationales Urheberrecht [1, 2]. Der Werksbegriff im Urheberrecht bezieht sich nirgends auf “factual works”, “Tatsachen über die Natur”, Messungen, Beobachtungen, usw. Davon zu unterscheiden ist die Präsentation solcher Fakten, etwa als Plot, Infografik, kreativ gestaltete Tabelle oder die Vermittlung der Fakten in einem Text.
2. In der Schweiz existieren auch sonst keine ähnlichen oder verwandten Rechte an Daten
De lege lata existieren in der Schweiz keine eigenständigen Rechte an Daten. Datenschutz-, Urheber- und Lauterkeitsrecht schützten Personen, Werke und bestimmte Leistungen. Daten werden dementsprechend nur dann erfasst, wenn es sich um Personendaten, um digitalisierte bzw. digitale Werke oder um das Ergebnis einer ausnahmsweise eigenständig durch das UWG geschützten Leistung handelt. Das Sachenrecht ist wegen der fehlenden Körperlichkeit von vornherein nicht auf Daten anwendbar.
3. Alle Creative-Commons Lizenzen (z.B. CC-BY) haben nur eine rechtliche Wirkung, wenn sie auf Werke angewandt werden, die dem Urheberrecht oder ähnlichen, angrenzenden Rechten unterliegen
CC licenses are operative only when applied to material in which a copyright exists, and even then only when a particular use would otherwise not be permitted by copyright. Note that the latest version of CC licenses also applies to rights similar to copyright, such as neighboring rights and sui generis database rights.
Schlussfolgerungen
Creative Commons Lizenzen können nicht auf Forschungsdaten, die an einer Schweizer Forschungseinrichtung entstehen, angewendet werden.
Forschungsdaten sind gemeinfrei. Jede Creative Commons Lizenz enthält auch eine Klausel, die die Lizenz explizit für unwirksam erklärt, wenn sie sich auf nicht urheberrechtlich geschütztes Material bezieht.
Es ist für alle Beteiligten schädlich, Forschungsdaten trotzdem mit einer CC-Lizenz zu versehen
- Potentiell Nachnutzer werden über ihre Rechte getäuscht.
- Die Nachnutzung wird eingeschränkt, falls Benutzer auf diese Täuschung hereinfalllen.
- Und zwar unter Umständen auf eine Weise, die Forschung verhindert. In einer Welt mit verteilte Datenbanken und automatisierte Abfragen könnte die Verpflichtung, 100000 Datenquellen korrekt zu attributieren, schnell zu einem Problem werden.
- Wer Daten so veröffentlicht, macht einen unbeholfenen Eindruck.
- In der allgemeinen Wahrnehmung werden CC-Lizenzen weniger ernst genommen, wenn sie oft in einem Kontext benutzt werden, wo sie keinen Effekt haben. Wenn wir sie bewusst und sinngemäss anwenden, möchten wir aber, dass sie ernst genommen und respektiert werden.
Forschungsdaten sollten unter der CC-Zero Public Domain Dedication veröffentlicht werden
Auch wenn dieses Mittel ebenfalls rechtlich wirkungslos ist, weil die Daten ja auch so schon schon gemeinfrei sind, vermittelt es einen korrekten Eindruck über die mit der Datennutzung verbundenen Rechte. Noch korrekter wäre es, das CC Public Domain Mark anzubringen. CC0 ist aber sicherer, falls Urheber- oder verwandte Rechte übersehen wurden, oder möglicherweise in Zukunft auf die Daten angewandt werden können. Ausserdem können so auch die Daten begleitende Information, wie z.B. ein README -Text, zur bedenkenlosen Nachnutzung gekennzeichnet werden.
- Sorgfältig gepflegte Datenrepositories, z.B. Dryad, veröffentlichen deshalb ausschliesslich unter CC0 [4].
- Einschlägige Organisationen, wie z.B. Creative Commons UK, empfehlen nachdrücklich CC0 oder Public Domain Mark für Forschungsdaten [5], wie das auch die von Pionieren in diesem Bereich verfassten Pantone Principles tun [6].
- Das Consortium of European Social Science Data Archives (CESSDA) schreibt in seinem Data Managemen Expert Guide:
CC0 is the only truly open Creative Commons licence.
Dieser Guide ist auch eine gute Quelle um Ausnahmen, d.h. Fälle, in denen CC0 keine gute Wahl ist, kennen zu lernen.
- Das Netzwerk für Biodiversitäts-Daten, Canadensys, erklärt hier, weshalb CC0 für ihre grosse Sammlung von Biodiversitätsdaten am geeignetsten ist: Canadensys: Why we should publish our data under CC0
Komplikation
Es gibt in einigen Ländern (hauptsächlich EU) tatsächlich sui-generis Rechte an “Datenbanken” (und ihrem Inhalt). Praktisch können so Forschungsdaten (falls es denn genug davon sind) mit Rechten belastet sein, die ihre Nachnutzung deutlich einschränken oder verhindern. Unter diesen Umständen (z.B. eine in Zusammenarbeit mit ausländischen Forschern erstellte Datenbank betreffend) hätten die CC – Lizenzen eine Wirkung. Experten im Bereich offener Forschungsdaten raten jedoch dazu, auch solche Daten unter der CC-Zero Public Domain Dedication zu veröffentlichen [4, 5, 6].
Verbreiteter Irrtum
Aber ich will doch zitiert werden und dafür sorgt doch die CC-Lizenz. Mit einer Public Domain Dedication werde ich nicht zitiert, das geht doch nicht!
Antwort:
Zitiert wird nicht wegen drohender zivilrechtlicher Konsequenzen (die eine CC-BY androht), sondern weil das zur Grundlage wissenschaftlicher Arbeit gehört, zu den wichtigste Normen der wissenschaftlichen Gemeinschaft zählt, und Plagiate aufs Schärfste sanktioniert werden. In der Regel nicht durch eine Zivilklage, sondern durch öffentliche Erniedrigung, Ächtung, Depublikation, Entzug von akademischen Titeln, etc. Und das ist völlig unabhängig davon, mit welchen Rechten ein Werk versehen oder nicht versehen ist.
Während man öfter von Plagiaten von Text und Abbildungen erfährt, kommt das bei Forschungsdaten praktisch nie vor, und das liegt in der Natur der Sache: Der Satz “Ich habe Daten benutzt, die ich irgendwo im Internet gefunden habe” kommt meist nicht durch den Peer-Review. Die Alternative (für den Datenplagiator), die Daten als selbst gemessen auszugeben und den Methodenteil zu fälschen, wäre ganz übler Wissenschaftsbetrug.
In diesem Zusammenhang soll auf den Text Plagiarism and Copyright Infringement: The Costs of Confusion ([8]) hingewiesen werden, in dem Laura J. Murray in einiger Tiefe den Unterschied zwischen dem akademischen Zitationssystem und Urheberrecht (“one of the threats to academic citation practice”) darlegt und dafür plädiert, Studierenden diesen besser zu vermitteln. Ein Grund für falsche Vorstellungen im Bereich von Datenveröffentlichungen scheint unserer Erfahrung nach zu sein, dass die Funktionsweise akademischen Zitierens jungen Studierenden nicht gut genug vermittelt wurde, damit sie die traditionellen Regeln und Normen der Textzitation auf die Zitation von Datensätzen übertragen können.
Um sicher auf die Art und Weise zitiert zu werden, wie man das gerne möchte, ist der beste Weg, den Daten einen copy & paste – baren Attributionstext mitzugeben. Sowohl in einem README-File, also auch in den Metadaten des Datenrepositories.
Referenzen
[1] ccdigitallaw.ch
[2] dmlp.org
[3] Hürlimann und Zech (2016). Rechte an Daten, sui-generis 2016, pp. 89. https://doi.org/10.21257/sg.27
[4] Creative Commons FAQ
[5] Dryad FAQ
[6] Creative Commons UK Fact Sheet
[7] Panton Principles
[8] Vicinus, M. & Eisner, C.(2008). Originality, Imitation, and Plagiarism: Teaching Writing in the Digital Age. Ann Arbor: University of Michigan Press. Retrieved June 7, 2019, from Project MUSE database. https://muse.jhu.edu/chapter/145066