arXiv als Open-Access-Quelle

Wenn über Open Access gesprochen und diskutiert wird, dauert es häufig nicht lange, dass arXiv als Beispiel genannt wird: Der E-print-Server arXiv gilt als Vorreiter und Musterbeispiel des Open-Access-Publizierens und als Prototyp eines fachlichen Repositoriums schlechthin.

In diesem Blog-Beitrag möchte ich einige Facetten dieser Diskussionen zum Open Access am Beispiel von arXiv aufnehmen und näher beleuchten. Unsicherheit (bis hin zur Unwissenheit) besteht z.B. über die Qualität der in arXiv veröffentlichten Paper: Gerne wird postuliert, dass auf arXiv jeder alles ablegen könne!

Das mag in der Anfangsphase, als arXiv auf eine kleine, definierte und untereinander bekannte Community beschränkt war, im Prinzip so gewesen sein, seit vielen Jahren aber sichert ein Moderationssystem die Qualität der Paper: Es dürfen ausschließlich wissenschaftliche Paper eingereicht werden, diese sollen für ihre jeweiligen Disziplinen relevant und von Wert und Interesse sein. Im Ende ist der Qualitätsanspruch von arXiv an Paper vergleichbar mit den Vorgaben seriöser wissenschaftlicher Zeitschriften für die Submission neuer Artikel. Das auf arXiv abgelegte Paper soll die Qualität eines wissenschaftlichen Beitrags haben, das akzeptierten Standards der wissenschaftlichen Kommunikation entspricht und geeignet für das Peer-Reviewing ist (vgl. „arXiv Primer: Goals and Mission“).

Die arXiv-Moderatoren und Moderatorinnen prüfen die eingereichten Paper also nach formal-inhaltlichen Kriterien:

  • Hat das Paper die Form einer wissenschaftlichen Publikation, u.a. mit Literaturverzeichnis (oder handelt es sich doch nur ein Abstract oder eine Buchbesprechung)? Auch Paper mit zweifelhaften Inhalten bzw. reißerischen oder missverständlichen Titeln werden abgelehnt.
  • Entspricht das Thema des Artikels dem inhaltlichen Scope von arXiv bzw. der vom Autoren gewählten Teildisziplin in arXiv?
  • Wird von einem Autor in kurzer Zeit eine hohe Zahl ähnlicher Artikel eingereicht, bzw. sind neu submittierte Paper nur Überarbeitungen von bereits abgelegten Papern?

Auch wichtig: Ist der Autor im Besitz der Rechte an seinem Paper? So werden Verlags-PDFs i.d.R. nicht akzeptiert. (Es sei denn, der Verlag würde die Ablage dieser Version auf arXiv gestatten, leider ist es mir nicht gelungen ein Beispiel für einen solchen generösen Verlag (auf dem Gebiet der Physik) zu finden. Über die Meldung von positiven Beispielen durch Leser und Leserinnen dieses Beitrags würde ich mich aber sehr freuen.)

Im Gegenteil, aktuell scheinen einige Verlage hinsichtlich ihrer Self-Archiving Policy einen Schritt zurück zu machen und die Veröffentlichung der finalen Autoren-Version neuerdings erst nach einer Embargo-Frist zu erlauben, wie z.B. in den neuen „green open access options“ von IOP – nach SHERPA/ RoMEO aktuell noch ein grüner Verlag ohne Embargo-Einschränkungen.

Ein Schwerpunkt der Arbeit der Moderatoren ist es, dafür zu sorgen, dass die Paper in den richtigen Teilarchiven landen, hierfür empfehlen sie dem Autoren Reclassifications bzw. Cross-Lists (d.h. zusätzliche Verweise auf Teilarchive, für die das Thema ebenfalls fachlich relevant ist.)

Im Ende schimmern hier wieder die Urspünge von arXiv als Preprint-Server durch: Abgelegt werden Paper, die bei einer wissenschaftlichen Zeitschrift eingereicht werden (können), und Leser werden über neue Preprints ihres Faches (über E-Mail-Alerts nach Classification der Teilarchive) informiert.

Interessant ist, dass auch ein automatisierter Textabgleich stattfindet: Jedes eingereichte Paper wird mit allen (!) Texten in arXiv verglichen. Enthält ein neuer Text signifikante Anteile bereits vorhandener Texte, so wird der Autor davon in Kenntnis gesetzt – auch wenn nicht sofort ein Plagiat unterstellt wird …

Seit 2004 erfolgt auch eine „Kontrolle“ der Autoren und Autorinnen durch das Endorsement: Neue Autoren werden für arXiv erst zugelassen, wenn sie durch „Endorser“ bestätigt und empfohlen worden sind. Als Endorser qualifizieren sich arXiv-Autoren, wenn sie regelmäßig in ihrer Fachdiziplin auf arXiv veröffentlicht haben. Die Empfehlung ist daher auch nur für das jeweilige Fachgebiet gültig. Durch das Endorsement werden die Autoren in arXiv durch ihre eigene Peer-Group verifiziert.

Aufgrund dieser Mechanismen der Qualitätssicherung entspricht arXiv den Anforderungen der Berliner Erklärung an eine Open-Access-Veröffentlichung: „Wir definieren den offenen Zugang oder den ‚Open Access’ als eine umfassende Quelle menschlichen Wissens und kulturellen Erbes, die von der Wissenschaftsgemeinschaft bestätigt wurden.“

Einige der abgelehnten Autoren haben mit viXra.org eine Alternativplattform zu arXiv geschaffen. Eine Bewertung der Inhalte kann und möchte ich nicht abgeben, das können nur die Peers der jeweiligen Disziplinen.

In den letzten Monaten konnten wir in den wohlbekannten Foren, Mailinglisten und Blogs heiß geführte Diskussionen über echten und falschen Open Access verfolgen. Nein, ich meine nicht, ob der grüne oder der goldene Weg des Open Access der richtige ist, sondern welche Lizenzen echten Open Access ermöglichen, und welche nur scheinbar Open Access erlauben. Im Kern geht es hier um die Diskussion der Definition von Open Access: Reicht der für den Leser (kosten)freie Zugriff für das Gütesiegel Open Access aus, oder bedeutet Open Access mehr, z.B. die maschinelle Analyse von Texten. Dürfen Open-Access-Dokumente durch eventuell kostenpflichtige kommerzielle Dienste nachgenutzt werden, oder ist nur die Nachnutzung für ebenfalls freie Dienste zugelassen. Welche Chancen lassen wir uns dabei entgehen?

Die Berliner Erklärung ist da deutlich: „Die Urheber und die Rechteinhaber solcher Veröffentlichungen gewähren allen Nutzern unwiderruflich das freie, weltweite Zugangsrecht zu diesen Veröffentlichungen und erlauben ihnen, diese Veröffentlichungen – in jedem beliebigen digitalen Medium und für jeden verantwortbaren Zweck – zu kopieren, zu nutzen, zu verbreiten, zu übertragen und öffentlich wiederzugeben sowie Bearbeitungen davon zu erstellen und zu verbreiten, sofern die Urheberschaft korrekt angegeben wird.“ Open Access geht damit über den freien lesenden Zugriff hinaus.

Wie aber sieht es mit den Lizenzen in arXiv und um arXiv herum aus?

Die Autoren übertragen keine exklusiven Rechte an arXiv, sie sichern arXiv aber das Recht zu, die Artikel ohne zeitliche Einschränkungen („perpetual“) bereitstellen zu dürfen.

arXiv-Autoren haben dementsprechend (mehr oder minder) die Wahl zwischen folgenden Lizenzformen:

Nach Information durch das arXiv-Team wählen die meisten Autoren die arXiv.org perpetual, non-exclusive license to distribute this article, also eine nicht sehr weitreichende Lizenz. Vermutlich liegt das daran, dass die Autoren sichergehen wollen, nicht mit den Verlagen in Konflikt zu geraten.

In den normalen arXiv-Metadaten werden diese Informationen zur jeweiligen Lizenzform nicht verankert.

Da arXiv von den Autoren das Recht zur Verbreitung der Paper erhält, kann es einerseits über seine OAI-Schnittstelle die Metadaten der Artikel frei bereitstellen (hier werden interessanterweise auch Lizenzen abgebildet) sowie die Volltexte als PDF – mit den sich aus der arXiv.org perpetual, non-exclusive license ergebenden Einschränkungen – über Amazon S3.

Hin und wieder werde ich danach gefragt, ob ein bei arXiv (als Preprint) veröffentlichter Artikel von Journals überhaupt noch akzeptiert wird – eventuell erfüllt er beim Journal dann nicht mehr das Kriterium der (unveröffentlichten) Originalpublikation. Diese Frage lässt sich nur mit einem „im Prinzip ja, näheres regelt der Autorenvertrag“ beantworten: Sprich viele Verlage akzeptieren die Einreichung eines bei arXiv veröffentlichten Preprints (IOP z.B. erlaubt die Einreichung über arXiv, d.h. durch Upload des arXiv-Files), um sicherzugehen sollte man aber immer die Richtlinien des jeweiligen Journals konsultieren. Auch welche Version des Artikels (vor oder nach dem Peer-Reviewing) unter welchen Konditionen (mit oder ohne Embargo, in der finalen Autorenversion oder ausschließlich als Preprint mit Link zur Verlagsversion) zugelassen wird, ist am sichersten den Autorenhinweisen zu entnehmen, da sich diese z.T. von Journal zu Journal unterscheiden (ebenso wie die Terminologie der Versionen)

Mein Fazit: arXiv ist eine qualitätsgesicherte Open-Access-Quelle, wenn auch durch die Lizenzen häufig auf den freien lesenden Zugriff beschränkt. Letztlich war und ist das ja auch das wesentliche Motiv für die Entstehung von arXiv: der schnelle Informationsaustausch in der Community durch Veröffentlichung und Lesen von Papern.

... ist Fachreferentin für Physik und zuständig für die Nationale Kontaktstelle im Netzwerk arXiv-DH