arXiv – Veteran und Vorreiter

Der E-print-Server arXiv  gilt als Vorreiter und Musterbeispiel des Open Access-Publizierens und ist der Prototyp eines fachlichen Repositoriums schlechthin.

Was passiert, wenn ein seit immerhin schon 20 Jahren etablierter und für Autoren und Leser kostenfreier Community-Dienst sich der Frage seiner nachhaltigen Sicherung stellt, möchte ich in dieser kleinen Reihe von Blog-Beiträgen darstellen.

Kurz zur Entstehung und Hintergründen von arXiv:
Begründet wurde arXiv bereits 1991 durch Paul Ginsparg, seit 2001 wird der Dienst durch die Cornell University Library betrieben. arXiv war letztlich eine „technische Anpassung“; die in Paul Ginspargs Community der Hochenergiephysik bestehende Kultur der Zirkulation gedruckter Preprints wurde ins Online-Zeitalter mit seinen entsprechenden technischen Möglichkeiten (wie einheitliche Textaustauschformate (TeX/LateX), WWW und -Server) transferiert. Das Vorbild der Teilchenphysik hat schnell in weiteren Teildisziplinen der Physik, aber auch physiknahe Gebiete wie die Mathematik oder Informatik Schule gemacht. arXiv wurde bereits in den 90ern um diese Facharchive erweitert.

arXiv ist ein fachliches Repositorium mit einfachen Funktionalitäten  und – im Vergleich zum Peer-Reviewing – reduzierten Mechanismen der Qualitätssicherung. Die Qualitätssicherung erfolgt über ein System der Empfehlung (Endorsement) neuer Autoren durch existierende Autoren und eine inhaltlich-formale Moderation. So wird sichergestellt, dass nur wissenschaftliche Artikel hochgeladen werden. Und: Ein einmal akzeptierter Beitrag bleibt immer sichtbar – ein gutes Mittel der Selbstkontrolle, wie ich denke.

Als Funktionalitäten bietet arXiv neben der Suche, Alerting-Dienste u.a. per E-Mail oder als RSS Feed sowie verschiedene Vernetzungsmöglichkeiten durch Trackbacks und Einbindung von Artikeln in gängige Bookmark- und Literaturverwaltungssysteme (Beispiel).
Die Inhalte von arXiv sind gut in Suchmaschinen und weitere Fachportale wie INSPIRE und CDS integriert, und lassen sich damit – auch außerhalb von arXiv – leicht finden. Auch in GetInfo wird arXiv mit durchsucht.

Für viele Wissenschaftler ist arXiv zu einem unverzichtbaren Werkzeug geworden. Selbstverständlich nutzen auch Nobelpreisträger arXiv!
Was die hohe Bedeutung von arXiv ausmacht, haben wir im Rahmen des Herbstworkshops 2011 der Arbeitsgruppe Information der DPG in entsprechenden Empfehlungen zu arXiv beschrieben: arXiv ist vor allem schwellenlose Kommunikationsplattform, die einen ungehinderten Zugriff auf Informationen ermöglicht. arXiv ist zum jetzigen Zeitpunkt nicht durch Open Access-Zeitschriften oder eine gute Ausstattung mit Zeitschriften-Lizenzen zu ersetzen. Für die Wissenschaft ergänzen sich die Dienste schneller Austausch via arXiv sowie Peer-Review über Verlage.
Festzustellen ist, dass die Fachkultur einen sehr starken Einfluss auf die Art und Intensität der Nutzung von arXiv hat – das lässt sich z.T. bis auf die Ebene von Arbeitskreisen herunterbrechen.

Anteil der Submissions in arXiv nach Fachgebiet (zum Vergrößern auf die Grafik klicken) Quelle

Dass arXiv sich sehr schnell von einem Angebot für Teilchenphysiker zu einem Dienst für eine Vielzahl (physiknaher) Fachgebiete entwickelt hat lässt sich sehr schön an dieser Grafik zum Anteil der Submissions pro Teildisziplin sehen: Gestartet 1991 mit Teilchenphysik (hep) waren bereits 1992  auch die Astronomie, die Kondensierte Materie (cond-mat), die Mathematik (math), und  weiter Physik (other physics) dabei. Später kamen noch die Computerwissenschaften (cs) und physikalische Aspekte der Gebiete Wirtschaftwissenschaften, Biologie und Statistik hinzu. Während in einigen Disziplinen die Zahl der eingereichten Paper in den letzten Jahren konstant bleibt, nimmt sie insbesondere in der Mathematik noch zu.

Die hohe Akzeptanz von arXiv in seinen Fachcommunities zeigt sich auch an seinen beeindruckenden Nutzungszahlen mit 77.000 Submissions sowie 50 Mio Downloads in 2011. In Rankings von Repositorien bzw. Online-Publikationen erscheint arXiv auf den ersten Plätzen.
Dem gegenüber stehen scheinbar minimale Kosten von 1ct pro Download und weniger als 7$ pro Submission. Insgesamt sind das dann aber ca. 500.000$ im Jahr als direkte Kosten im Jahr, die bis 2009 alleine durch die Cornell University Library finanziert wurden. Wer sich die Zahlen im Detail angucken will, wird hier fündig. Seit 2010 wird dieser Betrag unter internationaler Beteiligung gestemmt.

Wie sich dieser „Preis des Erfolgs von arXiv“  nachhaltig finanzieren lassen kann, soll hier in den nächsten Beiträgen zu arXiv dargestellt werden.

... ist Fachreferentin für Physik und zuständig für die Nationale Kontaktstelle im Netzwerk arXiv-DH