Digital Repository

10.01.2017 05:31 Uhr
Der Begriff Repository wird in der Softwaretechnik benutzt. Bei einem Repository handelt es sich um eine zentrale Ablage für Daten, Dokumente, Objekte und Programme mit ihren Metadaten.

Neben den eigentlichen Daten werden im Repository auch die verschiedenen Versionen, Konzeptionen und deren Entwicklungen abgelegt, wodurch alle abgelegten Softwarebausteine mit allen Informationen gespeichert werden. Auf die in Repositories gespeicherten Daten und Dokumente können autorisierte Autoren und Nutzer zugreifen und ändern. Repositories werden im Dokumenten- und Content-Management sowie in der Versionsverwaltung (CVS) eingesetzt. Die Inhalte werden mit Metadaten gekennzeichnet.

(http://www.itwissen.info/definition/lexikon/Repository-repository.html 01.2017)

Repositories/Repositorien  an Universitäten oder Forschungseinrichtungen sind dort betriebene Dokumentenserver, auf denen wissenschaftliche Materialien archiviert und weltweit entgeltfrei zugänglich gemacht werden.

Institutionelle und disziplinäre Repositorien

Als institutionelle Repositorien werden Dokumentenserver bezeichnet, die von Institutionen (meist Universitätsbibliotheken oder Forschungsorganisationen) betrieben werden und ihren Mitgliedern die digitale Publikation oder Archivierung ermöglichen.
Disziplinäre Repositorien hingegen sind institutionsübergreifend und stehen Wissenschaftlerinnen und Wissenschaftlern thematisch gebündelt, z.B. für eine Fachdisziplin, zur Publikation und Archivierung ihrer Arbeiten zur Verfügung (z.B. PsyDok als disziplinären Volltextserver in der [deutschsprachigen] Psychologie oder Social Science Open Access Repository (SSOAR) für die Sozialwissenschaften).
Wie der Zugriff für Nutzende ist auch die Bereitstellung der wissenschaftlichen Publikation für Autorinnen und Autoren auf institutionellen oder disziplinären Repositorien in der Regel entgeltfrei.

Die Scholarly Publishing & Academic Resources Coalition (SPARC), ein Zusammenschluss von Akademien, Bibliotheken und Forschungsorganisationen, empfiehlt den Aufbau wissenschaftseigener Publikationsinfrastrukturen. Auch die Hochschulrektorenkonferenz hat bereits im Jahr 2002 eine Empfehlung herausgegeben, in der die Hochschulleitungen aufgefordert werden, Umstrukturierungsprozesse im Publikationswesen durch Bereitstellung geeigneter Infrastrukturen zu fördern – entweder durch das Betreiben von Hochschulservern oder durch Gründung von hochschuleigenen Verlagen. Inzwischen bieten viele Universitäten und Forschungseinrichtungen ihren Mitgliedern die elektronische Archivierung auf eigenen Dokumentenservern an.
(https://open-access.net/informationen-zu-open-access/repositorien/) 01.2017

 

Was ist Open Access?

Ziel der Open-Access-Bewegung ist es, wissenschaftliche Literatur und wissenschaftliche Materialien für alle Nutzerinnen und Nutzer kostenlos im Internet zugänglich zu machen. Wissenschaftliche Literatur soll kostenfrei und öffentlich im Internet zugänglich sein, so dass Interessierte die Volltexte lesen, herunterladen, kopieren, verteilen, drucken, in ihnen suchen, auf sie verweisen und sie auch sonst auf jede denkbare legale Weise benutzen können, ohne finanzielle, gesetzliche oder technische Barrieren jenseits von denen, die mit dem Internet-Zugang selbst verbunden sind. In allen Fragen des Wiederabdrucks und der Verteilung und in allen Fragen des Copyright überhaupt sollte die einzige Einschränkung darin bestehen, den jeweiligen Autorinnen und Autoren Kontrolle über ihre Arbeit zu belassen und deren Recht zu sichern, dass ihre Arbeit angemessen anerkannt und zitiert wird.

Möglich wurde die Einrichtung von kostenfreien Dokumentenarchiven durch die Entwicklung der Software EPrints, die es erlaubt, wissenschaftliche Texte so zu archivieren, dass andere Wissenschaftlerinnen und Wissenschaftler entgeltfrei darauf zugreifen und in dem Gesamtbestand recherchieren können. Um eine serverübergreifende Abfrage von Metadaten zu garantieren, gründete sich 1999 die Open Archives Initiative(OAI), die Standards zur effizienten Recherche über verschiedene Server hinweg entwickelt hat.

Ursprünge der Open-Access-Bewegung

Den Grundstein der Open-Access-Bewegung legte Paul Ginsparg, der 1991 den Server ArXiv am Los Alamos National Laboratory (LAN-L) einrichtete, um Preprints in der Physik frei zugänglich zu machen. Weitere führende Akteure und Mitbegründer der Open-Access-Bewegung sind insbesondere Peter Suber, Professor für Philosophie am Earlham College in Richmond/Indiana, und der ungarische Kognitionswissenschaftler Stevan Harnad.
siehe http://open-access.net/de

 

Open Archives Initiative (OAI)


Die Open Archives Initiative (OAI) ist eine Initiative von Betreibern von Dokumentenservern, um die auf diesen Servern abgelegten elektronischen Publikationen im Internet besser auffindbar und nutzbar zu machen. Dazu werden verschiedene einfache Techniken entwickelt und bereitgestellt, insbesondere das OAI Protocol for Metadata Harvesting (OAI-PMH) zum Einsammeln und Weiterverarbeiten von Metadaten. Als Grundprinzip von OAI gilt die freie Weitergabe von Metadaten.

 

ROAR
keine Sportauspuffanlage! 🙂 sondern
Registry of Open Access Repositories (Homepage) der University of Southampton, UK.
ca. 3000 Repositories sind zur Zeit dort registriert.

OpenDOAR
Directory of Open Access Repositories (Homepage) der University of Nottingham, UK.
ca. 3000 Repositories sind zur Zeit dort registriert.


OAI Protocol for Metadata Harvesting (OAI-PMH)

Das XML basierte OAI Protocol for Metadata Harvesting (OAI-PMH) dient dem Sammeln von Metadaten, die von Data Providern bereitgestellt werden. Diese werden von Service Providern aufbereitet und für Suchanfragen im Internet bereitgestellt. Eine derartige Automatisierung kann nur erfolgreich etabliert werden, wenn es eine Einigung über den verwendeten Metadatenstandard gibt. OAI-PMH verlangt Daten, die mindestens dem Standard Dublin Core (DC) entsprechen, empfiehlt aber MARC.
Die Service Provider stellen für die User Suchmaschinen wie OAIster bereit, um die Metadaten einfach und serverübergreifend zu durchsuchen.


Um auch neueren Medien gerecht zu werden, wird seit 2007 ein Verfahren namens OAI Object Reuse and Exchange (OAI-ORE) geschaffen, das die Metadaten von digitalen Objekten abbilden kann. Dokumente, die als digitale Objekte bezeichnet werden, bestehen aus mehreren zusammengehörenden Dateien, so zum Beispiel verschieden Formate einer Datei (pdf, html, …) oder Übersetzungen oder externe Bilder oder Verknüpfungen oder …. . Es wird eine sogenannte Resource Map angelegt, die diese Strukturen abbildet.

 


OAIster wurde von der University of Michigan entwickelt und stellt über die Website www.oaister.org eine Suchmaschine zur Verfügung, die die Metadaten von allen Data Providern in Form von durchsucht.

 


 


Deutsche Initiative für Netzwerkinformation

Die Entwicklung der modernen Informations- und Kommunikationstechnologie verlangt einen Wandel innerhalb der Informationsinfrastrukturen der Hochschulen und anderer Forschungseinrichtungen. Der Umgang mit diesem Wandel ist ein zentrales Thema in der deutschen Hochschullandschaft und setzt mehr als bisher Absprachen, Kooperation, Empfehlungen und Standards voraus. Um diesen Umgang zu koordinieren und zu unterstützen, wurde die Deutsche Initiative für Netzwerkinformation (DINI) eingerichtet. Die Verbesserung der Informations- und Kommunikationsdienstleistungen und die dafür notwendige Entwicklung der Informationsinfrastrukturen an den Hochschulen und Fachgesellschaften soll regional und überregional gefördert werden. Durch Absprachen und Arbeitsteilung zwischen den Infrastruktureinrichtungen kann das Dienstleistungsangebot weiter verbessert werden. Über diese Zusammenarbeit der Infrastruktureinrichtungen hinaus ist die gemeinsame Entwicklung von Standards und Empfehlungen erforderlich.

Arbeitsgruppen

E-Framework E-Learning Elektronisches Publizieren (E-Pub) Forschungsinformationssysteme (FIS) Kompetenzzentrum Interoperable Metadaten (KIM) Lernräume Videokonferenztechnologien und ihre Anwendungsszenarien (VIKTAS) Virtuelle Forschungsumgebungen (vForum)

DINI-Übersicht aller deutschen Repositorien, davon mit DINI-Zertifikat.


Mehrwertdienste für digitale Repositorien


Das „Open-Access-Netzwerk“ (OA-Netzwerk) ist ein Projekt der DINI und zielt auf eine verstärkte Vernetzung von Repositorien, um den deutschen Forschungsbeitrag national und international sichtbarer zu machen. Hintergrund ist, dass digitale Sammlungen im Hinblick auf Wahrnehmung und Nutzung erst in einer organisatorisch und technisch vernetzten Umgebung ihre optimale Wirkung entfalten.

OA-Netzwerk stellt Dienste auf der Basis von aggregierten Daten der DINI-zertifizierten Repositorien bereit:

  • Kumulative Suche über Volltexte und Metadaten
  • Übergreifendes Browsing entlang von Klassifikationen
  • Automatische Benachrichtigung über neue Dokumente (Alerting)
  • Anbindung an weltweite Nachweisdienste
  • Exportfunktionen in gängige Datenbankformate
  • Anbindung an Druckdienste (Print on Demand)
  • Nutzungsstatistik und Zitationsanalyse (Entwicklungen aus weiteren DINI-Projekte)

 

Die Open-Source-Software OPUS wurde Ende der 1990er Jahre an der Universitätsbibliothek Stuttgart entwickelt, ist in php4 geschrieben und kann mit beliebigen SQL-Datenbanken betrieben werden. OPUS ist für Hochschulen frei verfügbar und basiert auf ebensolchen Softwarekomponenten. Es ist heute mit ca. 80 Installationen die in Deutschland am weitesten verbreitete Software für Hochschulschriftenserver, deren Datenbestände gemeinsam recherchiert werden können. Bibliotheks-Service-Zentren hosten OPUS auf eigenen Servern für Bibliotheken, die die Software nicht selbst betreiben wollen.

OPUS ermöglicht das Einstellen, Administrieren und Recherchieren von elektronischen Publikationen über das Internet.
Dokumente können auf einen (Volltext)Server im pdf-Format hochgeladen werden und die für die Wiederauffindbarkeit wichtigen Metadaten, das mind. aus fünfzehn Basiselementen bestehende Dublin Core Metedata Element Set (DC), werden über ein HTML Formular eingegeben (Beispiel). Die Eingabe bibliographischer Daten ohne Volltexte ist ebenfalls möglich.
Um eine dauerhaften und stabilen Adressierung von Dokumenten zu gewährleisten werden Uniform Resource Names (URN) auf der Basis der NBN (National Bibliography Number) vergeben. Der Namensraum NBN geht auf eine gemeinsame Initiative der Nationalbibliotheken zurück, die Hoheit für die NBN obliegt in jedem Staat bei der jeweiligen Nationalbibliothek (Deutsche Nationalbibliothek).

Zur Verbesserung der Suche und um einen einfachen Datenaustausch zu ermöglichen, wurden die im Rahmen der Open Archives Initiative entwickelten Verfahren und Werkzeuge in OPUS integriert:
Mittels der XEPICUR Schnittstelle (XML-Datentransferformat zur Verwaltung von Persistent Identifiers) werden diese automatisch an die Deutsche Nationalbibliothek gemeldet, deren XMetaDiss Schnittstelle ein Metadatenformat bereitstellt, das zu internationalen Standards kompatibel ist, damit deutsche Online-Hochschulschriften auch in internationale Metadatensuchmaschinen eingebunden werden können.
Eine im Web verfügbare Maske ermöglicht eine Suche in den Volltexten mit der Search Engine: htDig und eine Suche innerhalb der Metadaten.


 

 

MyCoRe = My Content Repository ist ein ist ein hochkomplexes und modulares System zur Entwicklung von Dokumenten- und Publikationsservern, Archivanwendungen, Sammlungen von Digitalisaten oder vergleichbaren Repositorien und basiert auf der Ende 1997 an der Universität Essen entwickelten Dokumentenserversoftware MILESS.

Es gibt ca. 20 Installationen in Deutschland.

Das CoRe in MyCoRe steht für „Content Repository“ oder wahlweise für „Core“ (Kern), das „My“ für die lokale Anpassung und Nutzung. Der Open Source Kern ist als eine in der Programmiersprache Java implementierte Klassenbibliothek (mycore.jar) realisiert.
Auf MyCoRe basierende Anwendungen nutzen einen gemeinsamen Kern, der die typischerweise für solche Anwendungen erforderliche Funktionalität wie Metadatenverwaltung, Suchfunktionen, OAI Schnittstelle, ein Bildbetrachtungsmodul etc. bereitstellt. Dieser Kern kann um eigene, spezielle lokale Funktionen erweitert und per Konfiguration angepasst werden.

MyCoRe Architektur

Aber Achtung: MyCoRe ist keine vollständige, unmittelbar einsetzbare Repository Software wie etwa OPUS oder EPrints, sondern ein Werkzeug zur Erstellung solcher und ähnlicher Anwendungen. Die Stärken von MyCoRe liegen in der Bereitstellung mächtiger, umfangreicher Funktionen und in der Flexibilität, beispielsweise sind das Metadatenmodell, die Weboberflächen, Such- und Eingabemasken frei konfigurierbar.

Funktionen

„Die Kernsoftware verfügt über alle wichtigen Funktionen, die ein Institutionelles Repositorium anbieten sollte: Unterstützung des Publikationsprozesses vom Autorenupload zur Klassifikation, Konfigurierbarkeit der Oberfläche und des Datenmodells über XML, Bereitstellung wichtiger Schnittstellen wie URNs, OAI, XMetaDiss, XEPICUR, Z39.50, MAB2, SOAP. Es unterstützt ein Video-Streaming
sowie eine Suche über Metadaten und Volltexte, selbst bei verteilten MyCoRe-Anwendungen. Damit ist das System auf den deutschen Raum spezifiziert und kann ohne größere Anpassungen sofort eingesetzt werden. Die Voraussetzung für einen längerfristigen Einsatz an einer Einrichtung, will man das Potenzial des Systems vollständig ausnutzen, ist allerdings die Bereitstellung von Programmierkapazitäten für Java-basierte Technologien.“
(Dobratz: Open-Source-Software zur Realisierung von Institutionellen Repositorien. ZfBB 54 (2007) 4-5, S.199-206.S. 204 )


 


Homepage

Die Open Source Software EPrints wird seit 2000 von der School of Electronics and Computer Science an der University of Southampton, England, entwickelt und betreut. Sie eignet sich zum Aufbau von institutionellen Open Access Repositorien, ist aber auf Self Archiving, also die Eigenpublikation von Wissenschaftlerinnen und Wissenschalftlern ausgerichtet.

EPrints ist in Perl geschrieben, arbeitet mit SQL Datenbanken und auf eine LAMP Architektur ausgerichtet, benötigt also ein Unix (Linux) Betriebsystem und einen Apache http Server. Seit einiger Zeit steht eineWindowsversion zur Verfügung.
Grundsätzlich ist es in der Standarddistribution einfach zu installieren und zu konfigurieren, erst das Einbinden von Erweiterungen erfordert Programmierkenntnisse.
EPrints verfügt über eine OAI-Schnittstelle, ermöglicht den Export der Metadatenformate MODS, METS, BiBTeX, OpenURLContextObject und unterstützt URNs. Ähnlich wie OPUS für den Einsatz in Deutschland optimiert ist, ist EPrints auf den englischsprachigen Bereich ausgerichtet und muss dementsprechend angepasst werden. Ein Hosting ist grundsätzlich möglich.


Referat

Das Referat zum Thema Digital Library – Digital Repository sollte mindestens enthalten:

  1. Was sind Repositorien?
  2. Was ist die Open-Access-Bewegung?
  3. Problem der Sichtbarkeit von Repositorien
  4. Lösungsversuche (ROAR – DOAR – OAI )
  5. Was ist das OAI Protocol for Metadata Harvesting (OAI-PMH)?
    Welches Problem soll dieses Protokoll lösen?
    Was ist ein Data Provider, was ein Service Provider und wie funktioniert das Protokoll?
  6. Was ist OAI Object Reuse and Exchange (OAI-ORE)?
  7. Was ist die DINI?
  8. Was ist OPUS?
  9. Was ist MyCoRe? Architektur erläutern.
  10. Was ist EPrints?