Metadaten modellieren und Schnittstellen nutzen (Teil 1)

Am Anfang der Vorlesung wurde DAS Übersichtsbild, welches am ersten Tag gezeigt wurde, nochmals aufgeschaltet. Dieses Mal hat die Grafik schon mehr Sinn gemacht, da mir die Begriffe links alle inzwischen bekannt sind und auch klar ist was der Verbindungspfeil “OAI-PMH” macht, da diese Schnittstelle mit der Übung 2 getestet wurde.

sdfsdf

In der heutigen Vorlesung sollten nun die nächsten Schritte mit VuFindHarvester bis zum marcEdit (XSLT) durchgegangen werden. Bei OAI-PMH handelt es sich um ein Übertragungsprotokoll für Metadaten. Es eignet sich besonders für grosse Datenabzüge und regelmässige Aktualisierungen. Daneben gibt es zum Beispiel Z39.50, wobei dieser sehr alt ist und vor allem für Live-Abfragen und gezielte Datenabrufen mit vielen Parametern genutzt wird. Auch SRU wird für diese Zwecke oft eingesetzt.

In dieser Vorlesung setzen wir auf OAI-PMH. Dazu wird das Tool VuFindHarvest eingesetzt, welches ein OAI-Harvester ist. Somit “erntet” dieses Tool Daten über OAI-Schnittstellen, welche angeboten werden. Bei der durchgeführten Übung wurde Koha und ArchiveSpace, mit welchen wir schon in früheren Vorlesungen gearbeitet haben, gestartet und der VuFindHarvest 4.1.0 installiert. Die Installation war sehr einfach, da wiederum alle benötigten Codes von den Dozenten zur Verfügung gestellt wurden. Mit dem neu installierten Tool konnten dann die Daten aus Koha und ArchivesSpace ganz einfach “geerntet” und auf der VM gespeichert werden. Daneben hatte ich bereits aus der letzten Übung Daten aus DSpace kopiert. Somit stellte sich die Datensituation wie folgt dar: • Aus Koha Daten im MARC21-XML Format • Aus ArchiveSpace Daten im EAD Format • Aus DSpace Daten im DC Format

Diese verschiedenen Formate sollten nun einheitlich auf MARC21-XML konvertiert werden. Diese Konvertierung von einem Metadatenstandard in einen anderen nennt man auch “Crosswalks”. Er beinhaltet Regeln, das sogenannte Mapping, zur Konvertierung. Leider ist meist eine 1:1-Zuordnung jedoch nicht möglich. Die angewandte Programmiersprache ist für XML-Dokumente standardmässig XSLT.

Um die Konvertierung durchzuführen wurde die Software MarcEdit 7 installiert und die Konfigurationen danach angepasst. Nach diesen Schritten konnten dann einige Daten sehr einfach konvertiert werden. Bei den EAD Daten musste ein Zwischenschritt eingefügt werden, da dieses Format nicht direkt nach MARC21-XML konvertiert werden konnte. Nach der Konvertierung wurde festgestellt, dass es minimale Verluste gab.

Schlussendlich kann ich sagen, dass ich nach dieser Vorlesung endlich den Gesamtkontext des Moduls sehe, da heute die Zusammenhänge zwischen diesen x Systemen und was damit bezweckt werden soll endlich klar wurde.