Einführung in Metadaten
OER-Baustein zur Einführung in das Thema Metadaten
In diesem Skript wird erklärt, was Metadaten sind, welche Arten von Metadaten es gibt und warum es für jede Forschungsarbeit relevant ist, Dateien, Datensätze und die Forschungsarbeit an sich mit Metadaten zu versehen. Die Zielgruppe dieser Einheit sind Studierende (BA und MA) und Promovierende in Fächern, die sich mit dem materiellen Erbe der Menschheitsgeschichte beschäftigen. Die fachspezifischen Beispieldaten sind an dieser Zielgruppe orientiert.
Metadaten, Forschungsdatenmanagement
1 Einleitung
Metadaten sind Daten über Daten. Sie beschreiben einen Datensatz oder einzelne Teile davon, sodass sowohl Menschen als auch Maschinen ihn verstehen können. Dies ist insbesondere dann relevant, wenn man selbst oder andere die Daten (in anderen Kontexten) wiederverwenden möchten. Metadaten gehören damit zu den Grundlagen für wissenschaftliches Arbeiten.
Lernziele
Die Zielgruppe dieser Einheit sind Studierende (BA und MA) und Promovierende in Fächern, die sich mit dem materiellen Erbe der Menschheitsgeschichte beschäftigen. Die fachspezifischen Beispieldaten sind an dieser Zielgruppe orientiert.
Die Lernenden werden zu folgenden Lernzielen nach Petersen u. a. (2025) befähigt:
- den Begriff Metadaten zu erläutern (LZ-ID 03_002_0626),
- die Relevanz von Metadaten zu erläutern (LZ-ID 03_002_0629),
- verschiedene Arten von Metadaten zu benennen (LZ-ID 03_002_0627),
- die FAIR-Prinzipien zu benennen (LZ-ID 01_007_0117).
Vorwissen
Es wird kein spezielles Vorwissen vorausgesetzt.
2 Was sind Metadaten und wofür brauche ich sie
Metadaten beschreiben den Inhalt, die Entstehung und den Kontext von Daten. Sie ermöglichen es, Informationen zu finden, zu veröffentlichen und wiederzuverwenden. Sie helfen dabei, Forschungsergebnisse einzuordnen, transparent und nachvollziehbar zu machen.
Warum Metadaten essenziell sind für das Verstehen und Benutzen von Daten, lässt sich an folgenden Beispielen verdeutlichen:
Szenario 1: Stellen Sie sich vor, Sie stoßen in alten Aufzeichnungen auf diesen Scan eines Grundrisses. Der Scan trägt noch den Namen, den der Scanner automatisch vergeben hatte, und Sie haben damals vergessen, sich Notizen zu dem Scan oder dem abgebildeten Objekt zu machen. Möglicherweise erinnern Sie sich noch daran, was der Plan zeigt, aber werden Sie sich noch daran erinnern, aus welcher Publikation er stammt, wer der/die Urheberin des Plans ist? Ohne diese Angaben können Sie den Scan nicht weiter verwenden.
Szenario 2: Sie übernehmen ein Projekt, in dem schon Vorarbeiten geleistet wurden. In den Unterlagen finden Sie eine Tabelle, für die es keine Angaben zu Inhalt, Autor:innen oder eine Beschreibung der Abkürzungen gibt. Sie müssen entweder viel Zeit darauf verwenden, die fehlenden Informationen einzuholen, oder Sie werden die Daten nicht weiter verwenden können.
Szenario 3: Sie stoßen in Ihrer Forschung auf eine ältere Datensammlung. Die Dateien heißen „Manuskript neu“ oder „Aufsatz“. Angaben zu Autor:in, Ort oder Methode fehlen. Die Daten sind damit praktisch unbrauchbar.
Durch eine eindeutige Dateibenennung, eine sinnvolle Ordnerstruktur und eine README-Datei, in der die Ordnerstruktur und das Projekt beschrieben sind, können die Daten von fremden Personen verstanden und weiter genutzt werden. Zu Dateistrukturen siehe auch das NFDI4Objects-OER-Skript Dateiorganisation
Mit gut gepflegten Metadaten wäre in allen drei Beispielen sofort klar:
- Wer hat die Daten erhoben?
- Wann, in welchem Kontext und unter welchen Bedingungen wurden die Daten erhoben?
- Welche Lizenz erlaubt mir die Nachnutzung?
Dieses Beispiel zeigt: Metadaten sparen nicht nur anderen Zeit, sondern auch Ihnen selbst – spätestens, wenn Sie Ihre eigenen Daten nach längerer Zeit wiederverwenden möchten.
Die eigenen Forschungsdaten mit Metadaten anzureichern, gehört daher zur guten wissenschaftlichen Praxis1 und sie spielen eine zentrale Rolle bei der Umsetzung der FAIR-Prinzipien2.
Die sogenannten FAIR-Prinzipien bilden eine international anerkannte Leitlinie für den Umgang mit Forschungsdaten. Sie stehen für:
- Findable: Daten sollen auffindbar sein.
- Accessible: Daten sollen zugänglich sein.
- Interoperable: Daten sollen in unterschiedlichen Kontexten und Systemen verarbeitet werden können.
- Reusable: Daten sollen wiederverwendbar sein.
Gut dokumentierte Metadaten sind eine zentrale Voraussetzung, um Daten gemäß diesen Prinzipien nutzbar zu machen.
Mehr zu den FAIR-Prinzipien finden Sie beispielsweise bei GoFAIR, forschungsdaten.info oder in einer Handreichung zu FAIRem Datenmanagement von NFDI4Culture
3 Welche Arten von Metadaten gibt es
Wie am obigen Beispiel deutlich wurde, gibt es unterschiedliche Arten von Metadaten, je nach Informationsbedürfnis und Anwendungskontext. Egal ob sie ein Forschungsvorhaben in seiner Gesamtheit oder den Inhalt eines einzelnen Dokuments beschreiben, können sie sich auf folgende Aspekte beziehen (Auflistung nach IANUS3):
3.1 Typen von Metadaten
Fachlich und inhaltlich nähere Beschreibung des Projekts, eines Objekts oder einer Methode:
- Titel eines Textes
- Kurzbeschreibung eines Fotos
- Schlagwörter
- Autor:innen eines Textes
Beschreiben den Zusammenhang zwischen verschiedenen Teilen von Daten:
- Angabe von referenzierten Dateien in Zeichnungen
- Angabe der Reihenfolge von Fotos oder zusammengehörigen Dateien
- Beschreibung einer Ordnerstruktur
Rechtliche Metadaten benennen Rechteinhaber, Lizenzbedingungen und Zugangsregeln:
- Quellenangaben
- Angabe von Lizenzen, unter der Daten genutzt werden können
Erhaltungsbezogene Metadaten (auch Provinzienz-Metadaten genannt) lassen die Geschichte eines digitalen Objektes, also die vorhergehenden und gegenwärtigen Zustände, nachvollziehen und beschreiben Erhaltungsmaßnahmen:
- Herkunft einer Karte
- Dateiversion und Angabe von Änderungen an der Ursprungsversion
- Konvertierungsmaßnahmen
- Verwendete Software, Methoden und Geräte
- Bearbeitungsschritte
Liefern Informationen zu Software, Hardware und Dateiformaten:
- Dateiformat eines Bildes
- Zeichenkodierung eines Textes
- Technische Parameter eines Messgerätes
Die einzelnen Kategorien können sich überschneiden und kombiniert auftreten.
Eine etwas andere, jedoch ähnliche Unterscheidung von Metadaten, findet sich bei forschungsdaten.info:
- Bibliografische Metadaten wie Titel, Autoren, Beschreibung oder Keywords ermöglichen die Zitation von Daten und Code und helfen bei der Auffindbarkeit und thematischen Eingrenzung.
- Administrative Metadaten zu Dateitypen, Standorten, Zugriffsrechten und Lizenzen helfen bei der Verwaltung und langfristigen Erhaltung der Daten.
- Prozessmetadaten beschreiben die Schritte und Aktionen mit ihren verwendeten Methoden und Hilfsmitteln, die zur Entstehung und Verarbeitung der Daten angewendet wurden.
- Inhaltsbeschreibende bzw. deskriptive Metadaten können je nach Disziplin sehr unterschiedlich aufgebaut sein und geben zusätzliche Informationen zu Inhalt und Entstehung der Daten.
3.2 Metadaten auf unterschiedlichen Hierarchiebenen
Metadaten kommen außerdem auf jeder Ebene eines Projektes oder Datensatzes zur Anwendung. Sie können sich also beziehen auf:
| Hierarchie-Ebene | Beispiel |
|---|---|
| Datensammlung | Der gesamte Datenbestand eines Projektes |
| Datei | Ein Grabungsfoto oder das Manuskript zu einem Aufsatz |
| Information | Ein Datensatz in einer Datenbank oder die Auflösung von Abkürzungen innerhalb einer Tabelle |
3.3 Metadaten für Daten, Methoden und Prozesse
Weiterhin können Metadaten nicht nur Daten selbst sondern auch angewandte Prozesse und Methoden zur Generierung der Daten beschreiben. Dadurch wird der Entstehungsprozess von Dateien und Dateikonvoluten verständlicher und die Nutzenden bekommen Hinweise für den weiteren Umgang mit den Daten.
In den IANUS-IT-Empfehlungen werden im Abschnitt Metadaten in der Anwendung daher Metadaten in drei Kategorien unterschieden:
| Metadaten-Kategorie | Beschreibung |
|---|---|
| Projektbezogene Metadaten | Dokumentieren den gesamten Datenbestand eines Projektes |
| Dateibezogene Metadaten | Dokumentieren einzelne Dateien |
| Methodenbezogene Metadaten | Dokumentieren angewandte Prozesse und Methoden |
4 Häufige Stolperfallen, wenn Metadaten fehlen
Beim Arbeiten mit Daten treten in der Praxis oft typische Probleme auf, die ihre Verwendung für andere erschweren:
- Unvollständige Angaben: Wichtige Informationen wie Erstellungsdatum oder Autor:in fehlen.
- Inkonsistente Begriffe: Dasselbe Objekt wird mit unterschiedlichen Schlagwörtern beschrieben, was die Suche erschwert.
- Fehlende Angaben zu Nutzungsrechten: Ohne klare Hinweise zu Lizenzen ist eine Nachnutzung unsicher oder unmöglich.
- Nicht standardisierte Formate: Eigene, individuelle Kategorien erschweren die Zusammenarbeit mit anderen.
Verwenden Sie, wenn möglich, standardisierte Metadaten-Schemata (z. B. Dublin Core) und dokumentieren Sie Ihre Entscheidungen nachvollziehbar.
5 Ausblick
Es gibt zahlreiche etablierte Standards und Werkzeuge, die den Umgang mit Metadaten erleichtern:
- Dublin Core: Ein einfaches, weit verbreitetes Schema zur Beschreibung elektronischer und physischer Ressourcen wie Webseiten, Bilder und Videos mit 15 Metadatenelementen.
- ADeX: Bundesweiter Standard für den Datenaustausch zwischen Archäologischen Landesämtern und mit anderen Fachinstitutionen.
- LIDO: Ein XML-Schema zum Austausch von Metadaten zu Museums- und Sammlungsobjekten.
- CIDOC CRM: Eine komplexe Onthologie, die insbesondere in den Kultur- und Geschichtswissenschaften Anwendung findet.
- Repositorien wie Zenodo, Propylaeum-Dok oder IANUS verlangen strukturierte Metadaten, um Daten auffindbar und zitierbar zu machen.
Für Ihre eigenen Projekte empfiehlt es sich, sich frühzeitig mit passenden Standards vertraut zu machen.
Weiterführende Quellen und Informationen
Um das hier erlernte Wissen zu vertiefen, bietet sich eine Übung zu den verschiedenen Metadatentypen an, die ebenfalls als NFDI4Objects-Baustein zur Verfügung steht. Zusätzlich finden Sie unter den NFDI4Objects-OER-Bausteinen außerdem Übungen zu Normdaten und persistenten Identifikatoren, die eng mit dem Thema Metadaten zusammenhängen.
Konkrete Beispiele für die Anwendung von Metadaten finden Sie auch in anderen N4O-OER-Bausteinen z.B. zu Bilddaten oder Tabellendaten.
Im World Wide Web gibt es eine Fülle an Informationen zu Metadaten und damit verbundenen Themen. Exemplarisch seien hier genannt:
IANUS: In den FDM-Empfehlungen von IANUS, insbesondere den Unterkapiteln des Abschnitts zu Dokumentation werden die Themen Metadaten, Strukturierung von Metadaten, Kontrollierte Vokabulare, Thesauri und Normdaten, Speicherung von Metadaten und Metadaten in der Anwendung ausführlich behandelt mit Blick auf Archäologie und Altertumswissenschaften.
Forschungsdaten.info: insbesondere die Abschnitte zu Metadaten und Metadatenstandards, zu den FAIR-Prinzipien und zu Persistent Identifiers. Außerdem lohnt ein Blick auf die Hinweise und Empfehlungen für den Wissenschaftsbereich Archäologie
Die Handreichung für ein FAIRes Management kulturwissenschaftlicher Forschungsdaten von NFDI4Culture behandelt die Themen FAIR-Prinzipien, Metadatenstandards, Vokabulare, Normdaten und Anwendungsontologien insbesondere für Kulturwissenschaften und enthält darüber hinaus ausführliche Linksammlungen.
Nachnutzen
Alle sind herzlich eingeladen, diesen Baustein und die zugehörige Copyleft-Lizenz zu nutzen, um ihr Wissen und Expertise in die Verbesserung und Aktualisierung einzubringen. Alle können die Inhalte erweitern oder überarbeiten, zum Beispiel um Anwendungsszenarien und Nutzungskontexte zu erweitern.
Unser Wunsch ist ein lebendiges, stetig wachsendes Dokument, das sich durch die Beiträge vieler verändert - im Einklang mit eines sich wandelnden Umfelds. Wir freuen uns im Falle einer Überarbeitung über eine kurze Notiz – das ist aber selbstverständlich keine Pflicht.
🔗 Quarto-Quellcode dieses Bausteins
🔗 Dieses Skript nutzt das OER-Skript-Template von NFDI4Objects
Disclaimer: Einsatz von LLM
Bei der Erarbeitung dieses OER-Bausteins wurde für einzelne zielgruppengerechte Formulierungshilfen ChatGPT 5.0 genutzt.
Bibliographie
Fußnoten
Deutsche Forschungsgemeinschaft, Leitlinien zur Sicherung guter wissenschaftlicher Praxis. Kodex (Version 3, 27. Januar 2025)↩︎
Die FAIR-Prinzipien wurden 2016 von der FORCE 11-Community veröffentlicht. Anschließend wurden sie zunächst in die Förderrichtlinien des EU-Förderprogramms Horizon 2020 und danach in den Kodex „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“ der DFG aufgenommen. Damit sind sie aus der Wissenschaftslandschaft nicht mehr wegzudenken und Teil eines jeden wissenschaftlichen Projekts. forschungsdaten.info: FAIReDaten↩︎
IANUS, FDM-Empfehlungen - Dokumentation mit Metadaten (CC BY-SA 4.0)↩︎
Lizenz
Urheber:innen
Zitation
@misc{bruhn2026,
author = {Bruhn, Kai-Christian and Schröer-Spang, Sandra},
publisher = {Hochschule Mainz},
title = {Einführung in Metadaten},
date = {2026},
url = {https://nfdi4objects.github.io/oer-template-skript/},
doi = {XXXXXXX.XXXXXXX},
langid = {de},
abstract = {In diesem Skript wird erklärt, was Metadaten sind, welche
Arten von Metadaten es gibt und warum es für jede Forschungsarbeit
relevant ist, Dateien, Datensätze und die Forschungsarbeit an sich
mit Metadaten zu versehen. Die Zielgruppe dieser Einheit sind
Studierende (BA und MA) und Promovierende in Fächern, die sich mit
dem materiellen Erbe der Menschheitsgeschichte beschäftigen. Die
fachspezifischen Beispieldaten sind an dieser Zielgruppe
orientiert.}
}


