Datenmodell

Warning

Dieses Kapitel ist nichtmehr aktuell!

Im Folgenden das Datenbankschema des Property Graphen beschrieben. Die RDF-Daten im Triple-Store folgend dagegen bislang keinen Schema sondern werden so eingespielt wie sie geliefert werden.

Als Sammlungsübergeifendes Datenmodell wird CIDOC-CRM (CRM) verwendet. Weitere Ontologien müssen auf CRM gemappt werden. Darüber hinaus werden eine Reihen von etablierten Vokabularen wie ICONCLASS, GND und die LIDO-Terminologien unterstützt.

Modellierung

Die Modellierung ist noch nicht abgeschlossen! Überlegungen zur Abbildung von CRM in RDF befinden sich hier.

Entitäten und Knoten

Zwischenzeitlich gelöschte und umbenannte Klassen können weiterhin verwendet werden, allerdings werden diese durch Expansion auf die neueste Form gemappt.

Elementare Datentypen

Die folgende CRM-Klassen für elementare Datentypen werden nicht als Knoten-Label verwendet. Ihre Instanzen werden im Datenmodell stattdessen als Property-Werte abgebildet:

Instanzen der folgenden CRM-Klassen werden ebenfalls wenn möglich nicht als Knoten sondern als Property-Werte abgebildet. Anderenfalls erfolgt die Expansion nur über die übergeordnete Klasse E41 Appellation:

Relationen und Kanten

CRM-Properties (nicht zu verwechseln mit Eigenschaften im Property-Graph Datenbankmodell) werden im Property-Graphen durch Kanten-Label modelliert.

[Expansion] von Kanten-Label ist noch nicht umgesetzt!

Inverse CRM-Properties sind noch nicht berücksichtigt!

Eine Ausnahme bilden die folgenden CRM-Properties für elementare Datentypen, die stattdessen zu Property-Keys werden (siehe folgender Abschnitt).

Beispiel

Folgender in CIDOC-CRM modellierter Teilgraph (in Turtle-Syntax):

@prefix crm: <http://www.cidoc-crm.org/cidoc-crm/> .

<http://objekte-im-netz.fau.de/palaeo/id/5af2f810b638d>
  a crm:E16_Measurement ;
  crm:P40_observed_dimension <http://objekte-im-netz.fau.de/palaeo/id/5b3540e7cea41> .

<http://objekte-im-netz.fau.de/palaeo/id/5b3540e7cea41>
  a crm:E54_Dimension ;
  crm:P2_has_type <http://objekte-im-netz.fau.de/palaeo/id/5e3eb2d5dc30b> ;
  crm:P91_has_unit <http://objekte-im-netz.fau.de/palaeo/id/5b353177d6480>
  crm:P90_has_value 2.8 .

<http://objekte-im-netz.fau.de/palaeo/id/5b353177d6480>
  a crm:E58_Measurement_Unit ;
  crm:P48_has_preferred_identifier <http://objekte-im-netz.fau.de/palaeo/id/5b353177d64bc> .

<http://objekte-im-netz.fau.de/palaeo/id/5e3eb2d5dc30b>
  a crm:E55_Type .
  crm:P48_has_preferred_identifier <http://objekte-im-netz.fau.de/palaeo/id/5e3eb2d5dc310> ;

<http://objekte-im-netz.fau.de/palaeo/id/5e3eb2d5dc310>
  a crm:E42_Identifier ;
  crm:P3_has_note "Höhe (Scan)" .

<http://objekte-im-netz.fau.de/palaeo/id/5b353177d64bc>
  a crm:E42_Identifier ;
  crm:P3_has_note "cm" .

Vokabulare

Die konkrete Modellierung und Implementierung ist noch in Arbeit.

Ausgewählte kontrollierte Vokabulare werden zentral in den Property Graphen eingespielt. Das Datenmodell dafür basiert auf CIDOC-CRM und SKOS mit folgenden Bestandteilen:

  • Vokabulare haben die Property uri mit der BARTOC-URI des Vokabulars als Wert und die Label E32_Authority_Document (E32 Authority Document) sowie ConceptScheme zur Markierung, dass sie als Vokabular eingespielt wurden.

  • Konzepte haben eine Property uri und können unterschiedliche Label haben. Der allgemein Fall ist E55_Type. (E55 Type). Darüber hinaus erhalten sie das Label Concept zur Markierung, dass sie aus einem Vokabular statt aus einer Lieferung von Forschungsdaten stammen.

  • Konzepte werden ihrem Vokabular mit dem Kanten-Label inScheme zugeordnet. Die entsprechende inverse CRM-Property P71 lists wird nicht verwendet.

  • Konzepte können mit den Kanten-Labeln broader miteinander verknüpft werden. Die entsprechende CRM-Property P127 has broader term wird nicht verwendet.

  • Konzepte können eine interne ID oder Notation haben (Property notation)

  • Konzepte sollten Benennungen haben (Property label und labelLang)

Darüber könnten folgende CRM-Bestandteile eine Rolle spielen:

NoteBeispiel

GND-Datensatz zu “Schleswig-Holstein”:

gnd :ConceptScheme :E32_Authority_Document             # GND
  uri: http://bartoc.org/en/node/430

sh :Concept :E55_Type :E42_Identifier            # Schleswig-Holstein
  uri: https://d-nb.info/gnd/4052692-6

sh -> gnd :inScheme