diff --git a/document.tex b/document.tex new file mode 100644 index 0000000..8a10767 --- /dev/null +++ b/document.tex @@ -0,0 +1,241 @@ +\documentclass[a4paper,12pt]{article} +%\usepackage[utf8]{inputenc} + +%\setmainfont{arial} +\usepackage{ngerman} +\usepackage{euler} +\usepackage{vertbars} +\usepackage{graphicx} +\usepackage{tabularx} +\usepackage{hyperref} +\usepackage{rotating} +\usepackage{imakeidx} +%usepackage{newfloat} +%usepackage{endfloat} +\usepackage{fontspec} + +\makeindex[name=ont] +\newcommand{\ontclass}[1]{\emph{#1}\index[ont]{#1}} + +\newcommand{\ontcomment}[1]{\emph{#1}\index[ont]{#1}} + +\newcommand{\ontprop}[1]{\emph{#1}\index[ont]{#1}} + +\newcommand{\ontgraph}[1]{\emph{#1}\index[ont]{#1}} +\title{Modellierung der Daten für den Atlas der Innovationen} +\author{Dirk Wintergrün} + +\begin{document} +\maketitle +\tableofcontents + +\section{Einführung} +Im folgenden wird ein Datenmodell für den Atlas der Innovationen vorgeschlagen. +Ausgangslage ist, dass das Datenmodell flexibel erweiterbar sein soll, wenn neue +Innovationsgruppen aufgenommen werden sollen und sich neue Fragen an vorhandenen +Daten ergeben. + +Außerdem sollte es mittelfristig an den am Institut im Aufbau befindlichen +Knowledge-Graphen anschlußfähig sein, in dem alle Daten des Institutes +zusammengeführt werden sollen. Angestrebt wird eine Kompatibilität zu dem +innerhalb von Ariadne \cite{_ariadne_2017} entwickelten Modell für archäologische Daten CRMArcheo \cite{_crmarchaeo_2017}. +Das Datenmodell das Datenmodell des Institutes und CRMArcheo basieren auf dem gleichen +Referenzmodell CRM \cite{cidoc_crm_special_interest_group_cidoc_2015}, so dass eine Kompatibilität automatisch gegeben ist. + +Vorgegeben Werte werden für einzelnen Eigenschaften jeweils als +Vokabulare angelegt, auf deren Einträge wird dann dort verwiesen. Diese +Vokabulare können von den Nutzern erweitert werden. Dieses sollte in der Regel +jedoch nicht ad-hoc geschehen, sondern als bewusste Projektentscheidung. + +In diesem Dokument, wird nicht die vollständige Kompatibilität zu CRM +dargestellt, sondern der Schwerpunkt liegt auf der Verständlichkeit für die +Fachwissenschaftler. + + + +\section{Das Grundkonzept der Datenstruktur} +Die Modellierung folgt immer dem folgenden Grundkonzept: + +\begin{itemize} + \item Datengruppen werden in Klassen aufgeteilt, diese Klassen erhalten + Unterklassen, die immer weiter spezifiziert werden. Es gilt immer das Prinzip + der Vererbung, d.h. Eingenschaften einer Oberklasse vererben sich immer auf + die Unterklasse können jedoch spezifiziert werden. + \item Ein Objekt ist jeweils eine Instanz einer Klasse und Eigenschaften von + Objekten werden als Relationen zwischen Objekten beschrieben, dieses + können auch Zahlen und Zeichenketten sein oder auch ein fest vorgegebenes + Vokabular. + \item In der Regel besteht der Wunsch nachzuvollziehen, welches Eigenschaft + von wem und warum hinzugefügt wurde, also Kommentare und Autoren anzufügen. Daher + sind Eigenschaften immer über ein sogenanntes "`Assignment"' an ein Objekt + angefügt, d.h. es wird immer ein Kommentar und ein Autor an das eigentliche + Datum angehängt. + \item Es ist möglich mehr als einen Wert oder eine anders Verständnis einer + Eigenschaft an Objekte anzuhängen. +\end{itemize} + +Die folgende Darstellung vereinfacht das Modell insoweit, dass die Assignments +nicht explizit aufgeschlüsselt werden. d.h. jede hier beschriebene Zuordnung +beschreibt immer die Zuordnung einer Eigenschaft, in der Online Darstellung +findet sich das komplexere Modell. Für den Anwender heißt dieses im +wesentlichen, wo gewünscht, steht immer ein Kommentarfeld, die Möglichkeit der Datierung dieses Eintrages, eventuell der +Verweis auf belegenden Quellen usw. für jede Eigenschaft zur Verfügung. Es läßt +sich also ausdrücken: "`Florian hat die Anzahl der Achsen zu 3 bestimmt, +aufgrund der Abbildung in A"'. + + + +\section{Die Grundidee für die Daten: Archäologisches Objekt und +domänenspezifische Aufteilung.} Die Metadaten werden in zwei Grundklassen aufgeteilt: + +\begin{itemize} + \item \textbf{Archäologische Grunddaten}: + \ontclass{GeneralObjectSpecification} + \item \textbf{Domänen spezifische Daten} für jede Innovationsgruppe: + \ontclass{DomainSpecificSpecification} +\end{itemize} + +Als Domäne ist bisher nur \ontclass{CarriageSpecification} realisiert, also die +Domäne der Wagen. + +\begin{figure}[h] +\includegraphics[width=0.9\textwidth]{images/mainclasses.png} +\caption{Übersicht über die Hauptgruppen der Metadaten} +\end{figure} + + +\subsection{GeneralObjectSpecification} + +Die allgemeinen Metadaten für jedes Objekt in der Datenbank sind in vier Gruppen +aufgeteilt: + +\begin{itemize} + \item \textbf{Identifier}, dh. in der Regel eine eindeutige ID in der + Datenbank, aber auch eventuell vorhandene Inventarnummern oder Signaturen URLS.: + \ontclass{ObjectIdentifierAssignment} + \item Daten, die sich auf die \textbf{Größe} des Objektes beziehen: + \ontclass{ObjectMeasurement} + \item Beschreibungen des \bf{Materials, des Fundzusammenhanges, allgemeine + Annotationen und die Datierung}: \ontclass{ObjectEnrichment} + \item Daten zur \textbf{Einordnung und Interpretation} des Objektes im Kontext + des Gesamtprojektes, die für alle Objekte gleich sind. +\end{itemize} + +\begin{figure}[h] +\includegraphics[width=0.9\textwidth]{images/generalObjectAssignment.png} +\caption{Metadaten Gruppen für alle Objekte} +\end{figure} + +\subsubsection{GeneralObjectSpecification:ObjectIdentifierAssignment} + +Hier werden Identifier zugeordnet, zur Zeit nur die ID aus der Datenbank. + +\subsubsection{GeneralObjectSpecification:ObjectMeasurement} + +Zugeordnet werden hier zur Zeit: +\begin{itemize} + \item \textbf{Breite}\ontclass{WidthMeasurement} + \item \textbf{Länge}\ontclass{LengthMeasurement} + \item \textbf{Höhe}\ontclass{HeigthMeasurement} + \item \textbf{Gewicht}:\ontclass{WeightMeasurement} +\end{itemize} + +\begin{figure}[h] +\includegraphics[width=0.9\textwidth]{images/objectMeasurement.png} +\caption{Messergebnisse} +\end{figure} + +\subsection{GeneralObjectSpecification:ObjectInterpretation} +Diese Klasse dient der Zuordnung von allgemeinen interpretativen Daten, die für +alle Objekte unabhängig von ihrer Innovationsgruppe erfasst werden sollen. + +\begin{itemize} + \item Festlegung der \textbf{Innovationsgruppe}, verweist auf ein Vokabular: + \ontclass{InnovationGroupAssignment} + \item Bestimmung der \textbf{Typology des Objektes}, verweist auf ein + Vokabular und es existieren hier Haupt- und Subtypen: + \ontclass{ArcheologicalTypologyAssignment} + \item Festlegung eines \textbf{Gewichtes für die Bewertung} bei statistischer + Auswertung, hier können unterschiedliche Gewichtungen abhängig vom Kontext + angegeben und abgefragt werden: \ontclass{WeightAssignment} +\end{itemize} + +\begin{figure}[h] +\includegraphics[width=0.9\textwidth]{images/objectInterpretation.png} +\caption{Interpretation der Objekte} +\end{figure} + +\subsection{GeneralObjectSpecification:ObjectEnrichment} +Die \ontclass{ObjectEnrichment} Gruppe umfasst vier Unterpunkte. +\begin{itemize} + \item Die \textbf{Zuordnung von Orten}, sowohl des Fundplatzes als auch des + derzeitigen Aufbewahrungsortes. Der Ort kann hier allgemein beschrieben werden oder auch + konkret mit Koordinaten versehen werden: \ontclass{ObjectLocationAssignment}. + \item Unterschiedliche Formen zusätzlicher \textbf{Bemerkungen zum Objekt}, + wie ein allgemeiner Kommentar oder eine Beschreibung des Fundkontextes: + \ontclass{ObjectAnnotationAssignment} + \item Verschieden Formen der \textbf{Datierung}, hier kann zusätzlich + spezifiziert werden, welche Datierungsmethode gewählt wurde. Es können mehrere Methoden und + Datierungen angegeben werden.(siehe \ref{sec:Datierung}) + \item Die Zuordnung einer (oder mehrer) \textbf{Materialgruppen}, hier wird + auf Vokabular verwiesen: \ontclass{ObjectMaterialGroupAssignment} +\end{itemize} + +\begin{figure}[h] +\includegraphics[width=0.9\textwidth]{images/objectEnrichment.png} +\caption{Weitere Angaben zu den Objekten} +\end{figure} + + +\subsection{Spezifikation für die Wagen} +Die Gruppe \ontclass{CarriageSpecificAssignment} umfasst alle Daten die +spezifisch für die Gruppe der Wagen aufgenommen werden. Diese ist unterteilt in +unterschiedliche Teilgruppen, in denen einzelne Details der Wagen beschrieben +werden. Das Diagramm \ref{fig:carriageSpecifications} gibt eine Übersicht. +Die Details können der Online Darstellung +\url{http://euler.mpiwg-berlin.mpg.de/aoi} entnommen werden. + +\begin{figure}[h]\label{fig:carriageSpecifications} +\includegraphics[width=0.9\textwidth]{images/carriageSpefication.png} +\caption{Metadaten zu den Wagen} +\end{figure} + +\section{Vokabulare} +Kontrolierte Vokabulare sehen wir für folgenden Eingeschaften vor: + +\subsection{Fundplatz/Findspot}\label{voc:Location} +Dieser enthält immer eine Addresse, dieses kann auch unbestimmt sein, wie +"`Mesopotamien (unbestimmter Ort)"' oder eine konkreten mit GIS Koordinaten +versehenes räumliches Gebiet oder einen Punkte beschreiben. + +Orten, können moderne Länder, Landschafts- oder Verwaltungseinheitsbezeichnungen +zugeordnet werden. + +\subsection{Materialgruppen}\label{voc:Materialgruppen} +TO BE DEFINED + +\subsection{Kontexttypen}\label{voc:Kontexttypen} +TO BE DEFINED + +\subsction{Holder}\label{voc:Holder} +Aufbewahrenden Orte von Objekten, wie Museen, Archive, Bibliotheken,\ldots + +\subsection{Innovationsgruppen}\label{voc:Innovationsgruppe} +Beschreibung der definierten Innovationsgruppen und Subgruppen + +\section{Datierung}\label{sec:Datierung} +Bei der Datierung wird erfasst: +\begin{itemize} + \item Eine Zeitspanne (oder eine genaue Zeit), wenn vorhanden.Es kann hier + mehr als eine mögliche Zeitspanne geben. + \item Eine Archäologische Datierung mit Kommentar. + \item Ein Kommentar zur Datierung + \item Eine Typisiserung der Datierungsmethode (z.b: C14) +\end{itemize} + +\printindex[ont] +\end{document} + + + +