Linked Open Geodata in Mainz – Best Practices und Projekte im Kontext der Humanities

Thiery, Florian


Hotel Elbflorenz Dresden


talk DE CC BY PDF DOI10.5281/zenodo.1421690

Geodaten-Spezialisten behaupten 80% aller Daten besitzen einen Raumbezug, denn »Geodaten sind der Treibstoff der digitalen Gesellschaft«. Ob Geodaten, offene Geodaten oder verlinkte Geodaten – der Forschungsstandort Mainz ist hier in der Scientific Community sehr präsent. Dies gilt insbesondere für den Bereich der Digital Humanities des Kompetenzbereichs Wissenschaftliche IT am RGZM. Als Mitglied der Leibniz-Gemeinschaft und Gründungsmitglied des mainzed steht das RGZM mit der Scientific Community in engem Austausch. Im Rahmen des von der öffentlichen Hand geforderten „OOO-Modells“ (Open Source, Open Data, Open Access) ist die Nutzung quelloffener und freier Software von hoher Bedeutung. Aber hier gilt: »Software comes and goes. Mind the Data!« (Arnulf Christl). Zur offenen Bereitstellung von Daten im Allgemeinen und Geodaten im Speziellen, sind Standards wie OGC-Services und RDF essentiell. Von der Community vorangetriebene Initiativen für freie Geodaten wie OpenStreetMap und von der öffentlichen Hand bereitgestellte Geodaten über Geoportale, ermöglichen immer mehr Entwicklern die Schaffung von Geodaten-Anwendungen in World Wide Web. Dies gilt auch für raumbezogene Projekte in den Digital Humanities wie Pleiades, welche die „klassische Geodatenlandschaft“ um den Bereich des Altertums erweitern und Anwendungen wie Recogito der Pelagios Commons zur Schaffung von Linked Open Geodata in den Humanities ermöglichen. Der Vortrag gibt einen Einblick in Linked Open Geodata Best Practices und Projekte im Kontext der Humanities des RGZM unter Anwendung des „OOO-Modells“ und deren Standards und Technologien wie PostGIS und QGIS sowie Technologien der „Oracle Familie“ wie JAVA und deren „Geo- und Semantik-Abkömmlinge“ GeoServer, RDF4J und Apache Jena.

RDF based modeling of relative and absolute chronological data: Examples from the central african rainforest and roman periodisation

Seidensticker, Dirk Thiery, Florian Mees, Allard Schmid, Clemens

24th Annual Meeting of the European Association of Archaeologists (EAA2018)

University of Barcelona


talk EN CC BY PDF DOI10.5281/zenodo.1410516

Chronology in Archaeology contains many hidden assumptions. Chronological intervals resulting from data analysis are sometimes based on absolute “certain” datings (e.g. C14 or Roman emperor reign years) or derived from relative datings or combinations of these. This may even lead to circular argumentations with hidden contradictions. To produce verifiable chronological relations, a well documented data scheme containing all the relevant chronological archaeological information is required.We modeled this scheme as an RDF (Resource Description Framework) based ontology comprising Allen`s interval algebra and provided the results as Linked Open Data. This is exemplarily done by parsing CSV based datasets of two case studies, one concerning the Iron Age settlement history of the Central African rainforest, and the second focusing on a system for Roman period classification used at the RGZM in Mainz.The first case study was based on a recently finished PhD thesis and reviewed the current knowledge on the settlement history of the Central African rainforest. The available data derived from surveys and excavations between present-day Cameroon and Angola. Chronological relations between groups have been modeled within a RDF graph in order to produce a machine readable and processable semantic representation. Additionally, we used radiocarbon dates from the OpenAccess data repository Archives des datations radiocarbone d'Afrique centrale (aDRAC). For the second case study, we developed a workflow for the RGZM retrieval system “easydb” in which a wide variety of time interval descriptions is used. Apart from the historically definable Roman emperor reigning years, which can often be subdivided by the consulship years of an emperor, many descriptives such as “early Roman” or “late Roman/early Medieval” are regularly used but far from being precise. For both case studies using RDF based modeling generated a reproducible representation of the state of knowledge concerning the temporal sequences of time intervals.

Taming Time – Modelling uncertainty as reproducible Linked Open Data

Thiery, Florian Mees, Allard

24th Annual Meeting of the European Association of Archaeologists (EAA2018)

University of Barcelona


talk EN CC BY PDF DOI10.5281/zenodo.1402509

It is a stroke of luck that the RGZM (Römisch-Germanisches Zentralmuseum Mainz) hosts already since the mid-1990s several online available databases containing millions of datasets, with content from many different archaeological disciplines. These databases where constructed in interdisciplinary transnational projects and include a lot of “hidden archaeological assumptions” in their relational data models. Especially short cutted relative chronological information and its dependencies are not modelled using transparent methods. The aim of our project is to make these hidden assumptions in archaeology visible and provide them as Linked Open Data to establish reproducible research as a fundament for Open Science. In particular the Samian Research database at the RGZM offers nearly 250’000 identified potter stamps, which are traditionally dated in a short cutted way. In Roman archaeology this is usually expressed by establishing “absolute dates” in well known “from-to” tables, whereas in reality, the situation is much more diffuse. In fact, Limes fortress dating is often done based on circular arguments. Samian stamps, for example, are being dated by sites, which on their own are again being dated by Samian. This paper focuses on modelling these circular dating arguments using a relative chronology based on Allen’s interval algebra for temporal reasoning in the Academic Meta Tool (AMT) to create Linked Open Data for reproducible and transparent research. AMT allows us to create a fitting ontology and visualise the reasoning results in a web app for detecting errors and circular reasoning. As an example, we will take a deeper look into the relative chronological relationships of the Limes fortresses.

Looking for the "grey value" in research and geodesy: Is there right or wrong in software framework decisions?

Thiery, Florian Schmid, Clemens

XXXI. International Geodetic Student Meeting

Universitat Politècnica de València


talk EN CC BY PDF DOI10.5281/zenodo.1293990

Working in research institutes as geodesist and working in geodesy companies produces always the same question: Is there the “right” decision? Do we have to choose always the way right or left or is there some kind of “grey value”, changing from right to left and from the left to the right? In geodesy there are a lot of examples where the “right” decision is not objectively given - it always depends on the usage. Examples in geodesy (research) like QGIS vs. ArcGIS or Open Street Map vs. Google Maps show how difficult decisions are and that we are always looking for the “grey value” to switch from the left to the right side. In geodesy research and research in general we have to consider that it is always political. The “right” objective decision of a developer is often not concordant with the “right” political statement. For example open software and source code is better than close blackboxes to allow reproducibility and transparency, but proprietary software might be faster or more convinient to use. This paper will focus on searching the “grey value” and “right” decision in version control software in software development, here especially Git, because between GitHub and GitLab you always have to make two main decisions: visibility vs. open source and community vs. ethics of science.

Taming Ambiguity - Dealing with doubts in archaeological datasets using LOD

Thiery, Florian Mees, Allard

Computer Applications and Quantitative Methods in Archaeology (CAA)

Tübingen, Germany


talk EN CC BY PDF DOI10.5281/zenodo.1200111

The Linked Data Cloud is full of controlled resources, which in fact quickly run out of control. Firstly, each resource collection, e.g. a thesaurus, is cooking its own soup related to its research context. Secondly, conceptualisation of LOD assumes standardised data, but in reality, only generic concepts or real instances exist. Thirdly, archaeological items are usually related to generic instances in the LOD cloud, based on their object orientated nature. Describing these relations by modelling archaeological assumptions causes ambiguities which have to be tamed to guarantee data quality for reuse, demonstrated in three examples: (1) Trying to link a triangular “lateen sail” into the LOD cloud, a problem known from the NAVIS II ancient ship depictions database, reveals that each repository has completely different “hidden assumptions” in its hierarchies with respect to their scientific domain. Are the usually SKOS based relations able to solve the challenge to model also the degree of doubt? Are different methods required? (2) Trying to map pot fragments of Gaulish Terra Sigillata to historically defined concepts of “types” and “service families”, or aligning these typologies, ends up in modelling doubtful assumptions. Can metrics be used to define “type” definitions? How can an already existing online research community help? (3) Setting up a meta-index for aligning various distributed databases at the RGZM by keywords and linking into the LOD Cloud is subject to uncertainties within the modelling of relations. As a result, this process includes dealing with the above mentioned ambiguity challenges.

Putting Samian pots together – modelling ceramic service family roots – connecting figure types.
Wie Graphen bei der Modellierung des Zweifels helfen können.

Thiery, Florian Mees, Allard

Graphentechnologien 2018

Akademie der Wissenschaften und der Literatur Mainz


talk DE CC BY PDF DOI10.5281/zenodo.1155748

In der Archäologie wurde bereits seit mehr als 120 Jahren damit begonnen, die römische Keramikgattung Terra Sigillata in Einzelformen zu klassifizieren. Jedoch spielen Unsicherheiten und Zweifel bei der Bestimmung von dieser europaweit überaus häufig vorkommenden Manufakturware eine herausragende Rolle. Wie beim modernen Porzellan gibt es bei Terra Sigillata standardisierte "Service", d.h. verschiedene Formen (Teller, Näpfe, Schalen) gehören durch ähnlich gestaltete Ränder oder Standringe zur gleichen "Service-Familie". Da oft nur Bruchstücke von einem Rand oder einem Standring gefunden werden, kann in solchen Fällen höchstens eine Zuweisung zu einer oder mehreren Service-Familien erfolgen. Eine solche Unsicherheit in der Zuweisung gilt es zu modellieren. Darüber hinaus geben die mit Namen versehenen Töpferstempel Auskunft darüber, wer die einzelnen Gefäße hergestellt hat. Die Bestimmung dieser Töpferstempel ist für die Chronologie dieser Ware von großer Bedeutung, da z.B. abgebrochene oder beschädigte Stempel von jüngerem Datum sein dürften als noch vollständig erhaltene Namensstempel. Da die Stempel oft von Hand und in verschiedenen Winkeln in den noch weichen Gefäßboden eingestempelt wurden, sind sie somit oft auf dem ersten Blick nicht als identisch erkennbar. Hier ist das Kriterium der Vagheit das zu modellierende Model. Der Glücksfall, dass in einer am Römisch-Germanischen Zentralmuseum Mainz (RGZM) entwickelten Datenbank 250'000 gestempelte Gefäße des römischen Tafelgeschirrs Terra Sigillata in einem relationalen Datenmodell erfasst und über das Web verfügbar sind, ermöglicht das Ausloten der Grenzen der relationalen Datenmodellierung im Kontext der „Modellierung des Zweifels“ an Hand von realen Beispielen. Graphbasierte semantische Datenmodellierung bietet eine weitere interoperable und skalierbare Möglichkeit zur Lösung der Modellierung von Zweifel und Unsicherheiten bei der Zuweisung von Stempel und "Service-Familien". Die Präsentation zeigt Lösungsstrategien mittels einfachem OWL-Reasoning zur Modellierung des Zweifels in der RGZM Terra Sigillata Datenbank in Realtime-Beispielen.

Academic Meta Tool – Ein Web-Tool zur Modellierung des Zweifels

Thiery, Florian Unold, Martin

Graphentechnologien 2018

Akademie der Wissenschaften und der Literatur Mainz


talk DE CC BY PDF DOI10.5281/zenodo.1155727

Graphdatenbanken und Triple Stores stellen bei der Modellierung von Forschungsdaten eine Alternative zu relationalen Datenbanken dar. Eine Modellierung der Daten in einem Netzwerk, anstatt in Tabellenstrukturen, eignet sie sich hervorragend um Daten interoperabel zur Verfügung zu stellen, indem man zwei Knoten aus verschiedenen Datenbanken miteinander über eine Kante verbindet. Dieser Technik bedienen sich viele Forschungsprojekte durch die Verwendung von Linked Open Data (LOD). Sowohl gängige Graphdatenbanken als auch gebräuchliche Triple Stores bieten jedoch keine Möglichkeit Unsicherheiten oder Vagheiten zu modellieren. Um dieser Unzulänglichkeit Rechnung zu tragen, haben wir das Academic Meta Tool (AMT) entwickelt. AMT bietet die Möglichkeit sämtlichen Kanten eine Gewichtung hinzuzufügen, um dadurch die Vagheit dieser Kante auszudrücken. Eine Beziehung zwischen zwei Knoten besteht also nur zu einem gewissen Grad. Dieser Grad, d.h. das Kantengewicht, wird üblicherweise in Prozent angegeben. AMT beinhaltet zusätzlich ein Verfahren, mit dem - unter Zuhilfenahme einer vordefinierten Ontologie - aus vorhandenen graphbasierten Daten automatisch Schlussfolgerungen gezogen werden können (Reasoning). Ein Prototyp des AMTs steht als Web-Anwendung zur Verfügung. In einer entwickelten Test-Ontologie können Personen und Interessen und deren Beziehungen in einem gewissen Grad zueinander modelliert werden. Diese Ontologie beinhaltet neben den genannten beiden Klassen fünf weitere Relationen, so dass Personen und Interessen miteinander in Beziehung gesetzt werden können. Außerdem enthält die Ontologie 11 Axiome, um automatisiert aus bestehenden Beziehungen neue Beziehungen generieren zu können. Ein Testfall, basierend auf der zuvor beschriebenen Ontologie, bildet die Beziehungen innerhalb des mainzed (Mainzer Zentrum für Digitalität in den Geistes- und Kulturwissenschaften) Netzwerks ab. Die Mitglieder des Netzwerks stehen in fachlichen bzw. hierarchischen Beziehungen zueinander. Zudem haben die Mitglieder des heterogenen Netzwerks viele unterschiedliche Interessen, die wiederum in einer SKOS-ähnlichen Taxonomie modellierbar sind. In einer Community Aktion haben die Mitglieder jeweils ihre Sicht auf das Netzwerk dargestellt, das heißt Beziehungen und Interessen, sowie deren Vagheitsgrad angegeben. AMT kann nun dieses Netz visualisieren und weitere Schlussfolgerungen ziehen, das heißt neue Beziehungen aufzeigen, welche bei der Eingabe nicht erkennbar waren, so dass dies einen Mehrwert für das Netzwerk bildet. Der beschriebene Testfall lässt sich auch auf andere Datengrundlagen, wie historische Personen-Netzwerke, etc. extrapolieren. Außerdem lassen sich statt der Personen-Interessen-Ontologie auch beliebige andere Ontologien verwenden, die in das AMT-Schema passen. Mit AMT präsentieren wir somit ein generisches Tool, das Unsicherheiten und Vagheiten in bestehenden Forschungsdaten darstellen und neue Folgerungen daraus schließen kann.

Avalanches on Atlantis - Real or Fake? The "true" story!

Thiery, Florian Taani, Rania

XXX. International Geodetic Student Meeting

Faculty of Geodesy, University of Zagreb


talk EN CC BY PDF DOI10.5281/zenodo.817496

The mythical island Atlantis was an empire assigned to the sea god Poseidon. It was firstly elaborately described in the Critias and Timaios dialogues written by the ancient Greek philosopher Plato. Egyptians described Atlantis consisting mostly of mountains in the northern part. Poseidon fell in love with Cleito. who bore him five pairs of male twins. The forst-born, Atlas, was established as rightful king of the entire island and the ocean. One Day, there is a great concern on Atlantis. Atlas and his twin brothers gathered for the annual island party at the king's palace as they hear a sound comming from the surrounding mighty mountains. It was a avalanche! Nothing happend, puh! Since they are responsible for the well-being of their countrymen and more recently saw snowfall, they are forced to deal with the subject of "avalanches". Areas where avalanches occur have to be recorded, for performing arrangements to protect the population and the environment. To make this possible a GIS was established. As a result the demolition sites of avalaches will be calculated and presented to the public. This presentation focuses on faked GIS datasets and their potentatial to show exemplary methods that could be processed on any other real dataset. The main topic here, is the caculation of demolition sites of avalaches on Atlantis. In this case, the free CC BY-SA 4.0 AtlantGIS dataset by Kai-Christian Bruhn (i3mainz, Hochschule Mainz) is used. We believe that simple datasets with a narrative are most qualified to impart knowledge and skills to students. This presentation is based on a students project by Rania Taani as part of the Geoinformatics and Surveying master modul "Interdiciplinary Applications of Spatial Information Techniques", which focuses on applications in the Digital Humanities.

Das Labeling System: Erstellung kontrollierter Linked Open Data Vokabulare als Metadaten-Hub für archäologische Fachdatenbanken

Thiery, Florian Mees, Allard

8. AG CAA Workshop

Mathematekon, Uni Heidelberg


talk DE CC BY PDF DOI10.5281/zenodo.292554

In vielen archäologischen Forschungsinstituten existiert üblicherweise eine zentrale Objektdatenbank (Diathek, Objektdatenbank, zentrale Fundverwaltung) und darüber hinaus ein Bündel an einzelnen Fachdatenbanken. Diese Fachdatenbanken entstanden in der Regel im Laufe von einzelnen (oft auch aus Drittmittel finanzierten) Projekten. Charakterisiert werden sie oft durch Spezialtabellen bzw. Fachspalten, die für die jeweilige Forschungscommunity und Forschungsfrage relevant sind. Für zentrale Repositorien sind diese fachbezogenen Attribute in der Regel nicht besonders relevant, da sie sich auf nur eine ganz kleine Untergruppe von Daten bezieht. Die fachspezifischen Attribute müssen außerhalb der zentralen Repositorien von der spezifischen Forschungsgruppe gepflegt werden, da archäologische Fachtermini oft sehr detailliert sind und von globalen autoritativen Thesauri wie Heritage Data oder Getty nicht exakt erfasst werden können. Oft wissen diese verteilten Systeme auch nichts über den Inhalt eines Anderen. Dabei könnten sich nachhaltige Synergieeffekte ergeben, indem man z.B. die Grunddaten miteinander verknüpft. Linked Open Data ermöglicht es diese Datenbanken zu verknüpfen. Voraussetzung hierzu ist eine eindeutige Referenz innerhalb der Datenbank auf eine persistente externe Quelle, worauf andere Datenbanken verweisen können. Im Semantic Web wird dies durch das W3C-standardisierte Resource Description Framework (RDF) und im Web adressierbare Unique Ressource Identifier (URI) umgesetzt. Die Referenzierung kann räumlich, zeitlich oder auch über Schlagworte erfolgen. Als Beispiele solcher Referenzen können GeoNames, Pleiades oder ChronOntology gelten. Das vom Institut für Raumbezogene Informations- und Messtechnik (i3mainz) und Römisch Germanischen Zentralmuseum (RGZM) in Kooperation mit dem Mainzer Zentrum für Digitalität in den Geistes- und Kulturwissenschaften (mainzed) implementierte Labeling System ermöglicht es webbasiert über ein benutzerfreundliches GUI eigene kontrollierte Vokabulare zu erzeugen, deren Begriffe über eine Suche mit Referenzkonzepten im Web zu verlinken und Begriffe als URI zu publizieren. Für die Anfangs skizierte, in vielen Institutionen vorhandene problematische IT-Situation der nicht vernetzten lokalen Datenbanken bietet die neue Architektur des RGZM einen Lösungsansatz, welcher zurzeit implementiert wird. Die digitale Verknüpfung der verteilten Fachdatenbanken (z.B. NAVIS und Samian Research) mit der Museums-Objektdatenbank (easyDB), mit Hilfe von kontrollierten Vokabularen, wird einen neuen Zugang zu den vorhandenen digitalen Daten ermöglichen, welcher zuvor nicht erreichbar war. Mit dem Labeling System können dabei in jahrelanger europäischer Abstimmung erstellte mehrsprachige fachspezifische kontrollierte Vokabulare (z.B. Schiffsvokabulare aus den RGZM-eigenen NAVIS-Datenbanken) standardisiert als Simple Knowledge Organization System (SKOS) der Forschungscommunity zur Verfügung gestellt werden. Dabei können die Begriffe zu autoritativen Thesauri verlinkt werden, sodass sie in der Linked Data Cloud verortet sind und deren Bedeutung näher spezifiziert wird. Der Vortrag präsentiert die Grundprinzipien des Erstellungsprozesses eines kontrollierten Vokabulars mit dem Labeling System. Was ist ein kontrolliertes Vokabular? Was ist ein Begriff? Wie kann ein Begriff näher beschrieben werden? Wie stehen publizierte kontrollierte Vokabulare und deren Begriffe externen Nutzern zur Verfügung? Welche Möglichkeiten bietet die Labeling System API zur Einbindung in die eigenen Fachdatenbanken? Am Beispiel verschieden definierter Formtypen römischer Keramik wird erläutert, inwiefern ein Mapping dieser Begriffe im Labeling System erstellt und in einem zweiten Schritt in einer Fachdatenbank eingebunden werden kann. Abschließend wird diskutiert inwiefern Begriffe des Labeling System in eine Systemarchitektur, wie die des RGZM eingebunden werden können und welche Möglichkeiten dadurch generiert werden.

Digitale Methoden zur Erarbeitung von archäologisch-relativ-chronologischen Zeitintervallen

Thiery, Florian Mees, Allard

Internationale Tagung der Österreichischen Gesellschaft für Mittelalterarchäologie

Campus, Universität Graz


talk DE EN CC BY PDF DOI10.5281/zenodo.292957

Aktuelle Entwicklungen in den digitalen Methoden der Archäologie suchen nach Lösungen für eine fachspezifisch adäquate Repräsentation chronologischer Konzepte, sowie deren persistente Adressierbarkeit. In diesem Paper wird ein konzeptioneller Vorschlag zur Lösung des archäologisch-relativchronologischen Problems mittels digitaler Methoden vorgestellt. Einerseits werden Zeitkonzepte und ihr relativchronologisches Verhältnis zueinander digital aufgearbeitet und im Semantic Web zur Verfügung gestellt. Neben Geodia, ein online-Portal für die Visualisierung von zeitlichen, geographischen und materiellen Aspekten antiker Kulturen im Mittelmeerraum und PeriodO, das als online-Gazetteer Zeitbegriffe als Linked Open Data anbietet, entwickeln das i3mainz und das DAI im Rahmen des Projekts ChronOntology eine regelbasierte Software-Architektur, die auch komplexe Zeitbegriffe in ihren Abhängigkeiten und räumlichem Kontext repräsentiert. Andererseits entstehen relativchronologische Materialzeitstufen aus einem bottom-up-Verfahren anhand datierter Fundkomplexe. Diese vom Fundmaterial heraus erarbeiteten Zeitkonzepte lassen sich in ihren relativen Bezügen quantifizieren, adressieren und digital verarbeiten. Konkret können relativchronologische Zeitangaben als Intervalle verstanden werden, die in 13 unterschiedlichen Arten semantisch verarbeitet werden können (Allen 1983; Freksa 1992). Das herausfordernde ist, dass Beschreibungen von z.B. Gefäßformen als Typologien zum Aufbau relativer Chronologien verwandt wurden, an denen wiederum Zeitkonzepte gekoppelt wurden. Dies kann mit der Keramik-Forschungsdatenbank "Samian" des RGZM sichtbar gemacht werden. Der digitale Umgang mit chronologischen Kreisargumentationen bildet ein methodisches Gerüst, das auch für die Mittelalterarchäologie weiterentwickelt werden kann, wenn feingranulierte digitale Datensätze mittelalterlicher Großmanufakturen von z.B. Siegburger Schnellen oder Goudaer Tonpfeifen vorliegen.

Linking periods: Modeling and utilizing spatio-temporal concepts in the chronOntology project

Schmiedle, Wolfgang Kallas, Nathalie Cuy, Sebastian Thiery, Florian

Computer Applications and Quantitative Methods in Archaeology (CAA)

Oslo, Norway


talk EN © PDF

In the last years several web services emerged that manage and make accessible place thesauri for the archaeologies and historical sciences. By making use of semantic technologies these applications are able to act as linked data hubs thereby making possibe the linkage of multiple datasets of varying thematic focus and of different structural properties. Another common denominator of archaeological data resources, besides geo-spatial properties, is the temporal classification of research objects. One of the applications that try to assume a role similar to that of gazetteers but for temporal concepts and cultural periods is developed in the chronOntology project. In this project, funded by the German Research Foundation, the German Archaeologial Institute (DAI) together with the i3mainz are developing a system for storing, managing, mapping and making accessible descriptions of temporal concepts. The core of this endeavor is a rich semantic modeling of various existing terminological systems for cultural periods using a data model based on the CIDOC-CRM and its extensions. The use of the rich ontological model provided by the CRM on the one hand permits representing the measurable temporal extent (with the possibility for fuzzy edges) while also making it possible to embed temporal concepts in a network of semantic relationships to other temporal concepts, connected historical regions and thematic contexts. Besides documenting the general architecture and data model of the project the paper will present possibilities of querying different heterogeneous data resources collected throughout various digitization and digging activities inside the DAI with the help of concepts defined in chronOntology. We will also point out the potential and problems of reasoning over geographically and temporally connected datasets.

Linked Open Data in Space and Time - A geodetic insight into humanities research using LOD

Thiery, Florian

XXIX. International Geodetic Student Meeting

Technische Universität München


talk EN CC BY-SA PDF DOI10.5281/zenodo.292962

Common standards are more and more important in interdisciplinary research. In particular, the combination of geospatial data and humanities expert data, like archaeological sites, should be based on standardized formats and services. In Germany, services like Web Feature Services and Web Map Services using relational databases are part of the administrative infrastructure. Moreover, Semantic Web and Linked Open Data technologies are graph-based alternatives used more and more especially on the British islands (e.g. the Ordnance Survey modelled their geospatial data as LOD). This technology, based on the Resource Description Framework (RDF) and the idea linking online available resources is suitable for interoperable data management in time and space. This presentation gives an insight into humanities research in the eyes of a classical geodesist using RDF. Starting from an introduction of Linked Open Data, interdisciplinary projects like chronOntology and the Labeling System will be presented.

E1-P1-Arches! Aspekte interoperabler Modellierung und Bereitstellung archäologischer Fachdaten mit dem Arches Framework

Thiery, Florian Engel, Thomas

7. AG CAA Workshop

HafenCity Universität Hamburg


talk DE CC BY-SA PDF DOI10.5281/zenodo.292967

Die heterogene Natur archäologischer Daten wird bis heute meist in relationalen Datenbanken abgebildet. Datenmodellierungen mit NoSQL-Datenbanken oder in Graphen, fristen auch im Jahr 2015 noch ein Nischendasein, obwohl die konzeptionellen wie auch die technischen Grundlagen seit langem zur Verfügung stehen und einen Zugang in das Web 3.0 und in die Linked Data Cloud ermöglichen. Das i3mainz (Institut für Raumbezogene Informations- und Messtechnik) arbeitet in verschiedenen Projekten mit interdisziplinären Kontexten an Graphenstrukturen, insbesondere auch an der Modellierung jener mit Hilfe des W3C-standardisierten Resource Description Framework (RDF). Ein besonderes Augenmerk liegt dabei bei der Evaluation von Methoden zur standardisierten und interoperablen Vorhaltung komplexer archäologischer Fundstellendaten. Die technische Basis bildet dabei das auf dem CIDOC Conceptual Reference Model (CIDOC CRM) und Simple Knowledge Organization System (SKOS) basierende ARCHES Heritage & Management System. Die von Kooperationspartnern innerhalb des Mainzer Zentrum für Digitalität in den Geistes- und Kulturwissenschaften»mainzed« in unterschiedlicher Form zur Verfügung gestellten archäologischen Fachdatenkönnen für eine Vielzahl von Szenarien als exemplarisch angesehen werden. Ziele der Initiative sind die standardisierte und interoperable Vorhaltung strukturiert modellierter archäologischer Datensätze. Dabei steht die Abbildung möglichst vieler Prozesse wie etwa Abfrage, Pflege, Erweiterung und Analyse im Mittelpunkt, welche auch von nicht direkt im Projekt involvierten Wissenschaftlern erbracht werden sollen. Das Paper präsentiert technische Grundlagen semantischer Datenmodellierung unter Verwendung von CIDOC CRM. Weiterhin werden prototypische Fragestellungen behandelt: Welche Voraussetzungen sollten Daten hinsichtlich Aufbau und Struktur erfüllen? Welche Schritte sind zur Datenintegration in vorhandene Graphenstrukturen nötig? Wie können diese Strukturen erweitert und auf individuelle Bedürfnisse angepasst werden? Welche prototypischen Probleme wurden dabei identifiziert? Welchen Vorteil bieten interaktive Web-Tools zur Erstellung von Thesauri (Authority Files) als Linked Open Data wie z.B. der Reference Data Manager oder das Labeling Systemgegenüber herkömmlich verwendeter, nicht HTTP-adressierbarer und nicht zitierbarer kontrollierter Vokabulare? Abschließend wird diskutiert, inwiefern CIDOC CRM modellierte Daten überhaupt geeignet sein können, eine Basis für interoperable Systeme darzustellen. Ist die CIDOC CRM inhärente Komplexität nicht gerade deswegen als problematisch zu bezeichnen? Können auf Triple basierende Modellierungen ein gleichwertiger Ersatz für auf Tupel (relationale Datenbanken) basierende Datenstrukturen darstellen oder sogar einen Mehrwert bezüglich bislang unbeantworteter Fragestellungen bilden? Welche Vorteile für den wissenschaftlichen Diskurs sind kurz- und langfristig zu erwarten?

Linked Samian Ware: challenges of a LOD approach to samian ware

Thiery, Florian

Computer Applications and Quantitative Methods in Archaeology (CAA)

Siena, Italy


talk EN CC BY PDF DOI10.5281/zenodo.292968

Research in samian ware advanced considerably in recent years based on a dataset collected by several scholars in the past decades. It comprises detailed and reviewed data of potters, pots and related places in the northern provinces of the Roman Empire. The spatial distribution and chronological pattern as well as the identification of kiln sites of individual potters are key research questions. Based on this data, for instance Mees proposed a reconstruction and analysis of pottery trade networks considering archaeological material. The nature of the data makes it reasonable to approach the questions utilizing the concept of Linked Open Data (LOD) to generate interoperability and potential for data dissemination. The goal of the study presented in this presentation is to migrate a subset of these data into a LOD structure and to make it accessible through URIs in a REST interface as well as via a SPARQL endpoint. The subjective semantic relations between potters, pots and places should be visualised in the manner of linking. Furthermore the resources should be linked to existing LOD projects, for instance to Pleiades for places, using the Semantic Web to get additional information for the own resource. Potter, pots and places and their attributes could be conceptually modelled using the CIDOC-CRM. However, in the study direct linking of individual objects to mature ontologies widely used in the Semantic Web was preferred, to avoid CIDOC-CRM modelling questions. This presentation shows different modelling concepts and its challenges for each resource type using (1) an own ontology, (2) existing ontologies in the web, (3) the approach of Kerameikos as well as (4) labels of the Labeling System. The semantic links between potters, pots and places could be build via an own fixed predicate ontology or using ontologies like SKOS or Open Annotation to generate loose coupled relations. The idea of LOD is to couple related resources to build up an interlinked web of data. In the context of the study it was investigated what kind of suitable web resources are available from which the samian ware resources could benefit. On the one hand, web accessible repositories for fragments and potters are missing. On the other hand, Pleiades provides a large number of places to support geographical annotations of textural sources or archaeological objects. These places are used by the Pelagios project that links data from more than 20 partners to get additional information to an abstract Pleiades place concept. In this study, find-spots and kiln sites are mapped to Pleiades places to get additional data from the Pelagios partners. The locations in the samian dataset are reviewed and show much higher precision than the Pleiades places, so this mapping challenge have to be solved, too. The results yield that research on samian ware can benefit from implementing the concept of LOD. Enhanced perspectives arise when extending the linked data to other resources like dies and coins. When the data is published it could contribute to cross-linking of archaeological information internationally. A major challenge is finding the correct modelling concept for each resource type, as well as the semantic links between each other and to relying resources in the Semantic Web. Using technologies like the Labeling System, CIDOC-CRM, SKOS and Open Annotation can help to overcome this bottleneck. The presentation presents the results of a M.Sc. thesis delivered at the Hochschule Mainz - University of Applied Sciences in cooperation with the Römisch Germanisches Zentralmuseum Mainz (RGZM) and the Institute for Spatial Information and Surveying Technology (i3mainz).

The Labeling System: A bottom-up approach for enriched vocabularies in the humanities

Thiery, Florian Engel, Thomas

Computer Applications and Quantitative Methods in Archaeology (CAA)

Siena, Italy


talk EN CC BY PDF DOI10.5281/zenodo.292970

Shared thesauri of concepts are increasingly used in the process of data modelling and annotating resources in the Semantic Web. This growing family of linked data thesauri follows a top-down principle. Vocabularies and broader concepts (SKOS-) are being created, maintained and provided under the supervision of central authorities to provide general and generic approaches used by scientists in the humanities. But the diversity of research questions in the humanities makes it virtually impossible to create shared controlled vocabularies that cover a wide range of potential applications, and therefore satisfy the needs of diverse stakeholders. Reliable interconnections among independent systems could solve this conceptual bottleneck of controlled vocabularies. The Labeling System (LS), developed by i3mainz and IEG in contrast follows a bottom-up approach, enabling scientists working in the digital humanities to manage, create and publish their own controlled vocabularies as a SKOS concept scheme and concepts provided via a REST API and URIs. One term of the vocabulary can be linked to broader corresponding concepts of domain experts and will become labels. The labels embed those broader concepts persistently into existing structures using a clean and straightforward UI. Technically the LS is defined over a flat ontology and can be queried through its triple store. The created concepts can then be interlinked with well known LOD resources from e.g. The Getty Research Institute or the British Museum, but also to authorities maintaining linked data resources from natural science domains. The LS is domain independent, while uniting perspectives of different scientific disciplines on the same label and therefore contributing to interdisciplinary collaboration for building up cross and inter-domain linked data communities. As the newly created expert resources are available persistently, the concept is quotable, which strengthens the scientific discourse of their semantic shape. The paper addresses principles of the Labeling System in the light of heterogeneous archaeological data from Western Europe and the Middle East. Consequently, “usual” archaeological topics of conceptualizing and interlinking temporal and spatial concepts (meaning) will be discussed. To what extent is it possible to align existing concepts with “inserting” specific concepts of domain experts? How can the LS be used to solve the ambiguity of a place type and its role or function in a specific archaeological meaning? Furthermore, we will show how the non-technical researcher can use the Labeling System to get introduced into the process of linked-data conceptualization. Finally, the paper details the benefits of enriching linked-data concepts through relating to linked-data communities of other domains, e.g. geology or anatomy.

The Labeling System - A New Approach to Overcome the Vocabulary Bottleneck

Piotrowski, Michael Colavizza, Giovanni Thiery, Florian Bruhn, Kai-Christian


Fort Collins, USA


talk EN © PDF

Shared controlled vocabularies are a prerequisite for collaborative annotation and semantic interchange. The creation and maintenance of such vocabularies is, however, time-consuming and expensive. The diversity of research questions in the humanities makes it virtually impossible to create shared controlled vocabularies that cover a wide range of potential applications and satisfy the needs of diverse stakeholders. In this paper we present a novel conceptual approach for mitigating these problems. We propose that projects define their own vocabularies as needed and link the vocabulary terms to one or more concepts in a reference thesaurus, so that the project-specific term effectively serves as a "label" for a set of shared concepts. We also describe the implementation of this approach in the Labeling System. The Labeling System is a Web application that allows users to easily import concepts or create SKOS vocabularies and link the vocabulary terms to concepts from one or more reference thesauri.

Linked Samian Ware: Potentiale von Linked Data in der Archäologie

Thiery, Florian

5. AG CAA Workshop

Eberhard Karls Universität Tübingen


talk DE CC BY PDF DOI10.5281/zenodo.292971

Die räumliche Verteilung und das zeitliche Muster, sowie die Identifizierung von Produktionszentren und die Rekonstruktion von Handelsnetzen der Töpfer, sind zentrale Fragen aktueller archäologischer Forschungen zur ‚Samian Ware‘. Die Studien basieren auf einem Datensatz einer internationalen Gruppe von Wissenschaftlern. Er umfasst detaillierte Daten zu Töpfern, Keramik-Fragmenten und deren Fundorten. Zudem sind Informationen zu Befunden, Töpfermatrizen, Gefäßformen, Produktionsstätten, Formschüsselherstellern und Angaben zur absoluten zeitlichen Datierung erfasst. Der Datensatz ist damit außerordentlich gut geeignet, aktuelle Technologien interoperabler Datenhaltung, insbesondere das Konzept der Linked Open Data (LOD) und der semantischen Modellierung archäologischer Informationen, exemplarisch zu verdeutlichen. Eines der Prinzipien der Linked Open Data ist die Bereitstellung der Daten als Ressource. Diese ist sowohl menschenlesbar, steht jedoch auch zur computertechnische Verarbeitung zur Verfügung. Ein Gefäßfragment und dessen Fundort wären beispielsweise mit einem Browser im World Wide Web unter einer HTTP-Adresse frei abrufbar. Ein weiterer Informationsgewinn entsteht durch die Nutzung kontrollierter Vokabulare, nicht nur für die Beschreibung der Ressourcen, sondern auch für deren Beziehungen untereinander. In einer Reihe von Wissenschaftsfeldern werden diese Konzepte erfolgreich eingesetzt, so dass mit diesen Konzepten erstmals eine Technologie zur Verfügung steht, welche eine direkte Verknüpfung heterogener Informationen aus unterschiedlichen archäologischen Datenbanken gewährleistet. Der Vortrag führt in die Migration der Daten sowie die Möglichkeiten und die Problematik der Modellierung der Attribute und Beziehungen mit Hilfe bestehender LOD-Konzepte und kontrollierter Vokabularien ein und zeigt eigene Ansätze zur Lösung auf. Insbesondere wird die Verlinkung zu anderen bereits bestehenden Projekten diskutiert. So bietet das Pleiades-Projekt eine Plattform, die geographische Elemente z.B. in Texten mit existierenden Ressourcen verbindet. Die Fund- und Produktionsstätten sind mit den Pleiades Places verknüpft, wodurch eine Vielzahl weiterer archäologischer und historischer Informationen über das Pelagios Projekt eingebunden sind. Zudem wird das Potential der Verlinkung und Abfrage von heterogenen Informationen zwischen Töpfern, Fragmenten und Orten und deren relativ-chronologische Beziehungen über LOD mit einer webbasierten Schnittstelle aufgezeigt. Die Komplexität des Netzes sich bedingender Datierungen der Funde ist im Datenmodell direkt abgebildet. Entsprechend schnell reagiert das System auf Modifikationen und erlaubt so eine Echtzeitvisualisierung der Simulation von Änderungen in diesen Bezügen. Die Ergebnisse zeigen, dass Forschung im Bereich der römischen Keramik vom Konzept der Linked Open Data profitiert. Vielversprechende Perspektiven entstehen durch die Verknüpfung mit weiteren Ressourcen wie Matrizen, Formschlüsseln und Münzen. Die technologische Basis ist eine PostgreSQL/PostGIS Datenbank als Kommunikationsplattform für JAVA Servlets und dem GeoServer, der OGC konforme Webdienste (WMS/WFS) anbietet. Die Daten werden in einer Schnittstelle maschinenlesbar und REST-konform zur Verfügung gestellt, die mit Hilfe von JAVA und den Frameworks Jersey, JAX-B und Hibernate Spatial, sowie dem GeoServer verarbeitet werden. Die beschriebenen Strukturen erlauben somit eine webbasierte Kartenansicht auf dem Client mit der JavaScript Bibliothek Leaflet unter Einbeziehung der Abhängigkeiten zwischen Töpfern, Fragmenten und Fundorten. Darüber hinaus ergibt eine ontologische Modellierung der semantischen Bezüge Potentiale für die Extraktion des in den Daten implizit vorhandenen Wissens. Der Vortrag ist das Ergebnis einer Masterarbeit an der Fachhochschule Mainz und wird die Ergebnisse kritisch reflektieren und damit einen Einstieg in diese neue Technologie erleichtern.

The Labelling System: A Bottom-up Approach for Enriched Vocabularies in the Humanities

Thiery, Florian Engel, Thomas

paper EN © Link ISBN9781784913380

mit Thomas Engel: The Labeling System: The Labelling System: A Bottom-up Approach for Enriched Vocabularies in the Humanities. In Stefano Campana, Roberto Scopigno, Gabriella Carpentiero und Marianna Cirillo, Hrsg., CAA2015. Keep The Revolution Going. Proceedings of the 43rd Annual Conference on Computer Applications and Quantitative Methods in Archaeology, Volume 1, 259-268, Oxford, NY, England, 2015. Archeopress Publishing Ltd. ISBN: 9781784913380.

The Labeling System: A new approach to overcome the vocabulary bottleneck

Piotrowski, Michael Colavizza, Giovanni Thiery, Florian Bruhn, Kai-Christian

paper EN © Link DOI10.1145/2657480.2657482

mit Michael Piotrowski, Giovanni Colavizza und Kai-Christian Bruhn: The Labeling System: A new approach to overcome the vocabulary bottleneck. In Patrick Schmitz, Laurie Pearce und Quinn Dombrowski, Hrsg., Proceedings of DH-CASE II: Collaborative Annotations on Shared Environments: Metadata, Tools and Techniques in the Digital Humanities, article A1, New York, NY, USA, 2014. ACM. DOI: 10.1145/2657480.2657482.

Modular Imaging Total Stations - Sensor Fusion for high precision alignment

Hauth, Stefan Schlüter, Martin Thiery, Florian

paper EN © PDF

mit Stefan Hauth und Martin Schlüter: Modular Imaging Total Stations - Sensor Fusion for high precision alignment. In V. Schwieger et al., Hrsg., 3rd International Conference on Machine Control & Guidance Proceedings, 202-210, Stuttgart, 2012.

Schneller und ausdauernder als das menschliche Auge: Modulare Okularkameras am Motortachymeter

Hauth, Stefan Schlüter, Martin Thiery, Florian

journal article DE © LINK

mit Stefan Hauth und Martin Schlüter: Schneller und ausdauernder als das menschliche Auge: Modulare Okularkameras am Motortachymeter. Allgemeine Vermessungs-Nachrichten (avn), Vol. 120, Nr. 6, 210-216, 2013.

Semantic Web und Linked Data: Generierung von Interoperabilität in archäologischen Fachdaten am Beispiel römischer Töpferstempel

Thiery, Florian

Master of Science Geoinformatik und Vermessung Fachhochschule Mainz

thesis DE CC BY-NC-SA talk PDF LINK DOI10.5281/zenodo.292979

Semantic Web und Linked Data: Generierung von Interoperabilität in archäologischen Fachdaten am Beispiel römischer Töpferstempel, Masterarbeit, Standnummer KM042, Betreuer: Prof. Kai-Christian Bruhn, in Zusammenarbeit mit dem Institut für Raumbezogene Informations- und Messtechnik (i3mainz) und dem Römisch-Germanischen Zentralmuseum (RGZM), Fachhochschule Mainz, 13. Juni - 11. Dezember 2013.

Gegenstand der Masterarbeit ist die Verwendung aktueller Technologien interoperabler Datenhaltung, insbesondere das Konzept der Linked Open Data (LOD) und der semantischen Modellierung, zur Verdeutlichung ihres Potentials in archäologischen Informationen am Beispiel von Terra Sigillata-Fundorten, -Töpfern und -Keramikfragmenten. Die Arbeit zeigt eine Migration von Daten, sowie die Möglichkeiten und die Problematik der Modellierung der Attribute und Beziehungen mit Hilfe bestehender LOD-Konzepte und kontrollierter Vokabularien, sowie eigene Ansätze zur Lösung. Diese Daten werden mittels REST-Schnittstelle zur Verfügung gestellt. Ein Schwerpunkt wird auf die Verlinkung zu anderen bereits bestehenden Projekten gelegt, wodurch eine Vielzahl weiterer archäologischer und historischer Informationen z.B. über das Pelagios Projekt eingebunden werden. Zudem wird das Potential der Verlinkung und Abfrage von heterogenen Informationen zwischen Töpfern, Fragmenten und Orten deren relativ chronologische Beziehungen über LOD mit einer webbasierten Schnittstelle aufgezeigt.

Eignung aktueller Industriekameras für modulare Digitalkameratachymeter

Thiery, Florian

Bachelor of Science Geoinformatik und Vermessung Fachhochschule Mainz

thesis DE CC BY-SA talk PDF LINK DOI10.5281/zenodo.292977

Eignung aktueller Industriekameras für modulare Digitalkameratachymeter, Bachelorarbeit, Standnummer B0066, Betreuer: Prof. Martin Schlüter, in Zusammenarbeit mit dem Institut für Raumbezogene Informations- und Messtechnik (i3mainz), Fachhochschule Mainz, 14. April - 01. Juni 2011.

Gegenstand der Bachelorarbeit ist die Bestimmung des Auflösungsvermögens des MoDiTa-Systems, sowie die Untersuchung von Techniken und Einstellungen zur Verbesserung der Sichtbarkeit von Himmelskörpern und Laserdots. Zudem werden Tools vorgestellt, die es ermöglichen, Aufnahmen von Targets im gesamten Blickfeld in Messserien zu erzeugen und das Auflösungsvermögen automatisch zu bestimmen. Verschiedene Komponenten des MoDiTa-Systems haben unterschiedliche Einflüsse auf das Auflösungsvermögen. Diese Arbeit zeigt die Unterschiede auf und gibt schlussendlich Empfehlungen für den Einsatz bestimmter Komponenten und Einstellungen bei der Bestimmung des Auflösungsvermögens.

labeling system

Thiery, Florian Kunz, Axel Dufner, Matthias

Get Together DH-RMU

Mainz, Deutschland


poster DE CC BY PDF DOI10.5281/zenodo.921997

Als Linked Open Data wird die direkte Vernetzung von frei verfügbaren Daten im Internet bezeichnet. Aufgrund der ständig wachsenden Datenmenge ergeben sich für die Wissenschaften daraus ganz neue Erkenntnismöglichkeiten. Dieses Wissensnetzwerk kämpft unter anderem mit dem Problem von nicht eindeutigen Begrifflichkeiten. Der natürliche Wortlaut eines Begriffs genügt datenverarbeitenden Systemen oftmals nicht, um sich dessen exakte Bedeutung zu erschließen. Eine maschinenlesbare Definition beinhaltet daher neben natürlichsprachlicher Erläuterungen auch Verknüpfungen zu anderen Datenquellen, um den korrekten Begriffskontext sicherzustellen. Labeling System ist eine Web-App, die an dieser Stelle ansetzt und mittels einer leicht bedienbaren Nutzeroberfläche das Erstellen von Begriffen und deren maschinenlesbarer Definitionen ermöglicht. Wissenschaftler*innen haben so die Möglichkeit, ihr Wissen als ”Linked Open Data“ zur Verfügung zu stellen und somit die Qualität der Forschungsdaten in ihrem Arbeitsgebiet zu verbessern.

Das Labeling System – ein freier Baukasten für kontrollierte Vokabulare

Piotrowski, Michael Thiery, Florian Bruhn, Kai-Christian


Graz, Österreich


poster DE © PDF

Maschinenlesbare Annotationen sind die Voraussetzung für die semantische Verarbeitung von Daten. Diese Aussage gilt unabhängig davon, ob es sich bei den Daten um natürlichsprachigen Text oder um strukturierte Datensätze in einer Datenbank handelt, und unabhängig davon, ob es um einfaches Sortieren und Filtern geht oder um komplexes automatisches Schließen. Kontrollierte Vokabulare (ob in einer einfachen Terminolgieliste oder als Taxonomien, Thesauri oder Ontologien strukturiert) sind dabei unbedingt notwendig, um Annotationen maschinell verarbeitbar zu machen; ohne terminologische Kontrolle sind Annotationen für die maschinelle Verarbeitung kaum nützlicher als an den Rand eines Buches gekrizelte Notizen. Kontrollierte Vokabulare abstrahieren von natürlichsprachlichen Ambiguitäten und Konnotationen; sie sind daher entscheidend für die semantische Verarbeitung von Forschungsdaten. Um projektübergreifende Zusammenarbeit und den semantischen Austausch von Daten zu ermöglichen, müssen Vokabulare nicht nur kontrolliert, sondern auch formell oder informell standardisiert sein. Standardisierte kontrollierte Vokabulare ermöglichen den Austausch, die Kombination und die gemeinsame Analyse annotierter Daten aus verschiedenen Quellen sowie die Implementierung generischer Werkzeuge für die semantische Verarbeitung. Erstellung und Wartung standardisierter kontrollierter Vokabulare sind jedoch zeitaufwändig und damit teuer. Zu den größten Herausforderungen zählen, dass alle beteiligten Parteien zu einem gemeinsamen Verständnis der Begriffe kommen, und dass die richtige Balance zwischen möglichst breiter Anwendbarkeit einerseits und möglichst präziser Analyse andereseits gefunden werden. Diese Ziele sind insbesondere in den Geisteswissenschaften schwierig zu erreichen: nicht nur sind die Forschungsfragen, die potentiell an einen gegebenen Datensatz gerichtet werden können, extrem weit gefächert, sondern die Kategorisierung der Daten ist häufig ein essenzieller Teil des Forschungsprozesses selbst. Es gibt daher einen eklatanten Mangel an standardisierten kontrollierten Vokabularen in den Geisteswissenschaften, der Digital-Humanities-Projekte letztlich dazu zwingt, eigene, projektspezifische Vokabulare zu definieren. Projektspezifische Vokabulare lösen können den internen Bedarf zwar kurzfristig befriedigen, sind aber nicht interoperabel und verhindern den zukünftigen Austausch und die Nachnutzung der annotierten Daten. Unser Poster stellt einen neuen konzeptuellen Ansatz zur Lösung dieser Probleme vor und beschreibt die Implementierung dieses Ansatzes in einem Softwarewerkzeug, dem Labeling System. Da es in der geisteswissenschaftlichen Forschung praktisch unmöglich ist, kontrollierte Vokabulare zu definieren, die alle denkbaren Anwendungen abdecken und generell akzeptiert sind, schlagen wir ein anderes Vorgehen vor. Bei unserem Ansatz definieren Projekte ihre eigenen Vokabulare, aber anstelle natürlichsprachlicher Definitionen werden die Terme mit einem oder mehreren Konzepten in einem Referenzthesaurus verknüpft. Der projektspezifische Term dient also quasi als »Label« für eine Menge gemeinsamer Konzepte. Dieser Ansatz ermöglicht es Projekten Vokabulare entsprechend ihrer Bedürfnisse und unter Verwendung im jeweiligen Forschungsgebiet üblichen Bezeichnungen benutzen, während gleichzeitig die Interoperabilität mit anderen Projekten über den Referenzthesaurus gewährleistet ist. Das Labeling System ist eine Webanwendung, die es Benutzern ermöglicht, SKOSVokabulare zu erstellen und auf einfache Weise deren Terme mit einem oder mehreren Konzepten in einem oder mehreren Referenzthesauri zu verknüpfen. Die Benutzeroberfläche ermöglicht die Visualisierung der definierten Vokabulare in einer hierarchischen Baumstruktur und ermöglicht den Zugriff auf Vokabulare über eine SPARQL-Schnittstelle. Das Labeling System basiert auf ausgereiften Open-SourceKomponenten und ist selbst ebenfalls frei verfügbar.

Das Labeling System – Lösen der Mehrdeutigkeiten von Räumen und deren Funktion

Thiery, Florian Bruhn, Kai-Christian

DHMainz | Forum DHMainz

JGU Mainz


poster DE CC BY PDF DOI10.5281/zenodo.292974

Linking potter, pots and places: a LOD approach to samian ware

Thiery, Florian

Computer Applications and Quantitative Methods in Archaeology (CAA)

Paris, France


poster EN CC BY PDF DOI10.5281/zenodo.292975

The Roman imperial period is known for the introduction of a red glossy pottery, the so called samian ware. It is crucial for archaeologists to date Roman sites in the Northern provinces. The research in samian ware pottery advanced in recent years. The spatial distribution and chronological pattern as well as the identification of kilnsites of individual potters are key research questions. Most recent studies are based on a dataset collected by several scholars in the past decades. It comprises detailed and reviewed data of potters, pots and related places. The character of the data makes it reasonable to approach it utilizing the concept of the Linked Open Data (LOD) in order to increase its potential for research. The goal of the study presented in this poster is to migrate a subset of these data into an appropriate structure and to make it accessible through URIs. Furthermore the place resources should be linked to existing LOD projects. Finally the query of the links between potters, pots and places was to render possible through a web based interface. The interoperability and possibility for data sharing is achieved by implementing suitable XML schemes (e.g. GML, MIDAS). Findspots and kilnsites are mapped to Pleiades places to benefit from the Pelagios project. Typically Pleiades places are designed to support geographical annotation of textual sources or archaeological objects. A major challenge of the study was to link the ‘samian places' to Pleiades places, because each follow their own spatial concept. Another aspect was the chronological information entailed in the dataset. Simulations of changes in the relative chronology of the material revealed the potential of the linked data approach by providing immediate access to all implications on related datasets. The results yield that research on samian ware can benefit from implementing the concept of LOD. Enhanced perspectives arise when extending the linked data to other resources like dies and coins. When the data is published it could contribute to the international crosslinking of archaeological information. Moreover, the data is ready for semantically modelling the relations in an ontology to foster the disclosure of knowledge hidden in the data. The poster presents the results of a M.Sc. Thesis delivered at the University of Applied Sciences Mainz.

S14: Modelling Data Quality in archaeological Linked Open Data

Bruhn, Kai-Christian Mees, Allard Thiery, Florian

Computer Applications and Quantitative Methods in Archaeology (CAA)

Jagiellonian University, Krakau


session EN CC BY PDF DOI10.5281/zenodo.1420244

Today, increasing quantities of data are published by archaeological institutions. At the same time, interconnecting these data following the concept of “Linked Data” is becoming more and more popular. The current evolution from “Linked Data” via “Linked Open Data” (LOD) towards “Linked Open Usable Data” enables a wide array of archaeological applications. However, this development of an increasing LO(U)D-cloud implies challenges in handling complex facets of data quality. Therefore, modelling the handling of data quality becomes an increasingly important issue. This is especially valid for archaeological data, which are based on a complicated network of concepts from different knowledge domains. Even very carefully compiled datasets can contain errors and ambiguities. Unrecognised errors multiply exponentially in scenarios of data reuse: not only incorrect data and conclusions are the result, but possibly also a loss of confidence in web-based resources. Moreover, modelling data quality to share knowledge about uncertainty is necessary to produce and publish transparent Linked Open Usable Data. The success of the session "Guaranteeing data quality in archaeological Linked Open Data" at CAA International 2018 has raised awareness of many challenges related to this topic and encourages pursuing the debate. For this session we invite contributions that addresses e.g. following issues: - Identifying and strategies for correcting inconsistencies within the data; - Identifying sources and dangers of incorrect or ambiguous data; - Identifying duplicates across different LOD sources; - Keeping track of the provenance of data as a means of solving errors and identifying their source; - Defining metrics in order to rate data in respect to their quality; - Setting up methodologies and tools in order to label or certify data sets based on their quality; - Compiling trust levels based on various inputs such as provenance and quality level; - Modelling uncertainty and vagueness in LOD (e.g. thesauri and CIDOC CRM); - Dealing with ambiguities resulting from multiple links in the LOD cloud; We encourage presenters to derive the problems from real-world datasets and to formulate proposals for solutions, preferably demonstrating (prototypes of) realised data driven web applications. As we target a broad and diverse audience because of the thematic relevance, the challenges described should also be integrated into their archaeological context (excavation, museum, archive, etc.).

S29: Our little minions, part 2: small tools with major impact

Mennenga, Moritz Thiery, Florian Visser, Ronald

Computer Applications and Quantitative Methods in Archaeology (CAA)

Jagiellonian University, Krakau


session EN CC BY PDF DOI10.5281/zenodo.1420244

In our daily work, small self-made scripts, home-grown small applications and little devices significantly help us to get work done. These little helpers often reduce our workload or optimize our workflows, although they are not often presented to the outside world. Instead, we generally focus on presenting the results of our research and silently use our small tools during our research. This session will focus on these small helpers (“little minions”,) and we invite researchers to share their tools so that the scientific community may benefit and - perhaps - create spontaneously special interest groups. This session aims at short presentations - “minion talks” (max. 10 minutes including discussion) - of small software or hardware solutions, not only focusing on field work / excavation technology, associated evaluation or methodical approaches in data driven archaeology. Each “minion talk” should explain the innovative character and mode of operation of the digital tool. The only restriction is, that the software, code or building instructions are open and freely available (e.g. GitHub). Proprietary products cannot be presented (but tools designed for them). We invite “minion talks” that present small tools or hardware inventions related but not limited to the following subjects: - data processing - measuring - digital documentation - GIS-Plugins - Hands-on digital inventions (for excavations) - Linked (Open) Data tools - etc. We invite speakers to submit an abstract. But after last years spontaneous success of “Stand-up-Science”, there will also be an opportunity to spontaneously participate and demonstrate what you have on your stick or laptop. If you want to participate without an abstract in the spontaneous section of the session, please send an email to us (even shortly before the conference). This is however not obligatory. Please come and spontaneously introduce your little minion!

Putting Samian pots together - Wie Graphen bei der Modellierung des Zweifels helfen können.

Thiery, Florian Mees, Allard

video DE ADW Mainz Mediathek

Academic Meta Tool - Ein Web-Tool zur Modellierung des Zweifels.

Unold, Martin Thiery, Florian

video DE ADW Mainz Mediathek

The Labeling System: A bottom-up approach for enriched vocabularies in the humanities.

Thiery, Florian Engel, Thomas

video EN YouTube