Linked Geodesy Docs!

Get interesting documents about Linked Data and Geodesy!

Find here presentations, papers, posters and more...

last updated: April 2018

Taming Ambiguity - Dealing with doubts in archaeological datasets using LOD

Thiery, Florian Mees, Allard

Computer Applications and Quantitative Methods in Archaeology (CAA)

Tübingen, Germany

22/03/2018

talk EN CC BY PDF DOI10.5281/zenodo.1200111

In der Archäologie wurde bereits seit mehr als 120 Jahren damit begonnen, die römische Keramikgattung Terra Sigillata in Einzelformen zu klassifizieren. Jedoch spielen Unsicherheiten und Zweifel bei der Bestimmung von dieser europaweit überaus häufig vorkommenden Manufakturware eine herausragende Rolle. Wie beim modernen Porzellan gibt es bei Terra Sigillata standardisierte "Service", d.h. verschiedene Formen (Teller, Näpfe, Schalen) gehören durch ähnlich gestaltete Ränder oder Standringe zur gleichen "Service-Familie". Da oft nur Bruchstücke von einem Rand oder einem Standring gefunden werden, kann in solchen Fällen höchstens eine Zuweisung zu einer oder mehreren Service-Familien erfolgen. Eine solche Unsicherheit in der Zuweisung gilt es zu modellieren. Darüber hinaus geben die mit Namen versehenen Töpferstempel Auskunft darüber, wer die einzelnen Gefäße hergestellt hat. Die Bestimmung dieser Töpferstempel ist für die Chronologie dieser Ware von großer Bedeutung, da z.B. abgebrochene oder beschädigte Stempel von jüngerem Datum sein dürften als noch vollständig erhaltene Namensstempel. Da die Stempel oft von Hand und in verschiedenen Winkeln in den noch weichen Gefäßboden eingestempelt wurden, sind sie somit oft auf dem ersten Blick nicht als identisch erkennbar. Hier ist das Kriterium der Vagheit das zu modellierende Model. Der Glücksfall, dass in einer am Römisch-Germanischen Zentralmuseum Mainz (RGZM) entwickelten Datenbank 250'000 gestempelte Gefäße des römischen Tafelgeschirrs Terra Sigillata in einem relationalen Datenmodell erfasst und über das Web verfügbar sind, ermöglicht das Ausloten der Grenzen der relationalen Datenmodellierung im Kontext der „Modellierung des Zweifels“ an Hand von realen Beispielen. Graphbasierte semantische Datenmodellierung bietet eine weitere interoperable und skalierbare Möglichkeit zur Lösung der Modellierung von Zweifel und Unsicherheiten bei der Zuweisung von Stempel und "Service-Familien". Die Präsentation zeigt Lösungsstrategien mittels einfachem OWL-Reasoning zur Modellierung des Zweifels in der RGZM Terra Sigillata Datenbank in Realtime-Beispielen.

Putting Samian pots together – modelling ceramic service family roots – connecting figure types.
Wie Graphen bei der Modellierung des Zweifels helfen können.

Thiery, Florian Mees, Allard

Graphentechnologien 2018

Akademie der Wissenschaften und der Literatur Mainz

19/01/2018

talk DE CC BY PDF DOI10.5281/zenodo.1155748

In der Archäologie wurde bereits seit mehr als 120 Jahren damit begonnen, die römische Keramikgattung Terra Sigillata in Einzelformen zu klassifizieren. Jedoch spielen Unsicherheiten und Zweifel bei der Bestimmung von dieser europaweit überaus häufig vorkommenden Manufakturware eine herausragende Rolle. Wie beim modernen Porzellan gibt es bei Terra Sigillata standardisierte "Service", d.h. verschiedene Formen (Teller, Näpfe, Schalen) gehören durch ähnlich gestaltete Ränder oder Standringe zur gleichen "Service-Familie". Da oft nur Bruchstücke von einem Rand oder einem Standring gefunden werden, kann in solchen Fällen höchstens eine Zuweisung zu einer oder mehreren Service-Familien erfolgen. Eine solche Unsicherheit in der Zuweisung gilt es zu modellieren. Darüber hinaus geben die mit Namen versehenen Töpferstempel Auskunft darüber, wer die einzelnen Gefäße hergestellt hat. Die Bestimmung dieser Töpferstempel ist für die Chronologie dieser Ware von großer Bedeutung, da z.B. abgebrochene oder beschädigte Stempel von jüngerem Datum sein dürften als noch vollständig erhaltene Namensstempel. Da die Stempel oft von Hand und in verschiedenen Winkeln in den noch weichen Gefäßboden eingestempelt wurden, sind sie somit oft auf dem ersten Blick nicht als identisch erkennbar. Hier ist das Kriterium der Vagheit das zu modellierende Model. Der Glücksfall, dass in einer am Römisch-Germanischen Zentralmuseum Mainz (RGZM) entwickelten Datenbank 250'000 gestempelte Gefäße des römischen Tafelgeschirrs Terra Sigillata in einem relationalen Datenmodell erfasst und über das Web verfügbar sind, ermöglicht das Ausloten der Grenzen der relationalen Datenmodellierung im Kontext der „Modellierung des Zweifels“ an Hand von realen Beispielen. Graphbasierte semantische Datenmodellierung bietet eine weitere interoperable und skalierbare Möglichkeit zur Lösung der Modellierung von Zweifel und Unsicherheiten bei der Zuweisung von Stempel und "Service-Familien". Die Präsentation zeigt Lösungsstrategien mittels einfachem OWL-Reasoning zur Modellierung des Zweifels in der RGZM Terra Sigillata Datenbank in Realtime-Beispielen.

Academic Meta Tool – Ein Web-Tool zur Modellierung des Zweifels

Thiery, Florian Unold, Martin

Graphentechnologien 2018

Akademie der Wissenschaften und der Literatur Mainz

19/01/2018

talk DE CC BY PDF DOI10.5281/zenodo.1155727

Graphdatenbanken und Triple Stores stellen bei der Modellierung von Forschungsdaten eine Alternative zu relationalen Datenbanken dar. Eine Modellierung der Daten in einem Netzwerk, anstatt in Tabellenstrukturen, eignet sie sich hervorragend um Daten interoperabel zur Verfügung zu stellen, indem man zwei Knoten aus verschiedenen Datenbanken miteinander über eine Kante verbindet. Dieser Technik bedienen sich viele Forschungsprojekte durch die Verwendung von Linked Open Data (LOD). Sowohl gängige Graphdatenbanken als auch gebräuchliche Triple Stores bieten jedoch keine Möglichkeit Unsicherheiten oder Vagheiten zu modellieren. Um dieser Unzulänglichkeit Rechnung zu tragen, haben wir das Academic Meta Tool (AMT) entwickelt. AMT bietet die Möglichkeit sämtlichen Kanten eine Gewichtung hinzuzufügen, um dadurch die Vagheit dieser Kante auszudrücken. Eine Beziehung zwischen zwei Knoten besteht also nur zu einem gewissen Grad. Dieser Grad, d.h. das Kantengewicht, wird üblicherweise in Prozent angegeben. AMT beinhaltet zusätzlich ein Verfahren, mit dem - unter Zuhilfenahme einer vordefinierten Ontologie - aus vorhandenen graphbasierten Daten automatisch Schlussfolgerungen gezogen werden können (Reasoning). Ein Prototyp des AMTs steht als Web-Anwendung zur Verfügung. In einer entwickelten Test-Ontologie können Personen und Interessen und deren Beziehungen in einem gewissen Grad zueinander modelliert werden. Diese Ontologie beinhaltet neben den genannten beiden Klassen fünf weitere Relationen, so dass Personen und Interessen miteinander in Beziehung gesetzt werden können. Außerdem enthält die Ontologie 11 Axiome, um automatisiert aus bestehenden Beziehungen neue Beziehungen generieren zu können. Ein Testfall, basierend auf der zuvor beschriebenen Ontologie, bildet die Beziehungen innerhalb des mainzed (Mainzer Zentrum für Digitalität in den Geistes- und Kulturwissenschaften) Netzwerks ab. Die Mitglieder des Netzwerks stehen in fachlichen bzw. hierarchischen Beziehungen zueinander. Zudem haben die Mitglieder des heterogenen Netzwerks viele unterschiedliche Interessen, die wiederum in einer SKOS-ähnlichen Taxonomie modellierbar sind. In einer Community Aktion haben die Mitglieder jeweils ihre Sicht auf das Netzwerk dargestellt, das heißt Beziehungen und Interessen, sowie deren Vagheitsgrad angegeben. AMT kann nun dieses Netz visualisieren und weitere Schlussfolgerungen ziehen, das heißt neue Beziehungen aufzeigen, welche bei der Eingabe nicht erkennbar waren, so dass dies einen Mehrwert für das Netzwerk bildet. Der beschriebene Testfall lässt sich auch auf andere Datengrundlagen, wie historische Personen-Netzwerke, etc. extrapolieren. Außerdem lassen sich statt der Personen-Interessen-Ontologie auch beliebige andere Ontologien verwenden, die in das AMT-Schema passen. Mit AMT präsentieren wir somit ein generisches Tool, das Unsicherheiten und Vagheiten in bestehenden Forschungsdaten darstellen und neue Folgerungen daraus schließen kann.

Avalanches on Atlantis - Real or Fake? The "true" story!

Thiery, Florian Taani, Rania

XXX. International Geodetic Student Meeting

Faculty of Geodesy, University of Zagreb

27/06/2017

talk EN CC BY PDF DOI10.5281/zenodo.817496

The mythical island Atlantis was an empire assigned to the sea god Poseidon. It was firstly elaborately described in the Critias and Timaios dialogues written by the ancient Greek philosopher Plato. Egyptians described Atlantis consisting mostly of mountains in the northern part. Poseidon fell in love with Cleito. who bore him five pairs of male twins. The forst-born, Atlas, was established as rightful king of the entire island and the ocean. One Day, there is a great concern on Atlantis. Atlas and his twin brothers gathered for the annual island party at the king's palace as they hear a sound comming from the surrounding mighty mountains. It was a avalanche! Nothing happend, puh! Since they are responsible for the well-being of their countrymen and more recently saw snowfall, they are forced to deal with the subject of "avalanches". Areas where avalanches occur have to be recorded, for performing arrangements to protect the population and the environment. To make this possible a GIS was established. As a result the demolition sites of avalaches will be calculated and presented to the public. This presentation focuses on faked GIS datasets and their potentatial to show exemplary methods that could be processed on any other real dataset. The main topic here, is the caculation of demolition sites of avalaches on Atlantis. In this case, the free CC BY-SA 4.0 AtlantGIS dataset by Kai-Christian Bruhn (i3mainz, Hochschule Mainz) is used. We believe that simple datasets with a narrative are most qualified to impart knowledge and skills to students. This presentation is based on a students project by Rania Taani as part of the Geoinformatics and Surveying master modul "Interdiciplinary Applications of Spatial Information Techniques", which focuses on applications in the Digital Humanities.

Das Labeling System: Erstellung kontrollierter Linked Open Data Vokabulare als Metadaten-Hub für archäologische Fachdatenbanken

Thiery, Florian Mees, Allard

8. AG CAA Workshop

Mathematekon, Uni Heidelberg

11/02/2017

talk DE CC BY PDF DOI10.5281/zenodo.292554

In vielen archäologischen Forschungsinstituten existiert üblicherweise eine zentrale Objektdatenbank (Diathek, Objektdatenbank, zentrale Fundverwaltung) und darüber hinaus ein Bündel an einzelnen Fachdatenbanken. Diese Fachdatenbanken entstanden in der Regel im Laufe von einzelnen (oft auch aus Drittmittel finanzierten) Projekten. Charakterisiert werden sie oft durch Spezialtabellen bzw. Fachspalten, die für die jeweilige Forschungscommunity und Forschungsfrage relevant sind. Für zentrale Repositorien sind diese fachbezogenen Attribute in der Regel nicht besonders relevant, da sie sich auf nur eine ganz kleine Untergruppe von Daten bezieht. Die fachspezifischen Attribute müssen außerhalb der zentralen Repositorien von der spezifischen Forschungsgruppe gepflegt werden, da archäologische Fachtermini oft sehr detailliert sind und von globalen autoritativen Thesauri wie Heritage Data oder Getty nicht exakt erfasst werden können. Oft wissen diese verteilten Systeme auch nichts über den Inhalt eines Anderen. Dabei könnten sich nachhaltige Synergieeffekte ergeben, indem man z.B. die Grunddaten miteinander verknüpft. Linked Open Data ermöglicht es diese Datenbanken zu verknüpfen. Voraussetzung hierzu ist eine eindeutige Referenz innerhalb der Datenbank auf eine persistente externe Quelle, worauf andere Datenbanken verweisen können. Im Semantic Web wird dies durch das W3C-standardisierte Resource Description Framework (RDF) und im Web adressierbare Unique Ressource Identifier (URI) umgesetzt. Die Referenzierung kann räumlich, zeitlich oder auch über Schlagworte erfolgen. Als Beispiele solcher Referenzen können GeoNames, Pleiades oder ChronOntology gelten. Das vom Institut für Raumbezogene Informations- und Messtechnik (i3mainz) und Römisch Germanischen Zentralmuseum (RGZM) in Kooperation mit dem Mainzer Zentrum für Digitalität in den Geistes- und Kulturwissenschaften (mainzed) implementierte Labeling System ermöglicht es webbasiert über ein benutzerfreundliches GUI eigene kontrollierte Vokabulare zu erzeugen, deren Begriffe über eine Suche mit Referenzkonzepten im Web zu verlinken und Begriffe als URI zu publizieren. Für die Anfangs skizierte, in vielen Institutionen vorhandene problematische IT-Situation der nicht vernetzten lokalen Datenbanken bietet die neue Architektur des RGZM einen Lösungsansatz, welcher zurzeit implementiert wird. Die digitale Verknüpfung der verteilten Fachdatenbanken (z.B. NAVIS und Samian Research) mit der Museums-Objektdatenbank (easyDB), mit Hilfe von kontrollierten Vokabularen, wird einen neuen Zugang zu den vorhandenen digitalen Daten ermöglichen, welcher zuvor nicht erreichbar war. Mit dem Labeling System können dabei in jahrelanger europäischer Abstimmung erstellte mehrsprachige fachspezifische kontrollierte Vokabulare (z.B. Schiffsvokabulare aus den RGZM-eigenen NAVIS-Datenbanken) standardisiert als Simple Knowledge Organization System (SKOS) der Forschungscommunity zur Verfügung gestellt werden. Dabei können die Begriffe zu autoritativen Thesauri verlinkt werden, sodass sie in der Linked Data Cloud verortet sind und deren Bedeutung näher spezifiziert wird. Der Vortrag präsentiert die Grundprinzipien des Erstellungsprozesses eines kontrollierten Vokabulars mit dem Labeling System. Was ist ein kontrolliertes Vokabular? Was ist ein Begriff? Wie kann ein Begriff näher beschrieben werden? Wie stehen publizierte kontrollierte Vokabulare und deren Begriffe externen Nutzern zur Verfügung? Welche Möglichkeiten bietet die Labeling System API zur Einbindung in die eigenen Fachdatenbanken? Am Beispiel verschieden definierter Formtypen römischer Keramik wird erläutert, inwiefern ein Mapping dieser Begriffe im Labeling System erstellt und in einem zweiten Schritt in einer Fachdatenbank eingebunden werden kann. Abschließend wird diskutiert inwiefern Begriffe des Labeling System in eine Systemarchitektur, wie die des RGZM eingebunden werden können und welche Möglichkeiten dadurch generiert werden.

Digitale Methoden zur Erarbeitung von archäologisch-relativ-chronologischen Zeitintervallen

Thiery, Florian Mees, Allard

Internationale Tagung der Österreichischen Gesellschaft für Mittelalterarchäologie

Campus, Universität Graz

20/09/2016

talk DE EN CC BY PDF DOI10.5281/zenodo.292957

Aktuelle Entwicklungen in den digitalen Methoden der Archäologie suchen nach Lösungen für eine fachspezifisch adäquate Repräsentation chronologischer Konzepte, sowie deren persistente Adressierbarkeit. In diesem Paper wird ein konzeptioneller Vorschlag zur Lösung des archäologisch-relativchronologischen Problems mittels digitaler Methoden vorgestellt. Einerseits werden Zeitkonzepte und ihr relativchronologisches Verhältnis zueinander digital aufgearbeitet und im Semantic Web zur Verfügung gestellt. Neben Geodia, ein online-Portal für die Visualisierung von zeitlichen, geographischen und materiellen Aspekten antiker Kulturen im Mittelmeerraum und PeriodO, das als online-Gazetteer Zeitbegriffe als Linked Open Data anbietet, entwickeln das i3mainz und das DAI im Rahmen des Projekts ChronOntology eine regelbasierte Software-Architektur, die auch komplexe Zeitbegriffe in ihren Abhängigkeiten und räumlichem Kontext repräsentiert. Andererseits entstehen relativchronologische Materialzeitstufen aus einem bottom-up-Verfahren anhand datierter Fundkomplexe. Diese vom Fundmaterial heraus erarbeiteten Zeitkonzepte lassen sich in ihren relativen Bezügen quantifizieren, adressieren und digital verarbeiten. Konkret können relativchronologische Zeitangaben als Intervalle verstanden werden, die in 13 unterschiedlichen Arten semantisch verarbeitet werden können (Allen 1983; Freksa 1992). Das herausfordernde ist, dass Beschreibungen von z.B. Gefäßformen als Typologien zum Aufbau relativer Chronologien verwandt wurden, an denen wiederum Zeitkonzepte gekoppelt wurden. Dies kann mit der Keramik-Forschungsdatenbank "Samian" des RGZM sichtbar gemacht werden. Der digitale Umgang mit chronologischen Kreisargumentationen bildet ein methodisches Gerüst, das auch für die Mittelalterarchäologie weiterentwickelt werden kann, wenn feingranulierte digitale Datensätze mittelalterlicher Großmanufakturen von z.B. Siegburger Schnellen oder Goudaer Tonpfeifen vorliegen.

Linking periods: Modeling and utilizing spatio-temporal concepts in the chronOntology project

Schmiedle, Wolfgang Kallas, Nathalie Cuy, Sebastian Thiery, Florian

Computer Applications and Quantitative Methods in Archaeology (CAA)

Oslo, Norway

30/04/2016

talk EN © PDF

In the last years several web services emerged that manage and make accessible place thesauri for the archaeologies and historical sciences. By making use of semantic technologies these applications are able to act as linked data hubs thereby making possibe the linkage of multiple datasets of varying thematic focus and of different structural properties. Another common denominator of archaeological data resources, besides geo-spatial properties, is the temporal classification of research objects. One of the applications that try to assume a role similar to that of gazetteers but for temporal concepts and cultural periods is developed in the chronOntology project. In this project, funded by the German Research Foundation, the German Archaeologial Institute (DAI) together with the i3mainz are developing a system for storing, managing, mapping and making accessible descriptions of temporal concepts. The core of this endeavor is a rich semantic modeling of various existing terminological systems for cultural periods using a data model based on the CIDOC-CRM and its extensions. The use of the rich ontological model provided by the CRM on the one hand permits representing the measurable temporal extent (with the possibility for fuzzy edges) while also making it possible to embed temporal concepts in a network of semantic relationships to other temporal concepts, connected historical regions and thematic contexts. Besides documenting the general architecture and data model of the project the paper will present possibilities of querying different heterogeneous data resources collected throughout various digitization and digging activities inside the DAI with the help of concepts defined in chronOntology. We will also point out the potential and problems of reasoning over geographically and temporally connected datasets.

Linked Open Data in Space and Time - A geodetic insight into humanities research using LOD

Thiery, Florian

XXIX. International Geodetic Student Meeting

Technische Universität München

04/05/2016

talk EN CC BY-SA PDF DOI10.5281/zenodo.292962

Common standards are more and more important in interdisciplinary research. In particular, the combination of geospatial data and humanities expert data, like archaeological sites, should be based on standardized formats and services. In Germany, services like Web Feature Services and Web Map Services using relational databases are part of the administrative infrastructure. Moreover, Semantic Web and Linked Open Data technologies are graph-based alternatives used more and more especially on the British islands (e.g. the Ordnance Survey modelled their geospatial data as LOD). This technology, based on the Resource Description Framework (RDF) and the idea linking online available resources is suitable for interoperable data management in time and space. This presentation gives an insight into humanities research in the eyes of a classical geodesist using RDF. Starting from an introduction of Linked Open Data, interdisciplinary projects like chronOntology and the Labeling System will be presented.

E1-P1-Arches! Aspekte interoperabler Modellierung und Bereitstellung archäologischer Fachdaten mit dem Arches Framework

Thiery, Florian Engel, Thomas

7. AG CAA Workshop

HafenCity Universität Hamburg

05/02/2016

talk DE CC BY-SA PDF DOI10.5281/zenodo.292967

Die heterogene Natur archäologischer Daten wird bis heute meist in relationalen Datenbanken abgebildet. Datenmodellierungen mit NoSQL-Datenbanken oder in Graphen, fristen auch im Jahr 2015 noch ein Nischendasein, obwohl die konzeptionellen wie auch die technischen Grundlagen seit langem zur Verfügung stehen und einen Zugang in das Web 3.0 und in die Linked Data Cloud ermöglichen. Das i3mainz (Institut für Raumbezogene Informations- und Messtechnik) arbeitet in verschiedenen Projekten mit interdisziplinären Kontexten an Graphenstrukturen, insbesondere auch an der Modellierung jener mit Hilfe des W3C-standardisierten Resource Description Framework (RDF). Ein besonderes Augenmerk liegt dabei bei der Evaluation von Methoden zur standardisierten und interoperablen Vorhaltung komplexer archäologischer Fundstellendaten. Die technische Basis bildet dabei das auf dem CIDOC Conceptual Reference Model (CIDOC CRM) und Simple Knowledge Organization System (SKOS) basierende ARCHES Heritage & Management System. Die von Kooperationspartnern innerhalb des Mainzer Zentrum für Digitalität in den Geistes- und Kulturwissenschaften»mainzed« in unterschiedlicher Form zur Verfügung gestellten archäologischen Fachdatenkönnen für eine Vielzahl von Szenarien als exemplarisch angesehen werden. Ziele der Initiative sind die standardisierte und interoperable Vorhaltung strukturiert modellierter archäologischer Datensätze. Dabei steht die Abbildung möglichst vieler Prozesse wie etwa Abfrage, Pflege, Erweiterung und Analyse im Mittelpunkt, welche auch von nicht direkt im Projekt involvierten Wissenschaftlern erbracht werden sollen. Das Paper präsentiert technische Grundlagen semantischer Datenmodellierung unter Verwendung von CIDOC CRM. Weiterhin werden prototypische Fragestellungen behandelt: Welche Voraussetzungen sollten Daten hinsichtlich Aufbau und Struktur erfüllen? Welche Schritte sind zur Datenintegration in vorhandene Graphenstrukturen nötig? Wie können diese Strukturen erweitert und auf individuelle Bedürfnisse angepasst werden? Welche prototypischen Probleme wurden dabei identifiziert? Welchen Vorteil bieten interaktive Web-Tools zur Erstellung von Thesauri (Authority Files) als Linked Open Data wie z.B. der Reference Data Manager oder das Labeling Systemgegenüber herkömmlich verwendeter, nicht HTTP-adressierbarer und nicht zitierbarer kontrollierter Vokabulare? Abschließend wird diskutiert, inwiefern CIDOC CRM modellierte Daten überhaupt geeignet sein können, eine Basis für interoperable Systeme darzustellen. Ist die CIDOC CRM inhärente Komplexität nicht gerade deswegen als problematisch zu bezeichnen? Können auf Triple basierende Modellierungen ein gleichwertiger Ersatz für auf Tupel (relationale Datenbanken) basierende Datenstrukturen darstellen oder sogar einen Mehrwert bezüglich bislang unbeantworteter Fragestellungen bilden? Welche Vorteile für den wissenschaftlichen Diskurs sind kurz- und langfristig zu erwarten?

Linked Samian Ware: challenges of a LOD approach to samian ware

Thiery, Florian

Computer Applications and Quantitative Methods in Archaeology (CAA)

Siena, Italy

01/04/2015

talk EN CC BY PDF DOI10.5281/zenodo.292968

Research in samian ware advanced considerably in recent years based on a dataset collected by several scholars in the past decades. It comprises detailed and reviewed data of potters, pots and related places in the northern provinces of the Roman Empire. The spatial distribution and chronological pattern as well as the identification of kiln sites of individual potters are key research questions. Based on this data, for instance Mees proposed a reconstruction and analysis of pottery trade networks considering archaeological material. The nature of the data makes it reasonable to approach the questions utilizing the concept of Linked Open Data (LOD) to generate interoperability and potential for data dissemination. The goal of the study presented in this presentation is to migrate a subset of these data into a LOD structure and to make it accessible through URIs in a REST interface as well as via a SPARQL endpoint. The subjective semantic relations between potters, pots and places should be visualised in the manner of linking. Furthermore the resources should be linked to existing LOD projects, for instance to Pleiades for places, using the Semantic Web to get additional information for the own resource. Potter, pots and places and their attributes could be conceptually modelled using the CIDOC-CRM. However, in the study direct linking of individual objects to mature ontologies widely used in the Semantic Web was preferred, to avoid CIDOC-CRM modelling questions. This presentation shows different modelling concepts and its challenges for each resource type using (1) an own ontology, (2) existing ontologies in the web, (3) the approach of Kerameikos as well as (4) labels of the Labeling System. The semantic links between potters, pots and places could be build via an own fixed predicate ontology or using ontologies like SKOS or Open Annotation to generate loose coupled relations. The idea of LOD is to couple related resources to build up an interlinked web of data. In the context of the study it was investigated what kind of suitable web resources are available from which the samian ware resources could benefit. On the one hand, web accessible repositories for fragments and potters are missing. On the other hand, Pleiades provides a large number of places to support geographical annotations of textural sources or archaeological objects. These places are used by the Pelagios project that links data from more than 20 partners to get additional information to an abstract Pleiades place concept. In this study, find-spots and kiln sites are mapped to Pleiades places to get additional data from the Pelagios partners. The locations in the samian dataset are reviewed and show much higher precision than the Pleiades places, so this mapping challenge have to be solved, too. The results yield that research on samian ware can benefit from implementing the concept of LOD. Enhanced perspectives arise when extending the linked data to other resources like dies and coins. When the data is published it could contribute to cross-linking of archaeological information internationally. A major challenge is finding the correct modelling concept for each resource type, as well as the semantic links between each other and to relying resources in the Semantic Web. Using technologies like the Labeling System, CIDOC-CRM, SKOS and Open Annotation can help to overcome this bottleneck. The presentation presents the results of a M.Sc. thesis delivered at the Hochschule Mainz - University of Applied Sciences in cooperation with the Römisch Germanisches Zentralmuseum Mainz (RGZM) and the Institute for Spatial Information and Surveying Technology (i3mainz).

The Labeling System: A bottom-up approach for enriched vocabularies in the humanities

Thiery, Florian Engel, Thomas

Computer Applications and Quantitative Methods in Archaeology (CAA)

Siena, Italy

31/03/2015

talk EN CC BY PDF DOI10.5281/zenodo.292970

Shared thesauri of concepts are increasingly used in the process of data modelling and annotating resources in the Semantic Web. This growing family of linked data thesauri follows a top-down principle. Vocabularies and broader concepts (SKOS-) are being created, maintained and provided under the supervision of central authorities to provide general and generic approaches used by scientists in the humanities. But the diversity of research questions in the humanities makes it virtually impossible to create shared controlled vocabularies that cover a wide range of potential applications, and therefore satisfy the needs of diverse stakeholders. Reliable interconnections among independent systems could solve this conceptual bottleneck of controlled vocabularies. The Labeling System (LS), developed by i3mainz and IEG in contrast follows a bottom-up approach, enabling scientists working in the digital humanities to manage, create and publish their own controlled vocabularies as a SKOS concept scheme and concepts provided via a REST API and URIs. One term of the vocabulary can be linked to broader corresponding concepts of domain experts and will become labels. The labels embed those broader concepts persistently into existing structures using a clean and straightforward UI. Technically the LS is defined over a flat ontology and can be queried through its triple store. The created concepts can then be interlinked with well known LOD resources from e.g. The Getty Research Institute or the British Museum, but also to authorities maintaining linked data resources from natural science domains. The LS is domain independent, while uniting perspectives of different scientific disciplines on the same label and therefore contributing to interdisciplinary collaboration for building up cross and inter-domain linked data communities. As the newly created expert resources are available persistently, the concept is quotable, which strengthens the scientific discourse of their semantic shape. The paper addresses principles of the Labeling System in the light of heterogeneous archaeological data from Western Europe and the Middle East. Consequently, “usual” archaeological topics of conceptualizing and interlinking temporal and spatial concepts (meaning) will be discussed. To what extent is it possible to align existing concepts with “inserting” specific concepts of domain experts? How can the LS be used to solve the ambiguity of a place type and its role or function in a specific archaeological meaning? Furthermore, we will show how the non-technical researcher can use the Labeling System to get introduced into the process of linked-data conceptualization. Finally, the paper details the benefits of enriching linked-data concepts through relating to linked-data communities of other domains, e.g. geology or anatomy.

The Labeling System - A New Approach to Overcome the Vocabulary Bottleneck

Piotrowski, Michael Colavizza, Giovanni Thiery, Florian Bruhn, Kai-Christian

DH-CASE

Fort Collins, USA

10/09/2014

talk EN © PDF

Shared controlled vocabularies are a prerequisite for collaborative annotation and semantic interchange. The creation and maintenance of such vocabularies is, however, time-consuming and expensive. The diversity of research questions in the humanities makes it virtually impossible to create shared controlled vocabularies that cover a wide range of potential applications and satisfy the needs of diverse stakeholders. In this paper we present a novel conceptual approach for mitigating these problems. We propose that projects define their own vocabularies as needed and link the vocabulary terms to one or more concepts in a reference thesaurus, so that the project-specific term effectively serves as a "label" for a set of shared concepts. We also describe the implementation of this approach in the Labeling System. The Labeling System is a Web application that allows users to easily import concepts or create SKOS vocabularies and link the vocabulary terms to concepts from one or more reference thesauri.

Linked Samian Ware: Potentiale von Linked Data in der Archäologie

Thiery, Florian

5. AG CAA Workshop

Eberhard Karls Universität Tübingen

15/02/2014

talk DE CC BY PDF DOI10.5281/zenodo.292971

Die räumliche Verteilung und das zeitliche Muster, sowie die Identifizierung von Produktionszentren und die Rekonstruktion von Handelsnetzen der Töpfer, sind zentrale Fragen aktueller archäologischer Forschungen zur ‚Samian Ware‘. Die Studien basieren auf einem Datensatz einer internationalen Gruppe von Wissenschaftlern. Er umfasst detaillierte Daten zu Töpfern, Keramik-Fragmenten und deren Fundorten. Zudem sind Informationen zu Befunden, Töpfermatrizen, Gefäßformen, Produktionsstätten, Formschüsselherstellern und Angaben zur absoluten zeitlichen Datierung erfasst. Der Datensatz ist damit außerordentlich gut geeignet, aktuelle Technologien interoperabler Datenhaltung, insbesondere das Konzept der Linked Open Data (LOD) und der semantischen Modellierung archäologischer Informationen, exemplarisch zu verdeutlichen. Eines der Prinzipien der Linked Open Data ist die Bereitstellung der Daten als Ressource. Diese ist sowohl menschenlesbar, steht jedoch auch zur computertechnische Verarbeitung zur Verfügung. Ein Gefäßfragment und dessen Fundort wären beispielsweise mit einem Browser im World Wide Web unter einer HTTP-Adresse frei abrufbar. Ein weiterer Informationsgewinn entsteht durch die Nutzung kontrollierter Vokabulare, nicht nur für die Beschreibung der Ressourcen, sondern auch für deren Beziehungen untereinander. In einer Reihe von Wissenschaftsfeldern werden diese Konzepte erfolgreich eingesetzt, so dass mit diesen Konzepten erstmals eine Technologie zur Verfügung steht, welche eine direkte Verknüpfung heterogener Informationen aus unterschiedlichen archäologischen Datenbanken gewährleistet. Der Vortrag führt in die Migration der Daten sowie die Möglichkeiten und die Problematik der Modellierung der Attribute und Beziehungen mit Hilfe bestehender LOD-Konzepte und kontrollierter Vokabularien ein und zeigt eigene Ansätze zur Lösung auf. Insbesondere wird die Verlinkung zu anderen bereits bestehenden Projekten diskutiert. So bietet das Pleiades-Projekt eine Plattform, die geographische Elemente z.B. in Texten mit existierenden Ressourcen verbindet. Die Fund- und Produktionsstätten sind mit den Pleiades Places verknüpft, wodurch eine Vielzahl weiterer archäologischer und historischer Informationen über das Pelagios Projekt eingebunden sind. Zudem wird das Potential der Verlinkung und Abfrage von heterogenen Informationen zwischen Töpfern, Fragmenten und Orten und deren relativ-chronologische Beziehungen über LOD mit einer webbasierten Schnittstelle aufgezeigt. Die Komplexität des Netzes sich bedingender Datierungen der Funde ist im Datenmodell direkt abgebildet. Entsprechend schnell reagiert das System auf Modifikationen und erlaubt so eine Echtzeitvisualisierung der Simulation von Änderungen in diesen Bezügen. Die Ergebnisse zeigen, dass Forschung im Bereich der römischen Keramik vom Konzept der Linked Open Data profitiert. Vielversprechende Perspektiven entstehen durch die Verknüpfung mit weiteren Ressourcen wie Matrizen, Formschlüsseln und Münzen. Die technologische Basis ist eine PostgreSQL/PostGIS Datenbank als Kommunikationsplattform für JAVA Servlets und dem GeoServer, der OGC konforme Webdienste (WMS/WFS) anbietet. Die Daten werden in einer Schnittstelle maschinenlesbar und REST-konform zur Verfügung gestellt, die mit Hilfe von JAVA und den Frameworks Jersey, JAX-B und Hibernate Spatial, sowie dem GeoServer verarbeitet werden. Die beschriebenen Strukturen erlauben somit eine webbasierte Kartenansicht auf dem Client mit der JavaScript Bibliothek Leaflet unter Einbeziehung der Abhängigkeiten zwischen Töpfern, Fragmenten und Fundorten. Darüber hinaus ergibt eine ontologische Modellierung der semantischen Bezüge Potentiale für die Extraktion des in den Daten implizit vorhandenen Wissens. Der Vortrag ist das Ergebnis einer Masterarbeit an der Fachhochschule Mainz und wird die Ergebnisse kritisch reflektieren und damit einen Einstieg in diese neue Technologie erleichtern.

The Labelling System: A Bottom-up Approach for Enriched Vocabularies in the Humanities

Thiery, Florian Engel, Thomas

paper EN © Link ISBN9781784913380

mit Thomas Engel: The Labeling System: The Labelling System: A Bottom-up Approach for Enriched Vocabularies in the Humanities. In Stefano Campana, Roberto Scopigno, Gabriella Carpentiero und Marianna Cirillo, Hrsg., CAA2015. Keep The Revolution Going. Proceedings of the 43rd Annual Conference on Computer Applications and Quantitative Methods in Archaeology, Volume 1, 259-268, Oxford, NY, England, 2015. Archeopress Publishing Ltd. ISBN: 9781784913380.

The Labeling System: A new approach to overcome the vocabulary bottleneck

Piotrowski, Michael Colavizza, Giovanni Thiery, Florian Bruhn, Kai-Christian

paper EN © Link DOI10.1145/2657480.2657482

mit Michael Piotrowski, Giovanni Colavizza und Kai-Christian Bruhn: The Labeling System: A new approach to overcome the vocabulary bottleneck. In Patrick Schmitz, Laurie Pearce und Quinn Dombrowski, Hrsg., Proceedings of DH-CASE II: Collaborative Annotations on Shared Environments: Metadata, Tools and Techniques in the Digital Humanities, article A1, New York, NY, USA, 2014. ACM. DOI: 10.1145/2657480.2657482.

Modular Imaging Total Stations - Sensor Fusion for high precision alignment

Hauth, Stefan Schlüter, Martin Thiery, Florian

paper EN © PDF

mit Stefan Hauth und Martin Schlüter: Modular Imaging Total Stations - Sensor Fusion for high precision alignment. In V. Schwieger et al., Hrsg., 3rd International Conference on Machine Control & Guidance Proceedings, 202-210, Stuttgart, 2012.

Schneller und ausdauernder als das menschliche Auge: Modulare Okularkameras am Motortachymeter

Hauth, Stefan Schlüter, Martin Thiery, Florian

journal article DE © LINK

mit Stefan Hauth und Martin Schlüter: Schneller und ausdauernder als das menschliche Auge: Modulare Okularkameras am Motortachymeter. Allgemeine Vermessungs-Nachrichten (avn), Vol. 120, Nr. 6, 210-216, 2013.

Semantic Web und Linked Data: Generierung von Interoperabilität in archäologischen Fachdaten am Beispiel römischer Töpferstempel

Thiery, Florian

Master of Science Geoinformatik und Vermessung Fachhochschule Mainz

thesis DE CC BY-NC-SA talk PDF LINK DOI10.5281/zenodo.292979

Semantic Web und Linked Data: Generierung von Interoperabilität in archäologischen Fachdaten am Beispiel römischer Töpferstempel, Masterarbeit, Standnummer KM042, Betreuer: Prof. Kai-Christian Bruhn, in Zusammenarbeit mit dem Institut für Raumbezogene Informations- und Messtechnik (i3mainz) und dem Römisch-Germanischen Zentralmuseum (RGZM), Fachhochschule Mainz, 13. Juni - 11. Dezember 2013.

Gegenstand der Masterarbeit ist die Verwendung aktueller Technologien interoperabler Datenhaltung, insbesondere das Konzept der Linked Open Data (LOD) und der semantischen Modellierung, zur Verdeutlichung ihres Potentials in archäologischen Informationen am Beispiel von Terra Sigillata-Fundorten, -Töpfern und -Keramikfragmenten. Die Arbeit zeigt eine Migration von Daten, sowie die Möglichkeiten und die Problematik der Modellierung der Attribute und Beziehungen mit Hilfe bestehender LOD-Konzepte und kontrollierter Vokabularien, sowie eigene Ansätze zur Lösung. Diese Daten werden mittels REST-Schnittstelle zur Verfügung gestellt. Ein Schwerpunkt wird auf die Verlinkung zu anderen bereits bestehenden Projekten gelegt, wodurch eine Vielzahl weiterer archäologischer und historischer Informationen z.B. über das Pelagios Projekt eingebunden werden. Zudem wird das Potential der Verlinkung und Abfrage von heterogenen Informationen zwischen Töpfern, Fragmenten und Orten deren relativ chronologische Beziehungen über LOD mit einer webbasierten Schnittstelle aufgezeigt.

Eignung aktueller Industriekameras für modulare Digitalkameratachymeter

Thiery, Florian

Bachelor of Science Geoinformatik und Vermessung Fachhochschule Mainz

thesis DE CC BY-SA talk PDF LINK DOI10.5281/zenodo.292977

Eignung aktueller Industriekameras für modulare Digitalkameratachymeter, Bachelorarbeit, Standnummer B0066, Betreuer: Prof. Martin Schlüter, in Zusammenarbeit mit dem Institut für Raumbezogene Informations- und Messtechnik (i3mainz), Fachhochschule Mainz, 14. April - 01. Juni 2011.

Gegenstand der Bachelorarbeit ist die Bestimmung des Auflösungsvermögens des MoDiTa-Systems, sowie die Untersuchung von Techniken und Einstellungen zur Verbesserung der Sichtbarkeit von Himmelskörpern und Laserdots. Zudem werden Tools vorgestellt, die es ermöglichen, Aufnahmen von Targets im gesamten Blickfeld in Messserien zu erzeugen und das Auflösungsvermögen automatisch zu bestimmen. Verschiedene Komponenten des MoDiTa-Systems haben unterschiedliche Einflüsse auf das Auflösungsvermögen. Diese Arbeit zeigt die Unterschiede auf und gibt schlussendlich Empfehlungen für den Einsatz bestimmter Komponenten und Einstellungen bei der Bestimmung des Auflösungsvermögens.

labeling system

Thiery, Florian Kunz, Axel Dufner, Matthias

Get Together DH-RMU

Mainz, Deutschland

09/2017

poster DE CC BY PDF DOI10.5281/zenodo.921997

Als Linked Open Data wird die direkte Vernetzung von frei verfügbaren Daten im Internet bezeichnet. Aufgrund der ständig wachsenden Datenmenge ergeben sich für die Wissenschaften daraus ganz neue Erkenntnismöglichkeiten. Dieses Wissensnetzwerk kämpft unter anderem mit dem Problem von nicht eindeutigen Begrifflichkeiten. Der natürliche Wortlaut eines Begriffs genügt datenverarbeitenden Systemen oftmals nicht, um sich dessen exakte Bedeutung zu erschließen. Eine maschinenlesbare Definition beinhaltet daher neben natürlichsprachlicher Erläuterungen auch Verknüpfungen zu anderen Datenquellen, um den korrekten Begriffskontext sicherzustellen. Labeling System ist eine Web-App, die an dieser Stelle ansetzt und mittels einer leicht bedienbaren Nutzeroberfläche das Erstellen von Begriffen und deren maschinenlesbarer Definitionen ermöglicht. Wissenschaftler*innen haben so die Möglichkeit, ihr Wissen als ”Linked Open Data“ zur Verfügung zu stellen und somit die Qualität der Forschungsdaten in ihrem Arbeitsgebiet zu verbessern.

Das Labeling System – ein freier Baukasten für kontrollierte Vokabulare

Piotrowski, Michael Thiery, Florian Bruhn, Kai-Christian

DHd-Tagung

Graz, Österreich

02/2015

poster DE © PDF

Maschinenlesbare Annotationen sind die Voraussetzung für die semantische Verarbeitung von Daten. Diese Aussage gilt unabhängig davon, ob es sich bei den Daten um natürlichsprachigen Text oder um strukturierte Datensätze in einer Datenbank handelt, und unabhängig davon, ob es um einfaches Sortieren und Filtern geht oder um komplexes automatisches Schließen. Kontrollierte Vokabulare (ob in einer einfachen Terminolgieliste oder als Taxonomien, Thesauri oder Ontologien strukturiert) sind dabei unbedingt notwendig, um Annotationen maschinell verarbeitbar zu machen; ohne terminologische Kontrolle sind Annotationen für die maschinelle Verarbeitung kaum nützlicher als an den Rand eines Buches gekrizelte Notizen. Kontrollierte Vokabulare abstrahieren von natürlichsprachlichen Ambiguitäten und Konnotationen; sie sind daher entscheidend für die semantische Verarbeitung von Forschungsdaten. Um projektübergreifende Zusammenarbeit und den semantischen Austausch von Daten zu ermöglichen, müssen Vokabulare nicht nur kontrolliert, sondern auch formell oder informell standardisiert sein. Standardisierte kontrollierte Vokabulare ermöglichen den Austausch, die Kombination und die gemeinsame Analyse annotierter Daten aus verschiedenen Quellen sowie die Implementierung generischer Werkzeuge für die semantische Verarbeitung. Erstellung und Wartung standardisierter kontrollierter Vokabulare sind jedoch zeitaufwändig und damit teuer. Zu den größten Herausforderungen zählen, dass alle beteiligten Parteien zu einem gemeinsamen Verständnis der Begriffe kommen, und dass die richtige Balance zwischen möglichst breiter Anwendbarkeit einerseits und möglichst präziser Analyse andereseits gefunden werden. Diese Ziele sind insbesondere in den Geisteswissenschaften schwierig zu erreichen: nicht nur sind die Forschungsfragen, die potentiell an einen gegebenen Datensatz gerichtet werden können, extrem weit gefächert, sondern die Kategorisierung der Daten ist häufig ein essenzieller Teil des Forschungsprozesses selbst. Es gibt daher einen eklatanten Mangel an standardisierten kontrollierten Vokabularen in den Geisteswissenschaften, der Digital-Humanities-Projekte letztlich dazu zwingt, eigene, projektspezifische Vokabulare zu definieren. Projektspezifische Vokabulare lösen können den internen Bedarf zwar kurzfristig befriedigen, sind aber nicht interoperabel und verhindern den zukünftigen Austausch und die Nachnutzung der annotierten Daten. Unser Poster stellt einen neuen konzeptuellen Ansatz zur Lösung dieser Probleme vor und beschreibt die Implementierung dieses Ansatzes in einem Softwarewerkzeug, dem Labeling System. Da es in der geisteswissenschaftlichen Forschung praktisch unmöglich ist, kontrollierte Vokabulare zu definieren, die alle denkbaren Anwendungen abdecken und generell akzeptiert sind, schlagen wir ein anderes Vorgehen vor. Bei unserem Ansatz definieren Projekte ihre eigenen Vokabulare, aber anstelle natürlichsprachlicher Definitionen werden die Terme mit einem oder mehreren Konzepten in einem Referenzthesaurus verknüpft. Der projektspezifische Term dient also quasi als »Label« für eine Menge gemeinsamer Konzepte. Dieser Ansatz ermöglicht es Projekten Vokabulare entsprechend ihrer Bedürfnisse und unter Verwendung im jeweiligen Forschungsgebiet üblichen Bezeichnungen benutzen, während gleichzeitig die Interoperabilität mit anderen Projekten über den Referenzthesaurus gewährleistet ist. Das Labeling System ist eine Webanwendung, die es Benutzern ermöglicht, SKOSVokabulare zu erstellen und auf einfache Weise deren Terme mit einem oder mehreren Konzepten in einem oder mehreren Referenzthesauri zu verknüpfen. Die Benutzeroberfläche ermöglicht die Visualisierung der definierten Vokabulare in einer hierarchischen Baumstruktur und ermöglicht den Zugriff auf Vokabulare über eine SPARQL-Schnittstelle. Das Labeling System basiert auf ausgereiften Open-SourceKomponenten und ist selbst ebenfalls frei verfügbar.

Das Labeling System – Lösen der Mehrdeutigkeiten von Räumen und deren Funktion

Thiery, Florian Bruhn, Kai-Christian

DHMainz | Forum DHMainz

JGU Mainz

30/05/2014

poster DE CC BY PDF DOI10.5281/zenodo.292974

Linking potter, pots and places: a LOD approach to samian ware

Thiery, Florian

Computer Applications and Quantitative Methods in Archaeology (CAA)

Paris, France

04/2014

poster EN CC BY PDF DOI10.5281/zenodo.292975

The Roman imperial period is known for the introduction of a red glossy pottery, the so called samian ware. It is crucial for archaeologists to date Roman sites in the Northern provinces. The research in samian ware pottery advanced in recent years. The spatial distribution and chronological pattern as well as the identification of kilnsites of individual potters are key research questions. Most recent studies are based on a dataset collected by several scholars in the past decades. It comprises detailed and reviewed data of potters, pots and related places. The character of the data makes it reasonable to approach it utilizing the concept of the Linked Open Data (LOD) in order to increase its potential for research. The goal of the study presented in this poster is to migrate a subset of these data into an appropriate structure and to make it accessible through URIs. Furthermore the place resources should be linked to existing LOD projects. Finally the query of the links between potters, pots and places was to render possible through a web based interface. The interoperability and possibility for data sharing is achieved by implementing suitable XML schemes (e.g. GML, MIDAS). Findspots and kilnsites are mapped to Pleiades places to benefit from the Pelagios project. Typically Pleiades places are designed to support geographical annotation of textual sources or archaeological objects. A major challenge of the study was to link the ‘samian places' to Pleiades places, because each follow their own spatial concept. Another aspect was the chronological information entailed in the dataset. Simulations of changes in the relative chronology of the material revealed the potential of the linked data approach by providing immediate access to all implications on related datasets. The results yield that research on samian ware can benefit from implementing the concept of LOD. Enhanced perspectives arise when extending the linked data to other resources like dies and coins. When the data is published it could contribute to the international crosslinking of archaeological information. Moreover, the data is ready for semantically modelling the relations in an ontology to foster the disclosure of knowledge hidden in the data. The poster presents the results of a M.Sc. Thesis delivered at the University of Applied Sciences Mainz.

The Labeling System: A bottom-up approach for enriched vocabularies in the humanities.

Thiery, Florian Engel, Thomas

video EN YouTube