Semantische Modellierung Formale Beschreibung Topic Maps Index

Transcription

Semantische Modellierung Formale Beschreibung Topic Maps Index
Formale Beschreibung
Semantische Modellierung
• Zwecke: Suche, Verknüpfung, Inferenz
• Ziel: „Wissensbasierte“ Suche
• Topic Maps als index-basiertes
Datenmodell
• Wissensrepräsentation und
-verarbeitung
• Beschreibungslogiken und OWL-DL
• Formale Ontologien
• Metadaten: Grobkörnige Beschreibung
– des Originalobjekts
– von Bildern, Reproduktionen des Objekts
– von „großen“ Objektkomponenten (und KomponentenBildern)
• Feinkörnige Beschreibung von Objektkomponenten
–
–
–
–
Visuell identifizierte Elemente (Klassifikation)
Weitere Eigenschaften: Konstruktion, Materialien, ...
Ikonographie
Interpretation
G. Görz, FAU, Informatik 8
G. Görz, FAU, Informatik 8
Topic Maps
Index
• Themenzentriertes Datenmodell
– orientiert am Konzept des Index
– vs. ressourcen-zentriertes Datenmodell von
RDF
• ISO/IEC-Standard 13250, 1999
• Topic Map: Kollektion von Topic-MapDokumenten (in SGML-Syntax)
• Graphen-Darstellung
G. Görz, FAU, Informatik 8
• Führt alle
Fundstellen für einen
Suchterminus auf
• Keine semantische
Gewichtung und
Strukturierung
• Datentyp
„Wörterbuch“
G. Görz, FAU, Informatik 8
Struktur in einem Buchindex
Topic Maps
• Topic maps originated in work on the merging of
electronic indexes and so are very much a subjectbased classification technique. In fact, topic maps are
organized around topics, and each topic is used to
represent some real-world thing. Topics represent
concepts, the same way terms in an indexing language
refer to concepts. In topic maps the concepts are called
subjects, and the standard emphatically states that a
subject can be "anything whatsoever".
• In topic maps, three constructs are provided for
describing the subjects represented by the topics:
names, occurrences, and associations. These
describe the names, properties, and relationships of
subjects, respectively... (Garshol 2004)
© Schlieder
•
G. Görz, FAU, Informatik 8
G. Görz, FAU, Informatik 8
Topic Maps
Topic Maps: Beispiel
Semantik der Graphenknoten auf der Objektebene: „Topics“,
eingeteilt in drei Typen
– „Subjects“ (Themen)
– „Associations“ (Verknüpfungen)
– „Scopes“ (Bereiche)
•
Beschreibung der durch die Topics dargestellen Themen:
– „Names“: Namen
– „Occurrences“: Eigenschaften
– „Associations“: Beziehungen der Themen untereinander
(n-stellig!)
• Keine strikte Trennung von Konzepten und Individuen
• Mapping TopicMaps <--> RDF (Lacher/Decker)
G. Görz, FAU, Informatik 8
G. Görz, FAU, Informatik 8
Topic Maps: Assoziationen
G. Görz, FAU, Informatik 8
„Omnigator“: Topic Map Navigator
G. Görz, FAU, Informatik 8
Eine Topic-basierte Suchmaschine
Topic Page: Individual
KartOO
G. Görz, FAU, Informatik 8
G. Görz, FAU, Informatik 8
Wissensrepräsentation und
-verarbeitung
Formale Beschreibung II:
Feinkörnige logische Objektbeschreibung
• Suche/Objektzugriff und Navigation in herkömmlichen
Hypermedia-Systemen ist im Prinzip text- und link-basiert:
– Auf einzelne Objekte beschränkt
– I.d.R. unklare Systematisierung des Bereichsvokabulars
• im günstigsten Fall Unterstützung durch Thesaurus
– Volltextsuche, Glossar-Unterstützung
– Visuelle Suche, wenn überhaupt, stark eingeschränkt
– Einfache Verknüpfung durch Links
• Komplexe (systematische) Anfragen - z.B. nach
Objekteigenschaften, Mengen von Objekten und
Eigenschaften, Topologie, Orientierung ???
• => Wissensrepräsentation erforderlich!
• Formale Wissens-Rekonstruktion und Implementation
– in einem (logischen) Kalkül
(... zweckgeleitet!)
• Interpretation der formalen Ausdrücke
– durch widerspruchsfreie, vollständige und effiziente
Inferenzalgorithmen
• Verwaltung und Aktualisierung formal repräsentierter
Wissensbestände
• Ziel: Systematische Verarbeitung komplexer Anfragen,
die weit über die in Links (vorab fest) gespeicherten
Assoziationen hinausgehen
=> Erstellung eines formalen begrifflichen Modells
(„formale Ontologie“), über dem durch einen
Inferenzmechanismus (logische) Schlüsse gezogen
werden können
G. Görz, FAU, Informatik 8
G. Görz, FAU, Informatik 8
Formale Ontologien
(Formal) Library Ontology [Stanford]
• bestehen aus (formalen) Definitionen („Beschreibungen“) der
Konzepte und Relationen in einem Sachgebiet:
– Die Konzepte (Klassen, Kategorien) resultieren aus Prädikation
und Abstraktion und werden durch Prädikate repräsentiert
Frage: Was? (im Unterschied zur Funktion: Wie?)
– Relationen zwischen Konzepten ergeben sich aus
terminololgischen Regeln und werden in einer Ober-/UnterKonzepthierarchie repräsentiert: Hyponymie: is-Relation
– Konzepten werden Eigenschaften („Rollen“, Attribute)
zugewiesen, repräsentiert durch (binäre) Relationen
has-Relation (im Unterschied zu Teil-Ganzes-Relationen -Mereonymie)
– Rollen können bzgl ihrer Werte eingeschränkt werden:
Constraints
– Weitere inhaltliche Relationen werden in Regeln („Axiomen“)
festgehalten
– Individuen: Instanzen von Klassen
G. Görz, FAU, Informatik 8
• X
G. Görz, FAU, Informatik 8
Beschreibungslogik:
Objekt- / Klassenbasierte Repräsentation
SEMANTIK: Begriffsnetz und logische Kombination
• Prädikate (Begriffe), einstellig: Konzepte (Klassen)
• Relationen, zweistellig: Rollen (funktional: Attribute)
• Individuen (Instanzen) mit Angabe von Konzept und
Rollenfüllern
• Konzept- und rollenbildende Operatoren
• Einschränkungen für Rollenwerte
• Anordnung von Konzepten und Rollen in einer
taxonomischen Vererbungs-Hierarchie
• Trennung der Terminologie (Begriffsnetz) von der
Beschreibung von Sachverhalten (mit Instanzen)
Beschreibungslogik: Inferenzen
• Entscheidbare Teilmenge(n) der Standardlogik mit
effizientem Inferenzalgorithmus
• Inferenzen: Logische Folgerungen von Aussagen über
Konzepte und Individuen
Gegeben eine Konzeptbeschreibung,
– ist sie konsistent mit der Terminologie?
– Ist eine andere Beschreibung spezieller oder allgemeiner
(Subsumtion)?
– Ist eine andere Beschreibung äquivalent (bedeutungsgleich)?
Bezeichnen zwei Klassen dieselbe Menge von Individuen?
– Was sind die speziellsten eingeführten Konzepte, mit denen
man die gegebene Beschreibung klassifizieren kann?
=> Strukturierung des Wissens, Berechnung der Taxonomie
Gegeben die Beschreibung eines Individuums,
– Ist es Instanz einer Klasse (Instantiierung) ?
– Retrieval der Instanzen einer Klasse
=> Flexible, komplexe (logisch verknüpfte) Anfragen
G. Görz, FAU, Informatik 8
Semantic Web: Sprachschichten
G. Görz, FAU, Informatik 8
OWL: Web Ontology Language
(<= DAML+OIL)
• OWL-DL: (Beschreibungs-) logische
Erweiterung für Frame-Sprachen
– Formal definierte Semantik
– Inferenzkomponente
• Erlaubt Klassenausdrücke statt –namen
– Verknüpfung mit AND OR NOT
• Restriktionen auf Attributen
– has-value value-type cardinality ...
• Eigenschaften von Attributen
– transitive symmetric ...
G. Görz, FAU, Informatik 8
G. Görz, FAU, Informatik 8
OWL-DL
• verleiht RDF(S) eine präzise Semantik
• entspricht einer ausdrucksstarken
Beschreibungslogik: SHIQ
G. Görz, FAU, Informatik 8
OWL /OIL als RDF(S)-Erweiterung
OWL /OIL als RDF(S)-Erweiterung
(1/2)
<rdfs:Class rdf:ID=”herbivore”>
<rdf:type
rdf:resource=”http://www.ontoknowledge.org/#DefinedClass”/>
<rdfs:subClassOf rdf:resource=”#animal”/>
<rdfs:subClassOf>
<oil:NOT>
<oil:hasOperand rdf:resource=”#carnivore”/>
</oil:NOT>
</rdfs:subClassOf>
</rdfs:Class>
© van Harmelen
OWL /OIL als RDF(S)-Erweiterung
(2/2)
(1/2)
<rdfs:Class rdf:ID=”herbivore”>
<rdf:type
rdf:resource=”http://www.ontoknowledge.org/#DefinedClass”/>
<rdfs:subClassOf rdf:resource=”#animal”/>
<rdfs:subClassOf>
<oil:NOT>
<oil:hasOperand rdf:resource=”#carnivore”/>
</oil:NOT>
</rdfs:subClassOf>
</rdfs:Class>
© van Harmelen
G. Görz, FAU, Informatik 8
RDF(S)
•
•
•
•
•
•
class-def
subclass-of
slot-def
subslot-of
domain
range
G. Görz, FAU, Informatik 8
© van Harmelen
OIL
• class-expressions
• AND, OR, NOT
• slot-constraints
• has-value, value-type
• cardinality
• slot-properties
G. Görz, FAU, Informatik 8
• trans, symm
Erweiterbarkeit
Methodologische Aspekte
Formaler Ontologien
• Formale Ontologie
– Standardisierte terminologische/begriffliche Hierarchie
• Konzepte („is“ - intransitiv, Substanz)
• Relationen („has“ - transitiv, Akzidentien)
– Axioms: constraints; rules, ...
• Referenz-Ontologien
– Generisches, universelles Konzept-Inventar
Repräsentationssprache und fundamentale Unterscheidungen
– Fundierende Relationen: Ganze & Teile (Mereologie),
Ähnlichkeit, Abhängigkeit, Verbindung, Inhärenz, zeitliche Ordnung
• Anwendungs-Ontologien („Domänen-Ontologien“)
– Modellerung spezieller Anwendungsgebiete
G. Görz, FAU, Informatik 8
G. Görz, FAU, Informatik 8
Referenz-Ontologien
Anwendungs-Ontologien
• Characteristika
• Characteristika
– Theoretischer Fokus auf (axiomatischer) Repräsentation
– Methodisches Gewicht auf Genauigkeit und
Komprehensivität
– Metaklassenschema
• Verwendung
– Allgemeiner theoretischer Rahmen
– Generische „upper ontology“ (soweit comp. traktabel)
• Beispiele: DOLCE (Guarino), Sowa, Smith,... [SUMO]
• Ist formale Rekonstruktion unabhängig von Zwecken?
– Erfüllen Anforderungen, um bestimmte Aufgaben zu lösen
– Theoretischer Fokus auf Schließen (Inferenz)
– Methodisches Gewicht auf Genauigkeit
• Verwendung
– Bereitstellung von Objektbeschreibungen (Instanzen:
Objekte des Anwendungsbereichs)
– Inferenz für Suche (Retrieval), Planung, Konfiguration,
Diagnose,...
– Kommunikation und Wiederverwendung des Wissens
(Semantic Web)
• Beispiele
– viele..., s. Protégé-Homepage
G. Görz, FAU, Informatik 8
G. Görz, FAU, Informatik 8
CIDOC Common Reference
Model
• CIDOC CRM: (Formale) Ontologie für
die Dokumentation in den
Kulturwissenschaften
– ISO 21127: „A Reference Ontology for the
Interchange of Cultural Heritage
Information“
The CIDOC CRM
Historical Archives….
Type:
Title:
Title.Subtitle:
Date:
Creator:
Republics
Publisher:
Subject:
Metadata
• Erweiterbar
• Verknüpfungen mit Dublin Core, IFLA
FRBR,...
G. Görz, FAU, Informatik 8
Text
Protocol of Proceedings of Crimea Conference
II. Declaration of Liberated Europe
February 11, 1945.
The Premier of the Union of Soviet Socialist
The Prime Minister of the United Kingdom
The President of the United States of America
State Department
Postwar division of Europe and Japan
Documents
About…
G. Görz, FAU, Informatik 8
© Doerr
The CIDOC CRM
The CIDOC CRM
Places and Objects
Images, non-verbose…
Type:
Title:
Date:
Publisher:
Source:
Copyright:
References:
Image
Allied Leaders at Yalta
1945
United Press International (UPI)
The Bettmann Archive
Corbis
Churchill, Roosevelt, Stalin
Metadata
Photos, Persons
“The following declaration has been approved:
The Premier of the Union of Soviet Socialist Republics,
the Prime Minister of the United Kingdom and the President
of the United States of America have consulted with each
other in the common interests of the people of their countries
and those of liberated Europe. They jointly declare their mutual
agreement to concert…
….and to ensure that Germany will never again be able to
disturb the peace of the world…… “
TGN Id: 7012124
Names: Yalta (C,V), Jalta (C,V)
Types:
inhabited place(C), city (C)
Position: Lat: 44 30 N,Long: 034 10 E
Hierarchy: Europe (continent) <– Ukrayina (nation) <– Krym (autonomous republic)
Note:
…Site of conference between Allied powers in WW II in 1945; ….
Source: TGN, Thesaurus of Geographic Names
Places, Objects
About…
About…
Title:
Yalta, Crimean Peninsula
Publisher: Kurgan-Lisnet
Source:
Liaison Agency
© Doerr
G. Görz, FAU, Informatik 8
© Doerr
G. Görz, FAU, Informatik 8
The CIDOC CRM
Explicit Events, Object Identity, Symmetry
E52 TimeSpan
February
E7 Activity
P7 took place
at
“Crimea Conference”
E39
Actor
E55 Types
E38 Image
P6
to 7 is
by ref
err
ed
E65 Creation
P86 falls
within
refer to / refine
refer to / identifie
1945
P82 at
some
P11
time
par
within
in
tici
pat
ed
E53 Place
7012124
E41 Appellations
E39
Actor
The CIDOC CRM
Top-level Entities relevant for Integration
E18 Physical Stuff
participate in affect or / refer to
location
Event
E39
Actor
© Doerr
*
P14 ormed
f
per
P81 ongoing
throughout
E52 TimeSpan
11-2-1945
P9
cre 4 ha
at s
ed
E28 Conceptual Objects
E39 Actors
E2 Temporal Entities
E31 Document
“Yalta Agreement”
G. Görz, FAU, Informatik 8
Objektbeschreibung als CIDOC
CRM-Instanz
at
E52 Time-Spanswithin
G. Görz, FAU, Informatik 8
© Doerr
Crosswalks need a common ontology
Dublin Core
CIDOC CRM
DC.Identifier: Louvre INV.779
DC.Type:
Image
E19 Physical
Object
Louvre
INV.779
Physical Object
FRBR
Conceptual Object
material objects can only
be at one place at a time!
AAT
paintings
DOI:10.9876/MonaLisa.jpg
BT !
electronic images
BT
has type oil paintings
DOI:10.9876/MonaLisa.jpg
© Doerr
FRBR
visual works
BT
© Doerr
E38 Image
Expression.Id:
BT !
Louvre INV.779
CIDOC CRM
DOI:10.9876/MonaLisa.jpg
Manifestation.Id:
Louvre INV.779
G. Görz, FAU, Informatik 8
E53 Places
has type
digital images
G. Görz, FAU, Informatik 8
immaterial objects
reside on carriers!
CIDOC CRM in OWL / Protégé-Editor
G. Görz, FAU, Informatik 8
G. Görz, FAU, Informatik 8
G. Görz, FAU, Informatik 8
G. Görz, FAU, Informatik 8
© Doerr/LeBoeuf