Semantische Modellierung Formale Beschreibung Topic Maps Index
Transcription
Semantische Modellierung Formale Beschreibung Topic Maps Index
Formale Beschreibung Semantische Modellierung • Zwecke: Suche, Verknüpfung, Inferenz • Ziel: „Wissensbasierte“ Suche • Topic Maps als index-basiertes Datenmodell • Wissensrepräsentation und -verarbeitung • Beschreibungslogiken und OWL-DL • Formale Ontologien • Metadaten: Grobkörnige Beschreibung – des Originalobjekts – von Bildern, Reproduktionen des Objekts – von „großen“ Objektkomponenten (und KomponentenBildern) • Feinkörnige Beschreibung von Objektkomponenten – – – – Visuell identifizierte Elemente (Klassifikation) Weitere Eigenschaften: Konstruktion, Materialien, ... Ikonographie Interpretation G. Görz, FAU, Informatik 8 G. Görz, FAU, Informatik 8 Topic Maps Index • Themenzentriertes Datenmodell – orientiert am Konzept des Index – vs. ressourcen-zentriertes Datenmodell von RDF • ISO/IEC-Standard 13250, 1999 • Topic Map: Kollektion von Topic-MapDokumenten (in SGML-Syntax) • Graphen-Darstellung G. Görz, FAU, Informatik 8 • Führt alle Fundstellen für einen Suchterminus auf • Keine semantische Gewichtung und Strukturierung • Datentyp „Wörterbuch“ G. Görz, FAU, Informatik 8 Struktur in einem Buchindex Topic Maps • Topic maps originated in work on the merging of electronic indexes and so are very much a subjectbased classification technique. In fact, topic maps are organized around topics, and each topic is used to represent some real-world thing. Topics represent concepts, the same way terms in an indexing language refer to concepts. In topic maps the concepts are called subjects, and the standard emphatically states that a subject can be "anything whatsoever". • In topic maps, three constructs are provided for describing the subjects represented by the topics: names, occurrences, and associations. These describe the names, properties, and relationships of subjects, respectively... (Garshol 2004) © Schlieder • G. Görz, FAU, Informatik 8 G. Görz, FAU, Informatik 8 Topic Maps Topic Maps: Beispiel Semantik der Graphenknoten auf der Objektebene: „Topics“, eingeteilt in drei Typen – „Subjects“ (Themen) – „Associations“ (Verknüpfungen) – „Scopes“ (Bereiche) • Beschreibung der durch die Topics dargestellen Themen: – „Names“: Namen – „Occurrences“: Eigenschaften – „Associations“: Beziehungen der Themen untereinander (n-stellig!) • Keine strikte Trennung von Konzepten und Individuen • Mapping TopicMaps <--> RDF (Lacher/Decker) G. Görz, FAU, Informatik 8 G. Görz, FAU, Informatik 8 Topic Maps: Assoziationen G. Görz, FAU, Informatik 8 „Omnigator“: Topic Map Navigator G. Görz, FAU, Informatik 8 Eine Topic-basierte Suchmaschine Topic Page: Individual KartOO G. Görz, FAU, Informatik 8 G. Görz, FAU, Informatik 8 Wissensrepräsentation und -verarbeitung Formale Beschreibung II: Feinkörnige logische Objektbeschreibung • Suche/Objektzugriff und Navigation in herkömmlichen Hypermedia-Systemen ist im Prinzip text- und link-basiert: – Auf einzelne Objekte beschränkt – I.d.R. unklare Systematisierung des Bereichsvokabulars • im günstigsten Fall Unterstützung durch Thesaurus – Volltextsuche, Glossar-Unterstützung – Visuelle Suche, wenn überhaupt, stark eingeschränkt – Einfache Verknüpfung durch Links • Komplexe (systematische) Anfragen - z.B. nach Objekteigenschaften, Mengen von Objekten und Eigenschaften, Topologie, Orientierung ??? • => Wissensrepräsentation erforderlich! • Formale Wissens-Rekonstruktion und Implementation – in einem (logischen) Kalkül (... zweckgeleitet!) • Interpretation der formalen Ausdrücke – durch widerspruchsfreie, vollständige und effiziente Inferenzalgorithmen • Verwaltung und Aktualisierung formal repräsentierter Wissensbestände • Ziel: Systematische Verarbeitung komplexer Anfragen, die weit über die in Links (vorab fest) gespeicherten Assoziationen hinausgehen => Erstellung eines formalen begrifflichen Modells („formale Ontologie“), über dem durch einen Inferenzmechanismus (logische) Schlüsse gezogen werden können G. Görz, FAU, Informatik 8 G. Görz, FAU, Informatik 8 Formale Ontologien (Formal) Library Ontology [Stanford] • bestehen aus (formalen) Definitionen („Beschreibungen“) der Konzepte und Relationen in einem Sachgebiet: – Die Konzepte (Klassen, Kategorien) resultieren aus Prädikation und Abstraktion und werden durch Prädikate repräsentiert Frage: Was? (im Unterschied zur Funktion: Wie?) – Relationen zwischen Konzepten ergeben sich aus terminololgischen Regeln und werden in einer Ober-/UnterKonzepthierarchie repräsentiert: Hyponymie: is-Relation – Konzepten werden Eigenschaften („Rollen“, Attribute) zugewiesen, repräsentiert durch (binäre) Relationen has-Relation (im Unterschied zu Teil-Ganzes-Relationen -Mereonymie) – Rollen können bzgl ihrer Werte eingeschränkt werden: Constraints – Weitere inhaltliche Relationen werden in Regeln („Axiomen“) festgehalten – Individuen: Instanzen von Klassen G. Görz, FAU, Informatik 8 • X G. Görz, FAU, Informatik 8 Beschreibungslogik: Objekt- / Klassenbasierte Repräsentation SEMANTIK: Begriffsnetz und logische Kombination • Prädikate (Begriffe), einstellig: Konzepte (Klassen) • Relationen, zweistellig: Rollen (funktional: Attribute) • Individuen (Instanzen) mit Angabe von Konzept und Rollenfüllern • Konzept- und rollenbildende Operatoren • Einschränkungen für Rollenwerte • Anordnung von Konzepten und Rollen in einer taxonomischen Vererbungs-Hierarchie • Trennung der Terminologie (Begriffsnetz) von der Beschreibung von Sachverhalten (mit Instanzen) Beschreibungslogik: Inferenzen • Entscheidbare Teilmenge(n) der Standardlogik mit effizientem Inferenzalgorithmus • Inferenzen: Logische Folgerungen von Aussagen über Konzepte und Individuen Gegeben eine Konzeptbeschreibung, – ist sie konsistent mit der Terminologie? – Ist eine andere Beschreibung spezieller oder allgemeiner (Subsumtion)? – Ist eine andere Beschreibung äquivalent (bedeutungsgleich)? Bezeichnen zwei Klassen dieselbe Menge von Individuen? – Was sind die speziellsten eingeführten Konzepte, mit denen man die gegebene Beschreibung klassifizieren kann? => Strukturierung des Wissens, Berechnung der Taxonomie Gegeben die Beschreibung eines Individuums, – Ist es Instanz einer Klasse (Instantiierung) ? – Retrieval der Instanzen einer Klasse => Flexible, komplexe (logisch verknüpfte) Anfragen G. Görz, FAU, Informatik 8 Semantic Web: Sprachschichten G. Görz, FAU, Informatik 8 OWL: Web Ontology Language (<= DAML+OIL) • OWL-DL: (Beschreibungs-) logische Erweiterung für Frame-Sprachen – Formal definierte Semantik – Inferenzkomponente • Erlaubt Klassenausdrücke statt –namen – Verknüpfung mit AND OR NOT • Restriktionen auf Attributen – has-value value-type cardinality ... • Eigenschaften von Attributen – transitive symmetric ... G. Görz, FAU, Informatik 8 G. Görz, FAU, Informatik 8 OWL-DL • verleiht RDF(S) eine präzise Semantik • entspricht einer ausdrucksstarken Beschreibungslogik: SHIQ G. Görz, FAU, Informatik 8 OWL /OIL als RDF(S)-Erweiterung OWL /OIL als RDF(S)-Erweiterung (1/2) <rdfs:Class rdf:ID=”herbivore”> <rdf:type rdf:resource=”http://www.ontoknowledge.org/#DefinedClass”/> <rdfs:subClassOf rdf:resource=”#animal”/> <rdfs:subClassOf> <oil:NOT> <oil:hasOperand rdf:resource=”#carnivore”/> </oil:NOT> </rdfs:subClassOf> </rdfs:Class> © van Harmelen OWL /OIL als RDF(S)-Erweiterung (2/2) (1/2) <rdfs:Class rdf:ID=”herbivore”> <rdf:type rdf:resource=”http://www.ontoknowledge.org/#DefinedClass”/> <rdfs:subClassOf rdf:resource=”#animal”/> <rdfs:subClassOf> <oil:NOT> <oil:hasOperand rdf:resource=”#carnivore”/> </oil:NOT> </rdfs:subClassOf> </rdfs:Class> © van Harmelen G. Görz, FAU, Informatik 8 RDF(S) • • • • • • class-def subclass-of slot-def subslot-of domain range G. Görz, FAU, Informatik 8 © van Harmelen OIL • class-expressions • AND, OR, NOT • slot-constraints • has-value, value-type • cardinality • slot-properties G. Görz, FAU, Informatik 8 • trans, symm Erweiterbarkeit Methodologische Aspekte Formaler Ontologien • Formale Ontologie – Standardisierte terminologische/begriffliche Hierarchie • Konzepte („is“ - intransitiv, Substanz) • Relationen („has“ - transitiv, Akzidentien) – Axioms: constraints; rules, ... • Referenz-Ontologien – Generisches, universelles Konzept-Inventar Repräsentationssprache und fundamentale Unterscheidungen – Fundierende Relationen: Ganze & Teile (Mereologie), Ähnlichkeit, Abhängigkeit, Verbindung, Inhärenz, zeitliche Ordnung • Anwendungs-Ontologien („Domänen-Ontologien“) – Modellerung spezieller Anwendungsgebiete G. Görz, FAU, Informatik 8 G. Görz, FAU, Informatik 8 Referenz-Ontologien Anwendungs-Ontologien • Characteristika • Characteristika – Theoretischer Fokus auf (axiomatischer) Repräsentation – Methodisches Gewicht auf Genauigkeit und Komprehensivität – Metaklassenschema • Verwendung – Allgemeiner theoretischer Rahmen – Generische „upper ontology“ (soweit comp. traktabel) • Beispiele: DOLCE (Guarino), Sowa, Smith,... [SUMO] • Ist formale Rekonstruktion unabhängig von Zwecken? – Erfüllen Anforderungen, um bestimmte Aufgaben zu lösen – Theoretischer Fokus auf Schließen (Inferenz) – Methodisches Gewicht auf Genauigkeit • Verwendung – Bereitstellung von Objektbeschreibungen (Instanzen: Objekte des Anwendungsbereichs) – Inferenz für Suche (Retrieval), Planung, Konfiguration, Diagnose,... – Kommunikation und Wiederverwendung des Wissens (Semantic Web) • Beispiele – viele..., s. Protégé-Homepage G. Görz, FAU, Informatik 8 G. Görz, FAU, Informatik 8 CIDOC Common Reference Model • CIDOC CRM: (Formale) Ontologie für die Dokumentation in den Kulturwissenschaften – ISO 21127: „A Reference Ontology for the Interchange of Cultural Heritage Information“ The CIDOC CRM Historical Archives…. Type: Title: Title.Subtitle: Date: Creator: Republics Publisher: Subject: Metadata • Erweiterbar • Verknüpfungen mit Dublin Core, IFLA FRBR,... G. Görz, FAU, Informatik 8 Text Protocol of Proceedings of Crimea Conference II. Declaration of Liberated Europe February 11, 1945. The Premier of the Union of Soviet Socialist The Prime Minister of the United Kingdom The President of the United States of America State Department Postwar division of Europe and Japan Documents About… G. Görz, FAU, Informatik 8 © Doerr The CIDOC CRM The CIDOC CRM Places and Objects Images, non-verbose… Type: Title: Date: Publisher: Source: Copyright: References: Image Allied Leaders at Yalta 1945 United Press International (UPI) The Bettmann Archive Corbis Churchill, Roosevelt, Stalin Metadata Photos, Persons “The following declaration has been approved: The Premier of the Union of Soviet Socialist Republics, the Prime Minister of the United Kingdom and the President of the United States of America have consulted with each other in the common interests of the people of their countries and those of liberated Europe. They jointly declare their mutual agreement to concert… ….and to ensure that Germany will never again be able to disturb the peace of the world…… “ TGN Id: 7012124 Names: Yalta (C,V), Jalta (C,V) Types: inhabited place(C), city (C) Position: Lat: 44 30 N,Long: 034 10 E Hierarchy: Europe (continent) <– Ukrayina (nation) <– Krym (autonomous republic) Note: …Site of conference between Allied powers in WW II in 1945; …. Source: TGN, Thesaurus of Geographic Names Places, Objects About… About… Title: Yalta, Crimean Peninsula Publisher: Kurgan-Lisnet Source: Liaison Agency © Doerr G. Görz, FAU, Informatik 8 © Doerr G. Görz, FAU, Informatik 8 The CIDOC CRM Explicit Events, Object Identity, Symmetry E52 TimeSpan February E7 Activity P7 took place at “Crimea Conference” E39 Actor E55 Types E38 Image P6 to 7 is by ref err ed E65 Creation P86 falls within refer to / refine refer to / identifie 1945 P82 at some P11 time par within in tici pat ed E53 Place 7012124 E41 Appellations E39 Actor The CIDOC CRM Top-level Entities relevant for Integration E18 Physical Stuff participate in affect or / refer to location Event E39 Actor © Doerr * P14 ormed f per P81 ongoing throughout E52 TimeSpan 11-2-1945 P9 cre 4 ha at s ed E28 Conceptual Objects E39 Actors E2 Temporal Entities E31 Document “Yalta Agreement” G. Görz, FAU, Informatik 8 Objektbeschreibung als CIDOC CRM-Instanz at E52 Time-Spanswithin G. Görz, FAU, Informatik 8 © Doerr Crosswalks need a common ontology Dublin Core CIDOC CRM DC.Identifier: Louvre INV.779 DC.Type: Image E19 Physical Object Louvre INV.779 Physical Object FRBR Conceptual Object material objects can only be at one place at a time! AAT paintings DOI:10.9876/MonaLisa.jpg BT ! electronic images BT has type oil paintings DOI:10.9876/MonaLisa.jpg © Doerr FRBR visual works BT © Doerr E38 Image Expression.Id: BT ! Louvre INV.779 CIDOC CRM DOI:10.9876/MonaLisa.jpg Manifestation.Id: Louvre INV.779 G. Görz, FAU, Informatik 8 E53 Places has type digital images G. Görz, FAU, Informatik 8 immaterial objects reside on carriers! CIDOC CRM in OWL / Protégé-Editor G. Görz, FAU, Informatik 8 G. Görz, FAU, Informatik 8 G. Görz, FAU, Informatik 8 G. Görz, FAU, Informatik 8 © Doerr/LeBoeuf