Social Semantic Desktop

Transcription

Social Semantic Desktop
Social Semantic Desktop
Seminararbeit
vorgelegt von
Stefan Tomanek
Soziales Retrieval im Web 2.0
Sommersemester 2008
Arbeitsgruppe Informationssysteme
Datum: 12. Oktober 2008
Betreuung:
Dipl.-Inform. Ingo Frommholz
Inhaltsverzeichnis
1 Einführung
2
2 Informationsorganisation: Wunsch und Wirklichkeit
2.1 Visualisierung kognitiver Zustände . . . . . . . . . . .
2.1.1 Mindmapping . . . . . . . . . . . . . . . . . . .
2.1.2 Concept-Mapping . . . . . . . . . . . . . . . . .
2.2 Organisation physischer Informationsträger . . . . . . .
2.3 Künstliche Gedächtniserweiterung . . . . . . . . . . . .
2.4 Unzulänglichkeiten klassischer Dateisysteme . . . . . .
2.4.1 Taxonomische Ordnung . . . . . . . . . . . . . .
2.4.2 Inkongruenz von Dateien und Dokumenten . . .
2.5 Semantisch orientierte Anwendungen . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
3
3
4
4
5
6
6
8
8
3 Implementierung des Social Semantic
3.1 RDF als Integrationsformat . . . . .
3.1.1 Bäume zu Graphen . . . . . .
3.2 Herkunft der Metadaten . . . . . . .
3.3 SPARQL . . . . . . . . . . . . . . . .
3.4 Soziale RDF-Datenbanken . . . . . .
3.5 Der zukünftige Weg . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
10
12
13
13
14
17
Desktops
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Fazit
18
Abbildungsverzeichnis
1
2
3
4
5
6
7
8
9
10
Mindmap zur Reflexion eines Themengebiets . . . . . . . . . .
Concept-Map zur Darstellung verwandter Konzepte . . . . . .
Hardlinks erlauben die Plazierung von Dateien in mehreren
Verzeichnissen . . . . . . . . . . . . . . . . . . . . . . . . . . .
Inkongruenz von Dokumenten und Dateien . . . . . . . . . . .
Semantisch orientierte Photo-Verwaltung mit F-Spot . . . . .
RDF-Aussagen in N3 . . . . . . . . . . . . . . . . . . . . . . .
Transformation einer Dateihierarchie zu einem RDF-Graphen
Graph-Anfragen mit SPARQL . . . . . . . . . . . . . . . . . .
Informationssuche mit Edutella . . . . . . . . . . . . . . . . .
Verteilte Metadaten-Datenbank mit RDFPeers . . . . . . . . .
1
3
4
7
8
9
11
12
14
15
16
1
Einführung
Informationen nehmen mit jedem Tag technischer Entwicklung weniger physischen Raum ein: was früher voluminöse Aktenschränke, CD-Regale und
Fotoalben erforderte, findet mittlerweile auf handtellergroßen Speichermedien Platz. Die digitale Durchdringung des Alltags führt sowohl im privaten
als auch geschäftlichen Umfeld zu einer steigenden Anzahl an elektronisch
vorliegenden Dokumenten: Während deren Speicherung zwar mit modernen
Mitteln erfolgt, bleibt ihre Organisation jedoch weiterhin an alten Ordnungsparadigmen der physischen Welt haften — die Dateisysteme der geläufigen
Betriebssysteme bieten meist nicht mehr Funktionalität als ein virtueller Aktenschrank, lassen also in ihrem Aufbau den tatsächlichen Informationsinhalt
der einzelnen Dokumente unberücksichtigt.
Das Aufkommen des sogenannten Web 2.0 vermochte es, diese klassische
Betrachtungsweise aufzubrechen und verschiedene Dokumente in semantisch
orientierter Weise zu präsentieren: Informationen verschiedener Autoren und
Typen können in Relation zueinander gesetzt, kommentiert und ausgetauscht
werden. Der Social Semantic Desktop[1, 2] hat das Ziel, viele der im Web 2.0
erprobten Techniken aus dem Web-Browser in das lokale System zu transferieren und die dabei enstehenden zusätzlichen Möglichkeiten für den Anwender nutzbar zu machen.
Diese Arbeit soll zunächst die Probleme und Unzulänglichkeiten aufzeigen, die klassische Desktop- und Dateisysteme bei der strukturierten Datenablage haben. Die dabei geschilderten Diskrepanzen zwischen den kognitiven
Prozessen des Anwenders und der Umsetzung der Anwendungsprogramme
sollen anschließend behandelt und zumindest teilweise aufgelöst werden. Dabei sollen Technologien vorgestellt werden, die eine semantische Organisation lokal vorliegender Daten und deren Anwendungs-, Anwender- und Rechnerübergreifende Verknüpfung erlauben. Neben den Chancen und Möglichkeiten müssen selbstverständlich auch die Risiken beachtet werden, die eine
solche Vermaschung privater und potentiell sensitiver Informationen mit sich
bringt.
2
Informationsorganisation: Wunsch und Wirklichkeit
Eine Informationsablage sollte die Denkprozesse und -strukturen ihres Benutzers nachahmen: Im Gegensatz zu streng hierarchischen Ordnungssystemen
assoziiert der menschliche Geist Informationen sehr frei untereinander; eine Wissenseinheit steht nie für sich alleine, sondern ist stets mit anderen
2
Konzepten verknüpft. Die Gestalt dieses Wissensnetzes wird dabei durch
die individuellen Erfahrungen des Anwenders geprägt: vergangene Erlebnisse
können erstaunliche Themensprünge hervorbringen, die für Außenstehende
und objektive Betrachter kurios erscheinen, für das betroffene Individuum
jedoch durchaus passend und logisch sind.
2.1
2.1.1
Visualisierung kognitiver Zustände
Mindmapping
Zur Unterstützung kognitiver Prozesse haben sich verschiedene Visualisierungsmethoden entwickelt: Eine sehr bekannte Variante ist das sogenannte
,,Mindmapping”[3], bei dem zur besseren Überblickung eines Themas eine sogenannte Gedächtniskarte erstellt wird. Im Zentrum dieser Darstellung steht
das Hauptthema, von dem Äste mit weiteren Unterkapiteln nach außen ragen. Auf diese Weise lagern sich konzentrisch um das Themengebiet verwandte und assoziierte Begriffe und Konzepte an, die wiederum selbst als Keim
für weitergehende Assoziationen dienen.
Abbildung 1: Mindmap zur Reflexion eines Themengebiets
In der Ausgestaltung der Gedächtniskarte ist der Anwender recht frei: Ne3
ben Schlagworten kann sie auch Bilder enthalten, um die visuell orientierten
Regionen des Gehirns anzusprechen. In jedem Fall bleibt sie jedoch zentral
auf ihr Wurzelelement ausgerichtet.
2.1.2
Concept-Mapping
Im Kontrast zum Mindmapping mit seinen radialen, baumartigen Strukturen
steht Concept Mapping: Die von John D. Novak[4] in den 1970er Jahren an
der Cornell University entwickelte Notation erfordert nicht zwingend einen
einzelnen zentralen Begriff, sondern verknüpft Konzepte durch gerichtete und
beschriftete Kanten. Die Kantenbeschriftung konkretisiert dabei die Art der
Relation, in der die verbundenen Begriffe stehen. Während Mindmaps stets
zentral auf einen einzelnen Begriff ausgerichtet sind, erlauben Concept-Maps
die Integration mehrerer Agglomerationskerne, die als Ausgangspunkte des
Diagramms fungieren. Dieses bewegt sich meist innerhalb eines KonzeptRahmens, dass die Thematik des Gesamtzusammenhangs vorgibt.
Mensch
mag
hält
mag
akzeptiert
Haustier
ist ein
ist ein
jagt
Katze
Hund
spielt mit
kann
Wollknäuel
bellen
Abbildung 2: Concept-Map zur Darstellung verwandter Konzepte
2.2
Organisation physischer Informationsträger
Die strukturierte Ablage physischer Informationsträger unterliegt den Limitierungen der physischen Welt: Bücher innerhalb einer Bibliothek benötigen
Raum und sind in ihrer Anzahl begrenzt. Um ihre Auffindbarkeit sicherzustellen, müssen sie anhand eines eindeutigen Ordnungskriteriums kategorisiert werden. Die dabei entstehende Taxonomie erlaubt aufgrund ihrer klaren
4
Baumstruktur nicht die Zuteilung eines Buches in zwei Kategorien: jedes Dokument ist genau einem übergeordneten Thema zugewiesen und befindet sich
infolgedessen an einem definierten Ort.
Die Distanz zweier Dokumente innerhalb der Taxonomie muss nicht mit
der assoziativen Distanz im kognitiven Netz des Anwenders korrelieren: Die
Verfolgung kleiner Querverweise eines Dokumentes können, sofern sie disziplinäre Grenzen überspringen, zu großen Sprüngen innerhalb der Bibliothekshierarchie führen. Für einen Anwender, der gerade ein Buch über Quantenphysik liest und seine Kenntnisse über Statistik vertiefen möchte, mag dieser
assoziative Schritt sehr klein sein; je nach Struktur der Bibliothek wird er
das Statistik-Werk vermutlich jedoch nicht im Regal der Physik-Bücher finden, sondern in der Mathematik-Abteilung – also unter Umständen in großer
physischer Distanz.
Die Grenzen der physischen Welt machen es schwer, Denkstrukturen
nachzubilden, zumal diese stets individuell sind und von der Perspektive
abhängen. Institutionen, die von einer vielzahl verschiedener Personen genutzt werden, müssen daher eine starke Hierarchie verwenden, um die Anordnung der vorgehaltenen Informationen zumindest für alle nachvollziehbar
zu halten.
2.3
Künstliche Gedächtniserweiterung
Die Technik, Informationen losgelöst von körperlichen Exemplaren zu verarbeiten, ermöglicht die Grenzen real-räumlicher Anordnung zu durchbrechen. Bereits 1945 veröffentlichte Vannevar Bush seinen Artikel ,,As we may
think”[5]: Der amerikanische Ingenieur, bisher vor allem in der AnalogrechnerEntwicklung und im Manhatten-Projekt involviert, schlug darin die Konstruktion einer Maschine vor, die ihrem Benutzer als Erweiterung seines
Gedächtnisses dienen sollte. Das Memex – als Kurzform für ,,Memory Extender” – genannte System sollte Informationen in Form von Mikrofilmen
aufnehmen und dem Benutzer auf mehreren Bildschirmen zur Verfügung stellen. Durch Eingabe einer Ziffernkombination konnte dieser auf einzelne Dokumente zugreifen und mit Hilfe eines Rades durch die verschiedenen Seiten
blättern.
Doch Memex sollte mehr leisten als vordefinierte Folien zu projizieren:
Der Benutzer sollte Dokumente miteinander verknüpfen können, um so Querverweise direkt verfolgen zu können. Betrachtete er also ein Dokument, so
zeigte die schreibtischgroße Maschine auf einem zweiten Bildschirm verwandte Dokumente an. Dokumente ließen sich so zu ,,Trains” anordnen, die nicht
zwingend der ursprünglichen Reihenfolge entsprechen, in der die Dokumente
in das System eingegeben wurden. Neben Mikrofilmmedien sollte das System
5
auch in der Lage sein, handschriftliche Notizen über berührungsempfindliche
Oberflächen aufzuzeichen und als zusätzliche Dokumente in den Datenbestand einzufügen. Durch diese Möglichkeiten wäre es Memex möglich gewesen, sich individuell auf die kognitiven Strukturen des Anwenders einzustellen
und Dokumente-Auswahlen individuell zusammenzustellen. Im Gegensatz zu
modernen Hypertext-Systemen – wie etwa dem WWW – ließen sich bei Memex nicht einzelne Elemente einer Bildschirmseite mit anderen Dokumenten
verknüpfen; atomare Einheit sollte das gesamte Dokument sein.
Memex wurde in der vorgeschlagenen Form nie realisiert: Tatsächlich
stellt Bushs Artikel lediglich eine visionäre Extrapolation der zur Zeit der
Veröffentlichung aktuellen Technik dar. Viele der dabei aufgeworfenen Ideen
fanden jedoch in modernisierter Form Eingang in Hypertext- und DokumentVerwaltungssysteme.
2.4
Unzulänglichkeiten klassischer Dateisysteme
Real existierende Computer nutzen zur Datenablage ein baumartiges Dateisystem. Betriebssysteme der Windows-Familie stellen dabei jeden einzelnen
phyischen Datenträger als isolierten Baum dar, während Unix-Abkömmlinge alle Medien zu einer gemeinsamen Hierarchie vereinigen. Beiden Familien
gemein ist jedoch die Unterscheidung zwischen Verzeichnissen und regulären
Dateien: Während erstgenannte lediglich der Strukturierung des abgelegten
Datenbestandes dienen, enthalten Dateien die eigentlichen Informationen.
2.4.1
Taxonomische Ordnung
Klassische Dateisysteme bieten zwei Mittel, um Dokumente zu organisieren:
Dateien werden mit Namen versehen und anschließend in Verzeichnissen kategorisiert. Dabei gehört eine Datei oder auch ein Verzeichnis stets zu einem
übergeordneten Verzeichnis, so dass sich eine strikte Baumstruktur ergibt.
Diese strikte Hierarchisierung ist oft hinderlich, da es nicht möglich ist,
eine Datei mehreren Kategorien zuzuordnen. So ist es in den meisten Systemen zum Beispiel nicht möglich, ein Rechnungsdokument sowohl in einem
Verzeichnis mit Kundenkorrespondenz als auch in einem für Rechnungen vorgesehenen zu plazieren.
Das Dateisystem, im Sinne der auf dem Datenträger geschriebenen Verwaltungsstruktur, unterstützt eine solche m-zu-n-Zuordnung in vielen Fällen
durchaus: Die meisten Desktop-Systeme pflegen jedoch die Ordner-Metapher,
die ein solches Verhalten nicht erlaubt. Die Unterscheidung der Begriffe ,,Ordner” und ,,Verzeichnis” scheint haarspalterisch, fördert jedoch einen gewaltigen Bedeutungsunterschied zu Tage: Während ein Aktenordner die darin
6
einsortierten Dokumente wirklich enthält, beinhaltet ein Verzeichnis lediglich
Verweise auf den eigentlichen Ablageort. Ein Buch über die Tierwelt Afrikas
kann sowohl in einem Buchverzeichnis über Biologie als auch in einer anderen
Liste über den schwarzen Kontinent verzeichnet sein; genauso ist es bei vielen
Dateisystemen möglich, Dateien – nicht jedoch Verzeichnisse – in mehreren
Verzeichnissen zu plazieren.
/
home
max
Rechnungen
Korrespondenz
Musterfirma
Musterfirma
Rechnung 1442
Brief 20083107
Abbildung 3: Hardlinks erlauben die Plazierung von Dateien in mehreren
Verzeichnissen
Jeder Eintrag in einem Verzeichnis wird dabei als Link oder auch Hardlink bezeichnet; alle Verzeichniseinträge einer Datei sind gleichberechtigt und
voneinander unabhängig: Erst, wenn der letzte Verweis entfernt wird, gilt die
Datei als gelöscht.
Mit Hardlinks ist es also durchaus möglich, eine Art Tagging für Dateien
zu implementieren: Jedes Verzeichnis, dem ein Verweis auf die Datei hinzugefügt wird, kann als zusätzliches Etikett verstanden werden, das Art und
Inhalt der Datei weiter beschreibt.
Die Verwendung von Hardlinks zur Datenorganisation ist jedoch eingeschränkt: Die zusätzlichen Verweise lassen sich nicht über Datenträgergrenzen hinweg erstellen und bieten keine Möglichkeit, direkte Beziehungen zwischen Dateien auszudrücken. Es ist auch nicht möglich, auf effiziente Art und
Weise alle Hardlinks zu finden, die auf ein bestimmtes Dokument verweisen.
Zudem besteht aufgrund der schlechten Unterstützung in grafischen Benutze7
roberflächen das Risiko von Fehlbedienungen und versehentlichen Löschungen, falls versehentlich der letzte existente Verzeichniseintrag eines Dokuments entfernt wird.
2.4.2
Inkongruenz von Dateien und Dokumenten
Ein weiteres Argument gegen die Verwendung von Dateisystem-Eigenschaften
zur semantischen Organisation von Datenbeständen liegt in der Tatsache begründet, dass Dateien und Dokumente nicht zwangsläufig deckungsgleich sein
müssen: Oft enthalten Objekte, die auf Dateisystemebene atomar erscheinen,
aus Anwendungssiche mehrere Dokumente. Klassische Beispiele für diese verborgenen, inneren Strukturen sind Mailboxdateien oder auch Adressbücher,
die mehrere Informationseinheiten zu einer Datei bündeln. Für Hardlinks sind
diese feingranularen Einheiten nicht greifbar, da Wissen über die Syntax der
Container-Datei erforderlich ist.
/
home
Eingang
max
mbox
Gesendet
Rechnungen
Projekte
Foo
Abbildung 4: Inkongruenz von Dokumenten und Dateien
2.5
Semantisch orientierte Anwendungen
Da semantisches Wissen über einzelne Dokumente auf Betriebs- und Dateisystemebene nicht verfügbar ist, muss es über spezielle Anwendungen gewonnen
werden. Besonders im Bereich der Mediendaten haben sich Anwendungen
herausgebildet, die sich von der unterliegenden Dateisystemstruktur lösen
und eigene Mechanismen zur Datenorganisation implementieren.
Bekannt ist dieses Vorgehen besonders bei Audio-Abspielprogrammen wie
iTunes, Rhythmbox oder Amarok: Musikstücke werden nicht über das Dateisystem verwaltet, sondern zu einer koherenten Sammlung hinzugefügt. Die
8
Anwendungen ignorieren bewusst die Verzeichnisstrukturen, aus denen die
Dateien stammen und wandeln den Baum in eine flache Menge um. Indem sie
Metadaten aus den einzelnen Dateien extrahieren und in einer separaten Datenbank speichern, ermöglichen sie beliebige Anfragen über gemeinsame Eigenschaften der gewünschten Audio-Dokumente: Aus der Datenbank können
beliebige Teilmengen extrahiert werden, die auf den semantisch orientierten
Attributen der Daten fußen und nicht auf Pfadangaben, deren Aussagekraft
sehr eingeschränkt ist.
Die Verflachung synthetischer Hierarchien zugunsten der Bildung von semantisch attributierten Objektmengen lässt sich auch auf andere Medientypen übertragen: Digitale Photos werden bereits bei ihrer Erstellung durch
die Kamera mit zahlreichen Metadaten ausgestattet, die neben technischen
Aspekten – wie Belichtungszeit und Blendenöffnung – die zeitliche und, dank
integrierter GPS-Empfänger in neuen Geräten, räumliche Einordnung erlauben. Gerade bei photographischen Dokumenten fällt die Einordnung in strikte Hierarchien oft schwer, da sich selten ein herausragendes Ordnungskriterium festmachen lässt: Neben Ort und Zeit sind die abgebildeten Objekte oder
Personen oft Ziel einer Suche.
Abbildung 5: Semantisch orientierte Photo-Verwaltung mit F-Spot
Die freie Software F-Spot1 stellt importierte Photos mit Hilfe eines Zeitstrahls dar. Zusätzliche semantische Informationen können Bildern in Form
von Tags, also einzelnen Schlagworten, hinzugefügt werden. Tags selbst können
in einer Hierarchie angeordnet werden, so dass zum Beispiel Personen- und
Ortsbezeichnungen in jeweils eigenen Kategorien erscheinen: Dadurch ist es
zum Beispiel möglich, Photos zu selektieren, die eine beliebige Person darstellen – und mit einem Tags versehen sind, der dieser Kategorie zugeordnet
ist.
1
http://f-spot.org/Main_Page
9
Anwendungsgestützte semantische Ordnung bietet einen Vorgeschmack
auf Dinge, die durch die Loslösung vom starren hierarchischen Ordnungsmodell möglich sind. Allerdings handelt es sich bei den bekannten Applikationen
nur um Insellösungen: Jede pflegt ihr eigenen Datenbankformat und ist in
sich abgeschottet. Es ist nicht möglich, Musik- und Photo-Dokumente miteinander zu verknüpfen oder gar aus dritten Anwendungen die Metadaten zu
nutzen.
3
Implementierung des Social Semantic Desktops
Derartige Insellösungen aufzubrechen und eine semantisch orientierte Zugriffsmethode über Anwendungsgrenzen hinweg aufzustellen ist eines der
Hauptziele bei der Implementierung des Semantic Desktops. An die Position
der strikten hierarchischen Dateisystemstrukturen als primäres Ordnungsinstrument tritt ein Graph, dessen Knoten aus allen Dokumenten des Anwenders besteht, dessen Kanten beliebige Beziehungen und Metadaten repräsentieren, und der von allen semantik-affinen Anwendungen genutzt und gepflegt
wird.
3.1
RDF als Integrationsformat
Als gemeinsames Datenformat hat sich RDF2 , das vom W3C entworfene
,,Resource Description Framework”, etabliert. Ursprünglich als Metadatenformat für Webseiten entwickelt, findet es mit einer vielzahl syntaktischer
Ausprägungen Verwendung für zahlreiche Modellierungsaufgaben.
Neben einer XML-basierten Notation hat sich vor allem die N3-Schreibweise
durchgesetzt. RDF-Aussagen sind Dreier-Tupel, die aus Subjekt, Prädikat
und Objekt bestehen. Das Subjekt stellt dabei das Element dar, über das
eine Aussage getroffen wird, deren Art und Ausprägung durch Prädikat und
das dazugehörige Objekt bestimmt werden. Jedes Element des Tripels wird
in Form eines URI 3 dargestellt – mit Ausnahme des Objektes, das auch eine
Zeichenkette sein kann.
Die Verwendung eines URI als primäres Identifikationsmerkmal bietet
Vorteile gegenüber der Verwendung der geläufigeren URL: Jeder gültige URL
stellt gleichzeitig einen validen URI dar, macht gleichzeitig jedoch auch eine Aussage über die Bezugsmethode, mit Hilfe derer die Ressource erlangt
werden kann. Dies ist jedoch nicht in jedem Fall gewünscht, da zirkulierende
2
3
http://www.w3.org/RDF/
Uniform Resource Identifier
10
// Import des Dublin - Core - Namensraumes
@prefix dc: < http: // purl . org / dc / elements /1.1/ >.
// Import benutzerdefinierter Praedikate
@prefix db: < http: // datenbruch . de / rdf / >.
< file: /// home / stefan / rechnung -15. pdf > db:isReplyTo <
file: /// home / stefan / Auftrag . pdf >.
< file: /// home / stefan / passphoto . jpg > db:pictures <
abook:Stefan %20 Tomanek >.
< c h k s u m : d 3 b 0 7 3 8 4 d 1 1 3 e d e c 4 9 e a a 6 2 3 8 a d 5 f f 0 0 > dc:title "
Seminarfolien Social Retrieval " .
Abbildung 6: RDF-Aussagen in N3
Dokumente unter Umständen nicht an einen dedizierten Speicherort gebunden sind. Es besteht auch kein Zwang, jede Ressource zwingend mit einem
Dokument zu hinterlegen: URIs können auch abstrakte Konzepte darstellen,
was besonders bei der Verwendung als Prädikat zum tragen kommt.
Das in N3-Syntax vorliegende Beispiel (siehe Abbildung 6) trifft verschiedene Aussagen über dem System bekannte Dokumente und verwendet dabei
Prädikate aus verschiedenen Quellen: Zum einen die bekannten Dublin-CoreElemente4 , in denen ein Standardrepertoire an häufig benötigten MetadatenTypen zur Verwendung im Internet zusammengefasst wurde, zum anderen
eine benutzerdefinierte Sammlung spezieller Prädikate. Das System lässt sich
dadurch beliebig für den gewünschten Anwendungsbereich ausbauen – sollen
Metadaten jedoch ausgetauscht werden, sollte man sich auf ein gängiges Vokabular einigen. Das Prädikat ,,isReplyTo” setzt zwei Dokumente in Relation
zueinander: Die kausale Folge der geschriebenen Rechnung auf den erhaltenen
Auftrag lässt sich so leicht modellieren und abbilden. Ebenso beschreibt das
Verb ,,pictures” das auf einem Photo abgebildete Objekt, indem es einen Eintrag im lokalen Adressbuch referenziert. Dem bekannten Tagging ähnelt die
Verwendung von Zeichenketten: Im vorliegenden Beispiel nutzt N3 das standardisierte Dublin-Core-Vokabular, um den Titel eines über eine Prüfsumme
identifizierten Dokuments in der lokalen RDF-Datenbasis abzulegen.
4
http://dublincore.org/
11
3.1.1
Bäume zu Graphen
Durch das Einfügen von RDF-Kanten wandelt sich das hierarchisch strukturierte Dateisystem in einen gerichteten Graphen, der sich wie eine transparente Folie über die bestehenden Hierarchien legt (siehe Abbildung 7). Durch
verschiedenartige Prädikate (in der Abbildung durch unterschiedliche Farben
gekennzeichnet) können unterschiedliche Relationen zwischen Dokumenten
gekennzeichnet werden, ebenso stellt das bekannte Tagging eine Untermenge dar: Tags erwachsen ganz intuitiv aus dem Graphenkonzept, indem das
Objekt durch eine Zeichenkette repräsentiert wird.
Abbildung 7: Transformation einer Dateihierarchie zu einem RDF-Graphen
Im Gegensatz zur dateisystembasierten Ordnung können Dokumente nicht
nur in gemeinsame Kategorien eingeteilt, sondern direkt mit typisierten Relationen untereinander versehen werden. Ein abgeschickter Brief kann daher
in seinen Metadaten vermerken, dass er eine Reaktion auf eine erhaltene EMail darstellt - die wiederum über eine Kante im RDF-Graphen mit ihrem
Absender im lokalen Adressbuch verknüpft ist. Auf diese Weise lassen sich
Zusammenhänge zwischen Dokumenten, Akteuren und Konzepten schnell
und in maschinell verarbeitbarer Weise sichern.
Ganz ähnlich der Vision ,,Memex” ist eine semantik-affine Oberfläche
durch geschickte Nutzung der Metadaten in der Lage, zur Benutzersituation
passende Dokumente zu präsentieren und so das Informationsbedürfnis des
Anwenders auf kognitiv hoher Ebene zu füllen.
12
3.2
Herkunft der Metadaten
Doch woher stammen die Metadaten, die für eine solche Adaption notwendig
sind? Im einfachsten Falle bringen Dokumente bereits leicht erfassbare und
klar strukturierte Daten mit. Dies ist vor allem bei Mediendokumenten wie
Ton- und Bildaufnahmen der Fall. Bei Eintritt in das System müssten die
inherenten Meta-Informationen aus den Dateien extrahiert und in den systemweiten RDF-Graphen eingefügt werden. Bestimmte Informationen lassen sich nur schwer automatisiert erkennen; die Erkennung von Bildinhalten
und die dazugehörige Annotation wird weiterhin dem menschlichen Benutzer
überlassen bleiben.
Viele Metainformationen lassen sich jedoch aus den Handlungen des Benutzers selbst ableiten: Öffnet er zum Beispiel zwei verschiedene Dokumente
gleichzeitig, so lässt sich aus dieser Handlung eine inhaltliche Relation der
beiden herleiten. Ein weiteres Beispiel ist die Sammlung von Bewegungsprofilen über einen tragbaren GPS-Empfänger während des Microsoft-Projektes
,,MyLifeBits”5 : Korrelationen zwischen den Aufenthaltsorten und den danach resultierenden Informationsbedürfnissen und Handlungen sind ebenfalls
zur Gruppierung verwandter Dokumente von Nutzen.
Eine primäre Quelle zusätzlicher Informationen wird sicherlich die Verwendung semantik-affiner Programme darstellen, die entsprechende MetaInformationen direkt bei der Erstellung oder Bearbeitung von Dokumenten
gewinnen und in den lokalen Graphen einfügen.
3.3
SPARQL
Um Abfragen auf einem RDF-Graphen durchzuführen, entwickelte das RDFData-Access-Arbeitsgruppe des W3C die Anfragesprache SPARQL (,,Simple Protocol and RDF Query Language”)6 , die Anfang des Jahres 2008 den
Status einer offiziellen W3C-Empfehlung[6] erreichte. Die Sprache benutzt
zur Selektion Anfrage-Tripel, die gegen die Tupel des RDF-Graphen geprüft
werden. Mit Hilfe gleichbenannter Variablen innerhalb der Anfrage können
– analog zum Tupelkalkül – verschiedene Kanten des Graphen miteinander
verbunden werden, so dass auch komplexe Anfragen durch verknüpfung verschiedener Informations- und Datenquellen möglich sind.
So durchsucht die Anfrage in Abbildung 8 den lokalen RDF-Graphen
nach allen bekannten Photos, die eine weibliche Person zeigen, deren Telefonnummer im Adressbuch Verzeichnet ist; dieses Beispiel zeigt, wie bisher
5
6
http://research.microsoft.com/barc/mediapresence/MyLifeBits.aspx
http://www.w3.org/TR/rdf-sparql-query/
13
PREFIX db: < http: // datenbruch . de / rdf / >
PREFIX ab: < http: // datenbruch . de / addressbook / >
SELECT ? photo ? phone
WHERE {
? photo db:pictures ? person .
? person ab:hasGender ab:female ;
ab:hasPhoneNumber ? phone .
}
Abbildung 8: Graph-Anfragen mit SPARQL
vollkommen disjunkte Datenspeicher durch SPARQL und die gemeinsame
RDF-Datenbasis miteinander vernetzt werden.
3.4
Soziale RDF-Datenbanken
Die wenigsten Dokumente bleiben jedoch exklusiv einem einzelnen Benutzer
vorbehalten: Arbeit findet meist in Gruppen statt, ebenso werden Fotos und
andere Mediendateien oft im kleinen oder auch größeren Kreis ausgetauscht.
Verlässt ein Dokument – zumindest als Kopie – das lokale System, zum Beispiel, indem es per E-Mail verschickt wird, wird es auch aus dem mühevoll erstellten RDF-Graphen gerissen. Die Kanten, die auf dem Ursprungssystem noch wertvolle Kontextinformationen geliefert haben, verschwinden auf
dem dem Empfänger: Selbst wenn dieser eine ähnliche semantisch orientierte
Oberfläche nutzt, erscheint das neue Dokument zunächst ,,nackt”.
Gerade in Arbeitsgruppen, die oft Informationen austauschen, muss daher ein Weg gefunden werden, die semantischen Verknüpfungen auch über
den Transportweg hinaus zu erhalten; genauso sollen Anwender von neuen
Relationen profitieren, die andere aufgrund der ihnen vorliegenden Daten erzeugen. Diese soziale Komponente erfordert losgelöst von der Übermittlung
der eigentlichen Dokumente einen Austausch auf Metadatenebene.
Ein naheliegender Ansatz besteht darin, den lokalen RDF-Graphen einer
zentralen instanz gegenüber offenzulegen und von dieser indizieren zu lassen;
anfragende Systeme können Metainformationen über ihnen vorliegende Dokumente anhand des eindeutigen URIs von dieser zentralen Stelle erfragen.
Die Verwendung einer zentralen Sammelstelle, die alle lokalen Graphen in
sich vereinigt, bringt jedoch Probleme mit sich: Mit wachsender Benutzerzahl wird es stetig schwieriger, den zentralen Index aktuell zu halten, ebenso
widerspricht das Gebot der Datensparsamkeit einer solchen Datenzusammen14
ballung.
Eine Alternative zu einer zentralistischen RDF-Suchmaschine stellen Peerto-Peer-Systeme dar. Das Projekt Edutella 7 nutzt dazu ein unstrukturiertes
Netz, wie es vom Filesharing-System Gnutella bekannt ist. Neue Knoten, die
dem Netz beitreten möchten, stellen eine Verbindung zu mindestens einem
System her, das bereits Teil des Netzes ist; sie selbst werden dabei wieder
Anlaufpunkt für andere Klienten, die das gleiche Anliegen haben. Auf diese
Weise entsteht eine vermaschte Struktur, in der jedes System auf Anfragen
nach seiner Datenbasis antworten kann.
Jeder Knoten leitet eingehende Anfragen an alle Knoten weiter, zu denen
er eine Verbindung hält: So breiten sie sich wellenförmig durch das Netz
aus. Eventuelle Antworten werden auf direktem Wege dem ursprünglichen
Fragesteller übermittelt. Um die Enstehung endloser Zyklen zu vermeiden,
ist jede Anfrage mit einer maximalen Lebenszeit (TTL) versehen, die bei
jeder Weiterleitungsstation dekrementiert wird.
?
Abbildung 9: Informationssuche mit Edutella
Die unstrukturierte Natur der Anfrageübermittlung und -verarbeitung
bringt Probleme bei der Informationssuche mit sich: So ist für den Anfragesteller nicht ersichtlich, ob es zu einer Anfrage keine Ergebnistupel im Netz
gibt, oder ob die Anfrage aufgrund zu geringer TTL die betroffenen Knoten
7
http://www.edutella.org/
15
nie erreicht hat; ebenso kann er nicht entscheiden, ob seine Anfrage noch
im Netz zirkuliert, oder ob er das Warten auf zusätzliche Ergebnistupel abbrechen kann. Abbildung 9 illustriert dieses Problem: Bei der vorliegenden
Netzstruktur erreichen erst Anfragen mit einer TTL von mindestens 4 das
System mit der gesuchten Information – begrenzt das Startsystem seine Traversierungstiefe auf 3, durchlaufen zwar 8 Nachrichten das Netz, ohne jedoch
den Zielknoten erreichen zu können.
Eine Alternative zur unstrukturierten Netzbildung Edutellas und dem
zentralistischen Ansatz stellt die Bildung eines verteilten Indizes dar: Der von
Min Cai und Martin Frank am Information Sciences Institute vorgeschlagene
Ansatz8 kommt ohne eine zentrale Instanz aus, erlaubt aber dennoch das
sichere und schnelle Auffinden relevanter Tupel.
Jeder teilnehmende Knoten im Netz wird dazu mit einer eindeutigen
Identifikationsnummer versehen; alle teilnehmenden Knoten werden in einem Kreis angeordnet, und jeder teilnehmer erhält Kenntnis über die IDs
der Systeme, die sich direkt vor ihm befinden, sowie über weitere Systeme mit exponentiell steigenden Kennziffern. Die Tripel, die in das System
eingebracht werden, durchlaufen mit jeder ihrer Komponenten eine HashFunktion, die den Wert von Subjekt, Prädikat und Objekt jeweils auf den
Zahlenraum der Knoten-IDs abbildet. So werden für jedes Tripel drei Systemkennungen ermittelt, deren nächstmöglicher Nachfolger im Netzring für
das Tripel verantwortlich sind.
S:P:O
Abbildung 10: Verteilte Metadaten-Datenbank mit RDFPeers
8
,,RDFPeers: A Scalable Distributed RDF Repository based on A Structured Peer-toPeer Network”, 2004
16
Abbildung 10 zeigt, wie für Subjekt, Pärdikat und Objekt eines Tripels
jeweils ein verantwortlicher Knoten ermittelt und das Tupel an diesen übergeben wird. Jedes Tripel ist demnach auf drei Systemen des Netzes gespeichert:
Ein anfragender Rechner kann aus den gegebenen Parametern ebenfalls über
die Hash-Funktion die Knoten-ID berechnen, die für die gesuchten Tupel
zuständig ist. Aufgrund der exponentiellen Datenstruktur kann eine solche
Anfrage den Ring mit geringem Aufwand traversieren und das zuständige System schnell erreichen, ohne wie beim Edutella-Ansatz alle Knoten durchlaufen zu müssen. Ist zumindest eine einzige Komponente des gesuchten Tripels
vorgegeben, lassen sich die Ergebnisse bei einer Knotenzahl von n mit einem
Aufwand von O(log(n)) ermitteln. Lediglich eine Anfrage ohne Parameter,
also das vollständige Aufzählen aller Tripel, erfordert die Kontaktierung jedes einzelnen Netzknotens und birgt daher die lineare Komplexität O(n).
Im Gegensatz zu Edutella lässt sich jedoch aufgrund der Ringstruktur des
Netzes entscheiden, wann sämtliche Systeme kontaktiert wurden.
3.5
Der zukünftige Weg
Wie bei vielen Objekten der aktuellen Forschung und Entwicklung existieren
auch im Bereich des Social Semantic Desktops verschiedene Interpretationen
und Strömungen: So haben einige Projekte nicht nur das Ziel, Anwendungen und Oberflächen auf eine gemeinsame Metadatenbasis zu stellen, sondern die verschiedenen Applikationen direkt zu einer koherenten Oberfläche
zu verschmelzen, um technisch-syntaktische Unterschiede zwischen verschiedenen Dateiformaten zugunsten einer inhaltlich-semantischen Betrachtungsweise zu verdrängen. So tragen OpenOffice-Writer-Dokumente, PDF-Dateien
und HTML-Seiten die gleichen Informationstypus, werden jedoch von jeweils
verschiedenen und unterschiedlichen Programmen verarbeitet. Die amalgamisierung verschiedener Anwendungen ist jedoch ein radikaler Schnitt, der
aufgrund des stark divergenten Funktionsumfangs vieler Applikationen nur
schwer ohne Verluste essentieller Funktionen möglich ist.
Ein weiterer Aspekt des Social Semantic Desktop besteht in der Erleichterung der kolaborativen Nutzung von Dokumenten: Es soll sehr einfach
möglich sein, ein Dokument für die Nutzung durch andere freizugeben. Auf
derzeitigen Systemen ist dies oft eine Frage des Speicherortes: Damit Interessierte die Datei beziehen können, muss sie sich in einem freigegebenen Verzeichnis oder auf einem Webserver befinden. Im Kontext des Social Semantic
Desktops soll die Kolaboration eine Eigenschaft des Dokumentes werden und
nicht seines Speicherortes: Die technischen Aspekte sollen dem Benutzer dazu
weitgehend verborgen bleiben.
Der Einfluss semantischer Gesichtspunkte sollte auch Einzug in Microsofts
17
Betriebssystem Windows Vista halten: Unter dem Namen WinFS kündigte
Microsoft eine Datenbankschicht an, die zusätzliche Attribute über Dateien
vorhalten sollte. Doch mit dem Erscheinen Vistas wurde WinFS zunächst verschoben, anschließend komplett abgesagt; es soll in Zukunft unter Umständen
als Teil des Microsoft SQL-Servers veröffentlicht werden.
Ein wichtiger Anlaufpunkt ist das Projekt NEPOMUK (,,Networked Environment for Personalized, Ontology-based Management of Unified Knowledge”)9 , das Forscher, Software-Entwickler und die Industrie zusammenbringen und eine gemeinsame Basis zur Entwicklung des Social Semantic
Desktops entwickeln möchte. Die Kombination offener und bereits heute
verfügbarer Technologien – Peer-to-Peer-Systeme, Soziale Netze, Semantisch
orientierte Oberflächen – soll zu einer übergreifenden Lösung führen. Eine erste Implementierung der von NEPOMUK vorgeschlagenen Richtlinien[7] findet in der freien Desktop-Oberläche KDE (,,KDE Desktop Environment”)10
statt: Die kürzlich veröffentlichte Version 4 unterstützt bereits das Taggen
von Dateien. Eine weitere Referenzimplementierung stellt das Projekt ,,gnowsis”11 des Deutschen Forschungszentrums für künstliche Intelligenz (DFKI)
dar.
4
Fazit
Die schrittweise Evolution der Benutzeroberfläche zu einer semantisch orientierten Sicht bietet viele neue Möglichkeiten, Informationen und Daten zu
organisieren und zu vernetzen. Die klassischen Ordnungsparadigmen sind der
Vielfältigkeit moderner Datensammlungen mit ihrer Vielzahl unterschiedlicher Datentypen nur schlecht gewachsen. Die multiplen Ordnungsmerkmale,
die viele Dokumente bieten, lassen sich nur schwer in den archaisch wirkenden Baumstrukturen der gängigen Dateisysteme abbilden. Ebenso erlaubt die
direkte Verknüpfung voneinander abhängiger Dateien den Nachvollzug ihrer
Entstehung und der damit verbundenen Beweggründe. Durch ein- und ausgehende Kanten im RDF-Graphen lässt sich ein ,,Umriss” eines Dokumentes
zeichnen, der dem semantisch stark eingeschränkten Dateinamen und -pfad
weit überlegen ist: Die Verflachung und Auflösung der strikten Hierarchien
ist gleichzeitig mit der Verdichtung des beschreibenden Netzes verbunden,
dass Dateien und Dokumente miteinander verknüpft.
Der Nutzen der Metadaten darf jedoch auch nicht überschätzt werden;
während viele Dokumentenformate ihre Metadaten sehr einfach preisgeben
9
http://nepomuk.semanticdesktop.org/
http://www.kde.org/
11
http://www.gnowsis.org/
10
18
und automatisch verarbeiten lassen, sind andere Datenformate ohne menschliche Unterstützung nur schwer aufzuschlüsseln: Ein E-Mail-Programm kann
den lokalen RDF-Graphen sehr einfach mit Kanten zwischen E-Mails, dem
Adressbuch und verschickten Dateien anreichen – Bilder und Photos mit
beschreibenden Tags auszustatten, wird jedoch weiterhin dem Benutzer obliegen. Dabei kommt die soziale Komponente zum tragen, die bereits aus
Online-Diensten wie Flickr 12 oder Youtube 13 bekannt ist, in denen Tags auch
von anderen Personen beigesteuert werden. Der Erfolg einer solchen Auslagerung hängt jedoch vom Interesse ab, die jene Personen den Dokumenten
entgegenbringen – ebenso muss die Aufwandsschwelle möglichst gering sein,
um möglichst wenige Benutzer von ihrem Beitrag abzuhalten. Je geringer
jedoch allgemeine Attraktivität und subjektiv betrachteter Mehrwert sind,
desto geringer fällt die Ausbeute an semantisch wertvollen Attributionen aus;
gerade bei Dokumenten, die nur einer kleinen Personengruppe zugänglich gemacht werden sollen, entfällt logischerweise der Erkenntniszugewinn durch
die vielen Namenlosen.
Radikale Herangehensweisen, die die komplette Verschmelzung aller Anwendungen zu einer koherenten Oberfläche fordern, bringen natürlich einen
Bruch mit bekannten Bedienungsparadigmen mit sich: Es muss sich zeigen,
ob die dadurch zu erringenden Vorteile diesen großen Schritt rechtfertigen. In
näherer Zukunft erscheint die evolutionäre Integration semantischer Komponenten in bestehende und erprobte Anwendungen der erfolgsversprechendere
Weg.
Die immense Ansammlung von Daten, die sich im Laufe der Zeit im RDFGraphen ansammelt, kann ein Risiko darstellen: Besonders die hintergründig
und ohne Benutzeraufforderung erfassten Metadaten erlauben weitreichende
Einblicke in Arbeitsfeld und -weise des Anwenders und machen ihn seinem
Computer gegenüber in gewisser Weise ,,gläsern”: Der Schutz dieser Informationen, deren Art und Umfang der Anwender oft selbst nicht überblicken
kann, muss gewährleistet sein. Ein Diebstahl dieser Informationen würde
zu erheblichen Datenschutzproblemen führen, ein Problem, das sich auch
bei der gemeinsamen Nutzung von Metadaten stellt: Hier müssen effektive
Schutzmechanismen geschaffen werden, um den Anwender nicht digital zu
entblößen.
Trotz der damit verbundenen Risiken und Probleme stellt der Social Semantic Desktop eine hochinteressante Vision dar, deren Verfolgung in jedem
Fall ein lohnendes Ziel für die Entwicklung zukünftiger Desktop- und Informationssysteme darstellt. Seine Einführung wird nicht in Form einer Revo12
13
http://www.flickr.com/
http://youtube.com/
19
lution erfolgen, sondern einzelne Komponenten des Gesamtkonzeptes werden
nach und nach die bekannten Paradigmen ergänzen.
Literatur
[1] Stefan Decker and Martin Frank. The social semantic desktop. Technical
report, Digital Enterprise Research Institute, 2004.
[2] Leo Sauermann, Ansgar Bernardi, and Andreas Dengel. Overview and
outlook on the semantic desktop, 2005.
[3] Tony Buzan. The mind map book. Penguin Books, 1996.
[4] John D. Novak. Learning Science in the Schools: Research Reforming
Practice, chapter ,,Concept Mapping: A Strategy for Organizing Knowledge”, pages 229–245. Lawrence Erlbaum Associates, 1995.
[5] Vannevar Bush. As we may think. The Atlantic Monthly, 176, 1945.
[6] W3C. Sparql protocol for rdf: W3c recommendation 15th January 2008.
http://www.w3.org/TR/2008/REC-rdf-sparql-protocol-20080115/.
[7] The NEPOMUK Project - On the way to the Social Semantic Desktop,
2007.
20