Freier Wissenszugang mit der Suchmaschine YaCy

Transcription

Freier Wissenszugang mit der Suchmaschine YaCy
Freier Wissenszugang
mit der Suchmaschine YaCy
SearchEngine
Michael Christen, [email protected], IP-ShareMedia.de
26. Oberhofer Kolloquium 2011
Web 3.0 - wird es das Web der Informationsspezialisten?
Inhalt
Teil 1: 10 Thesen zum freien Wissenszugang
freie Inhalte, Bürgerrechte, Privatsphäre, Datenschutz
+Demo!
Teil 2: Suchmaschinentechnik
Grundfunktionen, Skalierung, dezentrale Architektur
Teil 3: Freier Wissenszugang mit YaCy
freie Such-Appliance für alle
Bürgerrechte für eine nachhaltige Wissensgesellschaft
UNO Weltgipfel zur Informationsgesellschaft, Beitrag der Heinrich-Böll-Stiftung
(a)
Wissen ist Erbe und Besitz der Menschheit und damit frei.
(b)
Der Zugriff auf Wissen muss frei sein.
(c)
Alle Menschen haben das Recht auf Kommunikation und
Informationsfreiheit.
(d)
Das Recht auf Achtung der Privatheit ist ein Menschenrecht
und ist unabdingbar für die freie und selbstbestimmte
Entfaltung von Menschen in der Wissensgesellschaft.
aus: http://www.worldsummit2003.de/de/web/52.htm
Vorgehensweise:
Charta
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Thesen
Technik
Michael Christen
[email protected], http://yacy.net
Teil 1 - Thesen zum freien Wissenszugang
Suchmaschinen als Brücke zwischen freien Inhalten und Nutzern
1. These: freie Daten können nur dann wirklich frei sein
wenn sie mit freier Software gefunden werden können
freie Daten
Suche
Nutzer
u.a.:
Suchmaschinenmonopol:
freie Software
proprietäre und
zentralisierte Technik,
Aufzeichnung aller
Datenspuren, Zensur,
Filterung, Löschung,
Verschmutzung durch
Werbung
Der Nutzer ist auf die
Existenz und korrekte
Funktion proprietärer,
zentralisierter und
kontrollierter Suchportale
angewiesen, um freie
Inhalte finden zu können
Daten unter Creative
Commons Lizenz
Open Access Archive
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 1 - Thesen zum freien Wissenszugang
Suchmaschinen als Brücke zwischen freien Inhalten und Nutzern
1. These: freie Daten können nur dann wirklich frei sein
wenn sie mit freier Software gefunden werden können
freie Daten
Suche
Nutzer
2. These: zwischen freien Informationen und dem Nutzer
fehlt eine wesentliche Verbindung: die freie Suche
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 1 - Thesen zum freien Wissenszugang
Bürgerrechte und Wahrung der Privatsphäre
Das Internet und das World Wide Web sollten nach seiner ursprünglichen Philosophie eine
alle-zu-alle Infrastruktur bieten und nicht nur Sender-Empfänger Verbindungen aufbauen.
Nutzer/Daten
Produzent und
Konsument
von Software und Daten
Nutzer/Daten
Suchportale:
Torwächter des
World Wide Web
Produzent und
Konsument
von Software und Daten
3. These: Zensur durch Dritte kann nur durch das Betreiben einer
eigenen Suchmaschine verhindert werden.
&
4. These: Das Betreiben einer Suchmaschine für eigene Zwecke
ermöglicht eine bessere Qualität der Suchergebnisse.
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 1 - Thesen zum freien Wissenszugang
Datenschutz und Wahrung von Geschäftsgeheimnissen
Unternehmensumfeld
Discussions
Wiki
Code
Bugtracker
Suchmaschine
Das
Internet
5. These: Zur Wahrung der Privatsphäre und der Geheimhaltung ist es
notwendig, dass der Suchmaschinennutzer eine eigene Suchmaschine
betreibt
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 1 - Thesen zum freien Wissenszugang
Soziologische Aspekte von Suchmaschinen
Unterscheidung Suchmaschinen/Datenbanken
(beides sind Varianten eines Assoziativspeichers)
unstrukturierte Daten
strukturierte Daten
Suchmaschine
Datenbank
Menschen
Programme
6. These: Suchmaschinen finden
Informationen in unstrukturierten
Daten für Menschen...
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
...Datenbanken finden
Informationen in strukturierten
Daten für Programme
Michael Christen
[email protected], http://yacy.net
Teil 1 - Thesen zum freien Wissenszugang
Soziologische Aspekte von Suchmaschinen
unstrukturierte Daten
Ranking
Suchmaschine
Kontext und Vernetzung
von Information
g Generierung von Wissen
Relevanz
Gruppe
7. These: Eine Suchmaschine findet relevante Informationen nur für
eine bestimmte Gruppe von Menschen, wobei diese Gruppe die
gleichen Relevanz-Kriterien teilt
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 1 - Thesen zum freien Wissenszugang
Soziologische Aspekte von Suchmaschinen
Gruppe
8. These: Gemeinschaften und Gesellschaften brauchen eigene
Suchmaschinen um relevante Informationen optimal finden zu können
9. These: Die Suchergebnisse einer Suchmaschine für eine bestimmte
Gemeinschaft ist meinungsbildend für diese Gemeinschaft im Bezug zu
Normen und Werte
§
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 1 - Thesen zum freien Wissenszugang
Soziologische Aspekte von Suchmaschinen
Fazit: verschiedene Gruppen g verschiedene Interessen g eigene Suchmaschinen
Gruppe
Gruppe
Gruppe
Suchmaschine
Suchmaschine
Suchmaschine
10. These: Die Forderung nach einer nicht-monopolisierbaren und nichtzensierbaren Suchmaschine mit gleichberechtigten Rechten zur
Moderation des Suchindexes kann nur von einer dezentralen
Suchmaschinentechnik erfüllt werden.
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 2 - Suchmaschinentechnik
Crawler
Suchseite
Server
im Netz
„round-robin“
Zugriff
robots.txt und
Latenz beachten
Suchen und Ergebnisse mit
Navigatoren darstellen
Parser
z.B.: HTML, XHTML, RSS, RDF, XHTML+RDFa, FOAF,
vCard, Flash, PDF, PS, Word, Excel, Visio,
Powerpoint, OpenOffice, RTF, csv, gzip, zip, tar,
rar, bzip2, 7zip, images(EXIF)
Dokumente
viele
Dateiformate
Indexierer
Verschlagwortung ist die Umkehrung der
Dokument: Referenzg{Wort*}
Relation zu einer
Index: Wortg{Referenz*}
Relation
Dokumentencache
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Snippets
FTP SMB
Michael Christen
[email protected], http://yacy.net
Teil 2 - Suchmaschinentechnik
vertikale Skalierung: mehr Durchsatz
Leistungsfähige, skalierbare Suchmaschinen
Suchmaschinencluster
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
horizontale Skalierung: mehr Dokumente
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 2 - Suchmaschinentechnik
Leistungsfähige, skalierbare Suchmaschinen
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Search
Engine
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 2 - Suchmaschinentechnik
Dezentrale Websuche mit Peer-to-Peer Technik
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Search
Engine
Peer
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 2 - Suchmaschinentechnik
Peer-to-Peer Suchmaschine für das World Wide Web
Peer
Peer
Peer
Peer
Web Crawlen,
Indexieren, verteilt
speichern
Peer
Peer
Peer
DHT
Peer
Peer
Distributed Hash Table
Peer
Suchen in einer
Distributed Hash Table
Peer
Peer
DHT-Store
Peer
Peer
Peer
Peer
DHT-Read
Das YaCy Suchmaschinennetz besteht aus eigenständigen
Suchmaschinen, aber sie sind auch miteinander vernetzt.
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 2 - Suchmaschinentechnik
Peer-to-Peer Suchmaschine für das World Wide Web
Das Netz existiert. Jeder kann mitmachen. Keiner kann zensieren.
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 3 - Freier Wissenszugang mit YaCy
Such-Appliance für Portale im Internet oder Intranet
Communities
Your Project
Discussions
Code
Wiki
Bugtracker
Appliance
Search Engine
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 3 - Freier Wissenszugang mit YaCy
Suchmaschine für virtuelle Fachbibliotheken
Bibliotheken
>2000 Open Access Repositories
OAI-PMH
Import
Dublin Core
Metadaten
(web)
Suchindex
http://oai.yacy.net
Fachbibliothek deutsche Universitäten
http://blog.yacy-kochbuch.de/?page_id=23
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 3 - Freier Wissenszugang mit YaCy
Suchmaschine für wissenschaftliche Publikationen
Wissenschaft
Sciencenet:
http://sciencenet.kit.edu
Suchmaschine des
Karlsruhe Institut für
Technologie
35 Peers in eigenem Netz,
> 200 Mio. Dokumente
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Teil 3 - Freier Wissenszugang mit YaCy
freie dezentrale Suchmaschine für alle
für uns
freeworld:
http://search.yacy.net
Suchmaschine, bestehend
aus den Peers freiwilliger
600 Peers im Monat,
weltweit verteilt
> 1 Milliarde Dokumente
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Michael Christen
[email protected], http://yacy.net
Mit der Suchmaschine vom Team zum TeamComputing
Verwendung von Suchmaschinentechnik
•
technologische und soziotechnische Ebene
Projektteam
technologische Ebene (,wie setze ich Technik ein‘)
soziotechnische Ebene (,wie gehe ich mit Technik um‘)
Entwerfen
Projektsteuerung
Entwickeln
Dokumentieren
Versionskontrolle
(micro)Blogging
Diskussions-Foren
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Bugtracker
Michael Christen
[email protected], http://yacy.net
Vernetzung von Menschen
Vernetzung von Wissen
SearchEngine
Suchmaschine
Fazit
Werden die Forderung der Charta der Bürgerrechte erfüllt?
(a) Wissen ist Erbe und Besitz der Menschheit
und damit frei.
(b) Der Zugriff auf Wissen muss frei sein.
Freie Suchmaschinen sind die
Verbindungen zwischen freien
Inhalten und dem Nutzer
(c) Alle Menschen haben das Recht auf
Kommunikation und Informationsfreiheit.
Suchmaschinentechnik muss
für alle erreichbar und einfach
bedienbar sein.
(d) Das Recht auf Achtung der Privatheit ist
ein Menschenrecht und ist unabdingbar
für die freie und selbstbestimmte
Entfaltung von Menschen in der
Wissensgesellschaft.
Die Suchmaschine ist nur
dann privat, wenn sie nicht
aus einer zentralen Instanz
heraus genutzt werden muss,
sie muss dezentral sein.
YaCy ist freie Software,
download von http://yacy.net
Freier Wissenszugang mit der Suchmaschine YaCy
26. Oberhofer Kolloquium 2011
Die Bedingungen werden von
YaCy erfüllt!
Michael Christen
[email protected], http://yacy.net
Vielen Dank für Ihre Aufmerksamkeit!
SearchEngine
Suchmaschinen, Wissensmanagement,
Crowdsourcing, TeamComputing:
Wir beraten Sie!
YaCy Suchmaschinenprojekt
Dipl. Inf. Michael Christen,
[email protected]
http://yacy.net
Beratung TeamComputing
Dipl. Kaufmann Georg von Nessler,
[email protected]
Dipl. Inf. Michael Christen,
[email protected]
QR-Code: vCard
http://ip-sharemedia.de
http://yacy.net
ip-
(S(
www.ip-ShareMedia.de