Web 2.0

Transcription

Web 2.0
Einführung in die in die
Informationstechnik
IX – World Wide Web
2
Z
Zusammenfassung
f
Internet, Netz von Netzen
 Adressierung über IP
Adressierung über IP‐Adressen
Adressen, Domain Domain
Namen
 Übertragung geregelt über Protokolle
Ü

 TCP, IP, HTTP, FTP, SMTP, DHCP
, ,
,
,
,
paketorientierter Datentransfer über Router
 verschiedene Dienste: Email, WWW, DNS
hi d
Di
E il WWW DNS

3
Üb bli k
Überblick
Dienste: FTP, Telnet, SSH, Peer‐to‐Peer, VoIP
 World Wide Web
World Wide Web

 Protokolle
 Cookies
 Web 1.0
 Web 2.0
5
weitere Dienste
it
Di t

FTP zur Übertragung von Dateien
Ü
 Protokoll: FTP – File Transfer Protocol
 Anwendungen: FileZilla, integriert in TotalCommander

Telnet zur Benutzung entfernter Rechner
 Protokoll: Telnet Protocol

SSH zur sicheren Benutzung entfernter Rechner
 Ähnlich Telnet aber mit verschlüsselter Datenübertragung
Ä
 Protokoll: SSH Protocol
6
W it
Weitere Dienste
Di t

Peer‐To‐Peer‐Systeme zum Austausch von Dateien
 BitTorrent, eDonkey, eMule, Gnutella, FastTrack
 Anteil am globalen Datenverkehr: ca 24%
 Rechner, die Dienste in Anspruch nehmen und diese ebenfalls zur Verfügung stellen

Internet‐Telephonie
 Direkte Internet‐Telefonie
 Voice over IP
 Anteil am globalen Datenverkehr: ca. 12%
7
W ld Wid W b
World Wide Web




„Weltweites Gewebe“
Weltweite durch Hyperlinks „verwobene“ yp
Dokumente
Internet realisiert die Übertragung von Webseiten
Internet realisiert die Übertragung von Webseiten
verwendete Protokolle:
 HTTP –
HTTP HyperText Transfer Protocol
HyperText Transfer Protocol
 HTTPS – HyperText Transfer Protocol Secure


Anwendungen: Webbrowser
A
d
W bb
Anteil am globalen Datenverkehr: ca. 43%
8
Total Sites Across All Domains
Total Sites Across All Domains
August 1995 ‐ May 2009
http://news.netcraft.com/
9
O
Organisation des WWW: W3C
i ti d WWW W3C
Kümmert sich um Standardisierung und Normierungg
 Auch: WWW‐Consortium: www.w3c.org
 Zusammenschluss verschiedener Mitgliedsorganisationen u.a.:

 Apple, AT&T, Intel, Microsoft, SAP, SUN

Leitung: MIT (USA), INRIA (Frankreich), Keio
Leitung:
MIT (USA) INRIA (Frankreich) Keio
University (Japan)
10
HTTP
Hypertext Transfer Protocol
 1989 von Tim Berners‐Lee zusammen mit der URL und der Sprache HTML entwickelt
 Zustandsloses Protokoll:
Zustandsloses Protokoll:

 nach erfolgreicher Datenübertragung wird Verbindung nicht aufrecht erhalten
Verbindung
nicht aufrecht erhalten
 Sitzungsdaten gehen verloren
 Cookies für Speicherung der Sitzungsdaten
C ki fü S i h
d Sit
d t
11
HTTP K
HTTP‐Kommunikationsablauf
ik ti
bl f
Aktivieren des Links http://www.example.net/infotext.html schickt an www.example.net die Anfrage, die Ressource /infotext.html zurückzusenden
 Umsetzen des Namens www.example.net
über das DNS‐Protokoll
über das DNS
Protokoll in eine IP
in eine IP‐Adresse
Adresse  Senden einer Anforderung an den Webserver 
GET /infotext.html HTTP/1.1
Host: www.example.net

weitere Informationen in der Anfrage möglich
12
HTTP K
HTTP‐Kommunikationsablauf
ik ti
bl f

Antwort des Servers bestehend aus
 Header
Header‐Informationen
Informationen
 Inhalt der Nachricht = Webseiten‐Quellcode
HTTP/1.1
/1 1 200 OK
Server: Apache/1.3.29 (Unix) PHP/4.3.4
Content-Length: (Größe von infotext.html in Byte)
C t t L
Content-Language:
d
de
Content-Type: text/html
Connection: close
(Inhalt von infotext.html)
13
HTTP Statuscodes: Serverantworten, die Informationen HTTP Statuscodes: S
t
t
di I f
ti
über Fehlermeldungen etc. liefern







200 – OK: Die Anfrage wurde erfolgreich bearbeitet und das Ergebnis der 200
OK Di A f
d
f l i h b b it t d d E b i d
Anfrage wird in der Antwort übertragen. 201 – Created: Die Anfrage wurde erfolgreich bearbeitet. Die angeforderte Ressource wurde vor dem Senden der Antwort erstellt
angeforderte Ressource wurde vor dem Senden der Antwort erstellt. 400 – Bad Request: Die Anfrage‐Nachricht war fehlerhaft aufgebaut. 401 – Unauthorized: Die Anfrage kann nicht ohne gültige Authentifizierung durchgeführt werden Wie die Authentifizierung
Authentifizierung durchgeführt werden. Wie die Authentifizierung durchgeführt werden soll wird im „WWW‐Authenticate“‐Header der Antwort übermittelt. 403 – Forbidden: Die Anfrage wurde mangels Berechtigung des Clients 403 Forbidden: Die Anfrage wurde mangels Berechtigung des Clients
nicht durchgeführt. Diese Entscheidung wurde – anders als im Fall des Statuscodes 401 – unabhängig von Authentifizierungsinformationen getroffen. 404 – Not Found: Die angeforderte Ressource wurde nicht gefunden. Dieser Statuscode kann ebenfalls verwendet werden, um eine Anfrage ohne näheren Grund abzuweisen. 500 Internal Server Error: „Sammel‐Statuscode“ für unerwartete 500 –
I t
lS
E
S
l St t
d “ fü
t t
Serverfehler 14
C ki
Cookies

Problem: Zustand einer Web‐Sitzung nicht oder nur auf dem WebServer speicherbar
→ IP‐Adressen meist dynamisch vergeben
 Beispiel: Inhalt des Warenkorbs

Lösung: Speicherung von Informationen zu einer Webseite auf dem Clientrechner
→ Cookies

Cookies: kurze Texte
Cookies: kurze Texte
 vom Webserver an den Webbrowser gesandt
 Vom Webbrowser in Datenbank gespeichert
Vom Webbrowser in Datenbank gespeichert
15
Th W b
The Web around
d Wikipedia
Wiki di (18.06.2004)
(18 06 2004)
16
17
W b20
Web 2.0
Cloud Computing
Social Web
Blogs
Tagging
Social Cataloging
Kollaboration
Wikis
W b 2.0
Web
20
Webservices
Virtuelle Welten
Communitys
F lk
Folksonomy
Social Bookmarking
Podcasting
S
Semantic
ti Web
W b
18
B iff W b 2 0
Begriff: Web 2.0

Grundlage:  Weiterentwicklung der Web
Weiterentwicklung der Web‐Technologien
Technologien
 Veränderung der Wahrnehmung des Webs
ttechnische Sicht vs. soziale Sicht
h i h Si ht
i l Si ht
 Benutzung einer Versionsnummer, ähnlich g
,
wie bei Software
 Definition des Begriffs schwierig
Definition des Begriffs schwierig

→ Versuch einer Annäherung
19
W b 2.0
Web
2 0 - Konkretisierung
K k ti i

Beispiele die die Veränderung des Webs
charakterisieren:
Web 1.0
DoubleClick
Ofoto
mp3.com
Britannica Online
personal websites
domain name speculation
publishing
directories ((taxonomy)
y)
content management systems

Web 2.0









Google AdSense
Flickr
Napster
Wikipedia
blogging
search engine optimization
participation
tagging
gg g (("folksonomy")
y)
wikis
Was unterscheidet aber nun eine Web 1.0Anwendung von einer Web 2.0-Anwendung?
20
W b 2 0 Kriterien
Web 2.0 –
K it i
das Web als Plattform (anstatt des lokalen Rechners)
 Daten als wichtigste Grundlage
 „Architektur des Mitwirkens
Architektur des Mitwirkens“ → Verstärkung → Verstärkung
der Vernetzung
 Modulare Zusammenstellung von Systemen M d l
Z
t ll
S t
und Seiten

 Module von unterschiedlichen Entwicklern (Prinzip ähnlich OpenSource)
21
W b 2 0 Kriterien
Web 2.0 –
K it i



verteiltes, gemeinsames Nutzen von Inhalten und technischen Diensten → einfache Geschäftsmodelle
Ende des klassischen Softwarelebenszyklus‘ → immerwährendes Beta‐Stadium
Die Software geht über die Fähigkeiten eines einzelnen Verwendungszwecks hinaus.
einzelnen Verwendungszwecks hinaus.
22
W b l Pl ttf
Web als Plattform
Vom Desktop zum Webtop
 zentrales Ziel von Web 2.0 zentrales Ziel von Web 2 0 – Webbrowser als Webbrowser als
Plattform
 Plattform Vorteile gegenüber Anwendung

 keine Portierung auf andere Betriebssysteme
g
y
 keine neuen Software Ausgaben


kontinuierliche Verbesserung
kontinuierliche Verbesserung
Software als Service, Vermittler
23
W b l Pl ttf
Web als Plattform

WebOS
 „Betriebssystem“ für Webanwendungen
 Kein Betriebssystem im eigentlichen Sinne
 OS stellt Schnittstelle zwischen Hardware und Software dar

Verantwortlich für Dateisystem
 WebOS: Schnittstelle zur Programmierung von Webanwendungen



Zwischen Anwendung und Hardware
Zwischen
Anwendung und Hardware
WebOS ist mehr eine Art Oberfläche → WebDesktop
Bietet aber auch Funktionen zur Verwaltung von Dateien
g
24
W b l Pl ttf
Web als Plattform: WebDesktop
W bD kt
WebOs eigentlich im Hintergrund →
Funktionalität
 WebDesktop im Vordergrund → Sichtbare Schnittstelle zur Steuerung und Verwaltung
Schnittstelle zur Steuerung und Verwaltung von Webanwendungen
 Meist ähnlich Windows

25
W b l Pl ttf
Web als Plattform

Beispiele für WebDesktop, WebOS:
 eyeOS: http://eyeos.org
eyeOS: http://eyeos.org
 GlideOS: http://www.glideos.com
 OnlineOS: http://icube.at/home.jsp
O li OS htt //i b t/h
j
 Übersicht siehe: http://en.wikipedia.org/wiki/Web_desktop
26
W
Web als Plattform: eyeOS
b l Pl ttf
OS
27
A kt d W b 2 0 Cl d Computing
Aspekte des Web 2.0: Cloud
C
ti
Rechnen in der Wolke
 Bereitstellung von Diensten, on
Bereitstellung von Diensten on‐demand:
demand:

 Rechner, Speicher, Netz
 Anwendungen, Betriebssysteme, Tools

Lokale Anschaffung/Installation entfällt
g/
 Lediglich Zugangssystem muss vorhanden sein
28
A k d W b 2 0 Ab
Aspekte des Web 2.0: Abonnementdienste
di

Bereitstellung von Inhalten, die abonniert werden können
 Feeds: RSS, Atom

RSS R ll Simple Syndicate
RSS: Really
Si l S di t
 Zusätzliches Programm erforderlich: Feedreader
 Abonnement durch Eingabe der Feedadresse
 Feedreader lädt Feed automatisch (zeitgesteuert)
lädt Feed automatisch (zeitgesteuert)
29
A k d W b 2 0 W bS i
Aspekte des Web 2.0: WebServices
Web 1.0: alles auf einem Rechner
 Web 2.0: Software‐Bausteine, die auf verschiedenen Rechnern laufen
→ komponentenbasierte Webservices
→ komponentenbasierte Webservices
 Verbindung zu einer Anwendung über das Internet
 Service kann Daten bereitstellen, auswerten
S i k
D t b it t ll
t
 Beispiel: Google‐Maps, Suchmaschinen, LibraryThing, Interaktive Anwendungen im Web

30
I t kti A
Interaktive Anwendungen im Web
d
i W b
Mindmaps
 Chart
Chart‐ und Diagrammerstellung
und Diagrammerstellung
 Bildbearbeitung, Fotogallerien
 Communities
 Speicherplatz für Dateien
Speicherplatz für Dateien
…
 Übersicht: go2web20.net

31
S i l A kt d W b 2 0
Soziale Aspekte des Web 2.0


Web 1.0: Autoren sind für Inhalte verantwortlich
Web 2.0: Benutzer/innen wirken an Inhalten mit
→ Architektur des Mitwirkens

Nutzung kollektiver Intelligenz
Nutzung kollektiver Intelligenz
 Google: PageRanking Analyse der Verlinkung
 Amazon: besser durch Review der Leser
Amazon: besser durch Review der Leser
 Wikipedia lebt von der Aktivität der Benutzer
 Blogging, Tagging: Weisheit der Masse
Blogging Tagging: Weisheit der Masse
32
S i l A kt I Folksonomy
Soziale Aspekte I ‐
F lk
Gemeinschaftliches Indexieren → Tagging
 Zuordnen von Descriptoren, Schlagwörtern p
,
g
(Tags) zu Objekten

 Lesezeichen
 Photos
 wissenschaftliche Paper
wissenschaftliche Paper

Meist keine Festlegungen über Vokabular
 Jeder kann frei Taggen
 Herausbildung gemeinschftlicher Wortschatz
33
S i l A kt I Folksonomy
Soziale Aspekte I ‐
F lk

P bl
Probleme:
 Synonyme
 Unterschiedliche Sprachen
Unterschiedliche Sprachen
 Getrennt‐, Zusammenschreibung  WebDesktop, Web‐Desktop, Web Desktop, Web_Desktop
 Kontextbedeutungen: Apple, Virgin
 Singular/Plural
→ Bild
→ Bildung unterschiedlicher Kategorien
t
hi dli h K t
i

Vorteile:
 Arbeitsverteilung
 Benutzer fügen Schlagworte hinzu, nicht Autoren → bessere Benutzbarkeit (Suchergebnisse)?
34
S i l Aspekte
Soziale
A
kt I - Folksonomy
F lk


Phototagging: „Flickr“,
Social Bookmarking:
 „Delicious“,
D li i
“
 „Bibsonomy“
 Digg

Online Journalismus:
 Spiegel:
S i
l

k i Folksonomy
kein
F lk
Social Cataloging:
 Library
Thing
35
S i l A kt II Blogging
Soziale Aspekte II ‐
Bl i

Blog – Wortkreuzung aus Web Log
 Web‐Tagebuch

Umfrage ergab:
 73% der Blogger schreiben aus Spass
 27% nicht persönlich, zur Wissensvermittlung


Beispiele für textuelle Blogs: …
Blogs nicht nur textuell
 Podcasts
 VideoBlogs, Vlogs
36
S i l A kt II Blogging
Soziale Aspekte II ‐
Bl i

Beispiele:
 Podcasts: Deutschlandfunk, Mediathek von ARD Podcasts: Deutschlandfunk, Mediathek von ARD
und ZDF
 VideoBlogs: Rocketboom, Ehrensenf
VideoBlogs: Rocketboom Ehrensenf
37
S i l A kt III Mi bl i
Soziale Aspekte III: Microblogging
Blog bei dem nur Kurznachrichten versandt werden
 Postings können abboniert werden
 Öffentlich oder privat zugänglich
Ö
 Bekanntester Dienst: Twitter
Bekanntester Dienst: Twitter

38
S i l A kt IV Wiki
Soziale Aspekte IV: Wikis
Name stammt von Wikiwiki (hawaianisch für schnell))
 Content‐Management‐System (CMS)
 Erlaubt die gemeinsame Erstellung von Webseiten
 Prominentes Beispiel: Wikipedia
 Desktop Wikis: WikidPad, Tomboy, TiddlyWiki
D kt Wiki WikidP d T b Tiddl Wiki

39
P
Personalisiertes Web
li i t W b




Web 1.0: Webseite statisch, alle konsumieren die gleichen Inhalte
Web 2 0: Benutzer/innen können Inhalte ihren Interessen
Web 2.0: Benutzer/innen können Inhalte ihren Interessen entsprechend anpassen
Personalisierung, Definition: Anpassen an persönliche g,
p
p
Bedürfnisse
Bei digitalen Dokumenten:
Anpassung des Inhalts
 Anpassung der Darstellung


Grundsätzliche Unterscheidung:
Grundsätzliche Unterscheidung:
Für den Benutzer/Benutzerin
 Durch den Benutzer/Benutzerin

40
P
Personalisiertes Web
li i t W b

Personalisierung durch den Benutzer/in:
 Inhalte von Webseiten
Inhalte von Webseiten

Beispiel: NetVibes, Pageflakes
 Webradio:


Pandora, Last.fm, MusiMap, musiclens
P
Personalisierung für den Benutzer/in:
li i
fü d B
/i
 Google AdSense
41
D t
Daten‐getriebene Anwendungen
ti b
A
d



Web 1.0: Wer Inhalte konsumiert war unbekannt
W
b10 W I h l k
i
b k
Web 2.0: Nutzung von Daten über Benutzer/innen → Profile
jede erfolgreiche Internet Anwendung basiert auf einer
jede erfolgreiche Internet Anwendung basiert auf einer speziellen Datenbasis







eBay: Produkte und Verkäufer
Amazon: Produkte und Rezensionen
Amazon: Produkte und Rezensionen
Google: Webseiten
Teleatlas, Geocontent: Geo‐Daten
Kontrolle über Daten=Kontrolle über Markt
Management einer Datenbasis ist die Kernkompetenz von Web 2.0 Firmen
Web 2.0 Firmen
Software wird zu „Infoware“
42
Si h h it i W b 2 0
Sicherheit im Web 2.0


Allgemeine vs. Persönliche Daten
All
i
P ö li h D
Allgemein:


Rezensionen, Statistiken, Landkarten
Rezensionen, Statistiken, Landkarten
Persönliche Datenspuren im Netz:
Einkaufsverhalten → Vorlieben
B
Browseverhalten →
h lt → Interessen
I t
Persönliche Daten: Geburtstag, Adresse, Bankverbindung, Telefonnummer, Kreditkartendaten
→ komplettes N t erprofil Identitätss bs stem für Web 2 0?
→ komplettes Nutzerprofil, Identitätssubsystem für Web 2.0?






Was passiert mit diesen Informationen?
Wie sicher sind sie?
Daten resultieren nicht nur aus Web‐Verhalten, auch von Payback u.ä. Datensammlern
43
V
Vom URL‐Raten zur Suchmaschine
URL R t
S h
hi


Web 1.0: URL‐Raten, Web 2.0: Suchmaschinen
Letztere analysieren Webseiten
y
 Robots durchforsten das Web, in der Regel durch das Folgen von Links
 Analyse des Anfangs oder des gesamten Textes (Altavista, Fireball)


Auswertung von Metatags
Auswertung von Verlinkung: PageRank (Google)
Auswertung von Verlinkung: PageRank (Google)
44
S i lN t
Social Networking
ki
Webseiten mit denen Menschen in Kontakt /
treten/bleiben können
 Management von sozialen Netzwerken
 Zweck:

 Kommunikation
 Bildung neuer Geschaftsverbindungen
 Entwicklung neuer Projekte
Entwicklung neuer Projekte
 Terminmanagement, ‐abstimmung
46
Social Networking Networking
Beispiele
Interessen: Fotocommunity, StudiVZ
 Dating: Tickle, NachtlebenMD
Dating: Tickle NachtlebenMD (Urbanite)
 Beziehungsorientiert: LinkedIn, Friendster
 Geschäftsorientiert: Ecademy, OpenBC (Xing)

47
N
News im Web 2.0
i W b20
Web 1.0: Traditionelle Medien stellen ihre g g
Informationen im Web zur Verfügung
 Web 2.0: alle sind Journalisten?

 Stirbt der traditionelle Journalismus?
Sib d
di i
ll J
li
?
 Werden Nachrichten nur noch elektronisch gefiltert und aufbereitet?
 Journalist als Moderator zwischen bloggenden gg
Bürgern?

Graswurzel oder Bürgerjournalismus
Graswurzel oder Bürgerjournalismus
48
A kt d W b 2 0 Bü
Aspekte des Web 2.0: Bürgerjournalismus
j
li
Wikimedia
 The Huffington
The Huffington Post
 Google News
 Verbindung zwischen Radio und Blog: Blogspiel (Deutschlandfunk)

49
S
Semantic
ti Web
W b

Codierung von Bedeutung im Web
 In Rechnerverständlicher Form
In Rechnerverständlicher Form
Ermöglicht Automatische Auswertung von B d t
Bedeutungen
 Vorteile: 
 Daten können in Beziehung zueinander gesetzt werden
 Neue Erkenntnisse können gewonnen werden
50
W b 3 0?
Web 3.0?


Weiterführende semantische Vernetzung?
W
it füh d
ti h V
t
?
Internet 2.0: jedes Gerät hat eine eigene IP‐Adresse





IPv6: 128 Bit lange Adresse = 2128 Adressen
reicht für 6 65 ∙ 10
reicht, für 6,65 1023 Adressen/m2 Erdoberfläche
Jeder kann jederzeit online sein
Vielleicht aber auch nicht nur jedes Gerät sondern jeder Blog, jeder Artikel, Autor,…
Verarbeiten von Informationen erfolgt dezentral, getrennt vom Medium, unabhängig vom Autor





Man liest nicht mehr ein Blog sondern von einem Autor in mehreren Blogs
Orte wären irrelevant Bild wird durch IP bestimmt nicht Position
Orte wären irrelevant. Bild wird durch IP bestimmt, nicht Position
Neue Zugangswege wären notwendig
Artikel werden nicht mehr in einem Blog veröffentlicht sondern „zur Verfügung gestellt“
Informationen werden anhand ihrer IP identifiziert und entsprechend zusammengestellt
51
Z
Zusammenfassung
f
WWW: Dienst im Internet
 Weltweites Gewebe durch Verlinkung
Weltweites Gewebe durch Verlinkung
 Protokoll: Hypertext Transfer Protokoll


Web 2.0:
 Webseite als Plattform für Anwendungen
 Daten wichtiger als Aussehen
Daten wichtiger als Aussehen
 Nutzung verteilter Daten und Anwendungsteile
 Ausnutzen der Kompetenz vieler Web
Ausnutzen der Kompetenz vieler Web‐Nutzer
Nutzer
53
Dienste und deren Nutzung
Dienste und deren Nutzung
Suchmaschinen

Arten von Suchmaschinen:
 Manuell erstellte Kataloge
Manuell erstellte Kataloge
 Automatisch erstellte Indizes
 Suchmaschinen für Spezielle Zwecke
S h
hi
fü S i ll Z
k

Datenbank von Suchmaschinen: http://www.suchlexikon.de/
http://www.suchfibel.de
54
S h
Suchmaschinen, der manuell erstellte Katalog
hi
d
ll
ll K l

Generell: von Menschen gemacht
Von einer zusammen arbeitenden Gruppe → Redaktion
 Von vielen Beteiligten unabhängig voneinander → Folksonomy
V
i l B t ili t
bhä i
i
d → F lk


Meist hierarchische Präsentation des Katalogs




Beispiel: Yahoo Web de
Beispiel: Yahoo, Web.de
Eignung: Suche nach einem Thema, Sachgebiet, Stichwort
Vorteil: Redaktion kann Inhalt eines Dokuments
Vorteil: Redaktion kann Inhalt eines Dokuments berücksichtigen
Nachteil: Zusammenhänge können verloren gehen:
Nachteil: Zusammenhänge können verloren gehen:

Beispiel: Name einer Person + Sachverhalt
http://www.suchfibel.de
55
Suchmaschinen, der automatisch erstellte Suchmaschinen,
der automatisch erstellte
Katalog

Software (Robot, Crawler, Spider) browsed vollautomatisch durchs Netz




Von Link zu Link
Von Link zu Link
Indexierungssoftware analysiert und strukturiert Daten
Suchmaschinen arbeiten auf Begriffen
Suchmaschinen arbeiten auf Begriffen, ohne die Relevanz eines Wortes für den Inhalt des Dokumentes zu berücksichtigen
g
→ für die Suchanfrage wichtig zu wissen
Eingrenzen des Suchraumes: Welche Begriffe könnten im Zusammenhang mit dem Suchwort stehen

explizites Ausschließen von Begriffen
http://www.suchfibel.de
56
S h
Suchmaschinen, wichtigste Befehle
hi
i hi
B f hl

Plus (+): Verknüpfung zweier Wörter, beide müssen im Ergebnisdokument vorkommen


Minus (‐): schließt ein Wort aus, das nachfolgende darf nicht im Ergebnisdokument vorkommen
im Ergebnisdokument vorkommen


‐preis
Anführungsstriche: Verbinden von Worten zu einer Phrase. Anführungsstriche:
Verbinden von Worten zu einer Phrase.
Wird wie ein Wort behandelt


+Fahrrad
F h d
„Der oide Depp“
Trotzdem: nicht jede Suchmaschine erfasst das g
gesamte Web
http://www.suchfibel.de
57
B i
Barrieren für Suchmaschinen
fü S h
hi

Die Internetseite …  … ist nicht verlinkt
 … ist zu versteckt
 … ist zu aktuell
 … darf nicht indexiert werden
 … hat zuviel Text
 … hat keinen Text
 ... ist nicht frei zugänglich
g g
 … hat ein unbekanntes Dateiformat
→ Unsichtbares Netz
→ Unsichtbares Netz
http://www.ub.uni-bielefeld.de/biblio/search/help/invisibleweb.htm
58
S h
Suchmaschinen, Google
hi
G
l


Automatisches Browsen durch Links → Robot
Relevanzsortierungg durch PageRank
g
 Larry Page und Sergey Brin
 Grundprinzip: Je mehr Links auf eine Seite verweisen, p
p
,
desto höher ist das „Gewicht“ der Seite
 Je höher das „Gewicht“ der verweisenden Seiten, desto höher der Effekt → wichtiger die Seite
 Ziel: Liste der zu einem Suchbegriff wichtigsten Seiten
http://www.suchfibel.de
59
S h
Suchmaschinen, Google → Benutzung
hi
G
l →B


Plus (+), Minus (‐), Anführungsstriche
Oder (|): Verknüpfung zweier Wörter, beide können im Ergebnisdokument vorkommen
b id k
k





Strand | Beach
Berechnungen: ((3*8)/6)^2
Berechnungen
((3*8)/6)^2
Einheiten umrechnen: foot in cm
Z Ki
Zug, Kino und Wetterauskunft
d W tt
k ft
Erweiterte Syntax
http://de.wikipedia.org/wiki/Google
60
S h
Suchmaschinen, Google → Erweiterte Syntax
hi
G
l →E
i
S










cache: Sucht in von Google gespeicherten Seiten
define: Suche nach Definitionen
filetype: Suche nach bestimmten Dateiendungen
inanchor: Suche nur in Links
intitle: Suche nur im Titel einer Seite
inurl: Suche nur in der Adresse
intext: Suche nach Begriffen, die nur im Text vorkommen
link: Ausgabe aller Seiten, die auf eine bestimmte verlinken
site: Suche auf eine bestimmte Domain eingrenzen.
related: Sucht nach ähnlichen Seiten
http://de.wikipedia.org/wiki/Google
61
S i ll S h
Spezielle Suchmaschinen, Wolfram Alpha
hi
W lf
Al h






Weniger Suchmaschine, eher Antwortmaschine
Entwickelt vom Mathematica‐Erfinder Stephen p
Wolfram
Daten wurden von 100 Mitarbeitern manuell
Daten wurden von 100 Mitarbeitern manuell aufbereitet
Fragen können in Suchbegriffen oder direkt gestellt
Fragen können in Suchbegriffen oder direkt gestellt werden
S h
Sehr gut bei Fakten zu Mathematik, Technik, t b i F kt
M th
tik T h ik
Naturwissenschaften, Linguistik, Wirtschaft
Beispiel: How old is Barack Obama?
62
N
Neue Suchmaschinen, Microsoft Bing
S h
hi
Mi
f Bi



Neue Suchmaschine von Microsoft
Seit 3. Juni 2009 online
Entscheidungsmaschine
 Hilfe bei Kaufentscheidungen, Reservierungen, Hilfe bei Kaufentscheidungen Reservierungen
Reisevorbereitungen, etc.

Gute Suche nach Bildern und Videos
Gute Suche nach Bildern und Videos
 Incl. Interaktiver Vorschaufunktion

Im Moment amerikanische Version noch besser
63
S i ll S h
Spezielle Suchmaschinen, Bildindex
hi
Bildi d





Spezielle Suchmaschine für Bilder
Bildindex der Kunst und Architektur
2 Millionen Bilder aus 13 europäischen Ländern
Nach Künstler Ort Porträt und Themen katalogisiert
Nach Künstler, Ort, Porträt und Themen katalogisiert
Suche in unterschiedlichen Bereichen möglich
 Jahr, Genre, 64
S i ll S h
Spezielle Suchmaschinen, hi

Metasuchmaschinen
 Weiterleiten einer Suchanfrage an viele Suchmaschinen
 Oft langsamer
 Erste Metasuchmaschine: MetaCrawler
 Deutsche Metasuchmaschine: MetaGer

Weitere Spezialsuchmaschinen:
p
 Medienarchive, Bildarchive, Menschsuchmaschinen
 Nachrichtendienste, Bibliotheken und Buchkataloge
Nachrichtendienste, Bibliotheken und Buchkataloge
65
Z
Zusammenfassung
f



Suchmaschinen: manuell erstellt oder automatisch
Automatisch: Robots browsen durchs Netz → Indexierung von Webseiten nach Suchbegriffen und Schlüsselwörtern
Suchanfragen haben spezielle Syntax
 +, + ‐, „“, |, |


Größter Teil des Netzes ist nicht sichtbar
Z
Zugang zu Informationen teilweise über spezielle I f
ti
t il i üb
i ll
Suchmaschinen