1 Einführung in die Informationstechnik - Die Otto-von

Transcription

1 Einführung in die Informationstechnik - Die Otto-von
2
Überblick


Einführung in die Informationstechnik
Grundlagen Datenkommunikation
Datenübertragung analog, digital
 ISDN, DSL
Netzarten und ‐topologien
 Protokolle
 Internet
 Dienste im Internet
 IP‐Adressen, DNS

IV – Internet, Grundlagen und Dienste
3
4
Allgemeines
seit Windows 3.11 – Netzwerkunterstützung
Linux von Beginn an netzwerkfähig
 heute jeder Rechner vernetzt
 außerdem


 Tablets mit Bluetooth & WLAN
 Handys mit Bluetooth & WLAN
 Drucker, HiFi Anlage, intelligentes Wohnen
6
Prinzip der Datenkommunikation
Übertragungskanäle

DEE
DÜE
DÜE
DEE

Übertragungskanal
•analog/digital
•drahtgebunden/drahtlos, optisch
Standardschnittstelle
•seriell
•parallel
•USB
•Rechnerbussystem
•drahtlos (Bluetooth)
DEE
DÜE
analog, drahtgebunden


klassisches Telefonnetz (POTS), Wählleitung
veraltet: analoge Standleitungen
digital, drahtgebunden
ISDN, Wählleitung
DSL
 digitale Standleitungen


Datenendeinrichtung (Rechner, Tablet, Handy)
Datenübertragungseinrichtung (Modem,
Netzwerkkarte, WLAN‐Einheit, Surfstick, etc.)
1
7
Datenübertragung Telefon – analog
Datenübertragung Telefon – digital
langsam veraltet




bisher (ohne ISDN) analoge Übertragung
zur Datenübertragung: „aufprägen“ von Daten auf analoge Signale – modulieren
Empfänger demoduliert Signal
Modem = Modulator/Demodulator
öffentliches
Telefonnetz
Modem
8
ISDN – Integrated Services Digital Network
ermöglicht schnelleren Verbindungsaufbau
 zwei Nutzkanäle von je 64KBit/s
 zwei Gespräche gleichzeitig möglich
 durchgehende digitale Verbindung
 keine „Vertonung“ der Daten wie bei Modem
 Abschaltung geplant: 2018


Modem
9
ISDN
10
Datenübertragung Telefon – digital
Terminator
NTBA


S0 Bus


DSL – Digital Subscriber Line
hohe Datenübertragung über Telefonleitung
entwickelt Ende der 1980er Jahre
ADSL: Asynchrones Verfahren
 Downstream: „klassisch“ 768KBit/s
 Upstream: 128KBit/s
Computer
mit ISDN‐Karte (ISDN Modem)
öffentliches
Telefonnetz
Telefonnetz
 Heutzutage bis 24MBit/s Downstream, 1MBit/s Upstream

VDSL: Very High Speed Digital Subscriber Line
 bis 50MBit/s (200MBit/s technisch möglich) Downstream
NTBA=Network Termination Basic Access
 parallele Übertragung von: Internet, Telefon, TV
13
DSL mit ISDN
Netzarten mit Kabel
NTBA
S0 Bus

LAN: Local Area Network


Computer
mit ISDN‐ und
Netzwerkkarte
Ethernet

MAN: Metropolitan Area Network

WAN: Wide Area Network

DSL‐
Modem/
Router


öffentliches
Telefonnetz
Telefonnetz
Splitter
(NTBBA)
Heute meist „Blackbox“
räumlich begrenzter Bereich (wenige km)
10...1000MBit/s

Stadt oder größere Firma, 100MBit/s ... 10GBit/s
innerhalb eines Landes, Wissenschaftsnetz
2.5 ... 100GBit/s
GAN: Global Area Network

weltweite Vernetzung, logische Zusammenfassung von LANs, MANs und WANs
OVSt
NTBBA= Network Termination Broad Band Access
2
14
Netzarten – Drahtlos


Datenübertragung Mobilfunk
WLAN: Wireless Local Area Network


GPRS ‐ General Packet Radio Service
Long Term Evolution (LTE): Mobilfunkstandard der vierten Generation (4G)

UMTS: Mobilfunkstandard der dritten Generation (3G)

drahtloses LAN, 2.4 ... 450MBit/s
Bluetooth: Funkverbindung von Geräten zum Datenaustausch – PAN: Personal Area Network

Name erinnert an Harald Blåtand, genannt Blauzahn, König von Dänemark, lebte 940‐985
 1MBit/s


15

weitere Möglichkeiten:



Infrarot
Mobilfunk: 
100MBit/s
High Speed Packet Access (HSPA): HSDPA, HSUPA: 3,6 bzw. 7,2 Mbit/s
HSPA+: 28‐84 Mbit/s
Global System for Mobile Communications (GSM): Mobilfunkstandard der zweiten Generation (2G), 55‐
220KBit/s
16
Netztopologien – LAN
18
Netzwerktechnologie Ethernet


Bus


Ring

Stern
Backbone

Anfang der 70er Jahre entwickelt
Urheber: Robert Metcalfe
Ether steht für Äther
traditionell nur innerhalb eines Gebäudes
heute auch weiter entfernte Geräte
paketorientierte Datenübertragung
BNC
RJ 48
19
Skizze zum Ethernet
(Robert Metcalfe 1976)
20
Datenpaket


Im Netz versandte Dateneinheit
Enthält neben den zu übermittelnden Informationen
 Adressdaten
 Verwaltungsinformationen

Unterschiedliche Datenpakete einer Übertragung wählen unterschiedliche Wege
3
21
Protokoll – Beispiel
Protokolle

Ablauf eines handvermittelten Ferngesprächs (ab 1877)
für Kommunikation notwendig:



physikalische Verbindung
Vereinbarung über Art und Abfolge des Datenaustausches
1.
 Kommunikationsprotokoll
 beschreibt Aufbau eines Datenpaketes








2.

dessen Absender und Empfänger
den Typ des Pakets (z. B. Verbindungsaufbau, Verbindungsabbau oder reine Nutzdaten)
die Paketlänge
eine Prüfsumme
3.

3.
regelt unter anderem:

22
4.
elektrischen Signale während Kommunikation
Reihenfolge in der Partner kommunizieren
Sprache die sie sprechen


Beispiele: TCP, IP, HTTP, FTP, SMTP, IMAP, POP3, Teilnehmer teilt Amt Verbindungswunsch durch Betätigen des Kurbelinduktors mit
Amt: Hier Amt, was beliebt?
Teilnehmer: wünsche mit Nummer 44 zu sprechen
Wenn der gewünschte Teilnehmer frei war, hieß es:
Amt: bitte rufen und die Vermittlungskraft stellte mittels eines Schnurpaares die Verbindung zum B‐Teilnehmer her
andernfalls:
Amt: schon besetzt, werde melden wenn frei
Teilnehmer: Verstanden
Das Gesprächsende teilte der Anrufende der Vermittlungs‐
kraft durch erneutes Betätigen des Kurbelinduktors mit. Vermittlungskraft trennte die Verbindung und brachte die Klappe per Hand wieder in die Ausgangslage.
Quellen: http://de.wikipedia.org/wiki/Klappenschrank
http://www.devcon3.de/vermittlungstechnik.htm
23
Protokolle – Beispiel
Netze von Netzen
Rechnerkommunikation

24

Verbindungsaufbau zwischen Rechnern:
Computer 1 schickt Paket mit Verbindungswunsch
Computer 2 schickt Paket mit Verbindungsbestätigung
3. Computer 1 bestätigt Computer 2, dass er verstanden hat, dass Computer 2 bereit ist
 Handshake
1.

2.

Nicht immer können alle Teilnehmer in einem Netz vereint werden


zu viele Benutzer
starke räumliche Trennung der Benutzer
Verknüpfung mehrerer Netze erfolgt durch Verbindungsrechner (VR)
VR
oft ist Kommunikation Zusammenspiel verschiedener Protokolle

Internet
VR
25
Verbindungsrechner ‐ Beispiele

Gateway: Rechner der Verbindung zum Internet herstellt

Router:
 Auch oft als Router bezeichnet
26
Map of the Internet
Visualisierung
des Internets
→Routing

 Verbinden Teilnetze des Internets
 Bestimmt nächsten Rechner, zu dem Datenpaket gesendet wird
 Dienen der Paketvermittlung für IP‐Protokoll
 komplexe Funktionalität zum optimalen versenden von Paketen


Zustand der Routen
Kosten (Zeitdauer) für den Versand
http://upload.wikimedia.org/wikipedia/commons/b/bd/Internet_ma
p_1024_-_transparent.png
4
27
Internet







1973 Entwicklung von TCP/IP
1981 Entwicklung des CSNet
 1983 Domain Name System (University of
Wisconsin)
 1990 Abschaltung des ARPANET

Zentren militärischer Forschung
UCLA, SRI, UCSB, University of Utah in Salt Lake City

TelNET – Arbeit auf und Steuerung von entfernt liegenden Rechnern
FTP – Datentransfer zwischen entfernten Rechnern
Schub durch Entwicklung von


1972 erstes Emailprogramm (Ray Tomlinson)
 Erste Nutzung von @ für someone@someplace
zwei wichtige Dienste:


Internet
1957 Sputnikschock
→ ab 1962 Entwicklung militärisches Netz
1969 entstand erstes „richtiges“ Netz → ARPA‐Net
verbunden wurden vier Standorte


28
TCP – Transmission Control Protocol
IP – Internet Protocol
30
Zahlen und Fakten
31
Was passiert in einer Sekunde?
Quelle: http://t3n.de/news/infografik-passiert-60-sekunden-internet-314062/
32
33
Protokolle im Internet


Internet – Netz von Netzen
Basis für die Übertragung bilden Protokolle (Beschreibungen über Format und Ablauf des Datenaustausches auf verschiedenen Ebenen):
 TCP: Transmission Control Protocol
 IP: Internet Protocol


TCP sorgt für das Verpacken der Daten in Datenpakete
IP ist für den Versand zuständig
Einschub
BINÄRES ZAHLENSYSTEM
5
34
Bits



Bytes
komplexe Informationen werden durch Folgen von Bits dargestellt
 Die kleinste adressierbare Speichereinheit im Rechner ist das Byte
kleinste mögliche Informationseinheit
Wortschöpfung aus binary und digit
zwei Zustände

ja / nein
wahr / falsch
hell / dunkel
 Männlein / Weiblein
 links / rechts




35
 (engl.: byte; Kunstwort, ausgesprochen: Bait)
 Folge von acht Bits
 können gemeinsam in einem Rechner verarbeitet werden
technisch einfache Realisierung möglich
geladen / ungeladen
 Strom fließt / Strom fließt nicht
 5V Spannung / 0V Spannung
 magnetisiert / nicht magnetisiert


ultimativ: 1 oder 0
36
37
Positions‐ oder Stellenwertsysteme




heute gebräuchlichste Art der Zahlensysteme
kompakte Darstellung beliebig großer Zahlen mit wenigen Symbolen (Ziffern oder Zahlzeichen)
Anzahl der Symbole: Basis des Zahlensystems Beispiele:

allgemeine Darstellung:
 Basis des Zahlensystems: B
 Ziffer:  Zahl:  Binärsystem: {0,1}
 Wert:
 Oktalsystem: {0,1,2,3,4,5,6,7}
ai  {0, 1, 2, … , B‐1}
<a0, a1, a2, … , an>
geschrieben: anan‐1…a2a1a0
a0*B0 + a1*B1 + … + an*Bn=  ai*Bi
 Dezimalsystem: {0,1,2,3,4,5,6,7,8,9} 
 Hexadezimalsystem: {0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F} 38
39
Dezimalsystem
Dual‐ oder Binärsystem
heute meist verwendetes System  Basis: 10
 Ziffern: {0,1,2,3,4,5,6,7,8,9}




Beispiel:
 4361 Basis für Computer  Basis: 2
 Ziffern: {0,1}
= 4*103 + 3*102 + 6*101 + 1*100
= 4*1000 + 3*100 + 6*10 + 1*1
= 4000 + 300 + 60 + 1
Beispiel:
 10011
= 1*24 + 0*23 + 0*22 + 1*21 + 1*20
= 1*16 + 0*8 + 0*4 + 1*2 + 1*1
= 16 + 0 + 0 + 2 + 1
= 19
6
40
41
Natürliche Zahlen binär

Bitfolgen zur Darstellung größerer Zahlen
 1 Bit: 0 und 1
 2 Bit: 0 bis 3
 3 Bit: 0 bis 7
 4 Bit: 0 bis 15
 8 Bit: 0 bis 255
 16 Bit: 0 bis 65535
INTERNET GRUNDLAGEN
 32 Bit: 0 bis 4.294.967.296
 n Bit: 0 bis 2n‐1

Darstellung der natürlichen (positiven!) Zahlen
42
IP – Adressen







IP V6
Jeder Rechner im Internet braucht eine Adresse
Paketvermittlung erfolgt nur über Adressen
IP‐Adresse ist 32 Bit lang = 4Byte, daher maximal 232
(4.294.967.296) Rechner adressierbar
Zur besseren Lesbarkeit dargestellt als: d1.d2.d3.d4


43

Adressnotation hexadezimal statt dezimal (V4)
 8 Blöcke zu je 16Bit (65536 Werte)
 2001:0db8:85a3:08d3:1319:8a2e:0370:7344
 Als URL: Dezimalwerte der 4 verwendeten Bytes
Beispiel: 141.44.27.70
http://[2001:0db8:85a3:08d3:1319:8a2e:0370:73
44]/
Mögliche Abfrage ob ein Rechner im Netz verfügbar ist: ping <ip_adresse> oder <hostname>
Letzte IP V4 Adressbereich im April 2011 ausgegeben
neues Adressformat IPv6 eingeführt, besteht aus 6 Bytes

2128 Rechner adressierbar = 340 Sextillionen Adressen
genau: 340.282.366.920.938.463.463.374.607.431.768.211.456
 5×1028 für jeden der 6.5 Mrd. auf der Erde lebenden Menschen


Provider bekommt üblicherweise die ersten 32 Bit
http://www.networkworld.com/article/2228449/microsoft-subnet/ipv6-addressing--subnets--private-addresses.html
44
45
IP V6 – Besonderheiten

Netzmaske ex. nicht mehr explizit (wird nach Schrägstrich angegeben)

 Möglichkeit
ein Netz in
„Unter“-Netze zu teilen
 Ähnlich einer Vorwahl
 fd01:2:3:4:5:6:7:8/24

Führende Nullen können weggelassen werden
 fd30:0000:0000:1234:0001:0011:2468:003e ‐>
fd30::1234:1:11:2648:3e

Unique Local Address (ULA):  Alles was mit FD anfängt: fdxx:xxxx:xxxx:…
Subnetzmaske:

Vorteil:
 Teilnetze
können
bestimmten
Institutionsteilen
zugeordnet werden
 Vereinfacht die Suche
nach IP-Adressen
http://www.networkworld.com/article/2228449/microsoft-subnet/ipv6-addressing--subnets--private-addresses.html
7
46
Vergabe von IP‐Adressen
Spezielle IP‐Adressen

statisch oder dynamisch
statisch: IANA/ICANN

dynamisch durch Serverdienst: DHCP

47

 127.0.0.1 – localhost

 Deutschland: DENIC: www.denic.de
private (nicht öffentliche) IP‐Adressen:
 10.0.0.0–10.255.255.255
 172.16.0.0–172.31.255.255
 dynamic host configuration protocol
IANA - Internet Assigned Numbers Authority
ICANN - Internet Corporation for Assigned
Names and Numbers
RIPE - Réseaux IP Européens
ARIN
DENIC - Deutsches Network Information
Center
127.0.0.0 – lokaler Rechner (loopback)
 192.168.0.0–192.168.255.255
IANA
RIPE
APNIC LACNIC AfriNIC
DENIC
siehe auch: ping
48
49
Domainnamen
Anfangszeit des Internet: Adressierung nur über IP‐Adressen
 Alternativ: verteilte Datenbank zur Verwaltung von Namen im Internet
 Idee: Jedes Teilnetz verwaltet einen Bereich von Namen und hat selbst Bereichsnamen (domain name)

Einführung in die Informationstechnik
INTERNET, WEB 1.0 & WEB 2.0
50
Domainnamen

Domainnamen bestehen aus mindestens zwei Komponenten:
domain.ToplevelDomain, Beispiel: ovgu.de
subdomain.domain.ToplevelDomain, Beispiel: fgse.ovgu.de

ToplevelDomain: bezeichnet geographischen oder organisatorischen Bereich

Zweite Komponente: Domain

vollständig: uni‐magdeburg.de
 Beispiel: de … Deutschland, edu … education
 Beispiel: uni‐magdeburg
51
Toplevel Domains
Geographische: de, it, fr, cz, pl, eu
Organisatorische: edu, biz, mil, gov, org, info, name
 Teilweise werden freiwillige Kategorien eingefügt


 Beispiel: ac.uk, co.uk
Vergabe in Deutschland über DENIC
 Domainnamen nicht nur für WWW

siehe auch: nslookup
8
52
Dienste im Internet



DNS

Verschiedene Protokolle für verschiedene Aufgaben bzw. zur Realisierung verschiedener Dienste
Internet stellt nur Kommunikationsinfrastruktur zur Verfügung
Beispieldienste:






53



Email
World Wide Web
Dateitransfer (FTP)
Benutzung entfernter Rechner (Telnet, SSH)
Domain Name Service (DNS)
Instant Messagin (ICQ, etc.)
Domain Name System
verteilte Datenbank die den Namensraum der Adressen im Internet verwaltet
Umsetzung von Domainnamen in IP‐Adressen (forward lookup) und umgekehrt (reverse lookup)
Vorteile: dezentrale Verwaltung hierarchische Strukturierung des Namensraums in Baumform  Eindeutigkeit der Namen  Erweiterbarkeit 

Quelle. Wikipedia
54
55
E‐Mail


Message Transfer System (MTS)
E-Mail
Client
zum Versand (und Empfang) elektronischer Post
verwendete Protokolle:
Port 25
(SMTP)
SMTP
Server
POP3/
IMAP
Server
SMTP – Simple Mail Transfer Protocol
POP 3 – Post Office Protocol Version 3
 IMAP – Internet Message Access Protocol

Port 143
(IMAP)



Anwendungen: E‐Mail‐Clients
Zahlen & Fakten (2011):

3,146 Milliarden Emailkonten

Zahl der Spam‐Emails von 2010
zu 2011 um 20% gesunken
Port 110
(POP3)




E-Mail
Client
E-Mail
Client
SMTP (Simple Mail Transfer Protocol): Zuverlässiger Nachrichtentransfer
Suche nach Ziel‐SMTP‐Server über DNS (Domain Name System)
Weiterleitung
dann lokale Auslieferung an POP3/IMAP‐Server
56
POP3 vs. IMAP

POP3:
57
Ports

 Keine ständige Verbindung zum Mailserver
 erlaubt nur das Auflisten, Abholen und Löschen von E‐
Mails am E‐Mail‐Server  Keine Verwaltungsmöglichkeiten auf dem Server
 Emails werden heruntergeladen und vom Anwendungsprogramm verwaltet

IMAP:

Adresskomponenten, in Netzwerkprotokollen eingesetzt, um Datenpakete den richtigen Diensten zuzuordnen
bei TCP: Portnummer 16Bit: 65535 Werte
 0...49151 registrierte Ports (IANA), darüber frei
 Beispiel HTTP‐Port: 80
80
HTTP
143
IMAP
5190
ICQ
20
FTP
 Emails bleiben auf dem Server
 Gesamte Verwaltung erfolgt auf dem Server
 Vorteil: Mehrere Zugänge von unterschiedlichen Rechnern
9
58
weitere Dienste


Weitere Dienste
FTP zur Übertragung von Dateien

Peer‐To‐Peer‐Systeme zum Austausch von Dateien
 Protokoll: FTP – File Transfer Protocol
 BitTorrent, eDonkey, eMule, Gnutella, FastTrack
 Anwendungen: FileZilla, integriert in TotalCommander
 Gleichgestellte Rechner (Gegensatz Client‐Server)
 Rechner, die Dienste in Anspruch nehmen und diese Telnet zur Benutzung entfernter Rechner
ebenfalls zur Verfügung stellen
 Protokoll: Telnet Protocol

59

SSH zur sicheren Benutzung entfernter Rechner
Internet‐Telephonie
 Direkte Internet‐Telefonie
 Ähnlich Telnet aber mit verschlüsselter Datenübertragung
 Voice over
 Protokoll: SSH Protocol
IP
 Datenübertragung mittels TCP/IP
60
61
World Wide Web




„Weltweites Gewebe“
Weltweite durch Hyperlinks „verwobene“ Dokumente
Internet realisiert die Übertragung von Webseiten
verwendete Protokolle:
Internetdienste
 HTTP – HyperText
WEB 1.0 UND WEB 2.0
 HTTPS – HyperText

Transfer Protocol
Transfer Protocol Secure
Anwendungen: Webbrowser
62
63
Total Sites Across All Domains
Total Sites Across All Domains
August 1995 – Mai 2012
August 1995 – Februar 2013
http://news.netcraft.com/
http://news.netcraft.com/
10
66
Organisation des WWW: W3C




Organisation des WWW: W3C
Auch: WWW‐Consortium: www.w3c.org
kümmert sich um Standardisierung und Normierung
W3C keine zwischenstaatliche Organisa on → legt keine ISO‐
Normen fest
Zusammenschluss verschiedener Mitgliedsorganisationen u.a.:

67





Apple, AT&T, Intel, Microsoft, SAP, SUN

Leitung: MIT (USA), INRIA (Frankreich), Keio University (Japan)
Gründung: 1994
Gründer und Vorsitzender: Tim Berners‐Lee
deutsch‐österreichisches Büro: FH‐Potsdam
Techniken (Auswahl): HTML, XHTML, XML, RDF, OWL, CSS, SVG, RSS
Empfehlungen für barrierefreie Gestaltung von Webauftritten
68
69
HTTP
HTTP‐Kommunikationsablauf
Hypertext Transfer Protocol
1989 von Tim Berners‐Lee zusammen mit dem URL und der Sprache HTML entwickelt
 Zustandsloses Protokoll:

Aktivieren des Links http://www.example.net/infotext.html schickt an www.example.net die Anfrage, die Ressource /infotext.html zurückzusenden
 Umsetzen des Namens www.example.net
über das DNS‐Protokoll in eine IP‐Adresse  Senden einer Anforderung an den Webserver 

 nach erfolgreicher Datenübertragung wird Verbindung nicht aufrecht erhalten
 Sitzungsdaten gehen verloren
 Cookies für Speicherung der Sitzungsdaten
GET /infotext.html HTTP/1.1
Host: www.example.net

weitere Informationen in der Anfrage möglich
70
HTTP‐Kommunikationsablauf

Antwort des Servers bestehend aus
71
HTTP Statuscodes: Serverantworten, die Informationen über Fehlermeldungen etc. liefern

 Header‐Informationen

 Inhalt der Nachricht = Webseiten‐Quellcode

HTTP/1.1 200 OK
Server: Apache/1.3.29 (Unix) PHP/4.3.4
Content-Length: (Größe von infotext.html in Byte)
Content-Language: de
Content-Type: text/html
Connection: close
(Inhalt von infotext.html)




200 – OK: Die Anfrage wurde erfolgreich bearbeitet und das Ergebnis der Anfrage wird in der Antwort übertragen. 201 – Created: Die Anfrage wurde erfolgreich bearbeitet. Die angeforderte Ressource wurde vor dem Senden der Antwort erstellt. 400 – Bad Request: Die Anfrage‐Nachricht war fehlerhaft aufgebaut. 401 – Unauthorized: Die Anfrage kann nicht ohne gültige Authentifizierung durchgeführt werden. Wie die Authentifizierung durchgeführt werden soll wird im „WWW‐Authenticate“‐Header der Antwort übermittelt. 403 – Forbidden: Die Anfrage wurde mangels Berechtigung des Clients nicht durchgeführt. Diese Entscheidung wurde – anders als im Fall des Statuscodes 401 – unabhängig von Authentifizierungsinformationen getroffen. 404 – Not Found: Die angeforderte Ressource wurde nicht gefunden. Dieser Statuscode kann ebenfalls verwendet werden, um eine Anfrage ohne näheren Grund abzuweisen. 500 – Internal Server Error: „Sammel‐Statuscode“ für unerwartete Serverfehler 11
72
Cookies

73
Flash‐Cookies
Problem: Zustand einer Web‐Sitzung nicht oder nur auf dem WebServer speicherbar

→ IP‐Adressen meist dynamisch vergeben
 Beispiel: Inhalt des Warenkorbs, Surfverhalten


Lösung: Speicherung von Informationen zu einer Webseite auf dem Clientrechner

Cookies: kurze Texte (4KB)

→ Cookies
 vom Webserver an den Webbrowser gesandt
 Vom Webbrowser in Datenbank gespeichert
Benutzung wie „normale“ Text‐Cookies allerdings
 100KB groß danach Information des Anwenders
Flash: Technologie von Adobe zur Erstellung (Programmierung) multimedialer, interaktiver Inhalte
Problem: Datenschutz
 Browserübergreifend, da an Flash‐Player gebunden
 Kann zur Überwachung des Nutzers eingesetzt werden
 Nicht einfach über den Browser löschbar
 Kann normale Text‐Cookies kopieren und auch wiederherstellen (selbst wenn der Nutzer sie löscht)
74
Web 2.0
75
Begriff: Web 2.0
Cloud Computing
 Veränderung der Wahrnehmung des Webs
Wikis
Web 2.0
technische Sicht vs. soziale Sicht
 Benutzung einer Versionsnummer, ähnlich wie bei Software
 Definition des Begriffs schwierig

Webservices
Communitys
Virtuelle Welten
Folksonomy
Grundlage:  Weiterentwicklung der Web‐Technologien
Tagging
Social Cataloging
Kollaboration

Social Web
Blogs
Semantic Web
Social Bookmarking
→ Versuch einer Annäherung
Podcasting
76
77
Web 2.0 ‐ Sichtweisen
Web 2.0 ‐ Sichtweisen
O‘Reilly: Web 2.0 als Computerplattform, die Daten und Anwendungen bereitstellt
 Meckel: Idee der gemeinsamen Maximierung kollektiver Intelligenz und der Bereitstellung von Nutzenwerten für jeden Teilnehmer durch formalisierte und dynamische Informationsteilung und ‐herstellung


aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007
Breeding: neue Vision des Internets, die größere Interaktivität, Kontrolle des Nutzers über Informationen, radikale Personalisierung, die Entwicklung von Online‐Gemeinschaften und demokratisches Management von Informationen verspricht.
 Krol definiert Web 2.0 als Kombination von Geschäftsprozessen, Prinzipien und Technologien, die dem Nutzer Partizipation und Zusammenarbeit ermöglichen
aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007
12
78
Web 2.0 ‐ Sichtweisen

79
Web 2.0 - Beobachtungen
Tapscott: Bedeutung von Web 2.0: globale Infrastruktur, in der Kollaborationskosten gegen Null fallen

Beispiele die die Veränderung des Webs
charakterisieren (O‘Reilly, 2005!):
Web 1.0
DoubleClick
Ofoto
mp3.com
Britannica Online
personal websites
domain name speculation
publishing
directories (taxonomy)
content management systems

Web 2.0









Google AdSense
Flickr
Napster
Wikipedia
blogging
search engine optimization
participation
tagging ("folksonomy")
wikis
Was unterscheidet aber nun eine Web 1.0Anwendung von einer Web 2.0-Anwendung?
aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007
80
81
Web 2.0 – Kriterien
Web 2.0 – Kriterien
das Web als Plattform (anstatt des lokalen Rechners)
 Daten als wichtigste Grundlage
 „Architektur des Mitwirkens“ → Verstärkung der Vernetzung, Partizipation
 Modulare Zusammenstellung von Systemen und Seiten




verteiltes, gemeinsames Nutzen von Inhalten und technischen Diensten → einfache (neue) Geschäftsmodelle
Ende des klassischen So warelebenszyklus‘ → immerwährendes Beta‐Stadium
Die Software geht über die Fähigkeiten eines einzelnen Verwendungszwecks hinaus.
 Module von unterschiedlichen Entwicklern (Prinzip ähnlich OpenSource)
82
83
Web als Plattform
Web als Plattform ‐ WebOS
Vom Desktop zum Webtop
 zentrales Ziel von Web 2.0 – Webbrowser als Plattform
 Plattform Vorteile gegenüber Anwendung


 keine Portierung auf andere Betriebssysteme
 keine neuen Software Ausgaben

kontinuierliche Verbesserung
 Höhere Scherheit

Software als Service, Vermittler


„Betriebssystem“ für Webanwendungen
Kein Betriebssystem im eigentlichen Sinne
OS stellt Schnittstelle zwischen Hardware und Software dar
 Verantwortlich für Dateisystem

WebOS: Schnittstelle zur Programmierung von Webanwendungen
 Zwischen Anwendung und Hardware
 WebOS ist mehr eine Art Oberfläche → WebDesktop
 Bietet aber auch Funktionen zur Verwaltung von Dateien
13
84
85
Web als Plattform: WebDesktop
Web als Plattform
WebOs eigentlich im Hintergrund →
Funktionalität
 WebDesktop im Vordergrund → Sichtbare Schnittstelle zur Steuerung und Verwaltung von Webanwendungen
 Meist ähnlich Windows


Beispiele für WebDesktop, WebOS:
 eyeOS: http://eyeos.org
 GlideOS: http://www.glideos.com
 OnlineOS: http://icube.at/home.jsp
 Übersicht siehe: http://en.wikipedia.org/wiki/Web_desktop
86
87
88
89
Web als Plattform: eyeOS
Einführung in die Informationstechnik
WEB 2.0
14
90
Aspekte des Web 2.0: Cloud Computing


91
Cloud Computing
Rechnen in der Wolke
Bereitstellung von Diensten, on‐demand:

 Online Speicher zum Ablegen von Dateien
 Auch Musik, incl. Musicplayer (Cloudplayer)
 Rechner, Speicher, Netz

 Anwendungen, Betriebssysteme, Tools

Amazon Cloud Drive
Alternative: DropBox, Apple iCloud
 Ebenfalls Online‐Speicher zur Dateiablage und Lokale Anschaffung/Installation entfällt
‐austausch
 Lediglich Zugangssystem muss vorhanden sein

Google Drive
 Online Speicher, Zugriff auf Dokumente von Google Docs
92
Gemeinschaftliches Bearbeiten von Dokumenten
Interaktive Anwendungen im Web
Mindmaps, Office‐Anwendungen
 Chart‐ und Diagrammerstellung
 Bildbearbeitung, Fotogallerien
 Communities: Freunde finden, gemeinsam Einkaufen, personalisierte Angebote
 Speicherplatz für Dateien
…
 Übersicht: go2web20.net


GoogleDocs, WizIQ, Zoho, ThinkFree

http://mashable.com/2008/02/11/13‐word‐processors/
94
Gliffy
Mindmeister
15
96
Aspekte des Web 2.0: Abonnementdienste

Aspekte des Web 2.0: WebServices
Web 1.0: alles auf einem Rechner
 Web 2.0: Software‐Bausteine, die auf verschiedenen Rechnern laufen
→ komponentenbasierte Webservices (SOA)
 Verbindung zu einer Anwendung über das Internet
 Service kann Daten bereitstellen, auswerten
 Anwendung kann im Netz laufen oder lokal
 Beispiel: Amazon Webservices, Projekt Deutscher Wortschatz (http://wortschatz.uni‐leipzig.de/Webservices/), Interaktion zwischen Fluggesellschaften und Reisebüros Bereitstellung von Inhalten, die abonniert werden können

 Feeds: RSS, Atom

97
RSS: Really Simple Syndicate
 Zusätzliches Programm erforderlich: Feedreader
 Abonnement durch Eingabe der Feedadresse
 Feedreader lädt Feed automatisch (zeitgesteuert)
(http://de.wikipedia.org/wiki/Webservice#Beispiele)
98
Soziale Aspekte des Web 2.0


99
Soziale Aspekte des Web 2.0
Web 1.0: Autoren sind für Inhalte verantwortlich
Web 2.0: Benutzer/innen wirken an Inhalten mit

 Öffentliche Sammlung von interessanten Informationen
 Auffinden von Kontakten mit gleicher Interessensbasis
→ Architektur des Mitwirkens


Kollaborative Organisation von Informationen:

Nutzung kollektiver Intelligenz, kollektiven Wissens
Organisation von persönlichen Informationen
Soziales „Suchen & Finden“ von Informationen
 Beispiel:

 Reflexion und Sammlung von Erfahrungen

 (Chronologische) Dokumentation von Ideen und Verknüpfung von Bibliographien mit bestimmten Nutzern
Auffinden von Publikationen durch dessen Bibliographie
Gedanken
Reinmann & Sporer (2007)
Reinmann & Sporer (2007)
100
101
Soziale Aspekte I ‐ Folksonomy
Soziale Aspekte I ‐ Folksonomy
Gemeinschaftliches Indexieren → Tagging
 Zuordnen von Descriptoren, Schlagwörtern (Tags) zu Objekten


 Synonyme
 Unterschiedliche Sprachen
 Getrennt‐, Zusammenschreibung  WebDesktop, Web‐Desktop, Web Desktop, Web_Desktop
 Kontextbedeutungen: Apple, Virgin
 Singular/Plural
 Lesezeichen
 Photos
 wissenschaftliche Paper

Meist keine Festlegungen über Vokabular
 Jeder kann frei Taggen
 Herausbildung gemeinschftlicher Wortschatz
Probleme:
→ Bildung unterschiedlicher Kategorien

Vorteile:
 Arbeitsverteilung
 Benutzer fügen Schlagworte hinzu, nicht Autoren → bessere Benutzbarkeit (Suchergebnisse)?
16
102
Beispiel: Flickr
Soziale Aspekte I - Folksonomy


Phototagging: „Flickr“,
Social Bookmarking:
 „Delicious“,
 „Bibsonomy“
 Digg

Social Cataloging:
 Library
Thing
104
Soziale Aspekte II ‐ Blogging

Soziale Aspekte III: Microblogging
Blog – Wortkreuzung aus Web Log
Blog bei dem nur Kurznachrichten versandt werden
 Postings können abboniert werden
 Öffentlich oder privat zugänglich
 Bekanntester Dienst: Twitter

 Web‐Tagebuch

Umfrage ergab:
 73% der Blogger schreiben aus Spass
 27% nicht persönlich, zur Wissensvermittlung


106
Beispiele für textuelle Blogs: …
Blogs nicht nur textuell
 Podcasts
 VideoBlogs, Vlogs
107
108
Soziale Aspekte IV: Wikis
Soziale Aspekte V: Social Networking
Name stammt von Wikiwiki (hawaianisch für schnell)
 Content‐Management‐System (CMS)
 Erlaubt die gemeinsame Erstellung von Webseiten
 Prominentes Beispiel: Wikipedia
 Desktop Wikis: WikidPad, Tomboy, TiddlyWiki


Webseiten mit denen Menschen in Kontakt treten/bleiben können
 Management von sozialen Netzwerken
 Zweck:
 Kommunikation
 Bildung neuer Geschaftsverbindungen
 Entwicklung neuer Projekte
 Terminmanagement, ‐abstimmung
17
110
Social Networking 111
Personalisiertes Web
Beispiele

Interessen: Fotocommunity, StudiVZ, Flickr
 Dating: Urbanite
 Beziehungsorientiert: OpenNetworX, LinkedIn, Friendster, StayFriends, Facebook
 Geschäftsorientiert: Ecademy, Xing




Web 1.0: Webseite statisch, alle konsumieren die gleichen Inhalte
Web 2.0: Benutzer/innen können Inhalte ihren Interessen entsprechend anpassen
Personalisierung, Definition: Anpassen an persönliche Bedürfnisse
Bei digitalen Dokumenten:



Anpassung des Inhalts
Anpassung der Darstellung
Grundsätzliche Unterscheidung:


Für den Benutzer/Benutzerin
Durch den Benutzer/Benutzerin
112
Personalisiertes Web

113
Netvibes
Personalisierung durch den Benutzer/in:
 Inhalte von Webseiten

Beispiel: NetVibes, Pageflakes
 Webradio:


Last.fm, MusiMap, musiclens, pandora
Personalisierung für den Benutzer/in:
 Google AdSense
114
Musiclens
115
Daten‐getriebene Anwendungen



Web 1.0: Wer Inhalte konsumiert war unbekannt
Web 2.0: Nutzung von Daten (über Benutzer/innen → Profile)
jede erfolgreiche Internet Anwendung basiert auf einer speziellen Datenbasis
eBay: Produkte und Verkäufer
Amazon: Produkte und Rezensionen
 Google: Webseiten
 Teleatlas, Geocontent: Geo‐Daten





Kontrolle über Daten=Kontrolle über Markt
Management einer Datenbasis ist die Kernkompetenz von Web 2.0 Firmen
Software wird zu „Infoware“
18
116
Sicherheit im Web 2.0



News im Web 2.0
Allgemeine vs. Persönliche Daten
Allgemein:

Web 1.0: Traditionelle Medien stellen ihre Informationen im Web zur Verfügung
 Web 2.0: alle sind Journalisten?

Rezensionen, Statistiken, Landkarten
Persönliche Datenspuren im Netz:
Einkaufsverhalten → Vorlieben
Browseverhalten → Interessen
 Persönliche Daten: Geburtstag, Adresse, Bankverbindung, Telefonnummer, Kreditkartendaten
→ komple es Nutzerprofil, Identitätssubsystem für Web 2.0?





117
 Stirbt der traditionelle Journalismus?
 Werden Nachrichten nur noch elektronisch gefiltert und aufbereitet?
Was passiert mit diesen Informationen?
Wie sicher sind sie?
Daten resultieren nicht nur aus Web‐Verhalten, auch von Payback u.ä. Datensammlern
 Journalist als Moderator zwischen bloggenden Bürgern?
→ Graswurzel oder Bürgerjournalismus
118
119
Aspekte des Web 2.0: Bürgerjournalismus







The Giraffe Project (Christopher Grotke, Lisa LePage): Schaffung einer „News‐Community“
Wikimedia
IndyMedia
The Huffington Post
Verbindung zwischen Radio und Blog: Blogspiel
(Deutschlandfunk)
Google News
Leser (Consumer) und Journalist (Producer) vermischen sich zu:


Internet Grundlagen
SEMANTIC WEB
Produser
Prosumer
120
Semantic Web

Codierung von Bedeutung im Web

I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web –
the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day‐to‐day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize.

– Tim Berners‐Lee, 1999
 In rechnerverständlicher Form
Ermöglicht automatische Auswertung von Bedeutungen
 Vorteile: 
 Daten können in Beziehung zueinander gesetzt werden
 Neue Erkenntnisse können gewonnen werden
19
Das Web – Probleme
oder warum Semantic Web?

„The Semantic Web is not a separate Web, but an extension of the current one, in which information is given well‐defined meaning, better enabling computers and people to work in cooperation.”

Inhalte des Webs auf Menschen zugeschnitten

Problem: Finden von (gesuchten) Informationen
Suchmaschinen können Fundstellen suchen
 Layout, Struktur → einfache Nutzung


Stichwortbasiert, ohne Kontext

Wahl des richtigen Stichwortes ist entscheidend
Ergebnisse sind immer einzelne Webseiten

Tim Berners‐Lee, James Hendler, Ora Lassila



→From a Web of Documents to a Web of Data
Web – Probleme
oder warum Semantic Web?

Web ist heterogen:  unterschiedliche Informationsdarstellung: Bilder, Text, Audio
 unterschiedliche Codierung: ASCII, Unicode, ISO…
 unterschiedliche Sprachen


Bsp.: Suche nach Apple bringt Frucht und Rechner
müssen von Menschen interpretiert und kombiniert werden
oft ist gesuchte Info auf mehrere Webseiten verteilt
→ Informa onsintegra on
Relevanz kann nur schwer durch Maschine geprüft werden
Beispiele


Gegenüberstellung von Informationen zum Wahlprogramm einzelner Parteien
Verknüpfung von verteilt im Netz liegenden Informationen:
 Vortrag, Termin in Hawthorne/NY
 Reisebuchung von Berlin nach Hawthorne:
→ Informa onen zu einem Thema sind nur schwer aufzufinden
 Berlin liegt in Deutschland/Europa
 Hawthorne liegt in den USA/Amerika
 → Flugbuchung notwendig, Anschlusszug notwendig oder Mietwagen
Beispiel: Abendliche Planung


Essen gehen, Kino gehen, Cocktailbar
Problem:  Finden eines guten Restaurants (je nach persönlicher Mögliche Anwendungsbereiche


 kontextbezogene Informationsvernetzung
Vorliebe, Preisklasse, Einschätzung durch andere)
 Ermittlung des Kinoprogramms in unterschiedlichen Kinos mit Genrevorgabe, Reservierung von Karten
 Cocktailbar sollte in der Nähe des Kinos liegen

Mögliche Anfrage: Finde ein Restaurant mit italienischer Küche in mittlerer Preislage, und zeige mir die Kritiken zu den neuen Filmen der letzten zwei Wochen
Beispiel aus: http://www2.informatik.hu-berlin.de/mac/lehre/WS04/Ausarbeitungen/SemanticWeb.pdf
allgemein: wissensintensive Prozesse
Beispiel:
 intelligentes Information Retrieval
 personalisierte Wissensportale
 Helpdesk‐Systeme


→ Anwendungsso ware muss „logisch denken“
→ neues Wissen aus vorhandenem erschließen
http://rewerse.net/press_releases_approved/www.uni-protokolle.de/id/105246/index.html
20
Semantic Web
Semantic Web Prinzipien (Auswahl)
Beschreibung von Daten und deren Semantik in rechnerverständlicher/‐verarbeitbarer Form
 Daten brauchen Informationen darüber, wie sie zu strukturieren und zu interpretieren sind
 → Wissensrepräsenta on im Web
1. Alles kann durch eine URI identifiziert werden

http://www.magdeburg.de
mailto: [email protected]
http://www.w3.org/2001/12/semweb-fin/w3csw
Semantic Web Prinzipien (Auswahl)
2. Ressourcen und Links können typisiert sein
href
Ressource
Ressource
href
href
erzeugt
Buch
Report
gelesen von
Ressource
Ressource
href
href
Autor
erzeugt
erzeugt
Buch
Report
geschrieben von
Ressource
gelesen von
href
kommuniziert mit
Ressource
Lektor
•
http://www.w3.org/2001/12/semweb-fin/w3csw
href
href
geschrieben von
Ressource
Software
Ressource
erzeugt
href
Ressource
3. Unvollständige Informationen sind unproblematisch
Software
Ressource
href
Semantic Web Prinzipien (Auswahl)
Autor
kommuniziert mit
404 not found
Lektor
404 not found
im Semantic Web können fehlende Informationen rekonstruiert werden
http://www.w3.org/2001/12/semweb-fin/w3csw
Semantic Web Prinzipien (Auswahl)
Semantic Web Prinzipien (Auswahl)
4. Eine absolute Wahrheit ist nicht notwendig
 neues Wissen kann aus vorhandenen Informationen geschlussfolgert werden
 Marcel arbeitet in der Otto‐von‐Guericke‐
Universität
 Stefan ist Kollege von Marcel
→ Stefan arbeitet ebenfalls an der OvG‐Uni
5. Evolution wird unterstützt
 Informationen können auf einfache Weise in einen neuen Kontext gesetzt werden
 Beispiel: Stefan bekommt einen Ruf an eine andere Universität → neue Verknüpfung http://www.w3.org/2001/12/semweb-fin/w3csw
http://www.w3.org/2001/12/semweb-fin/w3csw
21
134
Web 3.0?





Zusammenfassung
Weiterführende semantische Vernetzung?
Internet 2.0: jedes Gerät hat eine eigene IP‐Adresse


WWW: Dienst im Internet
Weltweites Gewebe durch Verlinkung
 Protokoll: Hypertext Transfer Protokoll

IPv6: 128 Bit lange Adresse = 2128 Adressen
reicht, für 6,65 ∙ 1023 Adressen/m2 Erdoberfläche
Jeder kann jederzeit online sein

Vielleicht aber auch nicht nur jedes Gerät sondern jeder Blog, jeder Artikel, Autor,…
Verarbeiten von Informationen erfolgt dezentral, getrennt vom Medium, unabhängig vom Autor





135

Web 2.0:
 Webseite als Plattform für Anwendungen
 Daten wichtiger als Aussehen
Man liest nicht mehr ein Blog sondern von einem Autor in mehreren Blogs
Orte wären irrelevant. Bild wird durch IP bestimmt, nicht Position
Neue Zugangswege wären notwendig
Artikel werden nicht mehr in einem Blog veröffentlicht sondern „zur Verfügung gestellt“
Informationen werden anhand ihrer IP identifiziert und entsprechend zusammengestellt
 Nutzung verteilter Daten und Anwendungsteile
 Ausnutzen der Kompetenz vieler Web‐Nutzer
137
138
Vom URL‐Raten zur Suchmaschine


Web 1.0: URL‐Raten, Web 2.0: Suchmaschinen
Letztere analysieren Webseiten
 Robots durchforsten das Web, in der Regel durch das Folgen von Links
 Analyse des Anfangs oder des gesamten Textes (Altavista, Fireball)
Einführung in die Informationstechnik

VOM URL-RATEN ZUR
SUCHMASCHINE

Auswertung von Metatags
Auswertung von Verlinkung: PageRank (Google)
139
Dienste und deren Nutzung
Suchmaschinen, der manuell erstellte Katalog
Suchmaschinen

140
Arten von Suchmaschinen:


 Manuell erstellte Kataloge

 Automatisch erstellte Indizes
Datenbank von Suchmaschinen: http://www.suchlexikon.de/
Meist hierarchische Präsentation des Katalogs

Eignung: Suche nach einem Thema, Sachgebiet, Stichwort
Vorteil: Redaktion kann Inhalt eines Dokuments berücksichtigen
Nachteil: Zusammenhänge können verloren gehen:




http://www.suchfibel.de
Von einer zusammen arbeitenden Gruppe → Redak on
Von vielen Beteiligten unabhängig voneinander → Folksonomy

 Suchmaschinen für spezielle Zwecke

Generell: von Menschen gemacht
Beispiel: Yahoo, Web.de
Beispiel: Name einer Person + Sachverhalt
http://www.suchfibel.de
22
141
Suchmaschinen, der automatisch erstellte Katalog




Suchmaschinen, wichtigste Befehle
Software (Robot, Crawler, Spider) browsen vollautomatisch durchs Netz → Von Link zu Link
Indexierungssoftware analysiert und strukturiert Daten
Suchmaschinen arbeiten auf Begriffen, ohne die Relevanz eines Wortes für den Inhalt des Dokumentes zu berücksichtigen
→ für die Suchanfrage wich g zu wissen
Eingrenzen des Suchraumes: Welche Begriffe könnten im Zusammenhang mit dem Suchwort stehen

142

Plus (+): Verknüpfung zweier Wörter, beide müssen im Ergebnisdokument vorkommen

Minus (‐): schließt ein Wort aus, das nachfolgende darf nicht im Ergebnisdokument vorkommen

Anführungsstriche: Verbinden von Worten zu einer Phrase. Wird wie ein Wort behandelt

Trotzdem: nicht jede Suchmaschine erfasst das gesamte Web



explizites Ausschließen von Begriffen
+Fahrrad
‐preis
„Der oide Depp“
http://www.suchfibel.de
http://www.suchfibel.de
143
Barrieren für Suchmaschinen

144
Suchmaschinen, Google
Die Internetseite … 
 … ist nicht verlinkt

Automa sches Browsen durch Links → Robot
Relevanzsortierung durch PageRank
 … ist zu versteckt
 Larry Page und Sergey Brin
 … ist zu aktuell
 Grundprinzip: Je mehr Links auf eine Seite verweisen, desto höher ist das „Gewicht“ der Seite
 … darf nicht indexiert werden
 … hat zuviel Text
 Je höher das „Gewicht“ der verweisenden Seiten, desto höher der Effekt → wich ger die Seite
 … hat keinen Text
 Ziel: Liste der zu einem Suchbegriff wichtigsten Seiten
 ... ist nicht frei zugänglich
 … hat ein unbekanntes Dateiformat
→ Unsichtbares Netz
http://www.suchfibel.de
http://www.ub.uni-bielefeld.de/biblio/search/help/invisibleweb.htm
145
Suchmaschinen, Google → Benutzung


Plus (+), Minus (‐), Anführungsstriche
Oder (|): Verknüpfung zweier Wörter, beide können im Ergebnisdokument vorkommen





Strand | Beach
146
Suchmaschinen, Google → Erweiterte Syntax




Berechnungen: ((3*8)/6)^2
Einheiten umrechnen: foot in cm
Zug, Kino und Wetterauskunft
Erweiterte Syntax






http://de.wikipedia.org/wiki/Google
cache: Sucht in von Google gespeicherten Seiten
define: Suche nach Definitionen
filetype: Suche nach bestimmten Dateiendungen
inanchor: Suche nur in Links
intitle: Suche nur im Titel einer Seite
inurl: Suche nur in der Adresse
intext: Suche nach Begriffen, die nur im Text vorkommen
link: Ausgabe aller Seiten, die auf eine bestimmte verlinken
site: Suche auf eine bestimmte Domain eingrenzen.
related: Sucht nach ähnlichen Seiten
http://de.wikipedia.org/wiki/Google
23
147
148
149
150
Spezielle Suchmaschinen, Wolfram Alpha




Weniger Suchmaschine, eher Antwortmaschine
Entwickelt vom Mathematica‐Erfinder Stephen Wolfram
Daten wurden von 100 Mitarbeitern manuell aufbereitet
Fragen können in Suchbegriffen oder direkt gestellt werden
→ Seman sche Suchmaschine


Sehr gut bei Fakten zu Mathematik, Technik, Naturwissenschaften, Linguistik, Wirtschaft
Beispiel: How old is Barack Obama?
Microsoft Bing



Suchmaschine von Microsoft
Seit 3. Juni 2009 online
Entscheidungsmaschine
 Hilfe bei Kaufentscheidungen, Reservierungen, Reisevorbereitungen, etc.

Gute Suche nach Bildern und Videos
 Incl. Interaktiver Vorschaufunktion
151
Spezielle Suchmaschinen, Bildindex





Spezielle Suchmaschine für Bilder
Bildindex der Kunst und Architektur
2 Millionen Bilder aus 13 europäischen Ländern
Nach Künstler, Ort, Porträt und Themen katalogisiert
Suche in unterschiedlichen Bereichen möglich
 Jahr, Genre, 152
Spezielle Suchmaschinen, 
Metasuchmaschinen
 Weiterleiten einer Suchanfrage an viele Suchmaschinen
 Oft langsamer
 Erste Metasuchmaschine: MetaCrawler.de
 Deutsche Metasuchmaschine: MetaGer.de

Weitere Spezialsuchmaschinen:
 Medienarchive, Bildarchive, Menschsuchmaschinen
 Nachrichtendienste, Bibliotheken und Buchkataloge
 Beispiel: http://www.bundesarchiv.de/index.html.de
http://www.bildindex.de
24
153
Zusammenfassung



Suchmaschinen: manuell erstellt oder automatisch
Automatisch: Robots browsen durchs Netz → Indexierung von Webseiten nach Suchbegriffen und Schlüsselwörtern
Suchanfragen haben spezielle Syntax
 +, ‐, „“, |, 

Größter Teil des Netzes ist nicht sichtbar
Zugang zu Informationen teilweise über spezielle Suchmaschinen
25