WEB 2.0 - Die Otto-von-Guericke
Transcription
WEB 2.0 - Die Otto-von-Guericke
Einführung in die Informationstechnik IV – Internet, Grundlagen und Dienste 2 Überblick Grundlagen Datenkommunikation Datenübertragung analog, digital ISDN, DSL Netzarten und ‐topologien Protokolle Internet Dienste im Internet IP‐Adressen, DNS 3 Allgemeines seit Windows 3.11 – Netzwerkunterstützung Linux von Beginn an netzwerkfähig heute jeder Rechner vernetzt außerdem Tablets mit Bluetooth & WLAN Handys mit Bluetooth & WLAN Drucker, HiFi Anlage, intelligentes Wohnen 4 Prinzip der Datenkommunikation DEE DÜE DÜE DEE Übertragungskanal •analog/digital •drahtgebunden/drahtlos, optisch Standardschnittstelle •seriell •parallel •USB •Rechnerbussystem •drahtlos (Bluetooth) DEE DÜE Datenendeinrichtung (Rechner, Tablet, Handy) Datenübertragungseinrichtung (Modem, Netzwerkkarte, WLAN‐Einheit, Surfstick, etc.) 6 Übertragungskanäle analog, drahtgebunden klassisches Telefonnetz (POTS), Wählleitung veraltet: analoge Standleitungen digital, drahtgebunden ISDN, Wählleitung DSL digitale Standleitungen 7 Datenübertragung Telefon – analog langsam veraltet bisher (ohne ISDN) analoge Übertragung zur Datenübertragung: „aufprägen“ von Daten auf analoge Signale – modulieren Empfänger demoduliert Signal Modem = Modulator/Demodulator Modem öffentliches Telefonnetz Modem 8 Datenübertragung Telefon – digital ISDN – Integrated Services Digital Network ermöglicht schnelleren Verbindungsaufbau zwei Nutzkanäle von je 64KBit/s zwei Gespräche gleichzeitig möglich durchgehende digitale Verbindung keine „Vertonung“ der Daten wie bei Modem Abschaltung geplant: 2018 9 ISDN NTBA Terminator S0 Bus Computer mit ISDN‐Karte (ISDN Modem) NTBA=Network Termination Basic Access öffentliches Telefonnetz Telefonnetz 10 Datenübertragung Telefon – digital DSL – Digital Subscriber Line hohe Datenübertragung über Telefonleitung entwickelt Ende der 1980er Jahre ADSL: Asynchrones Verfahren Downstream: „klassisch“ 768KBit/s Upstream: 128KBit/s Heutzutage bis 24MBit/s Downstream, 1MBit/s Upstream VDSL: Very High Speed Digital Subscriber Line bis 50MBit/s (200MBit/s technisch möglich) Downstream parallele Übertragung von: Internet, Telefon, TV DSL mit ISDN Computer mit ISDN‐ und Netzwerkkarte Ethernet öffentliches Telefonnetz Telefonnetz NTBA S0 Bus DSL‐ Modem/ Router Splitter (NTBBA) Heute meist „Blackbox“ OVSt NTBBA= Network Termination Broad Band Access 13 Netzarten mit Kabel LAN: Local Area Network räumlich begrenzter Bereich (wenige km) 10...1000MBit/s MAN: Metropolitan Area Network Stadt oder größere Firma, 100MBit/s ... 10GBit/s WAN: Wide Area Network innerhalb eines Landes, Wissenschaftsnetz 2.5 ... 100GBit/s GAN: Global Area Network weltweite Vernetzung, logische Zusammenfassung von LANs, MANs und WANs 14 Netzarten – Drahtlos WLAN: Wireless Local Area Network drahtloses LAN, 2.4 ... 450MBit/s Bluetooth: Funkverbindung von Geräten zum Datenaustausch – PAN: Personal Area Network Name erinnert an Harald Blåtand, genannt Blauzahn, König von Dänemark, lebte 940‐985 1MBit/s weitere Möglichkeiten: Infrarot Mobilfunk: 15 Datenübertragung Mobilfunk GPRS ‐ General Packet Radio Service Long Term Evolution (LTE): Mobilfunkstandard der vierten Generation (4G) UMTS: Mobilfunkstandard der dritten Generation (3G) 100MBit/s High Speed Packet Access (HSPA): HSDPA, HSUPA: 3,6 bzw. 7,2 Mbit/s HSPA+: 28‐84 Mbit/s Global System for Mobile Communications (GSM): Mobilfunkstandard der zweiten Generation (2G), 55‐ 220KBit/s 16 Netztopologien – LAN Bus Stern Backbone Ring 18 Netzwerktechnologie Ethernet Anfang der 70er Jahre entwickelt Urheber: Robert Metcalfe Ether steht für Äther traditionell nur innerhalb eines Gebäudes heute auch weiter entfernte Geräte paketorientierte Datenübertragung BNC RJ 48 19 Skizze zum Ethernet (Robert Metcalfe 1976) 20 Datenpaket Im Netz versandte Dateneinheit Enthält neben den zu übermittelnden Informationen Adressdaten Verwaltungsinformationen Unterschiedliche Datenpakete einer Übertragung wählen unterschiedliche Wege 21 Protokolle für Kommunikation notwendig: physikalische Verbindung Vereinbarung über Art und Abfolge des Datenaustausches Kommunikationsprotokoll beschreibt Aufbau eines Datenpaketes dessen Absender und Empfänger den Typ des Pakets (z. B. Verbindungsaufbau, Verbindungsabbau oder reine Nutzdaten) die Paketlänge eine Prüfsumme regelt unter anderem: elektrischen Signale während Kommunikation Reihenfolge in der Partner kommunizieren Sprache die sie sprechen Beispiele: TCP, IP, HTTP, FTP, SMTP, IMAP, POP3, 22 Protokoll – Beispiel Ablauf eines handvermittelten Ferngesprächs (ab 1877) 1. 2. 3. 3. 4. Teilnehmer teilt Amt Verbindungswunsch durch Betätigen des Kurbelinduktors mit Amt: Hier Amt, was beliebt? Teilnehmer: wünsche mit Nummer 44 zu sprechen Wenn der gewünschte Teilnehmer frei war, hieß es: Amt: bitte rufen und die Vermittlungskraft stellte mittels eines Schnurpaares die Verbindung zum B‐Teilnehmer her andernfalls: Amt: schon besetzt, werde melden wenn frei Teilnehmer: Verstanden Das Gesprächsende teilte der Anrufende der Vermittlungs‐ kraft durch erneutes Betätigen des Kurbelinduktors mit. Vermittlungskraft trennte die Verbindung und brachte die Klappe per Hand wieder in die Ausgangslage. Quellen: http://de.wikipedia.org/wiki/Klappenschrank http://www.devcon3.de/vermittlungstechnik.htm 23 Protokolle – Beispiel Rechnerkommunikation Verbindungsaufbau zwischen Rechnern: Computer 1 schickt Paket mit Verbindungswunsch 2. Computer 2 schickt Paket mit Verbindungsbestätigung 3. Computer 1 bestätigt Computer 2, dass er verstanden hat, dass Computer 2 bereit ist Handshake 1. oft ist Kommunikation Zusammenspiel verschiedener Protokolle 24 Netze von Netzen Nicht immer können alle Teilnehmer in einem Netz vereint werden zu viele Benutzer starke räumliche Trennung der Benutzer Verknüpfung mehrerer Netze erfolgt durch Verbindungsrechner (VR) VR Internet VR 25 Verbindungsrechner ‐ Beispiele Gateway: Rechner der Verbindung zum Internet herstellt Auch oft als Router bezeichnet Router: Verbinden Teilnetze des Internets Bestimmt nächsten Rechner, zu dem Datenpaket gesendet wird Dienen der Paketvermittlung für IP‐Protokoll komplexe Funktionalität zum optimalen versenden von Paketen Zustand der Routen Kosten (Zeitdauer) für den Versand 26 Map of the Internet Visualisierung des Internets →Routing http://upload.wikimedia.org/wikipedia/commons/b/bd/Internet_ma p_1024_-_transparent.png 27 Internet 1957 Sputnikschock → ab 1962 Entwicklung militärisches Netz 1969 entstand erstes „richtiges“ Netz → ARPA‐Net verbunden wurden vier Standorte Zentren militärischer Forschung UCLA, SRI, UCSB, University of Utah in Salt Lake City zwei wichtige Dienste: TelNET – Arbeit auf und Steuerung von entfernt liegenden Rechnern FTP – Datentransfer zwischen entfernten Rechnern Schub durch Entwicklung von TCP – Transmission Control Protocol IP – Internet Protocol 28 Internet 1972 erstes Emailprogramm (Ray Tomlinson) Erste Nutzung von @ für someone@someplace 1973 Entwicklung von TCP/IP 1981 Entwicklung des CSNet 1983 Domain Name System (University of Wisconsin) 1990 Abschaltung des ARPANET 30 Zahlen und Fakten 31 Was passiert in einer Sekunde? Quelle: http://t3n.de/news/infografik-passiert-60-sekunden-internet-314062/ 32 Protokolle im Internet Internet – Netz von Netzen Basis für die Übertragung bilden Protokolle (Beschreibungen über Format und Ablauf des Datenaustausches auf verschiedenen Ebenen): TCP: Transmission Control Protocol IP: Internet Protocol TCP sorgt für das Verpacken der Daten in Datenpakete IP ist für den Versand zuständig 33 Einschub BINÄRES ZAHLENSYSTEM 34 Bits kleinste mögliche Informationseinheit Wortschöpfung aus binary und digit zwei Zustände technisch einfache Realisierung möglich ja / nein wahr / falsch hell / dunkel Männlein / Weiblein links / rechts geladen / ungeladen Strom fließt / Strom fließt nicht 5V Spannung / 0V Spannung magnetisiert / nicht magnetisiert ultimativ: 1 oder 0 35 Bytes komplexe Informationen werden durch Folgen von Bits dargestellt Die kleinste adressierbare Speichereinheit im Rechner ist das Byte (engl.: byte; Kunstwort, ausgesprochen: Bait) Folge von acht Bits können gemeinsam in einem Rechner verarbeitet werden 36 Positions‐ oder Stellenwertsysteme heute gebräuchlichste Art der Zahlensysteme kompakte Darstellung beliebig großer Zahlen mit wenigen Symbolen (Ziffern oder Zahlzeichen) Anzahl der Symbole: Basis des Zahlensystems Beispiele: Binärsystem: {0,1} Oktalsystem: {0,1,2,3,4,5,6,7} Dezimalsystem: {0,1,2,3,4,5,6,7,8,9} Hexadezimalsystem: {0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F} 37 allgemeine Darstellung: Basis des Zahlensystems: B ai {0, 1, 2, … , B‐1} Zahl: <a0, a1, a2, … , an> geschrieben: anan‐1…a2a1a0 Ziffer: Wert: a0*B0 + a1*B1 + … + an*Bn= ai*Bi 38 Dezimalsystem heute meist verwendetes System Basis: 10 Ziffern: {0,1,2,3,4,5,6,7,8,9} Beispiel: 4361 = 4*103 + 3*102 + 6*101 + 1*100 = 4*1000 + 3*100 + 6*10 + 1*1 = 4000 + 300 + 60 + 1 39 Dual‐ oder Binärsystem Basis für Computer Basis: 2 Ziffern: {0,1} Beispiel: 10011 = 1*24 + 0*23 + 0*22 + 1*21 + 1*20 = 1*16 + 0*8 + 0*4 + 1*2 + 1*1 = 16 + 0 + 0 + 2 + 1 = 19 40 Natürliche Zahlen binär Bitfolgen zur Darstellung größerer Zahlen 1 Bit: 0 und 1 2 Bit: 0 bis 3 3 Bit: 0 bis 7 4 Bit: 0 bis 15 8 Bit: 0 bis 255 16 Bit: 0 bis 65535 32 Bit: 0 bis 4.294.967.296 n Bit: 0 bis 2n‐1 Darstellung der natürlichen (positiven!) Zahlen 41 INTERNET GRUNDLAGEN 42 IP – Adressen Jeder Rechner im Internet braucht eine Adresse Paketvermittlung erfolgt nur über Adressen IP‐Adresse ist 32 Bit lang = 4Byte, daher maximal 232 (4.294.967.296) Rechner adressierbar Zur besseren Lesbarkeit dargestellt als: d1.d2.d3.d4 Dezimalwerte der 4 verwendeten Bytes Beispiel: 141.44.27.70 Mögliche Abfrage ob ein Rechner im Netz verfügbar ist: ping <ip_adresse> oder <hostname> Letzte IP V4 Adressbereich im April 2011 ausgegeben neues Adressformat IPv6 eingeführt, besteht aus 6 Bytes 2128 Rechner adressierbar = 340 Sextillionen Adressen genau: 340.282.366.920.938.463.463.374.607.431.768.211.456 5×1028 für jeden der 6.5 Mrd. auf der Erde lebenden Menschen 43 IP V6 Adressnotation hexadezimal statt dezimal (V4) 8 Blöcke zu je 16Bit (65536 Werte) 2001:0db8:85a3:08d3:1319:8a2e:0370:7344 Als URL: http://[2001:0db8:85a3:08d3:1319:8a2e:0370:73 44]/ Provider bekommt üblicherweise die ersten 32 Bit http://www.networkworld.com/article/2228449/microsoft-subnet/ipv6-addressing--subnets--private-addresses.html 44 IP V6 – Besonderheiten Netzmaske ex. nicht mehr explizit (wird nach Schrägstrich angegeben) fd01:2:3:4:5:6:7:8/24 Führende Nullen können weggelassen werden fd30:0000:0000:1234:0001:0011:2468:003e ‐> fd30::1234:1:11:2648:3e Unique Local Address (ULA): Alles was mit FD anfängt: fdxx:xxxx:xxxx:… http://www.networkworld.com/article/2228449/microsoft-subnet/ipv6-addressing--subnets--private-addresses.html 45 Subnetzmaske: Möglichkeit ein Netz in „Unter“-Netze zu teilen Ähnlich einer Vorwahl Vorteil: Teilnetze können bestimmten Institutionsteilen zugeordnet werden Vereinfacht die Suche nach IP-Adressen 46 Vergabe von IP‐Adressen statisch oder dynamisch statisch: IANA/ICANN Deutschland: DENIC: www.denic.de dynamisch durch Serverdienst: DHCP dynamic host configuration protocol IANA - Internet Assigned Numbers Authority ICANN - Internet Corporation for Assigned Names and Numbers RIPE - Réseaux IP Européens ARIN DENIC - Deutsches Network Information Center IANA RIPE DENIC APNIC LACNIC AfriNIC 47 Spezielle IP‐Adressen 127.0.0.0 – lokaler Rechner (loopback) 127.0.0.1 – localhost private (nicht öffentliche) IP‐Adressen: 10.0.0.0–10.255.255.255 172.16.0.0–172.31.255.255 192.168.0.0–192.168.255.255 siehe auch: ping 48 Einführung in die Informationstechnik INTERNET, WEB 1.0 & WEB 2.0 49 Domainnamen Anfangszeit des Internet: Adressierung nur über IP‐Adressen Alternativ: verteilte Datenbank zur Verwaltung von Namen im Internet Idee: Jedes Teilnetz verwaltet einen Bereich von Namen und hat selbst Bereichsnamen (domain name) 50 Domainnamen Domainnamen bestehen aus mindestens zwei Komponenten: domain.ToplevelDomain, Beispiel: ovgu.de subdomain.domain.ToplevelDomain, Beispiel: fgse.ovgu.de ToplevelDomain: bezeichnet geographischen oder organisatorischen Bereich Beispiel: de … Deutschland, edu … education Zweite Komponente: Domain Beispiel: uni‐magdeburg vollständig: uni‐magdeburg.de 51 Toplevel Domains Geographische: de, it, fr, cz, pl, eu Organisatorische: edu, biz, mil, gov, org, info, name Teilweise werden freiwillige Kategorien eingefügt Beispiel: ac.uk, co.uk Vergabe in Deutschland über DENIC Domainnamen nicht nur für WWW siehe auch: nslookup 52 Dienste im Internet Verschiedene Protokolle für verschiedene Aufgaben bzw. zur Realisierung verschiedener Dienste Internet stellt nur Kommunikationsinfrastruktur zur Verfügung Beispieldienste: Email World Wide Web Dateitransfer (FTP) Benutzung entfernter Rechner (Telnet, SSH) Domain Name Service (DNS) Instant Messagin (ICQ, etc.) 53 DNS Domain Name System verteilte Datenbank die den Namensraum der Adressen im Internet verwaltet Umsetzung von Domainnamen in IP‐Adressen (forward lookup) und umgekehrt (reverse lookup) Vorteile: dezentrale Verwaltung hierarchische Strukturierung des Namensraums in Baumform Eindeutigkeit der Namen Erweiterbarkeit Quelle. Wikipedia 54 E‐Mail zum Versand (und Empfang) elektronischer Post verwendete Protokolle: SMTP – Simple Mail Transfer Protocol POP 3 – Post Office Protocol Version 3 IMAP – Internet Message Access Protocol Anwendungen: E‐Mail‐Clients Zahlen & Fakten (2011): 3,146 Milliarden Emailkonten Zahl der Spam‐Emails von 2010 zu 2011 um 20% gesunken 55 Message Transfer System (MTS) E-Mail Client Port 25 (SMTP) SMTP Server POP3/ IMAP Server Port 110 (POP3) Port 143 (IMAP) E-Mail Client E-Mail Client SMTP (Simple Mail Transfer Protocol): Zuverlässiger Nachrichtentransfer Suche nach Ziel‐SMTP‐Server über DNS (Domain Name System) Weiterleitung dann lokale Auslieferung an POP3/IMAP‐Server 56 POP3 vs. IMAP POP3: Keine ständige Verbindung zum Mailserver erlaubt nur das Auflisten, Abholen und Löschen von E‐ Mails am E‐Mail‐Server Keine Verwaltungsmöglichkeiten auf dem Server Emails werden heruntergeladen und vom Anwendungsprogramm verwaltet IMAP: Emails bleiben auf dem Server Gesamte Verwaltung erfolgt auf dem Server Vorteil: Mehrere Zugänge von unterschiedlichen Rechnern 57 Ports Adresskomponenten, in Netzwerkprotokollen eingesetzt, um Datenpakete den richtigen Diensten zuzuordnen bei TCP: Portnummer 16Bit: 65535 Werte 0...49151 registrierte Ports (IANA), darüber frei Beispiel HTTP‐Port: 80 80 HTTP 143 IMAP 5190 ICQ 20 FTP 58 weitere Dienste FTP zur Übertragung von Dateien Protokoll: FTP – File Transfer Protocol Anwendungen: FileZilla, integriert in TotalCommander Telnet zur Benutzung entfernter Rechner Protokoll: Telnet Protocol SSH zur sicheren Benutzung entfernter Rechner Ähnlich Telnet aber mit verschlüsselter Datenübertragung Protokoll: SSH Protocol 59 Weitere Dienste Peer‐To‐Peer‐Systeme zum Austausch von Dateien BitTorrent, eDonkey, eMule, Gnutella, FastTrack Gleichgestellte Rechner (Gegensatz Client‐Server) Rechner, die Dienste in Anspruch nehmen und diese ebenfalls zur Verfügung stellen Internet‐Telephonie Direkte Internet‐Telefonie Voice over IP Datenübertragung mittels TCP/IP 60 Internetdienste WEB 1.0 UND WEB 2.0 61 World Wide Web „Weltweites Gewebe“ Weltweite durch Hyperlinks „verwobene“ Dokumente Internet realisiert die Übertragung von Webseiten verwendete Protokolle: HTTP – HyperText Transfer Protocol HTTPS – HyperText Transfer Protocol Secure Anwendungen: Webbrowser 62 Total Sites Across All Domains August 1995 – Mai 2012 http://news.netcraft.com/ 63 Total Sites Across All Domains August 1995 – Februar 2013 http://news.netcraft.com/ 66 Organisation des WWW: W3C Auch: WWW‐Consortium: www.w3c.org kümmert sich um Standardisierung und Normierung W3C keine zwischenstaatliche Organisa on → legt keine ISO‐ Normen fest Zusammenschluss verschiedener Mitgliedsorganisationen u.a.: Apple, AT&T, Intel, Microsoft, SAP, SUN 67 Organisation des WWW: W3C Leitung: MIT (USA), INRIA (Frankreich), Keio University (Japan) Gründung: 1994 Gründer und Vorsitzender: Tim Berners‐Lee deutsch‐österreichisches Büro: FH‐Potsdam Techniken (Auswahl): HTML, XHTML, XML, RDF, OWL, CSS, SVG, RSS Empfehlungen für barrierefreie Gestaltung von Webauftritten 68 HTTP Hypertext Transfer Protocol 1989 von Tim Berners‐Lee zusammen mit dem URL und der Sprache HTML entwickelt Zustandsloses Protokoll: nach erfolgreicher Datenübertragung wird Verbindung nicht aufrecht erhalten Sitzungsdaten gehen verloren Cookies für Speicherung der Sitzungsdaten 69 HTTP‐Kommunikationsablauf Aktivieren des Links http://www.example.net/infotext.html schickt an www.example.net die Anfrage, die Ressource /infotext.html zurückzusenden Umsetzen des Namens www.example.net über das DNS‐Protokoll in eine IP‐Adresse Senden einer Anforderung an den Webserver GET /infotext.html HTTP/1.1 Host: www.example.net weitere Informationen in der Anfrage möglich 70 HTTP‐Kommunikationsablauf Antwort des Servers bestehend aus Header‐Informationen Inhalt der Nachricht = Webseiten‐Quellcode HTTP/1.1 200 OK Server: Apache/1.3.29 (Unix) PHP/4.3.4 Content-Length: (Größe von infotext.html in Byte) Content-Language: de Content-Type: text/html Connection: close (Inhalt von infotext.html) 71 HTTP Statuscodes: Serverantworten, die Informationen über Fehlermeldungen etc. liefern 200 – OK: Die Anfrage wurde erfolgreich bearbeitet und das Ergebnis der Anfrage wird in der Antwort übertragen. 201 – Created: Die Anfrage wurde erfolgreich bearbeitet. Die angeforderte Ressource wurde vor dem Senden der Antwort erstellt. 400 – Bad Request: Die Anfrage‐Nachricht war fehlerhaft aufgebaut. 401 – Unauthorized: Die Anfrage kann nicht ohne gültige Authentifizierung durchgeführt werden. Wie die Authentifizierung durchgeführt werden soll wird im „WWW‐Authenticate“‐Header der Antwort übermittelt. 403 – Forbidden: Die Anfrage wurde mangels Berechtigung des Clients nicht durchgeführt. Diese Entscheidung wurde – anders als im Fall des Statuscodes 401 – unabhängig von Authentifizierungsinformationen getroffen. 404 – Not Found: Die angeforderte Ressource wurde nicht gefunden. Dieser Statuscode kann ebenfalls verwendet werden, um eine Anfrage ohne näheren Grund abzuweisen. 500 – Internal Server Error: „Sammel‐Statuscode“ für unerwartete Serverfehler 72 Cookies Problem: Zustand einer Web‐Sitzung nicht oder nur auf dem WebServer speicherbar → IP‐Adressen meist dynamisch vergeben Beispiel: Inhalt des Warenkorbs, Surfverhalten Lösung: Speicherung von Informationen zu einer Webseite auf dem Clientrechner → Cookies Cookies: kurze Texte (4KB) vom Webserver an den Webbrowser gesandt Vom Webbrowser in Datenbank gespeichert 73 Flash‐Cookies Benutzung wie „normale“ Text‐Cookies allerdings 100KB groß danach Information des Anwenders Flash: Technologie von Adobe zur Erstellung (Programmierung) multimedialer, interaktiver Inhalte Problem: Datenschutz Browserübergreifend, da an Flash‐Player gebunden Kann zur Überwachung des Nutzers eingesetzt werden Nicht einfach über den Browser löschbar Kann normale Text‐Cookies kopieren und auch wiederherstellen (selbst wenn der Nutzer sie löscht) 74 Web 2.0 Cloud Computing Social Web Blogs Tagging Social Cataloging Kollaboration Wikis Web 2.0 Webservices Virtuelle Welten Communitys Folksonomy Social Bookmarking Podcasting Semantic Web 75 Begriff: Web 2.0 Grundlage: Weiterentwicklung der Web‐Technologien Veränderung der Wahrnehmung des Webs technische Sicht vs. soziale Sicht Benutzung einer Versionsnummer, ähnlich wie bei Software Definition des Begriffs schwierig → Versuch einer Annäherung 76 Web 2.0 ‐ Sichtweisen O‘Reilly: Web 2.0 als Computerplattform, die Daten und Anwendungen bereitstellt Meckel: Idee der gemeinsamen Maximierung kollektiver Intelligenz und der Bereitstellung von Nutzenwerten für jeden Teilnehmer durch formalisierte und dynamische Informationsteilung und ‐herstellung aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007 77 Web 2.0 ‐ Sichtweisen Breeding: neue Vision des Internets, die größere Interaktivität, Kontrolle des Nutzers über Informationen, radikale Personalisierung, die Entwicklung von Online‐Gemeinschaften und demokratisches Management von Informationen verspricht. Krol definiert Web 2.0 als Kombination von Geschäftsprozessen, Prinzipien und Technologien, die dem Nutzer Partizipation und Zusammenarbeit ermöglichen aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007 78 Web 2.0 ‐ Sichtweisen Tapscott: Bedeutung von Web 2.0: globale Infrastruktur, in der Kollaborationskosten gegen Null fallen aus: Christian Kuhn: Web 2.0, Auswirkungen auf internetbasierte Geschäftsmodelle, Diplomica Verlag, Hamburg, 2007 79 Web 2.0 - Beobachtungen Beispiele die die Veränderung des Webs charakterisieren (O‘Reilly, 2005!): Web 1.0 DoubleClick Ofoto mp3.com Britannica Online personal websites domain name speculation publishing directories (taxonomy) content management systems Web 2.0 Google AdSense Flickr Napster Wikipedia blogging search engine optimization participation tagging ("folksonomy") wikis Was unterscheidet aber nun eine Web 1.0Anwendung von einer Web 2.0-Anwendung? 80 Web 2.0 – Kriterien das Web als Plattform (anstatt des lokalen Rechners) Daten als wichtigste Grundlage „Architektur des Mitwirkens“ → Verstärkung der Vernetzung, Partizipation Modulare Zusammenstellung von Systemen und Seiten Module von unterschiedlichen Entwicklern (Prinzip ähnlich OpenSource) 81 Web 2.0 – Kriterien verteiltes, gemeinsames Nutzen von Inhalten und technischen Diensten → einfache (neue) Geschäftsmodelle Ende des klassischen So warelebenszyklus‘ → immerwährendes Beta‐Stadium Die Software geht über die Fähigkeiten eines einzelnen Verwendungszwecks hinaus. 82 Web als Plattform Vom Desktop zum Webtop zentrales Ziel von Web 2.0 – Webbrowser als Plattform Plattform Vorteile gegenüber Anwendung keine Portierung auf andere Betriebssysteme keine neuen Software Ausgaben kontinuierliche Verbesserung Höhere Scherheit Software als Service, Vermittler 83 Web als Plattform ‐ WebOS „Betriebssystem“ für Webanwendungen Kein Betriebssystem im eigentlichen Sinne OS stellt Schnittstelle zwischen Hardware und Software dar Verantwortlich für Dateisystem WebOS: Schnittstelle zur Programmierung von Webanwendungen Zwischen Anwendung und Hardware WebOS ist mehr eine Art Oberfläche → WebDesktop Bietet aber auch Funktionen zur Verwaltung von Dateien 84 Web als Plattform: WebDesktop WebOs eigentlich im Hintergrund → Funktionalität WebDesktop im Vordergrund → Sichtbare Schnittstelle zur Steuerung und Verwaltung von Webanwendungen Meist ähnlich Windows 85 Web als Plattform Beispiele für WebDesktop, WebOS: eyeOS: http://eyeos.org GlideOS: http://www.glideos.com OnlineOS: http://icube.at/home.jsp Übersicht siehe: http://en.wikipedia.org/wiki/Web_desktop 86 Web als Plattform: eyeOS 87 88 89 Einführung in die Informationstechnik WEB 2.0 90 Aspekte des Web 2.0: Cloud Computing Rechnen in der Wolke Bereitstellung von Diensten, on‐demand: Rechner, Speicher, Netz Anwendungen, Betriebssysteme, Tools Lokale Anschaffung/Installation entfällt Lediglich Zugangssystem muss vorhanden sein 91 Cloud Computing Amazon Cloud Drive Online Speicher zum Ablegen von Dateien Auch Musik, incl. Musicplayer (Cloudplayer) Alternative: DropBox, Apple iCloud Ebenfalls Online‐Speicher zur Dateiablage und ‐austausch Google Drive Online Speicher, Zugriff auf Dokumente von Google Docs 92 Interaktive Anwendungen im Web Mindmaps, Office‐Anwendungen Chart‐ und Diagrammerstellung Bildbearbeitung, Fotogallerien Communities: Freunde finden, gemeinsam Einkaufen, personalisierte Angebote Speicherplatz für Dateien … Übersicht: go2web20.net Gemeinschaftliches Bearbeiten von Dokumenten GoogleDocs, WizIQ, Zoho, ThinkFree http://mashable.com/2008/02/11/13‐word‐processors/ 94 Gliffy Mindmeister 96 Aspekte des Web 2.0: Abonnementdienste Bereitstellung von Inhalten, die abonniert werden können Feeds: RSS, Atom RSS: Really Simple Syndicate Zusätzliches Programm erforderlich: Feedreader Abonnement durch Eingabe der Feedadresse Feedreader lädt Feed automatisch (zeitgesteuert) 97 Aspekte des Web 2.0: WebServices Web 1.0: alles auf einem Rechner Web 2.0: Software‐Bausteine, die auf verschiedenen Rechnern laufen → komponentenbasierte Webservices (SOA) Verbindung zu einer Anwendung über das Internet Service kann Daten bereitstellen, auswerten Anwendung kann im Netz laufen oder lokal Beispiel: Amazon Webservices, Projekt Deutscher Wortschatz (http://wortschatz.uni‐leipzig.de/Webservices/), Interaktion zwischen Fluggesellschaften und Reisebüros (http://de.wikipedia.org/wiki/Webservice#Beispiele) 98 Soziale Aspekte des Web 2.0 Web 1.0: Autoren sind für Inhalte verantwortlich Web 2.0: Benutzer/innen wirken an Inhalten mit → Architektur des Mitwirkens Nutzung kollektiver Intelligenz, kollektiven Wissens Organisation von persönlichen Informationen Reflexion und Sammlung von Erfahrungen (Chronologische) Dokumentation von Ideen und Gedanken Reinmann & Sporer (2007) 99 Soziale Aspekte des Web 2.0 Kollaborative Organisation von Informationen: Öffentliche Sammlung von interessanten Informationen Auffinden von Kontakten mit gleicher Interessensbasis Soziales „Suchen & Finden“ von Informationen Beispiel: Verknüpfung von Bibliographien mit bestimmten Nutzern Auffinden von Publikationen durch dessen Bibliographie Reinmann & Sporer (2007) 100 Soziale Aspekte I ‐ Folksonomy Gemeinschaftliches Indexieren → Tagging Zuordnen von Descriptoren, Schlagwörtern (Tags) zu Objekten Lesezeichen Photos wissenschaftliche Paper Meist keine Festlegungen über Vokabular Jeder kann frei Taggen Herausbildung gemeinschftlicher Wortschatz 101 Soziale Aspekte I ‐ Folksonomy Probleme: Synonyme Unterschiedliche Sprachen Getrennt‐, Zusammenschreibung WebDesktop, Web‐Desktop, Web Desktop, Web_Desktop Kontextbedeutungen: Apple, Virgin Singular/Plural → Bildung unterschiedlicher Kategorien Vorteile: Arbeitsverteilung Benutzer fügen Schlagworte hinzu, nicht Autoren → bessere Benutzbarkeit (Suchergebnisse)? 102 Soziale Aspekte I - Folksonomy Phototagging: „Flickr“, Social Bookmarking: „Delicious“, „Bibsonomy“ Digg Social Cataloging: Library Thing Beispiel: Flickr 104 Soziale Aspekte II ‐ Blogging Blog – Wortkreuzung aus Web Log Web‐Tagebuch Umfrage ergab: 73% der Blogger schreiben aus Spass 27% nicht persönlich, zur Wissensvermittlung Beispiele für textuelle Blogs: … Blogs nicht nur textuell Podcasts VideoBlogs, Vlogs 106 Soziale Aspekte III: Microblogging Blog bei dem nur Kurznachrichten versandt werden Postings können abboniert werden Öffentlich oder privat zugänglich Bekanntester Dienst: Twitter 107 Soziale Aspekte IV: Wikis Name stammt von Wikiwiki (hawaianisch für schnell) Content‐Management‐System (CMS) Erlaubt die gemeinsame Erstellung von Webseiten Prominentes Beispiel: Wikipedia Desktop Wikis: WikidPad, Tomboy, TiddlyWiki 108 Soziale Aspekte V: Social Networking Webseiten mit denen Menschen in Kontakt treten/bleiben können Management von sozialen Netzwerken Zweck: Kommunikation Bildung neuer Geschaftsverbindungen Entwicklung neuer Projekte Terminmanagement, ‐abstimmung 110 Social Networking Beispiele Interessen: Fotocommunity, StudiVZ, Flickr Dating: Urbanite Beziehungsorientiert: OpenNetworX, LinkedIn, Friendster, StayFriends, Facebook Geschäftsorientiert: Ecademy, Xing 111 Personalisiertes Web Web 1.0: Webseite statisch, alle konsumieren die gleichen Inhalte Web 2.0: Benutzer/innen können Inhalte ihren Interessen entsprechend anpassen Personalisierung, Definition: Anpassen an persönliche Bedürfnisse Bei digitalen Dokumenten: Anpassung des Inhalts Anpassung der Darstellung Grundsätzliche Unterscheidung: Für den Benutzer/Benutzerin Durch den Benutzer/Benutzerin 112 Personalisiertes Web Personalisierung durch den Benutzer/in: Inhalte von Webseiten Beispiel: NetVibes, Pageflakes Webradio: Last.fm, MusiMap, musiclens, pandora Personalisierung für den Benutzer/in: Google AdSense 113 Netvibes 114 Musiclens 115 Daten‐getriebene Anwendungen Web 1.0: Wer Inhalte konsumiert war unbekannt Web 2.0: Nutzung von Daten (über Benutzer/innen → Profile) jede erfolgreiche Internet Anwendung basiert auf einer speziellen Datenbasis eBay: Produkte und Verkäufer Amazon: Produkte und Rezensionen Google: Webseiten Teleatlas, Geocontent: Geo‐Daten Kontrolle über Daten=Kontrolle über Markt Management einer Datenbasis ist die Kernkompetenz von Web 2.0 Firmen Software wird zu „Infoware“ 116 Sicherheit im Web 2.0 Allgemeine vs. Persönliche Daten Allgemein: Rezensionen, Statistiken, Landkarten Persönliche Datenspuren im Netz: Einkaufsverhalten → Vorlieben Browseverhalten → Interessen Persönliche Daten: Geburtstag, Adresse, Bankverbindung, Telefonnummer, Kreditkartendaten → komple es Nutzerprofil, Identitätssubsystem für Web 2.0? Was passiert mit diesen Informationen? Wie sicher sind sie? Daten resultieren nicht nur aus Web‐Verhalten, auch von Payback u.ä. Datensammlern 117 News im Web 2.0 Web 1.0: Traditionelle Medien stellen ihre Informationen im Web zur Verfügung Web 2.0: alle sind Journalisten? Stirbt der traditionelle Journalismus? Werden Nachrichten nur noch elektronisch gefiltert und aufbereitet? Journalist als Moderator zwischen bloggenden Bürgern? → Graswurzel oder Bürgerjournalismus 118 Aspekte des Web 2.0: Bürgerjournalismus The Giraffe Project (Christopher Grotke, Lisa LePage): Schaffung einer „News‐Community“ Wikimedia IndyMedia The Huffington Post Verbindung zwischen Radio und Blog: Blogspiel (Deutschlandfunk) Google News Leser (Consumer) und Journalist (Producer) vermischen sich zu: Produser Prosumer 119 Internet Grundlagen SEMANTIC WEB 120 Semantic Web Codierung von Bedeutung im Web In rechnerverständlicher Form Ermöglicht automatische Auswertung von Bedeutungen Vorteile: Daten können in Beziehung zueinander gesetzt werden Neue Erkenntnisse können gewonnen werden I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day‐to‐day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize. – Tim Berners‐Lee, 1999 „The Semantic Web is not a separate Web, but an extension of the current one, in which information is given well‐defined meaning, better enabling computers and people to work in cooperation.” Tim Berners‐Lee, James Hendler, Ora Lassila →From a Web of Documents to a Web of Data Das Web – Probleme oder warum Semantic Web? Inhalte des Webs auf Menschen zugeschnitten Layout, Struktur → einfache Nutzung Problem: Finden von (gesuchten) Informationen Suchmaschinen können Fundstellen suchen Stichwortbasiert, ohne Kontext Bsp.: Suche nach Apple bringt Frucht und Rechner Wahl des richtigen Stichwortes ist entscheidend Ergebnisse sind immer einzelne Webseiten müssen von Menschen interpretiert und kombiniert werden oft ist gesuchte Info auf mehrere Webseiten verteilt → Informa onsintegra on Relevanz kann nur schwer durch Maschine geprüft werden Web – Probleme oder warum Semantic Web? Web ist heterogen: unterschiedliche Informationsdarstellung: Bilder, Text, Audio unterschiedliche Codierung: ASCII, Unicode, ISO… unterschiedliche Sprachen → Informa onen zu einem Thema sind nur schwer aufzufinden Beispiele Gegenüberstellung von Informationen zum Wahlprogramm einzelner Parteien Verknüpfung von verteilt im Netz liegenden Informationen: Vortrag, Termin in Hawthorne/NY Reisebuchung von Berlin nach Hawthorne: Berlin liegt in Deutschland/Europa Hawthorne liegt in den USA/Amerika → Flugbuchung notwendig, Anschlusszug notwendig oder Mietwagen Beispiel: Abendliche Planung Essen gehen, Kino gehen, Cocktailbar Problem: Finden eines guten Restaurants (je nach persönlicher Vorliebe, Preisklasse, Einschätzung durch andere) Ermittlung des Kinoprogramms in unterschiedlichen Kinos mit Genrevorgabe, Reservierung von Karten Cocktailbar sollte in der Nähe des Kinos liegen Mögliche Anfrage: Finde ein Restaurant mit italienischer Küche in mittlerer Preislage, und zeige mir die Kritiken zu den neuen Filmen der letzten zwei Wochen Beispiel aus: http://www2.informatik.hu-berlin.de/mac/lehre/WS04/Ausarbeitungen/SemanticWeb.pdf Mögliche Anwendungsbereiche allgemein: wissensintensive Prozesse Beispiel: kontextbezogene Informationsvernetzung intelligentes Information Retrieval personalisierte Wissensportale Helpdesk‐Systeme → Anwendungsso ware muss „logisch denken“ → neues Wissen aus vorhandenem erschließen http://rewerse.net/press_releases_approved/www.uni-protokolle.de/id/105246/index.html Semantic Web Beschreibung von Daten und deren Semantik in rechnerverständlicher/‐verarbeitbarer Form Daten brauchen Informationen darüber, wie sie zu strukturieren und zu interpretieren sind → Wissensrepräsenta on im Web Semantic Web Prinzipien (Auswahl) 1. Alles kann durch eine URI identifiziert werden http://www.magdeburg.de mailto: [email protected] http://www.w3.org/2001/12/semweb-fin/w3csw Semantic Web Prinzipien (Auswahl) 2. Ressourcen und Links können typisiert sein Software Ressource href href Ressource Ressource href href erzeugt erzeugt Buch Report geschrieben von Ressource gelesen von href Ressource Autor kommuniziert mit Lektor http://www.w3.org/2001/12/semweb-fin/w3csw Semantic Web Prinzipien (Auswahl) 3. Unvollständige Informationen sind unproblematisch Software Ressource href href Ressource Ressource href href erzeugt erzeugt Buch Report geschrieben von Ressource gelesen von href Ressource • Autor kommuniziert mit 404 not found Lektor 404 not found im Semantic Web können fehlende Informationen rekonstruiert werden http://www.w3.org/2001/12/semweb-fin/w3csw Semantic Web Prinzipien (Auswahl) 4. Eine absolute Wahrheit ist nicht notwendig neues Wissen kann aus vorhandenen Informationen geschlussfolgert werden Marcel arbeitet in der Otto‐von‐Guericke‐ Universität Stefan ist Kollege von Marcel → Stefan arbeitet ebenfalls an der OvG‐Uni http://www.w3.org/2001/12/semweb-fin/w3csw Semantic Web Prinzipien (Auswahl) 5. Evolution wird unterstützt Informationen können auf einfache Weise in einen neuen Kontext gesetzt werden Beispiel: Stefan bekommt einen Ruf an eine andere Universität → neue Verknüpfung http://www.w3.org/2001/12/semweb-fin/w3csw 134 Web 3.0? Weiterführende semantische Vernetzung? Internet 2.0: jedes Gerät hat eine eigene IP‐Adresse IPv6: 128 Bit lange Adresse = 2128 Adressen reicht, für 6,65 ∙ 1023 Adressen/m2 Erdoberfläche Jeder kann jederzeit online sein Vielleicht aber auch nicht nur jedes Gerät sondern jeder Blog, jeder Artikel, Autor,… Verarbeiten von Informationen erfolgt dezentral, getrennt vom Medium, unabhängig vom Autor Man liest nicht mehr ein Blog sondern von einem Autor in mehreren Blogs Orte wären irrelevant. Bild wird durch IP bestimmt, nicht Position Neue Zugangswege wären notwendig Artikel werden nicht mehr in einem Blog veröffentlicht sondern „zur Verfügung gestellt“ Informationen werden anhand ihrer IP identifiziert und entsprechend zusammengestellt 135 Zusammenfassung WWW: Dienst im Internet Weltweites Gewebe durch Verlinkung Protokoll: Hypertext Transfer Protokoll Web 2.0: Webseite als Plattform für Anwendungen Daten wichtiger als Aussehen Nutzung verteilter Daten und Anwendungsteile Ausnutzen der Kompetenz vieler Web‐Nutzer 137 Einführung in die Informationstechnik VOM URL-RATEN ZUR SUCHMASCHINE 138 Vom URL‐Raten zur Suchmaschine Web 1.0: URL‐Raten, Web 2.0: Suchmaschinen Letztere analysieren Webseiten Robots durchforsten das Web, in der Regel durch das Folgen von Links Analyse des Anfangs oder des gesamten Textes (Altavista, Fireball) Auswertung von Metatags Auswertung von Verlinkung: PageRank (Google) 139 Dienste und deren Nutzung Suchmaschinen Arten von Suchmaschinen: Manuell erstellte Kataloge Automatisch erstellte Indizes Suchmaschinen für spezielle Zwecke Datenbank von Suchmaschinen: http://www.suchlexikon.de/ http://www.suchfibel.de 140 Suchmaschinen, der manuell erstellte Katalog Generell: von Menschen gemacht Von einer zusammen arbeitenden Gruppe → Redak on Von vielen Beteiligten unabhängig voneinander → Folksonomy Meist hierarchische Präsentation des Katalogs Beispiel: Yahoo, Web.de Eignung: Suche nach einem Thema, Sachgebiet, Stichwort Vorteil: Redaktion kann Inhalt eines Dokuments berücksichtigen Nachteil: Zusammenhänge können verloren gehen: Beispiel: Name einer Person + Sachverhalt http://www.suchfibel.de 141 Suchmaschinen, der automatisch erstellte Katalog Software (Robot, Crawler, Spider) browsen vollautomatisch durchs Netz → Von Link zu Link Indexierungssoftware analysiert und strukturiert Daten Suchmaschinen arbeiten auf Begriffen, ohne die Relevanz eines Wortes für den Inhalt des Dokumentes zu berücksichtigen → für die Suchanfrage wich g zu wissen Eingrenzen des Suchraumes: Welche Begriffe könnten im Zusammenhang mit dem Suchwort stehen explizites Ausschließen von Begriffen http://www.suchfibel.de 142 Suchmaschinen, wichtigste Befehle Plus (+): Verknüpfung zweier Wörter, beide müssen im Ergebnisdokument vorkommen Minus (‐): schließt ein Wort aus, das nachfolgende darf nicht im Ergebnisdokument vorkommen ‐preis Anführungsstriche: Verbinden von Worten zu einer Phrase. Wird wie ein Wort behandelt +Fahrrad „Der oide Depp“ Trotzdem: nicht jede Suchmaschine erfasst das gesamte Web http://www.suchfibel.de 143 Barrieren für Suchmaschinen Die Internetseite … … ist nicht verlinkt … ist zu versteckt … ist zu aktuell … darf nicht indexiert werden … hat zuviel Text … hat keinen Text ... ist nicht frei zugänglich … hat ein unbekanntes Dateiformat → Unsichtbares Netz http://www.ub.uni-bielefeld.de/biblio/search/help/invisibleweb.htm 144 Suchmaschinen, Google Automa sches Browsen durch Links → Robot Relevanzsortierung durch PageRank Larry Page und Sergey Brin Grundprinzip: Je mehr Links auf eine Seite verweisen, desto höher ist das „Gewicht“ der Seite Je höher das „Gewicht“ der verweisenden Seiten, desto höher der Effekt → wich ger die Seite Ziel: Liste der zu einem Suchbegriff wichtigsten Seiten http://www.suchfibel.de 145 Suchmaschinen, Google → Benutzung Plus (+), Minus (‐), Anführungsstriche Oder (|): Verknüpfung zweier Wörter, beide können im Ergebnisdokument vorkommen Strand | Beach Berechnungen: ((3*8)/6)^2 Einheiten umrechnen: foot in cm Zug, Kino und Wetterauskunft Erweiterte Syntax http://de.wikipedia.org/wiki/Google 146 Suchmaschinen, Google → Erweiterte Syntax cache: Sucht in von Google gespeicherten Seiten define: Suche nach Definitionen filetype: Suche nach bestimmten Dateiendungen inanchor: Suche nur in Links intitle: Suche nur im Titel einer Seite inurl: Suche nur in der Adresse intext: Suche nach Begriffen, die nur im Text vorkommen link: Ausgabe aller Seiten, die auf eine bestimmte verlinken site: Suche auf eine bestimmte Domain eingrenzen. related: Sucht nach ähnlichen Seiten http://de.wikipedia.org/wiki/Google 147 Spezielle Suchmaschinen, Wolfram Alpha Weniger Suchmaschine, eher Antwortmaschine Entwickelt vom Mathematica‐Erfinder Stephen Wolfram Daten wurden von 100 Mitarbeitern manuell aufbereitet Fragen können in Suchbegriffen oder direkt gestellt werden → Seman sche Suchmaschine Sehr gut bei Fakten zu Mathematik, Technik, Naturwissenschaften, Linguistik, Wirtschaft Beispiel: How old is Barack Obama? 148 149 150 Microsoft Bing Suchmaschine von Microsoft Seit 3. Juni 2009 online Entscheidungsmaschine Hilfe bei Kaufentscheidungen, Reservierungen, Reisevorbereitungen, etc. Gute Suche nach Bildern und Videos Incl. Interaktiver Vorschaufunktion 151 Spezielle Suchmaschinen, Bildindex Spezielle Suchmaschine für Bilder Bildindex der Kunst und Architektur 2 Millionen Bilder aus 13 europäischen Ländern Nach Künstler, Ort, Porträt und Themen katalogisiert Suche in unterschiedlichen Bereichen möglich Jahr, Genre, http://www.bildindex.de 152 Spezielle Suchmaschinen, Metasuchmaschinen Weiterleiten einer Suchanfrage an viele Suchmaschinen Oft langsamer Erste Metasuchmaschine: MetaCrawler.de Deutsche Metasuchmaschine: MetaGer.de Weitere Spezialsuchmaschinen: Medienarchive, Bildarchive, Menschsuchmaschinen Nachrichtendienste, Bibliotheken und Buchkataloge Beispiel: http://www.bundesarchiv.de/index.html.de 153 Zusammenfassung Suchmaschinen: manuell erstellt oder automatisch Automatisch: Robots browsen durchs Netz → Indexierung von Webseiten nach Suchbegriffen und Schlüsselwörtern Suchanfragen haben spezielle Syntax +, ‐, „“, |, Größter Teil des Netzes ist nicht sichtbar Zugang zu Informationen teilweise über spezielle Suchmaschinen