1 Einführung in die Informationstechnik
Transcription
1 Einführung in die Informationstechnik
2 Zusammenfassung Internet, Netz von Netzen Adressierung über IP‐Adressen, Domain Namen Übertragung geregelt über Protokolle Ü Einführung in die Informationstechnik TCP, IP, HTTP, FTP, SMTP, DHCP IX – World Wide Web paketorientierter Datentransfer über Router verschiedene Dienste: Email, WWW, DNS 3 5 Überblick weitere Dienste Dienste: FTP, Telnet, SSH, Peer‐to‐Peer, VoIP World Wide Web FTP zur Übertragung von Dateien Protokoll: FTP – File Transfer Protocol Anwendungen: FileZilla, integriert in TotalCommander Protokolle Telnet zur Benutzung entfernter Rechner SSH zur sicheren Benutzung entfernter Rechner Cookies Protokoll: Telnet Protocol Web 1.0 Ähnlich Telnet aber mit verschlüsselter Datenübertragung Web 2.0 Protokoll: SSH Protocol 6 Weitere Dienste Peer‐To‐Peer‐Systeme zum Austausch von Dateien BitTorrent, eDonkey, eMule, Gnutella, FastTrack 7 World Wide Web Anteil am globalen Datenverkehr: ca 24% Rechner, die Dienste in Anspruch nehmen und diese ebenfalls zur Verfügung stellen Internet‐Telephonie HTTP – HyperText Transfer Protocol Direkte Internet‐Telefonie Voice over IP Anteil am globalen Datenverkehr: ca. 12% „Weltweites Gewebe“ Weltweite durch Hyperlinks „verwobene“ Dokumente Internet realisiert die Übertragung von Webseiten Internet realisiert die Übertragung von Webseiten verwendete Protokolle: HTTPS – HyperText Transfer Protocol Secure Anwendungen: Webbrowser Anteil am globalen Datenverkehr: ca. 43% 1 8 Total Sites Across All Domains 9 Organisation des WWW: W3C August 1995 ‐ May 2009 Kümmert sich um Standardisierung und Normierung Auch: WWW‐Consortium: www.w3c.org Zusammenschluss verschiedener Mitgliedsorganisationen u.a.: Apple, AT&T, Intel, Microsoft, SAP, SUN http://news.netcraft.com/ Leitung: MIT (USA), INRIA (Frankreich), Keio University (Japan) 10 11 HTTP HTTP‐Kommunikationsablauf Hypertext Transfer Protocol 1989 von Tim Berners‐Lee zusammen mit der URL und der Sprache HTML entwickelt Zustandsloses Protokoll: Zustandsloses Protokoll: Aktivieren des Links http://www.example.net/infotext.html schickt an www.example.net die Anfrage, die Ressource /infotext.html zurückzusenden Umsetzen des Namens www.example.net über das DNS‐Protokoll in eine IP‐Adresse Senden einer Anforderung an den Webserver nach erfolgreicher Datenübertragung wird Verbindung nicht aufrecht erhalten Sitzungsdaten gehen verloren Cookies für Speicherung der Sitzungsdaten GET /infotext.html HTTP/1.1 Host: www.example.net weitere Informationen in der Anfrage möglich 12 HTTP‐Kommunikationsablauf Antwort des Servers bestehend aus 13 HTTP Statuscodes: Serverantworten, die Informationen über Fehlermeldungen etc. liefern Header‐Informationen Inhalt der Nachricht = Webseiten‐Quellcode HTTP/1.1 /1 1 200 OK Server: Apache/1.3.29 (Unix) PHP/4.3.4 Content-Length: (Größe von infotext.html in Byte) Content-Language: de Content-Type: text/html Connection: close (Inhalt von infotext.html) 200 – OK: Die Anfrage wurde erfolgreich bearbeitet und das Ergebnis der Anfrage wird in der Antwort übertragen. 201 – Created: Die Anfrage wurde erfolgreich bearbeitet. Die angeforderte Ressource wurde vor dem Senden der Antwort erstellt. 400 – Bad Request: Die Anfrage‐Nachricht war fehlerhaft aufgebaut. 401 – Unauthorized: Die Anfrage kann nicht ohne gültige Authentifizierung durchgeführt werden Wie die Authentifizierung Authentifizierung durchgeführt werden. Wie die Authentifizierung durchgeführt werden soll wird im „WWW‐Authenticate“‐Header der Antwort übermittelt. 403 – Forbidden: Die Anfrage wurde mangels Berechtigung des Clients nicht durchgeführt. Diese Entscheidung wurde – anders als im Fall des Statuscodes 401 – unabhängig von Authentifizierungsinformationen getroffen. 404 – Not Found: Die angeforderte Ressource wurde nicht gefunden. Dieser Statuscode kann ebenfalls verwendet werden, um eine Anfrage ohne näheren Grund abzuweisen. 500 – Internal Server Error: „Sammel‐Statuscode“ für unerwartete Serverfehler 2 14 Cookies 15 The Web around Wikipedia (18.06.2004) Problem: Zustand einer Web‐Sitzung nicht oder nur auf dem WebServer speicherbar → IP‐Adressen meist dynamisch vergeben Beispiel: Inhalt des Warenkorbs Lösung: Speicherung von Informationen zu einer Webseite auf dem Clientrechner Cookies: kurze Texte → Cookies vom Webserver an den Webbrowser gesandt Vom Webbrowser in Datenbank gespeichert 16 17 Web 2.0 Cloud Computing Social Web Blogs Tagging Social Cataloging Wikis W b 2.0 Web 20 Kollaboration Webservices Communitys Virtuelle Welten Folksonomy Semantic Web Social Bookmarking Podcasting 18 Begriff: Web 2.0 Grundlage: 19 Web 2.0 - Konkretisierung Weiterentwicklung der Web‐Technologien Web 1.0 Veränderung der Wahrnehmung des Webs DoubleClick Ofoto ttechnische Sicht vs. soziale Sicht h i h Si ht i l Si ht Benutzung einer Versionsnummer, ähnlich wie bei Software Definition des Begriffs schwierig → Versuch einer Annäherung Beispiele die die Veränderung des Webs charakterisieren: mp3.com Britannica Online personal websites domain name speculation publishing directories (taxonomy) content management systems Web 2.0 Google AdSense Flickr Napster Wikipedia blogging search engine optimization participation tagging ("folksonomy") wikis Was unterscheidet aber nun eine Web 1.0Anwendung von einer Web 2.0-Anwendung? 3 20 21 Web 2.0 – Kriterien Web 2.0 – Kriterien das Web als Plattform (anstatt des lokalen Rechners) Daten als wichtigste Grundlage „Architektur des Mitwirkens Architektur des Mitwirkens“ → Verstärkung → Verstärkung der Vernetzung Modulare Zusammenstellung von Systemen und Seiten verteiltes, gemeinsames Nutzen von Inhalten und technischen Diensten → einfache Geschäftsmodelle Ende des klassischen Softwarelebenszyklus‘ → immerwährendes Beta‐Stadium Die Software geht über die Fähigkeiten eines einzelnen Verwendungszwecks hinaus. Module von unterschiedlichen Entwicklern (Prinzip ähnlich OpenSource) 22 23 Web als Plattform Web als Plattform Vom Desktop zum Webtop zentrales Ziel von Web 2.0 – Webbrowser als Plattform Plattform Vorteile gegenüber Anwendung „Betriebssystem“ für Webanwendungen Kein Betriebssystem im eigentlichen Sinne OS stellt Schnittstelle zwischen Hardware und Software dar keine Portierung auf andere Betriebssysteme Verantwortlich für Dateisystem WebOS: Schnittstelle zur Programmierung von keine neuen Software Ausgaben WebOS Webanwendungen kontinuierliche Verbesserung Software als Service, Vermittler Zwischen Anwendung und Hardware WebOS ist mehr eine Art Oberfläche → WebDesktop Bietet aber auch Funktionen zur Verwaltung von Dateien 24 25 Web als Plattform: WebDesktop Web als Plattform WebOs eigentlich im Hintergrund → Funktionalität WebDesktop im Vordergrund → Sichtbare Schnittstelle ur Steuerung und Verwaltung Schnittstelle zur Steuerung und Verwaltung von Webanwendungen Meist ähnlich Windows Beispiele für WebDesktop, WebOS: eyeOS: http://eyeos.org GlideOS: http://www.glideos.com OnlineOS: http://icube.at/home.jsp O li OS htt //i b t/h j Übersicht siehe: http://en.wikipedia.org/wiki/Web_desktop 4 26 27 Aspekte des Web 2.0: Cloud Computing Web als Plattform: eyeOS Rechnen in der Wolke Bereitstellung von Diensten, on‐demand: Rechner, Speicher, Netz Anwendungen, Betriebssysteme, Tools Lokale Anschaffung/Installation entfällt Lediglich Zugangssystem muss vorhanden sein 28 Aspekte des Web 2.0: Abonnementdienste Aspekte des Web 2.0: WebServices Web 1.0: alles auf einem Rechner Web 2.0: Software‐Bausteine, die auf verschiedenen Rechnern laufen → komponentenbasierte Webservices → komponentenbasierte Webservices Verbindung zu einer Anwendung über das Internet Service kann Daten bereitstellen, auswerten Beispiel: Google‐Maps, Suchmaschinen, LibraryThing, Interaktive Anwendungen im Web Bereitstellung von Inhalten, die abonniert werden können Feeds: RSS, Atom 29 RSS R ll Simple Syndicate RSS: Really Si l S di t Zusätzliches Programm erforderlich: Feedreader Abonnement durch Eingabe der Feedadresse Feedreader lädt Feed automatisch (zeitgesteuert) 30 31 Interaktive Anwendungen im Web Soziale Aspekte des Web 2.0 Mindmaps Chart‐ und Diagrammerstellung Bildbearbeitung, Fotogallerien Communities Speicherplatz für Dateien … Übersicht: go2web20.net Web 1.0: Autoren sind für Inhalte verantwortlich Web 2.0: Benutzer/innen wirken an Inhalten mit Nutzung kollektiver Intelligenz Nutzung kollektiver Intelligenz → Architektur des Mitwirkens Google: PageRanking Analyse der Verlinkung Amazon: besser durch Review der Leser Wikipedia lebt von der Aktivität der Benutzer Blogging, Tagging: Weisheit der Masse 5 32 33 Soziale Aspekte I ‐ Folksonomy Soziale Aspekte I ‐ Folksonomy Gemeinschaftliches Indexieren → Tagging Zuordnen von Descriptoren, Schlagwörtern (Tags) zu Objekten Synonyme Unterschiedliche Sprachen Getrennt‐, Zusammenschreibung WebDesktop, Web‐Desktop, Web Desktop, Web_Desktop Kontextbedeutungen: Apple, Virgin Singular/Plural Lesezeichen Photos wissenschaftliche Paper Probleme: → Bildung unterschiedlicher Kategorien Meist keine Festlegungen über Vokabular Vorteile: Arbeitsverteilung Benutzer fügen Schlagworte hinzu, nicht Autoren → Jeder kann frei Taggen Herausbildung gemeinschftlicher Wortschatz bessere Benutzbarkeit (Suchergebnisse)? 34 Soziale Aspekte II ‐ Blogging Soziale Aspekte I - Folksonomy 35 Phototagging: „Flickr“, Social Bookmarking: Blog – Wortkreuzung aus Web Log Umfrage ergab: Web‐Tagebuch „Delicious“, „Bibsonomy“ 73% der Blogger schreiben aus Spass Digg 27% nicht persönlich, zur Wissensvermittlung Online Journalismus: Social Cataloging: Spiegel: Library kein Folksonomy Beispiele für textuelle Blogs: … Blogs nicht nur textuell Podcasts VideoBlogs, Vlogs Thing 36 Soziale Aspekte II ‐ Blogging Beispiele: Podcasts: Deutschlandfunk, Mediathek von ARD und ZDF VideoBlogs: Rocketboom, Ehrensenf VideoBlogs: Rocketboom Ehrensenf 37 Soziale Aspekte III: Microblogging Blog bei dem nur Kurznachrichten versandt werden Postings können abboniert werden Öffentlich oder privat zugänglich Ö Bekanntester Dienst: Twitter 6 38 39 Soziale Aspekte IV: Wikis Personalisiertes Web Name stammt von Wikiwiki (hawaianisch für schnell) Content‐Management‐System (CMS) Erlaubt die gemeinsame Erstellung von Webseiten Prominentes Beispiel: Wikipedia Desktop Wikis: WikidPad, Tomboy, TiddlyWiki Web 1.0: Webseite statisch, alle konsumieren die gleichen Inhalte Web 2.0: Benutzer/innen können Inhalte ihren Interessen entsprechend anpassen Personalisierung, Definition: Anpassen an persönliche g, p p Bedürfnisse Bei digitalen Dokumenten: Anpassung des Inhalts Anpassung der Darstellung Grundsätzliche Unterscheidung: Für den Benutzer/Benutzerin Durch den Benutzer/Benutzerin 40 Personalisiertes Web Daten‐getriebene Anwendungen Personalisierung durch den Benutzer/in: Inhalte von Webseiten 41 Beispiel: NetVibes, Pageflakes Webradio: Web 1.0: Wer Inhalte konsumiert war unbekannt Web 2.0: Nutzung von Daten über Benutzer/innen → Profile jede erfolgreiche Internet Anwendung basiert auf einer speziellen Datenbasis Pandora, Last.fm, MusiMap, musiclens Personalisierung für den Benutzer/in: Google AdSense eBay: Produkte und Verkäufer Amazon: Produkte und Rezensionen Amazon: Produkte und Rezensionen Google: Webseiten Teleatlas, Geocontent: Geo‐Daten Kontrolle über Daten=Kontrolle über Markt Management einer Datenbasis ist die Kernkompetenz von Web 2.0 Firmen Software wird zu „Infoware“ 42 Sicherheit im Web 2.0 Allgemeine vs. Persönliche Daten Allgemein: Rezensionen, Statistiken, Landkarten 43 Vom URL‐Raten zur Suchmaschine Persönliche Datenspuren im Netz: Einkaufsverhalten → Vorlieben B Browseverhalten → h lt → Interessen I t Persönliche Daten: Geburtstag, Adresse, Bankverbindung, Telefonnummer, Kreditkartendaten → komplettes Nutzerprofil, Identitätssubsystem für Web 2.0? Robots durchforsten das Web, in der Regel durch das Was passiert mit diesen Informationen? Wie sicher sind sie? Daten resultieren nicht nur aus Web‐Verhalten, auch von Payback u.ä. Datensammlern Web 1.0: URL‐Raten, Web 2.0: Suchmaschinen Letztere analysieren Webseiten Folgen von Links Analyse des Anfangs oder des gesamten Textes (Altavista, Fireball) Auswertung von Metatags Auswertung von Verlinkung: PageRank (Google) 7 44 46 Social Networking Social Networking Beispiele Webseiten mit denen Menschen in Kontakt treten/bleiben können Management von sozialen Netzwerken Zweck: Interessen: Fotocommunity, StudiVZ Dating: Tickle, NachtlebenMD (Urbanite) Beziehungsorientiert: LinkedIn, Friendster Geschäftsorientiert: Ecademy, OpenBC (Xing) Kommunikation Bildung neuer Geschaftsverbindungen Entwicklung neuer Projekte Terminmanagement, ‐abstimmung 47 48 News im Web 2.0 Aspekte des Web 2.0: Bürgerjournalismus Web 1.0: Traditionelle Medien stellen ihre Informationen im Web zur Verfügung Web 2.0: alle sind Journalisten? Wikimedia The Huffington Post Google News Verbindung zwischen Radio und Blog: Blogspiel (Deutschlandfunk) Stirbt der traditionelle Journalismus? Sib d di i ll li ? Werden Nachrichten nur noch elektronisch gefiltert und aufbereitet? Journalist als Moderator zwischen bloggenden Bürgern? Graswurzel oder Bürgerjournalismus 49 Semantic Web Codierung von Bedeutung im Web 50 Web 3.0? In Rechnerverständlicher Form Ermöglicht Automatische Auswertung von B d t Bedeutungen Vorteile: Weiterführende semantische Vernetzung? Internet 2.0: jedes Gerät hat eine eigene IP‐Adresse IPv6: 128 Bit lange Adresse = 2128 Adressen reicht, für 6,65 ∙ 1023 Adressen/m2 Erdoberfläche Jeder kann jederzeit online sein Vielleicht aber auch nicht nur jedes Gerät sondern jeder Blog, jeder Artikel, Autor,… Verarbeiten von Informationen erfolgt dezentral, getrennt vom Medium, unabhängig vom Autor Daten können in Beziehung zueinander gesetzt werden Neue Erkenntnisse können gewonnen werden Man liest nicht mehr ein Blog sondern von einem Autor in mehreren Blogs Orte wären irrelevant. Bild wird durch IP bestimmt, nicht Position Neue Zugangswege wären notwendig Artikel werden nicht mehr in einem Blog veröffentlicht sondern „zur Verfügung gestellt“ Informationen werden anhand ihrer IP identifiziert und entsprechend zusammengestellt 8 51 Dienste und deren Nutzung Zusammenfassung Suchmaschinen WWW: Dienst im Internet Weltweites Gewebe durch Verlinkung Protokoll: Hypertext Transfer Protokoll 53 Arten von Suchmaschinen: Manuell erstellte Kataloge Automatisch erstellte Indizes Suchmaschinen für Spezielle Zwecke S h hi fü S i ll Z k Web 2.0: Webseite als Plattform für Anwendungen Daten wichtiger als Aussehen Nutzung verteilter Daten und Anwendungsteile Ausnutzen der Kompetenz vieler Web‐Nutzer Datenbank von Suchmaschinen: http://www.suchlexikon.de/ http://www.suchfibel.de 54 Suchmaschinen, der manuell erstellte Katalog 55 Suchmaschinen, der automatisch erstellte Katalog Generell: von Menschen gemacht Software (Robot, Crawler, Spider) browsed vollautomatisch durchs Netz Indexierungssoftware analysiert und strukturiert Daten Suchmaschinen arbeiten auf Begriffen Suchmaschinen arbeiten auf Begriffen, ohne die Relevanz eines Wortes für den Inhalt des Dokumentes zu berücksichtigen → für die Suchanfrage wichtig zu wissen Eingrenzen des Suchraumes: Welche Begriffe könnten im Zusammenhang mit dem Suchwort stehen Von einer zusammen arbeitenden Gruppe → Redaktion Von vielen Beteiligten unabhängig voneinander → Folksonomy Meist hierarchische Präsentation des Katalogs Eignung: Suche nach einem Thema, Sachgebiet, Stichwort Vorteil: Redaktion kann Inhalt eines Dokuments berücksichtigen Nachteil: Zusammenhänge können verloren gehen: Beispiel: Yahoo Web de Beispiel: Yahoo, Web.de Beispiel: Name einer Person + Sachverhalt Von Link zu Link explizites Ausschließen von Begriffen http://www.suchfibel.de http://www.suchfibel.de 56 Suchmaschinen, wichtigste Befehle Plus (+): Verknüpfung zweier Wörter, beide müssen im Ergebnisdokument vorkommen Minus (‐): schließt ein Wort aus, das nachfolgende darf nicht im Ergebnisdokument vorkommen im Ergebnisdokument vorkommen ‐preis Anführungsstriche: Verbinden von Worten zu einer Phrase. Wird wie ein Wort behandelt +Fahrrad „Der oide Depp“ 57 Barrieren für Suchmaschinen Die Internetseite … … ist nicht verlinkt … ist zu versteckt … ist zu aktuell … darf nicht indexiert werden … hat zuviel Text … hat keinen Text ... ist nicht frei zugänglich Trotzdem: nicht jede Suchmaschine erfasst das gesamte Web … hat ein unbekanntes Dateiformat → Unsichtbares Netz http://www.suchfibel.de http://www.ub.uni-bielefeld.de/biblio/search/help/invisibleweb.htm 9 58 Suchmaschinen, Google 59 Suchmaschinen, Google → Benutzung Automatisches Browsen durch Links → Robot Relevanzsortierung durch PageRank Larry Page und Sergey Brin Plus (+), Minus (‐), Anführungsstriche Oder (|): Verknüpfung zweier Wörter, beide können im Ergebnisdokument vorkommen Grundprinzip: Je mehr Links auf eine Seite verweisen, p p , desto höher ist das „Gewicht“ der Seite Je höher das „Gewicht“ der verweisenden Seiten, desto höher der Effekt → wichtiger die Seite Ziel: Liste der zu einem Suchbegriff wichtigsten Seiten Strand | Beach Berechnungen: ((3*8)/6)^2 Berechnungen ((3*8)/6)^2 Einheiten umrechnen: foot in cm Zug, Kino und Wetterauskunft Erweiterte Syntax http://www.suchfibel.de http://de.wikipedia.org/wiki/Google 60 Suchmaschinen, Google → Erweiterte Syntax 61 Spezielle Suchmaschinen, Wolfram Alpha cache: Sucht in von Google gespeicherten Seiten define: Suche nach Definitionen filetype: Suche nach bestimmten Dateiendungen inanchor: Suche nur in Links intitle: Suche nur im Titel einer Seite inurl: Suche nur in der Adresse intext: Suche nach Begriffen, die nur im Text vorkommen link: Ausgabe aller Seiten, die auf eine bestimmte verlinken site: Suche auf eine bestimmte Domain eingrenzen. related: Sucht nach ähnlichen Seiten Weniger Suchmaschine, eher Antwortmaschine Entwickelt vom Mathematica‐Erfinder Stephen Wolfram Daten wurden von 100 Mitarbeitern manuell Daten wurden von 100 Mitarbeitern manuell aufbereitet Fragen können in Suchbegriffen oder direkt gestellt werden Sehr gut bei Fakten zu Mathematik, Technik, Naturwissenschaften, Linguistik, Wirtschaft Beispiel: How old is Barack Obama? http://de.wikipedia.org/wiki/Google 62 Neue Suchmaschinen, Microsoft Bing Neue Suchmaschine von Microsoft Seit 3. Juni 2009 online Entscheidungsmaschine Hilfe bei Kaufentscheidungen, Reservierungen, Hilfe bei Kaufentscheidungen Reservierungen Reisevorbereitungen, etc. Gute Suche nach Bildern und Videos 63 Spezielle Suchmaschinen, Bildindex Spezielle Suchmaschine für Bilder Bildindex der Kunst und Architektur 2 Millionen Bilder aus 13 europäischen Ländern Nach Künstler Ort Porträt und Themen katalogisiert Nach Künstler, Ort, Porträt und Themen katalogisiert Suche in unterschiedlichen Bereichen möglich Jahr, Genre, Incl. Interaktiver Vorschaufunktion Im Moment amerikanische Version noch besser 10 64 Spezielle Suchmaschinen, Metasuchmaschinen Weiterleiten einer Suchanfrage an viele Suchmaschinen 65 Zusammenfassung Oft langsamer Erste Metasuchmaschine: MetaCrawler Deutsche Metasuchmaschine: MetaGer Weitere Spezialsuchmaschinen: Medienarchive, Bildarchive, Menschsuchmaschinen Nachrichtendienste, Bibliotheken und Buchkataloge Suchmaschinen: manuell erstellt oder automatisch Automatisch: Robots browsen durchs Netz → Indexierung von Webseiten nach Suchbegriffen und Schlüsselwörtern Suchanfragen haben spezielle Syntax +, ‐, „“, |, Größter Teil des Netzes ist nicht sichtbar Zugang zu Informationen teilweise über spezielle Suchmaschinen 11