Filesharing - Universität Osnabrück
Transcription
Filesharing - Universität Osnabrück
Filesharing Ausarbeitung zum Vortrag im Rahmen des Seminars "Web Publishing" im Wintersemester 2003 / 2004 bei Prof. Dr. Oliver Vornberger Universität Osnabrück von Alexander Koller und Nils von Delft Web Publishing Filesharing WS 03/04 Inhaltsverzeichnis: 1.Einleitung 1.1. Was ist Filesharing? 4 4 2.Entstehung 2.1.Usenet 2.2.IRC 5 5 6 3.Der Durchbruch 3.1. Napster - Der Anfang 3.2. Napster - Das Ende 8 8 9 4.Netzstrukturen und Technik 4.1.Netzsysteme 4.1.1.Zentrales System 4.1.2.Ring 4.1.3.Hierarchie 4.1.4.Dezentrales System 4.1.5.Hybrid Systeme 4.2.Hashing 4.3.Resuming 4.4.Auto-Resuming 4.5.Multi Source 4.6.Swarming 11 11 11 11 12 12 13 14 14 14 15 15 5.Die Erben Napsters 5.1.Audiogalaxy 5.2.Gnutella 5.3.Fasttrack 16 16 17 19 6.Mehr als Musik 6.1.Edonkey 2000 6.2. Weiterentwicklung von eDonkey2000 6.3.Bittorrent 21 21 24 26 2 Web Publishing Filesharing WS 03/04 7.Kostenpflichtige Programme 7.1.Napster2 7.2.I-Tunes 7.3.Phonoline 28 28 29 30 8.Gegenwart und Zukunft 8.1 Zukunftstrends 8.2.Andere Clients und Netze 8.2.1.Direct Connect 8.2.2.Overnet 8.2.3.Kademlia 8.2.4.MP2P 8.2.5.Soulseek 8.2.Rechtliche Lage 31 31 32 32 33 34 35 36 37 9.Exkurse 9.1.Audio Formate 9.2.Video Formate 9.3.Grabben und Rippen 9.4.Player 9.5.Ad- und Spyware 38 38 40 43 44 46 10.Quellen 47 3 Web Publishing Filesharing WS 03/04 1. Einleitung Mit der weiteren Verbreitung des Internet hat sich neben Aspekten wie Informationsgewinnung oder Kommunikation ein weiterer Punkt ins Interesse der InternetBenutzer gespielt, das so genannte Filesharing. Aber was ist Filesharing überhaupt? Und was ist alles mit Filesharing verbunden? Diesen Fragen wollen wir hier auf den Grund gehen, indem wir zunächst klären was es überhaupt ist und dann auf die grundlegende Struktur sowie die Ideen dieser eingehen. Anschließend wollen wir natürlich ein paar bekannte, erfolgreiche Systeme vorstellen und ihre Besonderheiten diskutieren. Beginnen werden wir beim Usenet und IRC um einen Überblick zu bekommen wie es begonnen hat, um dann direkt an den Punkt zu gelangen an dem Filesharing für die breite Masse populär wurde, nämlich bei Napster. Anschließend werden weitere Netze wie AudioGalaxy, Gnutella, Fasttrack, Edonkey2000 und Bittorrent betrachtet. Ein Punkt der stark an Filesharing haftet ist die Frage, ob und in welchem Maße es illegal ist. Auch hier werden wir einen kurzen Einblick bringen - auch wenn dort alles ziemlich unklar und im ständigen Wandel begriffen ist. Natürlich interessieren uns auch die Zukunftsaussichten. So werden wir besprechen, welche Dinge den Usern besonders wichtig und welche Trends abzusehen sind. Hierbei werden wir auch kurz auf die von der Industrie zur Verfügung gestellten Programme eingehen, mit deren Hilfe man die Möglichkeit hat, sich für eine bestimmte Gebühr seine Musik direkt aus dem Netz herunter zu laden. In kurzen Exkursionen werden wir auf die Randbereiche eingehen und Dinge wie Audio und Videoformate besprechen, sowie die Frage klären wie die Information überhaupt auf den Rechner kommt. Sprich: Wie bekomme ich Musik und Videos in das entsprechende Datenformat? Wie funktioniert "rippen" und "grabben"? 1.1. Was ist Filesharing? Wörtlich übersetzt bedeutet der Begriff Filesharing "Akten teilen". Es geht also darum Informationen mit anderen Personen zu teilen, bzw. ihnen zugänglich zu machen. Wir werden ihn so definieren, wie er wohl den meisten Menschen geläufig ist und zwar als Mittel zum Datenaustausch in Netzwerken. Dabei geht es vor allem um Austausch von Musik, Videos, aber auch Spielen, Software, Dokumenten oder anderem. 4 Web Publishing Filesharing WS 03/04 2. Entstehung Die Anfänge von Filesharing sind schwer zu definieren, da selbst das Verschicken von Emails und das Bereitstellen von Dateien per FTP streng genommen schon "Filesharing" ist. Wir sind der Meinung, dass anfangs eher Informationen zu "sharen" waren und sehen die Anfänge des Filesharings in diesem Bereich. 2.1. Usenet Die ersten Ansätze von Filesharing-Systemen findet man schon sehr früh, 11 Jahre vor dem WWW, repräsentiert durch das Usenet (heute vielleicht besser bekannt unter dem Namen Newsgroups). Neben WWW und E-Mail gehört das Usenet zu den wichtigsten Diensten des Internet. Es ist eine Sammlung von Diskussionsforen zu allen nur denkbaren Themen, die mit einem eigenen Protokoll und einer verteilten Serverstruktur arbeitet. Das Usenet wurde 1979 von Tom Truscott und Jim Ellis an der Duke Universität von North Carolina erfunden, indem diese die Möglichkeit ausnutzten, zwei Unix-Rechner über das zum Betriebssystem gehörige Softwarepaket UUCP (unix-to-unix-copy) miteinander zu verknüpfen. Daraus wurde ein Konferenzsystem, das über seinen Namen - Unix User Network - eine gewisse Selbstbezogenheit reflektierte. 1980 wurde ein Band mit einer Zusammenstellung der für das Usenet notwendigen Software auf einer Konferenz von UnixBenutzern verteilt. Von Jahr zu Jahr wuchs die Anzahl der Usenet Teilnehmer, so dass es heute die wohl größte öffentliche Kommunikationsplattform der Welt ist (Ungefähr 18000 öffentliche Newsgroups). Anders als heute handelte es sich aber nicht um einen Verbund von Rechnern die über eine Standleitung kommunizierten sondern nur über eine Dial-UP Verbindung. So war das Ganze anfangs eher ein dezentrales System, in dem jeder Client und Server war. Diese Struktur ermöglicht es bei einem Verbot des Internets problemlos ein Dial-Up Netzwerk zu gestalten das weiterhin den Informationstausch ermöglicht. Bei dem steigenden Informationsfluss bildeten sich 1983 so genannte "Backbones". Das waren die zentralen Rechner die sozusagen ein Kernstück des Ganzen darstellen. Dadurch erhielten die "Backbone"-Admins aber auch einen ungeheuren Einfluss auf das Informationsangebot im Usenet. Diese Admins standen ständig in Kontakt, da nur wenn sie sich einig waren alle Informationen im ganzen Usenet verfügbar waren. Ab 1987 wurde das Prinzip des Backbones an verschiedenen Stellen durchlöchert: Die alt-Hierarchie wurde zur Verfügung gestellt, die Einrichtung neuer Nachrichtengruppen formalisiert und quasi demokratischen Regeln unterworfen. Außerdem wurde 1986 das Network News Transfer Protocol (NNTP) veröffentlicht, das es ermöglichte, Usenet-Mitteilungen über das Internet zu transportieren. Mit der Überlagerung von Usenet und Internet, wie es NNTP erlaubte, übernahm das Usenet auch die Eigenschaft der Ausfallsicherheit. Bezogen auf die inhaltliche Ordnung hieß das: Eine effektive Kontrolle von zentralen Stellen war nicht mehr möglich, denn in einem verteilten Netz können Knoten, die bestimmte Gruppen nicht führen, umgangen werden. 5 Web Publishing Filesharing WS 03/04 Sehr schnell kamen die Nutzer auf die Idee, dass das Usenet auch gut zum Verteilen von Daten geeignet sei. Allerdings gab es hier ein großes Problem: das Usenet war für Textdateien ausgelegt und nicht für Binärdateien, aber wie immer fand man einen Weg dieses Problem zu umgehen. Die Binärdateien wurden in Textdateien umkodiert und dann im Usenet verteilt. Der Endnutzer musste dann nur noch die Textdateien wieder decodieren und hatte so wieder die ursprünglichen Binärdateien. 2.2. IRC Eine weitere große Entwicklung (ohne die es wahrscheinlich kein Napster gegeben hätte) fand im Jahr 1988 statt, der Finne Jarkko Oikarinen erfand den Textzeilen-Kommunikationsdienst IRC (Internet Relay Chat). IRC ermöglichte einen "Echtzeit-Chat" auf Textzeilenbasis. Seine Idee war innerhalb der Uni eine bessere Kommunikationsplattform zu schaffen und war erstmal nur für Unix ausgelegt. Über Kontakte zu den Universitäten in Helsinki und Tampere erreichte Jarkko, dass mehrere neue IRC-Server gegründet wurden und die Userzahl ständig weiter anstieg. Über Jarkkos Freund Vijay Subramaniam (der erste nicht finnische IRC-User) erfuhren die Leiter der Universitäten von Denver und Oregon vom IRC und bauten bei sich IRC-Server auf. Sie nahmen sogleich mit Jarkko persönlich Kontakt auf und baten um eine Anbindung ans finnische IRC Netzwerk. 1989 gab es weltweit bereits 40 IRC Server mit durchschnittlich 12 Usern online. Es ähnelte zu diesem Zeitpunkt sehr dem Usenet, aber die Netzstruktur der Server unterschied sich sehr davon. Während das Usenet dezentral angelegt war, bildeten die IRC-Server eine Kette, so dass es bei einem Rechnerausfall zu einem "Netsplit" kam, der einige Zeit brauchte um behoben zu werden, da die Synchronisation der Server sehr aufwendig war. Dieses Problem gibt es auch heute noch und wird auch aufgrund der Netzstruktur immer bestehen bleiben. Aber der wesentlichste Unterschied zum Usenet entstand 1990 als das "IRC-Netz" sich das erste Mal aufspaltete. Seitdem entstanden immer mehr voneinander unabhängige Netze (A-Net, EFNet, Undernet, DALnet). Nun aber zu der Frage was das textbasierte IRC mit dem Datenaustausch zu tun hat bzw. welche große Rolle es für die Entwicklung des Filesharing spielt. Zum ersten vereinfachte es den Kontakt zwischen den tauschwilligen Usern, so dass diese FTP- und Web-Adressen austauschen konnten. Mit der Einbindung des CTCP-Protokoll und der Umsetzung im DCCTransfer wurde eine schlichte Verbindung zwischen den Usern möglich, über die dann auch Daten ausgetauscht werden konnten. Eine Erweiterung des ganzen kam dann mit der Ergänzung des FServe der es ermöglichte ganze Dateilisten mittels Textoberfläche zugänglich zu machen. Durch die Skriptfähigkeit einiger IRC-Clients ist dies sogar automatisch mittels vorgefertigter Trigger möglich, die den Zugang zu einem FServer verwalten. Bei reinen ShareChannels geht es sogar soweit, dass durch Aufrufen eines Triggers die Dateien aller User im Channel eingesehen werden können. Hier liegt aber auch ein großes Sicherheitsloch. Dadurch dass der Datentransfer eigentlich nicht vorgesehen war, ist die aktuelle Lösung eher unschön und durch den Direktzugriff auf die Platte auch risikoreich. Falsch geschriebene Trigger und schlecht konfigurierte Fserver können dazu führen, dass es möglich ist unberechtigte Aktionen auf dem Rechner auszuführen. 6 Web Publishing Filesharing WS 03/04 Clients: Windows mIRC Gibt es seit 1995, ist mächtig, einfach zu bedienen und in der Shareware-Version uneingeschränkt nutzbar. Die umfangreichen Skript-Fähigkeiten des Clients lassen sich zum Guten wie zum Bösen einsetzen. Features wie Trigger-gesteuerte FServer wären ohne Skripts nicht möglich. mIRC ist der populärste IRC-Client. Das Programm ist uneingeschränkte Shareware und kostet 20 $. Download: http://www.mirc.com Unix BitchX Ist eine modifizierte Version des Klassikers ircII, der ideale Client für Skript- Kiddies. Dank seiner Plugin- und Skript-Fähigkeiten ist damit so ziemlich alles machbar, was sich über IRC theoretisch machen lässt. Allerdings erfordert das Programm auch eine erhebliche Einarbeitungszeit. Zum Dateitausch kann man mit BitchX wie mit mIRC FServer betreiben oder im Channel in regelmäßigen Abständen interessante Dateien ankündigen. Download: http://bitchx.org/ XChat Bietet im Gegensatz zu BitchX eine grafische Oberfläche für das X Window System, benutzt GTK+ und kann optional für Gnome kompiliert werden. Die Oberfläche ist intuitiver zu bedienen und eher mIRC ähnlich. Download: http://www.xchat.org 7 Web Publishing Filesharing WS 03/04 3. Der Durchbruch Man kann behaupten, dass der große Durchbruch und der "Volkssport Filesharing" mit dem Auftreten von Napster begann. Kaum ein Filesharing-Tool hat so starken Einfluss auf die Mentalität der Internetnutzer gehabt wie Napster. Es stellt sich also die Frage: Warum war Napster so erfolgreich? Was hatte Napster was das Usenet nicht bieten konnte? Bevor wir auf diese Fragen eingehen, müssen wir aber am Rande eine Entwicklung erwähnen ohne die Napster nicht so bekannt und groß geworden wäre. 3.1. Napster - Der Anfang Nach dem kleinen Exkurs zurück zum Kernthema. Die Geschichte des Durchbruchs beginnt im IRC, wo sich Shawn Fanning, ein Informatik-Student an der Boston University, der Hackergruppe w00w00 (als passives Mitglied) anschloss. Während sich seine Kommilitonen nicht so sehr für das IRC interessierten wie er, sondern mehr die schnelle UniversitätsAnbindung ans Netz nutzen, um dort nach digitalisierter Musik zu suchen, überlegte Fanning sich, dass es doch viel besser wäre, wenn die MP3-Fans sich direkt, wie im IRC, austauschen würden und nicht mehr auf die zentralen Instanzen (Lycos, Scour.com waren zu dem Zeitpunkt die besten Webanbieter dafür) angewiesen sein, die viel zu langsam für die kurzlebigen Angebote waren. Denn zu dem Zeitpunkt kam es häufig vor, dass große Angebote schnell wieder verschwanden, auf Grund von rechtlichem Druck, oder weil die Provider nicht bereit waren Gigabyte um Gigabyte Traffic für die Musik bereit zustellen. Fannings Idee war, dass die User (Sucher) direkt auf die Platte des jeweiligen Users (Anbieter) zugreifen können sollten, während die Suche über zentrale Indexserver erfolgen sollte, bei denen sich der User beim Einloggen registrierte. Damit legte er die Grundidee des Peer to Peer (Von Nachbar zu Nachbar), die schon seit den 70igern bekannt war, als Grundstein für sein Projekt und für alle zukünftigen Filesharing-Programme und Netze fest. Im Herbst 1998 begann er mit dem Konzept und der Planung des Projektes "Napster" (sein damaliger IRC Nickname), was schnell so groß wurde, dass er sich von der Universität abwand und nach einem Semester seine Universitätskarriere beendete. Unterstützung für sein Projekt fand er bei seinem Onkel, der ein kleines Internet-Schach-Portal betrieb und sich damit finanzierte. Als Fanning dann im Juni 1999 die erste Napster Version an seine Freunde und diese die dann weiter verteilten, fand es schnell eine große Usergemeinde. Spätestens als download.com Napster mit dem Spotlight kürte, verbreitete sich Napster rasend schnell. Aber hier gab es auch das erste Problem: Die Napsterserver brachen einfach unter dem großen Ansturm zusammen. Er brauchte Hilfe und die fand er bei seinen Freunden von w00w00, Sean Parker und Jordan Ritter. Zeitgleich gründete er mit seinem Onkel "Napster Inc.", die das ganze Projekt professionalisieren sollte. Im September 99 veröffentlichte Napster Inc. die 2.0 Version und zog nach Kalifornien um. Der Vorteil von Napster war einfach, dass tote Links gar nicht erst auftraten und das Angebot immer den aktuellen Bestand der verbundenen User darstellte. Hier ist ein erster Kritikpunkt 8 Web Publishing Filesharing WS 03/04 zu finden: Die 80 Server von Napster Inc. kommunizierten nicht untereinander, so dass keine Synchronisation stattfand, was ein wenig die Auswahl einschränkte. Trotzdem war das Angebot gewaltig und durch eine IRC-ähnliche Chatfunktion baute sich eine kleine Community auf, weiter unterstützt durch die Möglichkeit einer Freundes-Liste, die anzeigte ob ein neu gefundener Musikfreund online war oder nicht und die Möglichkeit, einfach die freigegebenen Ordner eines Users zu durchsuchen, um zu sehen was der andere noch so hörte. Features waren zudem Resuming und Auto-resuming, die es ermöglichten abgebrochene Downloads auch später fortzusetzen. Nachteil war, dass die Suche UserIP zurück lieferte, was eine Strafverfolgung vereinfachte. 3.2. Napster - Das Ende Mit wachsender Userzahl geriet Napster zunehmend in das Visier der Recording Industry Association of America (RIAA). Im November 1999 verlangte die RIASS die Schließung Napsters mit dem Vorwurf, dass ein Großteil der dort getauschten Musikstücke, Kopien urheberrechtlich geschützten Materials seien, und machte Napster indirekt für die Umsatzrückgänge verantwortlich. Napster führte an, dass dadurch der CD- und Konzertkartenverkauf noch gefördert wurde. Mit der Klage tat sich die RIAA keinen Gefallen: Dadurch rückte Napster noch mehr ins Licht der Öffentlichkeit und die Userzahlen stiegen weiter. Anfang 2000 sahen sich mehrere Unis gezwungen die Verbindung zu den Napsterservern zu unterbinden, da der massive Datentransfer teilweise die kompletten Universitätsnetze lahm legte. Zu der Zeit klagte auch die Band Metallica gegen Napster und verlangte die Sperrung von 335435 Usern, die über die Drittfirma NetPD ermittelt wurden. Napster kam dieser Forderung nach und sperrte die Usernamen, die gesperrten User änderten aber einfach ihren Nick und tauschten dann fröhlich weiter. Ende Oktober 2000 versuchte die Bertelsmann eCommerce Group (BeCG) vergeblich, Napster in einen Abo-Dienst zu verwandeln, der die Künstler entsprechend vergütete. Derweil zog sich der Gerichtsprozess in die Länge und Napster wurde immer populärer. In der Woche vor der Gerichtsentscheidung stieg das Datentransfervolumen in drei Tagen um das vierfache an. Napster verlor aber vor Gericht. Die Richterin lehnte den Suchmaschinenvergleich ab, obwohl keine einzige Datei jemals über einen Napsterserver gelaufen war. Am 28. März 2001 musste Napster auf richterlichen Beschluss ein Filtersystem einführen, das die 650.000 von der RIAA genannten Songs aus dem Angebot herausfilterte. Die ersten Varianten des Filtersystems scheiterten an der Intelligenz der User. Da nur nach Dateinamen gefiltert wurde, variierten die User den Namen geringfügig und das Tauschen konnte weitergehen. Spätere Filter nutzen eine dem Hashing-Verfahren ähnliche Technik um die Dateien zu identifizieren. Am 1.7.2001 nahm Napster Inc. die eigenen Server vom Netz, um angeblich ein neues Filtersystem zu installieren, Napster ging aber nie wieder online. Shawn Fanning hatte mit Napster eine Revolution ausgelöst die bis heute nicht gestoppt werden konnte, und mit 40 Millionen Usern und 5,4 Millionen zeitgleich online befindlichen Usern auch heute noch zu einem der größten Netze gehören würde. Mit dem Ende Napster hieß es: Napster ist tot - lang lebe Peer to Peer! 9 Web Publishing Filesharing WS 03/04 Viele Nutzer wechselten zu ähnlichen Systemen wie Gnutella, Audiogalaxy oder Kazaa. Andere bauten ihre eigenen Napsternetze auf. Durch die Entschlüsselung und die Dokumentation der Napster-Protokolle entstanden zwei Server-Projekte, OpenNap und Jnerve. Jnerve, auf Java basierend, setze sich nicht durch da es zu umständlich war es einzusetzen, so dass es heute viele kleine OpenNap-Netze gibt, die zwar nie so groß wie Napster werden, aber eigentlich die direktesten Nachfolger von Napster sind. 10 Web Publishing Filesharing WS 03/04 4. Netzstrukturen und Technik Um das Filesharing effizienter zu machen werden immer neue Verfahren entwickelt. Da diese natürlich auch immer neue Begriffe mit sich bringen wollen wir kurz ein paar grundlegende Begriffe klären und dadurch gleich die neuen Ideen und "Tricks" zum effizienteren Filesharing deutlich machen. Aber zunächst wollen wir etwas auf die grundlegenden Netzstrukturen eingehen 4.1. Systeme Es soll nun darum gehen ein paar grundlegende Verteilungssysteme des Filesharings darzustellen. Dabei geht es vor allem bei neueren Tools nur noch um die Suche, da das Senden der Dateien, um das Netz nicht zu belasten, direkt zwischen den Beteiligten abläuft. Da aber das Suchen natürlich ein wesentlicher Bestandteil des Filesharing und gerade dies der Punkt ist, an dem sich die Systeme unterscheiden, hier also ein bisschen Theorie. 4.1.1. Zentrales System Dies ist das wohl einfachste System, sehr oft verwendet bei Client/Server Anwendungen, Datenbanken, Webservern und anderen einfachen Systemen. Alle Informationen und Funktionen werden an einen zentralen Server geschickt. Alle Clients sind mit diesem einen Server verbunden, der die Steuerung übernimmt. Viele Peer-To-Peer Anwendungen haben auch eine zentralisierte Komponente. Das SETI@Home System beispielsweise ist vollständig zentralisiert mit einem Server der die Aufgaben verteilt. Die Suchfunktion des alten Napster war vollkommen zentralisier (das Filesharing hingegen nicht). 4.1.2. Ring System Bei vielen Client Anfragen bekommt ein zentraler Server häufig Probleme, daher ist eine gängige Lösung mehrere Rechner in Ringform anzuordnen und als Server fungieren zu lassen. Die Kommunikation wird dabei so geregelt, dass eine Gruppe von Rechnern identische Informationen besitzt aber Sicherheitsmechanismen und "load-balancing Fähigkeiten" hat. Im Gegensatz zu den anderen Systemen werden Ring-Systeme generell da eingesetzt wo die Rechner nah zusammen stehen und zur selben Organisation gehören. 11 Web Publishing Filesharing WS 03/04 4.1.3. Hierarchisches System Das hierarchische System wird schon lange im Internet eingesetzt, jedoch in der Praxis als dezentrales System oft übersehen. Das bekannteste hierarchische System im Internet ist der Domain Name Service, bei dem die Zuständigkeit von der Wurzel, dem Name Server, zum Server auf den der Name registriert ist und oft noch auf weitere Ebenen übergeben wird. Das Network Time Protocol (NTP) stellt ein weiteres hierarchisches System dar. Dort gibt es so genannte "root time"-Server mit der festgelegten Normzeit. Die anderen Rechner gleichen sich mit dieser Zeit in einem selbst organisierenden Baum ab. Das NTP hat über 175.000 Mitglieder von denen die meisten nur zwei oder drei Verbindungen vom Root-Server entfernt sind. Ein anderes großes hierarchisches System ist das Usenet, das eine baumartige Struktur benutzt, um Artikel zwischen den Servern zu kopieren. 4.1.4. Dezentrale Systeme Das letzte reine System, was wir behandeln wollen ist das dezentrale System, in dem alle Teilnehmer ähnlich kommunizieren und gleiche Rollen haben. Gnutella war zu Beginn eines der reinsten dezentralen Systeme die verwendet wurden - inzwischen ist durch das Einführen von Supernodes das Ganze zu einem Hybrid-System geworden. Es gibt noch einige andere dezentrale Systeme wie z.B. Freenet oder OceanStore. Dezentrale Systeme sind aber nicht neu: Das Internet Routing Protocol selbst ist großteils dezentral. Dabei wird das Border Gateway Protocol benutzt um die Verbindungen zwischen verschiedensten autonomen Systemen herzustellen. 12 Web Publishing Filesharing WS 03/04 4.1.5. Verbundene Systeme (Hybridsysteme) In der Praxis entsprechen die Systeme oft mehr als nur einer Architektur. So werden häufig verschiedene Systeme in ein neues System integriert, ein so genanntes Hybridsystem. Die Server haben dabei oft mehr als nur eine Rolle. Ein Server kann z.B. zentralisiert mit einem anderen Rechner agieren und zur gleichen Zeit Teil einer Hierarchie sein. Zentralisiert und Ring Wie schon oben erwähnt haben große Webserverapplikationen oft einen Ring als Grundstruktur um die Last zu verteilen und vor dem Zusammenbruch des Systems durch den Ausfall eines Rechners geschützt zu sein. Das Serversystem an sich ist dann ein Ring, aber das Gesamtsystem ist ein Hybrid. Wir haben ein zentrales System wobei die Clients auf einen Server zugreifen, der in diesem Fall ein Ring ist. Vom Client aus betrachtet haben wir also ein zentralisiertes System mit der Sicherheit und Performance eines Rings. Zentralisiert und Zentralisiert Der Server in einem zentralen System ist selber oft ein Client von einem oder mehreren Servern. Die Verbindung von mehreren zentralen Systemen ist die Grundlage eines N-Tier Frameworks. Wenn zum Beispiel ein WebBrowser zu einem Server verbindet ist dieser unter Umständen nur für die Verarbeitung der Daten zuständig aber nicht dafür sie zu liefern. Er bekommt diese als Client von einem anderen System (einem Datenbankserver beispielsweise). Zentrale Systeme werden oft in Kombination mit größeren Systemen eingesetzt. Zentralisiert und Dezentralisiert Immer mehr Peer-To-Peer Systeme basieren auf einer Architektur von zentralen Systemen, die in eine dezentrales eingebunden sind. Diese Art von Verbindung wird im großen Rahmen im FastTrack Filesharing System eingesetzt, dass z.B. von KaZaA genutzt wird. Die meisten Teilnehmer haben eine zentrale Verbindung zu einem "Supernode" und geben alle Suchen an diesen Server weiter (so ähnlich wie ein Napster Client Fragen an den Server schickt). Aber die Supernodes sind keine Einzelserver, sondern sie sind in einem, Gnutella ähnlichen Netzwerk angeordnet. Emails im Internet haben die gleiche Struktur. Mail-Clients haben eine zentralisierte Verbindung mit einem speziellen Mailserver, aber die Mailserver selber teilen die Mails dezentral. 13 Web Publishing Filesharing WS 03/04 4.2. Hashing Bei neueren Filesharing Tools wird es immer wichtiger, Dateien eindeutig bestimmen zu können. Sagen der Name und die Größe der Datei zwar schon einiges aus, möchte man aber doch auch bei Dateien mit gleichen und natürlich auch bei Dateien mit unterschiedlichen Namen aber gleichen Größen wissen, ob sie nicht vielleicht doch identisch sind. Gerade wenn man von verschiedenen Personen eine Datei lädt, ist es natürlich unumgänglich eindeutig klarzustellen, dass die Dateien gleich sind. Überdies ist die eindeutige Identifizierung auch sehr sinnvoll um mögliche "Fakes", also Dateien die unter falschem Namen in Umlauf gebracht werden, zu beschreiben und zu veröffentlichen, um so anderen beteiligten die Möglichkeit zu geben, diese direkt zu meiden. Außerdem bietet es die Möglichkeit, die Qualität der Dateien zu bewerten und es anderen Usern eindeutig mitzuteilen. Beim Hashing wird die Datei in bestimmte Abschnitte eingeteilt und diese werden analysiert. So wird ein Hashcode ermittelt, der so komplex ist, dass kaum Möglichkeit besteht, dass zwei Dateien denselben Code bekommen. Die ersten Hashcodes wurden bereits bei Napster eingesetzt - sehr zum Leidwesen einiger Kazaa User, die in den USA von der RIAA verklagt wurden, über Kazaa illegal Musik zu vertreiben. Dass sie die Stücke nicht aus dem eigenen Besitz gerippt hatten, wurde ihnen zum Teil durch alte Napster Hashcodes nachgewiesen. 4.3. Resuming Natürlich ist es, besonders bei größeren Dateien, nicht immer möglich sie "in einem Rutsch" herunter zu laden. Man möchte also eine Datei gerne zu einem späteren Zeitpunkt einfach wieder aufnehmen und weiter laden. Für diesen Zweck ist das Resuming "erfunden" worden. Mit Hilfe von Resuming kann man also eine Datei an der Stelle wieder aufnehmen bis zu der man geladen hatte und den Download weiter fortsetzen. Dies macht natürlich auch in sofern Sinn, dass immer mal die Verbindung durch irgendetwas unterbrochen werden kann und man sich den Ärger erspart sie noch einmal ganz von Anfang an laden zu müssen. 4.4. Auto-Resuming Bei vielen Filesharing Programmen kommt es auch mal vor, dass der Partner von dem man die Dateien herunter lädt offline geht und erst zu einem späteren Zeitpunkt wieder da ist. In diesem Fall möchte man sich nicht selber darum kümmern, dass der Download wieder aufgenommen wird sondern würde das gerne automatisch erledigt haben. Dies ist mit autoresuming möglich. Wenn der Download abbricht wartet das Programm selbständig darauf, dass der User oder ein anderer User (mit multiple source) verfügbar ist und man von ihm die Datei an der Stelle weiter lädt, an der der Download zuvor abgebrochen war. 14 Web Publishing Filesharing WS 03/04 4.5. Multiple Source Mit hashing und auto-resuming ist nun auch eine andere Idee durchsetzbar und zwar die, dass ich meine Dateien nicht nur von einem User lade, sondern wenn mehrere User diese habe sie auch von verschiedenen Quellen laden kann. Die Dateien sind also im Netzwerk unter ihrem Hashcode bekannt und so kann die Datei wenn ein Download abgebrochen wird so schnell wie möglich von irgendeinem User im Netzwerk wieder aufgenommen werden und man muss nicht warten bis derselbe User, von dem ich zuvor geladen habe, wieder verfügbar ist. 4.6. Swarming Um noch schnellere und zuverlässigere Downloads zu bekommen ist swarming ein weiterer wichtiger Punkt beim Thema Filesharing. Das Problem, dass man eine Datei nur von einem einzigen User gleichzeitig laden kann wird so umgangen, dass die Datei in viele einzelne Teile eingeteilt wird. So werden gewissermaßen viele kleine Dateien geladen und diese vom Programm automatisch zusammengesetzt. Dies hat natürlich sowohl den Vorteil, dass sich die Downloadgeschwindigkeiten der einzelnen Downloads nun zu einer höheren gesamten Geschwindigkeit aufsummieren. 15 Web Publishing Filesharing WS 03/04 5. Die Erben Napsters Wie schon erwähnt mit dem Ende Napsters, war die Filesahring-Idee nicht gestorben eher das Gegenteil. Die vielen Netzsuchenden Napster-User wurden von schon existierenden P2PNetzen aufgefangen. Einige davon werden wir im Folgenden vorstellen. 5.1. Audiogalaxy Der erfolgreichste Musikdatei-Nachfolger von Napster, war Audiogalaxy. Die in Texas ansässigen Entwickler, entschieden sich für ein stark zentralisiertes Netzwerk und eine Webbasierte Bedienung. Nach der Installation des sehr kompakten Audiogalaxy-Satelliten erfolgt zunächst die Eingabe von Kennung, Passwort und einer E-Mail-Adresse. Das Netzwerk bestand aus einem zentralen Server, bei dem jeder registrierte Nutzer mit seinem Web-Browser die gewünschten Dateien suchen und zum Download markieren konnte. Die benötigten Downloadinformationen (Quelle etc.) wurden dann an den Client übermittelt und dort weiterverarbeitet, d.h. der Client begann mit der Kontaktaufnahme zum Anbieter und verwaltete den Download. Anders als bei Napster speicherte der Audiogalaxy-Server die Dateilisten der User bis zum nächsten Login und aktualisierte diesen dann einfach. So war ein sehr großes Angebot indexiert und stand dem Suchenden zur Verfügung. Ging der gesuchte Anbieter wieder online, meldete der Server dieses an die wartenden Clients und diese nahmen Kontakt zu dem Anbieter auf. Ein weiterer Vorteil dieses Systems war, dass durch die Registrierung am Anfang und der Plattform-Unabhängigkeit des Clients, von jedem Rechner aus der User Zugriff auf seinen Account hatte und so Musik laden konnte. Audiogalaxy verfolgt nach eigenen Angaben drei Ziele: 1. Konsumenten die Musik zu bieten, die sie suchen, 2. Musikern zu ermöglichen, dass ihre Musik gehört wird 3. die "gute" Musik von der "schlechten" zu trennen. Den zweiten Punkt ihrer Ziele erreichten sie durch so genanntes Musikhosting. Dem Musiker wurde Platz auf dem Server zugewiesen, den er zur Verfügung hatte um Musik hochzuladen und diese an andere zu verteilen. Ob diese Funktion häufig genutzt wurde kann ich leider nicht sagen, da ich dazu keinerlei Informationen gefunden habe. Punkt drei ist wohl eher ein "Mode"-Ziel um sich abzuheben. Da Audiogalaxy als inoffizieller Napster-Nachfolger galt, musste es nach einer gerichtlichen Auseinandersetzung Mitte 2002 jedoch ebenfalls den Betrieb einstellen. Allerdings scheint es Audiogalaxy wieder zu geben, jetzt jedoch mit starken Filtersystemen, so dass es nicht mehr "Volkssport-tauglich" ist. Link: www.audiogalaxy.com 16 Web Publishing Filesharing WS 03/04 5.2. Gnutella Ein Nachfolger von Napster war das Gnutella Netzwerk. Zunächst entwickelt von der Firma Nullsoft, wurde die Software aber ziemlich schnell von ihrer Mutterfirma AOL wieder von der Webseite genommen. Allerdings waren andere Programmierer in der Lage die Struktur nachzuvollziehen und darauf aufzubauen. Guckt man sich die Struktur des Netzes genauer an, so stellt man relativ schnell fest, dass diese sich grundlegend von Napster unterscheidet. So war die Suche zunächst absolut dezentral, wurde aber im Laufe der Zeit in ein Hybrid-System ausgebaut. Doch beginnen wir mit der Anmeldung im Netz. Zunächst meldet man sich bei einem Host an, der Informationen, bzw. IP-Adressen, von Teilnehmern gespeichert hat. Mit diesen kann man sich dann verbinden. Es genügt im Prinzip einen anderen Teilnehmer zu kennen um ins Netzwerk zu geraten, es ist also kein zentraler Server nötig und im Prinzip ist jeder selber Server. Zu Entstehungszeiten des Netzes war es so, dass absolut jeder Teilnehmer im Netz gleichberechtigt war. Bei Suchanfragen wurde bei allen bekannten Nachbarn angefragt, die die Anfrage dann wiederum an ihre Nachbarn weiter gaben. Das ganze ging bis in die 7. Ebene. Die Frage wurde also rekursiv weiter gegeben und die Antwort entsprechend über alle Zwischenstellen wieder zurück zum Fragesteller. Auf diese Weise können bei einer Suchanfrage schon mal durchaus 70 MB Traffic verursacht werden - was das Netz natürlich sehr belastete. Vor allem zu Beginn war es möglich mit zu allgemeinen Suchanfragen, wie beispielsweise die Suche nach "mp3", das ganze System sehr stark belasten, da die Trefferzahl natürlich sehr hoch war. Später begann man dann durch Sperren bestimmter Begriffe oder Beschränkung der Ergebnisanzahl solche Probleme zu beheben. Inzwischen haben sich ein paar Dinge geändert und es wurden so genannte "Supernodes" eingefügt, die die Suchanfragen übernehmen. User mit höherer Bandbreite sind also Ankerpunkte im Netz - diese sind dezentral mit anderen Nodes verbunden, wobei die "normalen User" zentral mit einem Node verbunden sind. Die Suchanfrage wird also an den Node gestellt, der diese dann wie oben zwischen allen Clients beschrieben an andere Nodes weiter gibt. Dabei ist die Anfrage um den Traffic zu beschränken auf 256 Bytes beschränkt. Des Weiteren gibt es im Netz eine Zeitgrenze nach deren Überschreitung Fragen automatisch fallen gelassen werden und Nodes haben die Möglichkeit doppelte Anfragen auszusortieren und ebenfalls fallen zu lassen. Wenn die Frage normal beantwortet wird enthält die Antwort dann eine IP Adresse und den Port mit deren Hilfe dann die Dateien über das normale HTMLProtokoll herunter geladen werden können. Das Gnutella Netzwerk ist sehr groß und auch sehr bekannt, was man unter anderem an der Anzahl der Clients sehen kann. Da gibt es beispielsweise BearShare und LimeWire - wohl die beiden bekanntesten Clients. Aber auch andere Programme wie Shareaza, Gnucleus, oder XoloX greifen auf das Gnutella Netzwerk zu. Ein weiterer Client ist auch Morpheus der allerdings als Fasttrack Client bekannter wurde und später aus rechtlichen Gründen auf das Gnutella Netzwerk wechselte. 17 Web Publishing Filesharing Die Oberfläche von BearShare Clients Shareaza: http://www.shareaza.com Gnucleus. http://www.gnucleus.com/ LimeWire: http://www.limewire.com/ BearShare: http://www.bearshare.com/ Morpheus: http://www.morpheus.com/ XoloX: http://www.xolox.nl/ 18 WS 03/04 Web Publishing Filesharing WS 03/04 5.3. Fasttrack Am gleichen Tag an dem Napster die einstweilige Verfügung aufgebrummt bekam, gaben Niklas Zennström und Janus Fries in Amsterdam den Start eines neuen Filesharing-Tools bekannt: Kazaa. Eigentlich als Demo-Programm für die Netzwerk-Technologie Fasttrack angelegt, bot Kazaa im Vergleich zu Napster und Gnutella einige Vorteile. Basierend auf zwei Netzwerkebenen bot es die Stabilität von zentralen Indexservern und die Unangreifbarkeit der Dezentralität von Gnutella. Der User baut dabei eine Verbindung zu so genannten Supernodes (Rechner mit starken Netzanbindungen z.B. in Universitäten und Firmen) auf, der wiederum mit anderen Supernodes kommuniziert, so dass die Suche selber auf der zweiten Netzwerkebene abläuft. Der Datenaustausch erfolgt dann weiter über Peer to PeerVerbindungen, so dass die Supernodes (sollten sie nicht selber Anbieter der Datei sein) weiter nichts mit dem Tausch zu tun haben. Dadurch, dass jeder Rechner theoretisch ein Supernode werden kann, ist das Schließen des Netzes wie bei Napster nicht möglich. Wird ein Supernode identifiziert und geschlossen, gibt es immer wieder einen Neuen der an seine Stelle treten kann. Nur mit der Schließung des Internets könnte man dieses Netzwerk aufhalten. Als Napster endgültig die Tore schloss, erhielt das Fasttrack Netz, ähnlich wie Audiogalaxy, einen starken Userzuwachs. Jedoch benutzen die meisten amerikanischen User Morpheus, den Client von musiccity.com die sich eine Fasttrack-Lizenz erworben hatte. Kazaa und Morpheus boten beide eine selbsterklärende Oberfläche und ermöglichten neben Musik auch die Suche nach jedem beliebigem anderem Dateiformat, so dass Ebooks, Programme und sogar Hollywoodfilme kinderleicht für jedermann im Netz verfügbar wurden. Fasttrack unterstützt Hashing, Resuming, Auto-resuming und Swarming, so dass auch große Dateien für Breitbandnutzer in akzeptabler Zeit verfügbar sind. Da Zennström und Fries aber mehr am wirtschaftlichen Konzept des Fasttrack-Netzwerks interessiert waren, verkauften sie es im Januar 2002 an Sharman Networks, eine australische Firma. Kurz darauf gab es Änderungen im Netzwerk-Protokoll, das alle anderen Clients außer Kazaa aus dem Netz verbannte. Selbst Morpheus, bis dahin offizieller Nutzer des Netzes, wurde nach einigen Lizenzstreitigkeiten aus dem Netz verbannt und wechselte zu Gnutella über. Da viele User nicht auf die Annehmlichkeiten von Kazaa verzichten wollten, wechselten sie somit auf den Kazaa Media Desktop(KMD). Leider wurde schnell bekannt, dass Sharmann Networks in diesem Client eine Unzahl an Ad- und Spyware eingebaut hatte, was zu Usereinbrüchen führte, da viele User um ihre Anonymität fürchteten. Diese Entwicklung, Ad- und Spyware in Filesharing-Tools einzubinden, erfreute sich immer mehr der Beliebtheit semi-kommerzieller Betreiber solcher Software. Jedoch sorgte ein OpenSource-Projekt schnell Abhilfe. Kazaa Lite (heute K++) nutzte das gleiche Protokoll wie der KMD und bot die gleiche und teilweise bessere Leistung ganz ohne Ad- und Spyware. Jeder Versuch von Seiten Sharman Networks K++ zu übertreffen, scheiterte an der schnellen Aktualisierungsleistung der OpenSource-Gemeinschaft. Beispiel: In Kazaa wurde ein Creditsystem eingeführt das Uploader belohnen sollte und bei hoher Punktzahl einen besseren Download garantierte. K++ reagierte darauf und baute eine Option ein, die es ermöglichte den Creditwert aufs Maximum zu stellen, so dass letztendlich alles wieder beim Alten war. 19 Web Publishing Filesharing WS 03/04 Links: Kazaa: http://www.kazza.com Kazaa Lite: http://www.mp3-world.net Die Such-Oberfläche von K++ UPDATE: Seit einigen Tagen hat Sharman Networks es geschafft K++ aus dem Netz zu treiben. Per Gerichtsbeschluss darf K++ nirgends mehr verlinkt werden und die Homepage ist auch geschlossen worden. Zudem soll es mit der englischen Version nicht mehr möglich sein sich zu Supernodes zu verbinden, was wir leider nicht ganz nachvollziehen können, weil der deutsche Client weiterhin problemlos ins Fasttrack-Netz kommt. 20 Web Publishing Filesharing WS 03/04 6. Mehr als Musik Mit wachsenden Dateigrößen und wachsendem Down- und Uploadvolumen entstanden auch neue Netzwerke, die sich speziell auf große Dateien spezialisiert haben. Die beiden Größten werden wir hier vorstellen. 6.1. eDonkey2000 Eins der größten Netze für "große Datenmengen" ist das eDonkey2000 Netz, erfunden von Jed McCaleb. Dieses Filesharingsystem basiert auf dem Multisource File Transfer Protokoll (MFTP) über das alle Dateitypen getauscht werden können. Die Netzstruktur ist getrennt und bildet einen Mittelweg zwischen Gnutella und Napster, es gibt Indexserver und Clients. Anders als bei Napster stehen die Server allerdings nicht alle in einer "Firma", sondern jeder ist in der Lage mit dem zugänglichen Servertool seinen eigenen Rechner als eDonkey2000 Server ins Netz zu stellen. Mit der Client-Software kann man sich dann auf so einem Server anmelden und die Suchanfragen an diesen richten. Ähnlich wie bei Gnutella leiten die Server die Suchanfragen an die ihnen bekannten Server weiter, so dass ein relativ großer Teil des Netzes mit einer Suchanfrage abgedeckt wird. Die Resultate werden dem Client direkt (Serverresultate) oder entsprechend der Suchanfrage (global) zurückgeliefert. Entscheidet sich ein User für einen Download, übernimmt er die gefundenen Quellen (Anbieter, IPs) in den Transfer, und der Client nimmt direkt Kontakt mit den entsprechenden Rechnern auf, so dass der Server ab diesem Zeitpunkt nichts mehr mit dem Filesharing zu tun hat. Die Such-Oberfläche bei eMule 21 Web Publishing Filesharing WS 03/04 Die Anfrage wird von den Anbieterclients in eine Warteliste gesteckt, die den Download koordiniert. Abhängig von der vorhandenen Bandbreite können mehrere User gleichzeitig mit Daten bedient werden, alle anderen erhalten einen Platz in der Warteliste. Ist diese voll, muss der Suchende beim nächsten Kontaktversuch Glück haben, dass gerade ein Platz frei wird. Somit ähnelt die Netzstruktur Kazaa am ehesten, die auch den Mittelweg zwischen Napster und Gnutella wählten, sich aber durch die Trennung von Server und Clientsoftware doch deutlich davon unterscheidet. Die Netzstruktur ist auch nicht so angreifbar wie die von Kazaa, da dort ja immer erst zu den festen Supernodes verbunden und von da dann an einen in der Nähe befindlichen weitergegeben wird. Nachteil des Ganzen ist die Hardwarebelastung bei der Serverbereitstellung. Diese war anfangs sehr groß, so dass es nicht viele große Server gab, die viele User und Dateien boten. Waren früher Server mit 1.000 Usern oder 10.000 (als Highlight) sehr groß, sind heute Server unter 100.000 Usern schon fast nicht mehr interessant. (Die Topserver liegen bei 200.000-300.000 Usern). Diesen enormen Zuwachs konnte das Netz nur leisten, da sich ein OpenSource-Team an dem Serverprotokoll zu schaffen gemacht hat und auch die Hardware der Serverrechner immer besser wurde. Da durch die Verbreitung von eDonkey mehrere Admins größerer Firmen anfingen, ungenutzte Kapazitäten für das eDonkey Netz zur Verfügung zu stellen, laufen heute viele große Server "heimlich" in den "Kellern" für das eDonkey-Netz. Kleines Beispiel: Einer der besten Server, Silent-Bob, stand angeblich im "Keller" von Mobilcom, ist leider Mitte letzten Jahres vom Netz gegangen, weil der Server schließlich doch noch zu Firmenzwecken genutzt wurde. (Wurde bei heise.de erwähnt: Link) Der Verlust wurde aber anders als einige erwartet problemlos aufgefangen. Die eDonkey2000 Netzstruktur Man muss dazusagen, dass eDonkey ein eher europäisches Netz ist. Die großen Server stehen alle irgendwo in Europa, nur vereinzelt findet man nicht-europäische Server in den Serverlisten der verschiedenen Seiten. Mit dem Stichwort Serverlisten sind wir beim wohl größten Manko des eDonkey-Netzwerkes. Ohne eine aktuelle Serverliste ist der User aufgeschmissen. In der Serverliste ist eine Anzahl von Servern mit IPs enthalten die aktiv sind, so dass der Client sich verbinden kann. Fehlt diese Serverliste oder ist diese veraltet, kann der User nicht ins Netz und muss sich erst eine Serverliste besorgen. Was zwar durch die 22 Web Publishing Filesharing WS 03/04 Vielzahl der Angebote im Netz (einfach mal server.met googeln) ein Leichtes ist, aber doch die Flexibilität etwas einschränkt. Die Serverliste Kleine Zwischenbilanz: eDonkey • • • • • • • • • ist unabhängig von einem zentralen Server Client und Server stehen getrennt zur Verfügung sowohl der Client als auch der Server unterstützen dynamische Ports, so dass ein Portblock keinen langfristigen Einfluss auf das Netz haben muss die Suche erfolgt über (fast) alle User die im Netz sind (über den Server hinaus) es werden beliebige Dateitypen unterstützt Dateien erhalten eine eindeutige ID (Hash), die es ermöglicht auch nach einem Neustart des Clients den Download weiter fortzusetzen es gibt eine Datei-Sammelfunktion (Collection) die es erlaubt Dateien zu Gruppen zusammenzufassen es wird Swarming durch das MFT unterstützt die fragmentarischen Dateien stehen anderen Usern automatisch zum Download zur Verfügung (Dateien im Download werden automatisch "geteilt" und es gibt auch keine Möglichkeit dies abzustellen) 23 Web Publishing Filesharing WS 03/04 6.2. Weiterentwicklung von eDonkey2000 Der von Jed McCaleb entwickelte eDonkey2000 Client wird heute aber kaum noch verwendet, denn "am Morgen des 13. Mai 2002 war Merkur (Nick eines der Entwickler von eMule) mit dem originalen eDonkey2000-Client unzufrieden und war überzeugt, es besser machen zu können." (Zitat: http://emule-project.net/ ) Er suchte sich ein paar Freunde und rief das eMule-Project ins Leben. Der neue Client eMule bietet eine Fülle von Funktionen, die der eDonkey Client nicht bietet oder nur beschränkt zur Verfügung stellt. Eine Liste einiger der Besonderheiten von eMule (Quelle: http://emule-project.net/): • • • • • • • • • • • • • • Clients nutzen mehrere Netzwerke, um ein zuverlässiges Netzwerk zu aufzubauen(ED2K, Quellenaustausch, Kad) Kad ist noch im Alpha-Stadium - ein Testclient steht zum Download bereit Die Warteschlange und das Credit-System helfen dabei, dass jeder die gewünschte Datei herunterladen kann, indem jene belohnt werden, die dem Netzwerk etwas zurückgeben. eMule ist absolut kostenlos. eMule ist auch komplett frei von Adware, Spyware,... Wir tun was wir tun zum Vergnügen und für Erfahrungen, nicht für Geld. Jede Datei wird während des Ladens auf Fehler geprüft, um die Korrektheit der Dateien sicherzustellen. Die "Intelligente Fehlerkorrektur" von eMule findet fehlerhafte Dateisegmente mit einer Genauigkeit von wenigen Kilobytes. Dies spart Zeit und Bandbreite, bei der Reparatur. Auto-Prioritäten und Quellenmanagement erlauben es viele Dateien herunterzuladen, ohne dies andauernd zu überwachen. Mit der Vorschau Funktion kannst du dir Videos und Archive anschauen, bevor sie ganz heruntergeladen sind. Für Videovorschauen empfehlen wir den VideoLAN Client. eMule unterstützt so genannte Web-Services, mit denen du schnellen Zugriff zu andere Web-Seiten hast. Du kannst Kategorien für deine Downloads erstellen, um diese komfortabel zu organisieren. Um die Datei zu finden, die du suchst, bietet eMule mehrere Möglichkeiten: Serversuche (lokal, und global), web-basiert (Jigle und Filedonkey) sowie Kademliabasierte Suche (noch im Test). eMule erlaubt weiterhin sehr komplexe boolesche Suchanfragen, was die Suche sehr flexibel hält. Mit dem Nachrichten und Freundessystem kannst du Nachrichten zu anderen Clients schicken und sie als Freunde hinzufügen. In deiner Freundeliste kannst du immer sehen, wenn ein Freund online ist. Mit dem eingebauten IRC-Client kannst du mit anderen Downloadern auf der ganzen Welt chatten. 24 Web Publishing Filesharing WS 03/04 Ein Download mit Quellenherkunft Hinzu kommt, dass eMule • • • • ohne Installation auskommt ein schlichtes, kompaktes, intuitives User Interface hat ed2k-Links* unterstützt werden (wird im eDonkey jetzt seit neustem auch) (als wohl wichtigster Punkt) einen automatischen server.met-Import bietet *ed2k Links sind im Internet verfügbare Links, die Datei-Informationen zum Download beinhalten und durch Anklicken den Download automatisch in eMule integrieren. Beispiel: (Eselfilme) All diese Vorteile haben eMule zum erfolgreichsten Client gemacht und so findet man heute zu 98% eMule-Clients im eDonkey2000-Netz. Auch die Kombination von eDonkey2000 und Overnet hatte die User nicht zu einem Wechsel bewegt. Jetzt mit der noch im Alpha-Test befindlichen serverlosen Variante Kademlia wird ein Wechsel weit in die Ferne gerückt sein. Wenn man also ins eDonkey Netz reinsehen möchte, sollte man sich auf jeden Fall für den eMule-Client entscheiden, da dieser leichter zu handhaben ist. Links: www.edonkey2000.com - offizielle eDonkey2000 Homepage www.emule-project.net - offizielle eMule Homepage 25 Web Publishing Filesharing WS 03/04 6.3. Bittorrent Im Vergleich zu vielen anderen Filesharing-Systemen ist das Bittorrentsystem kein großes zusammenhängendes Gesamtsystem. Es geht dabei mehr um eine Technologie bzw. Software um einzelne Dateien oder auch Dateiengruppen als Einheiten zu "sharen". Man geht also weniger davon aus, dass man ein großes System hat in dem 1000 Leute mit 1000 Leuten 1000 mp3s tauschen wollen die alle nichts miteinander zu tun haben, sondern die Grundidee ist vielmehr, dass es Dateien oder einen Verbund von Dateien gibt und alle Beteiligten an dem gesamten Inhalt interessiert sind. Dabei gibt es einen Tracker und Torrentfiles. Mit Hilfe der TorrentFiles und der BitTorrent Software kann man die Verbindung zu einem Tracker herstellen der dann den Kontakt zu anderen Rechnern im Netzwerk aufbaut, bzw. die IP’s der Rechner zurückgibt damit man selbst die Verbindung herstellen kann. Zuvor wird jedoch noch der gesamte, für die Datei nötige, Platz auf der Festplatte reserviert. Die Datei wird in Teile eingeteilt (Stichwort swamming) so dass von mehreren Quellen gleichzeitig geladen werden kann. Die TorrentFiles sind normal nur wenige kb groß und können z.B. auf Webseiten herunter geladen werden. Mit dem System werden Verbindungen zu mehrere Rechnern hergestellt - sowohl zum Down- als auch zum Upload. Der Vorteil zum einfachen verschicken ist, dass die Last von einem Server genommen wird und der Upload aller Teilnehmern genutzt werden kann. Des weitern kann man sich sicher sein, dass man auch nur diese Datei hoch lädt und keine anderen Dateien getauscht werden. In dem Moment in dem man das Programm schließt wird der Upload direkt beendet. Lädt man später eine anderen Datei so bekommt dann auch nur diese den vollen Upload. Das System ist also besonders geeignet für neue Dateien, die über einen kurzen Zeitraum verteilt werden sollen. Zentrales "normales" Serversystem. Quelle: http://bitconjurer.org/ Bittorrent System Das System macht es der Industrie zum einen einfacher, illegales Verteilen zu Verhindern, da sie nur die Torrent Files vom Markt schaffen müssen. Es reicht also, ein paar Webseiten, die Torrent Files verteilen, zu schließen, man muss nicht gleich die ganze Torrent Software verbieten (was auch schwer möglich ist, weil sie ja durchaus auch für legale Dinge genutzt werden kann). Auf der anderen Seite ist es für sie aber so auch schwerer, größere Quellen zu 26 Web Publishing Filesharing WS 03/04 finden, weil man nicht mehr über eine zentrale Stelle an "die Täter" herankommt. Es ist aber nicht so, dass der Torrent nur für rechtlich fragliche Zwecke eingesetzt wird. So wird das System auch zum Verteilen von freier Software (beispielsweise freie Linux Distributionen) benutzt. Links: http://bitconjurer.org/BitTorrent/ - offizielle Homepage http://bt.degreez.net/ - "experimental client" mit erweiterten Funktionen 27 Web Publishing Filesharing WS 03/04 7. Kostenpflichtige Programme Da die Musikindustrie mit starken Verlusten in den letzten Jahren zu kämpfen hat und dies unter anderem auf Filesharing und die Möglichkeit sich Musik direkt aus dem Netz zu laden zurückführt, hat sie sich entschlossen "auf diesen Zug aufzuspringen". So gibt es neuerdings Programme bei denen man kostenpflichtig Musik herunterladen kann und diese dann legal erworben hat. In Deutschland gibt es bisher so ein System noch nicht, daher werden wir 2 amerikanische Systeme vorstellen und kurz auf ein zurzeit für den deutschen Markt geplantes eingehen. 7.1. Napster 2 Wieder auferstanden ist Napster. Allerdings scheint Name und Design so ziemlich das einzige zu sein, was geblieben ist. Napster 2 ist eines der ersten online Programme bei denen man für Bezahlung legal Lieder erwerben kann. Napster hat Verträge mit den 5 größten Plattenfirmen und noch hunderte kleinerer und hat laut Homepage "über 500.000 Tracks mit einer Spannweite über alle Genres von Eminem bis Miles Davis" im Angebot. Im online Katalog hat man die Möglichkeit sich 30 Sekunden der Lieder direkt anzuhören. Möchte man ein Lied kaufen (wozu man allerdings die Premium Version benötigt) muss man 0,99$ investieren. Ein Album kostet 9,95$. Zusätzlich fällt bei der Premium Version, noch eine Grundgebühr von 9,95$ pro Monat an. Eine Brennfunktion ist direkt in das Programm integriert. Des Weiteren gibt es noch Features wie detaillierte Informationen zu Künstlern und Liedern einen Playlisteditor, eine Umfangreiche Suchfunktion (mit Genre, Artist, Titel und Beliebtheit), sowie Informationen über 40 Jahre US Charts und ähnliches. Napster setzt auf Microsofts Audio-Codec Windows Media Audio. Streams erfolgen - je nach Internetverbindung - zwischen 32 und 96 kBit/s. Die herunter geladene Musik landet in einer Qualität von 128 kBit/s auf der Festplatte, wobei Napster allerdings auf kodierte Altbestände zurückgreift: Neben dem aktuellen WMA-Codec in der Version 9 finden sich auch Titel, die mit überholten Versionen (v8 und v7) enkodiert wurden. Bisher steht der bezahlte Dienst nur für US User zur Verfügung. Wann Napster in Europa starten soll ist noch nicht bekannt. 28 Web Publishing Filesharing WS 03/04 Die Oberfläche von Napster 2 Link: http://www.napster.com 7.2. iTunes Music Store Eine weitere, Napster recht ähnliche, Software gibt es von den Apple Machern, den iTunes Music Store. Der Unterscheid in der Handhabung und Steuerung ist sehr gering. Das Angebot ist zwar - trotz einer großen Auswahl an Audiobooks (die Napster nicht hat) - etwas kleiner als beim Konkurrenten (laut Angaben 400.000 statt 500.000 Titel Mitte November), dafür ist es aber erfolgreicher. So gab Apple Anfang November den Verkauf von 1,5 Millionen Songs bekannt, und zwar für den Zeitraum in dem Konkurrent Napster, kurz nach dessen Start, nur 300.000 Titel verkauft habe. Der allgemeine Erfolg der Apple Software hatte die Macher bereits einen Monat zuvor veranlasste auch eine Windows Version auf den Markt zu bringen. Um die Marktführung weiter auszubauen schloss das Unternehmen einen Vertrag mit AOL, der den AOL Usern einen schnelleren Zugriff zu iTunes ermöglicht und auf der anderen Seite stellt Apple AOL Musik Events direkt über iTunes bereit. Wie mittlerweile bekannt wurde ist es einem norwegischen Hacker angeblich gelungen den iTunes Kopierschutz zu umgehen. Dabei soll Quicktime so gepatcht werden, dass es anschließend die von Quicktime für die Wiedergabe entschlüsselten Musik-Daten "abfangen" und speichern kann. 29 Web Publishing Filesharing WS 03/04 Wie Apple Manager Eddy Cue mitte Januar mitteilte, soll der iTunes Musik Store im Laufe dieses Jahres auch in Europa starten. Genaueres ist allerdings nicht bekannt. Die Oberfläche des iTunes Music Stores Link: http://www.itunes.com 7.3. Phonoline Der Start der deutschen Musikbörse wurde seit August 2003 schon mehrfach verschoben. Im Moment wird das erste Quartal 2004 als Starttermin angepeilt. Grund der Verzögerung ist laut Fokus ein Streit zwischen der GEMA und den Anbietern. PhonoLine wird als so genannter White-Label-Dienst beliebigen Webanbietern ermöglichen, einen eigenen Online-Shop zum Musikdownload aufzusetzen, soll also gewissermaßen eine Verbindung verschiedener Shops sein. Es wird mit Hilfe der Deutsche-Telekom-Tochter TCom aufgebaut und ein Vertrag mit der Einzelhandelsfirma Saturn als Anbieter ist auch schon sicher. Weiter gibt es Gerüchte über die Teilnahme von Bild, RTL und VIVA. Phonoline soll dabei allerdings gegen eine Grundgebühr nur die technische Grundlage für die Geschäfte bieten, um die lizenzrechtlichen Verträge müssen sich hingegen die Anbieten selber kümmern. Dabei soll die Bitrate nicht fest, sondern von derzeit 128 kBit/s beliebig hochsetzbar sein. Hier soll es auch (im Gegensatz zu Napster) noch eine Mac und Linux Version geben. Update: Wie verschieden Internet Seiten berichten wird sich der Start der Tauschbörse, nachdem er nun für die CeBit dieses Jahres angekündigt war, noch weiter verschieben. News link: http://www.heise.de/newsticker/meldung/43846 30 Web Publishing Filesharing WS 03/04 8. Gegenwart und Zukunft Wie deutlich geworden sein sollte, umfasst das Thema Filesharing heute einen riesigen Bereich, der nur schwer im Rahmen eines solchen Seminars darzustellen ist. Wir haben uns für einige Teilgebiete und bekannte Netze entschieden und wollen in diesem Kapitel einfach noch ein paar andere Clients kurz vorstellen. Des Weiteren wollen wir kurze Ausblicke auf zukünftige Trends bieten und laienhaft auf die doch schwer zu durchschauende Rechtslage eingehen. 8.1. Zukunftstrends Durch die immer stärkeren Bemühungen, diverser Musikverbände, Tauschbörsen zu schließen, sehen sich viele Entwickler gezwungen neuen Techniken zu entwickeln, die die Identität der User verschleiern und Anonymität groß schreiben. Denn das Motto lautet: "Wenn man nichts über den User weiß, kann man ihn auch nicht verklagen." Allerdings wird dies sehr schwer werden, da immer irgendwie eine Verbindung zwischen den Usern entstehen und so zumindest die IP bekannt gegeben werden muss. Andere sehen darin vorerst kein Problem und halten eher die Kopplung mehrer Netze in einem Client für erstrebenswert, so genannte Hybrid-Tools: Auffälligstes Projekt dazu ist wohl der Eetee Client der sowohl Fasttrack, OpenNap, Gnutella als auch eDonkey und Bittorrent unterstützt. Allerdings ist von dem Client abzuraten, da momentan nicht ganz klar ist, wer hinter dem Projekt steckt. http://www.eetee.com/ - offizielle Homepage Als letztes sind hier dann noch die serverlosen Netze zu nennen: Overnet und Kademlia, bei denen versucht wird auf die Server zu verzichten und ähnlich wie bei Gnutella alles serverlos zu gestallten, allerdings mit wesentlich weniger Traffic. Mehr zu den beiden Netzen gibt es hier Overnet und hier Kademlia 31 Web Publishing Filesharing WS 03/04 8.2. Andere Clients und Netze Natürlich gibt es noch mehr als die hier vorgestellten Netze. Ein paar ausgewählte, beliebte, besondere oder auch zukunftsweisende wollen wir hier kurz vorstellen. 8.2.1. Direct Connect Ein weiteres, bei vielen Filesharing-Nutzern sehr beliebtes Netz, ist das Direkt ConnectNetzwerk. Mit 1 Petabyte (1000 Terabyte) Datenmenge ist es eines der größten, wenn nicht sogar das größte Netz. Allerdings sind nicht alle Daten auf einen Schlag zu erhalten, sondern es gibt einzelne Server, so genannte Hubs, bei denen sich der User anmeldet. Dabei haben die Hubs oft besondere Themen, wie speziell Musik einer bestimmten Stielrichtung oder Filme und fordern außerdem eine bestimmte zu teilende Datenmenge - hat man weniger als diese kommt man nicht auf den Hub. Dies führt dazu, dass dieses Netz für Nutzer die keine großen Datenmengen auf ihrer Festplatte haben kaum zu verwenden ist und so großteils von Usern mit Breitband Anbindung verwendet wird. Hat man die geforderte Datenmenge freigegeben kann man sich in der Regel recht schnell mit dem Hub verbinden, der zunächst eine Art Chat ist. Dort gibt es auch eine Liste von Usern bei denen man direkt Listen ihrer Dateien anfordern kann, oder man nutzt die Suchfunktion um den Hub nach Dateien zu durchsuchen. Zwar ist auto-resuming möglich, swarming wird hingegen nicht unterstützt. Trotz dieser technischen Rückständigkeit erreicht man bei Direct Connect in vielen Fällen deutlich höhere Geschwindigkeiten als bei anderen Netzen und durch die Thementrennung ist auch die Dateienvielfalt sehr hoch. Link: http://www.neo-modus.com/ - offizielle Homepage http://dcplusplus.sourceforge.net/ - alternativer Client mit erweiterten Optionen 32 Web Publishing Filesharing WS 03/04 Die Oberfläche von DC++ 8.2.2. Overnet Overnet wurde zuerst unter dem Namen Flock bekannt. Die Tauschbörse stammt vom gleichen Entwickler, der auch schon eDonkey entwickelte, von Jed McCaleb. Overnet ist deshalb auch ähnlich aufgebaut mit der Ausnahme, dass von dem zentralen Serversystem hin zu einem dezentralen System gewechselt wurde. Overnet ist übersichtlich strukturiert und der Benutzer findet sich relativ schnell mit der Tauschbörse zurecht. Es gibt viele unterschiedliche Einstellungsmöglichkeiten von verschiedenen Skins bis zu Netzwerkeinstellungen. Des Weiteren unterstützt Overnet sowohl multiple sources als auch resuming. Die Suche von Overnet läuft über verschiedene "Hash-Tabellen" ab, wodurch das Netzwerk weniger belastet und auch die Downloadgeschwindigkeit dadurch weniger beeinträchtigt wird. Die Suchanfrage von Overnet ist extrem schnell und es werden zumeist auch sehr viele Suchergebnisse aufgelistet. Link: www.overnet.com - offizielle Homepage 33 Web Publishing Filesharing WS 03/04 8.2.3. Kademlia Kademlia ist der logische Schritt der eMule Evolution. eMule soll wie Overnet losgelöst von Servern arbeiten können. Im Moment befindet sich der eMule Kademlia Client in der Testphase und ist in den üblichen Client integriert. Dafür sprechen eine Entlastung der Server, die langsam immer mehr belastet werden durch die wachsenden Userzahlen, was bis jetzt nur durch neue Serverprotokolle erreicht werden konnte. Zudem macht es das Ganze noch angriffsresistenter, denn selbst wenn eine ganze Reihe von Nodes gefloodet werden, hat das für das Netz selbst keine allzu großen Auswirkungen. Mit der Zeit strickt sich das Netz dann um diese "Löcher" herum neu und das Problem ist gelöst. Diese Fähigkeiten verdankt Kademlia dem gleichnamigen Algorithmus, der speziell zum Aufbau eines dezentralen P2P-Netzwerkes erdacht wurde. Die Struktur bilden so genannte Nodes, deren Aufbau und Kommunikation zugleich vom Algorithmus koordiniert werden. Grundlage von Kademlia sind das Internet Protocol und das darauf aufbauende, zustandslose UDP Protocol. Über einem bestehenden LAN/WAN wird ein neues, virtuelles Netzwerk aufgebaut, in dem jeder Node durch eine eindeutige Nummer ("Node-ID") identifiziert wird. Die ID dient sowohl zur Identifizierung, als auch für die weitere Kommunikation und Suche im Netz. Diese ID wird in dem so genannten "Bootstrapping" Verfahren ermittelt, und beruht auf der Kombination einer IP eines im Netz befindlichen Nodes und Zufallsgenerierung. Da es keine zentrale Instanz gibt, die einen Index der vorhandenen Dateien bereitstellt, wird diese Aufgabe auf alle Clients gleichermaßen aufgeteilt: Ein Node, der eine Datei besitzt, errechnet zuerst eine eindeutige, und immer gleich lange Bitsequenz (Hash). Die Länge der im Netz verwendeten Hashes und der Node-IDs muss gleich lang sein. Er sucht nun im Netz die Nodes, deren ID (in Bits gerechnet) die kleinste "Distanz" zum Hash aufweisen, und übermittelt ihnen seine Kontaktdaten. Diese werden dann gespeichert und für eine Abfrage bereitgestellt. Sucht jetzt jemand die Datei, durchläuft er den gleichen Prozess und gelangt so relativ schnell an die nötigen Kontaktinformationen für den Download. Da das Netz üblicherweise in ständigem Wandel begriffen ist, werden die Kontaktdaten auf mehrere Nodes verteilt und von der Quelle alle paar Stunden aktualisiert. Durch Optimierung lässt sich die für das Protokoll benötigte Bandbreite auf relativ kleine Werte senken, der Quellentausch von eMule ist hier ein gutes Beispiel. Link: www.emule-project.net - offizielle Homepage 34 Web Publishing Filesharing WS 03/04 8.2.4. MP2P Die beiden gängigsten Clients für das dezentrale Manolito P2P Netzwerk sind Blubster und der Nachfolger Piolet. Diese recht junge Tauschbörse erfreut sich inzwischen einer Benutzeranzahl von rund 100000 Usern, bei denen insgesamt über 20 Millionen Lieder zu finden sind. Allerdings ist das Angebot auch auf diese begrenzt - hier gibt es nur mp3s. Multisource und autoresuming werden unterstütz, swarming leider nicht. Bei der Suche nach Dateien können nur Titel und Interpret angegeben werden, da sich diese Tauschbörse, wie oben erwähnt, auf das tauschen von mp3’s beschränkt. Suchanfragen werden jedoch schnell bearbeitet und liefern zügige Ergebnisse. Leider ist die Anzahl der Suchergebnisse im Vergleich zu größeren, älteren Netzen noch sehr beschränkt. Die größten Nachteile dieser jungen Tauschbörse sind somit klar die noch vergleichsweise niedrige Zahl an Usern und die Beschränkung der Dateiformate auf das mp3-Format. Eine Suche bei Blubster Link: http://www.piolet.com http://www.blubster.com 35 Web Publishing Filesharing WS 03/04 8.2.5. Soulseek Nach dem Ende von Audiogalaxy ist Soulseek wohl die beste Anlaufstelle für seltene Musikstücke. Allerdings ist man hier wieder zu den Napster-Ursprüngen zurückgekehrt. Es läuft über einen zentralen Indexserver und das Hauptangebot ist wieder MP3. Zwar ist der Download von anderen Dateien möglich, aber eher selten. Das Musikangebot betrifft eher den Nicht-Mainstream-Musik Bereich, man bekommt Mainstream auch, aber das Angebot ist hier eher gering im Vergleich zu anderen Börsen. Der Download ist nicht mit Kazaa oder ähnlichem vergleichbar, da Soulseek kein Swarming unterstützt und nur von einem User zieht, so dass eher niedrige Downloadraten erreicht werden. Was aber gegenüber den andern Clients leichter fällt ist die Möglichkeit einen ganzen Ordner in den Download zu schieben, so dass das komplette Album mit einem Klick in der Downloadliste ist und nicht jeder Song einzeln gesucht werden muss. Während man bei Kazaa noch einfach keine Dateien selbst zum Hochladen anbieten kann, funktioniert das bei Soulseek nicht so leicht. Man bekommt zwar genug Dateien über die File Suche, aber dies ist nicht der einzige Weg an Dateien zu kommen. Da viele Leute nur jemanden aus ihrer so genannten "Buddy-List" downloaden lassen, muss man selbst auch etwas bieten können, um für diese interessant zu werden. In den eingebauten Chats lassen sich schnell Bekanntschaften schließen und so kann das fröhliche Downloaden beginnen. Soulseek wird immer bekannter, was sowohl Vor- als auch Nachteile hat. Denn die Chats werden immer mehr von Mainstream-Usern überschwemmt, die das Netz auch mit vielen Nicht-Musikdateien bereichern, wodurch die Suche nach Musik erschwert wird. Link: http://www.slsknet.org - offizielle Homepage Die Oberfläche von Soulseek 36 Web Publishing Filesharing WS 03/04 8.3. Rechtslage Da dies ein Informatikseminar ist, bitten wir zu entschuldigen, dass wir nicht auf juristische Fachkenntnisse zurückgreifen können und nur bedingt gewährleisten, dass alles was hier folgt rechtlich Bestand hat. Zumal sich momentan an der Rechtslage in Deutschland ständig was ändert. Wir gehen hier nur auf ein paar entscheidenden Fragen zu unserem Thema ein. 1. Die Rechtslage im Fall Filesharing ist nicht eineindeutig. 2. Das Nutzen von Filesharing-Tools im Allgemeinen ist nicht illegal. 3. Der Austausch von Daten ist, so lange es sich um legales Material (der Anbieter ist selbst der oder besitzt die Berechtigung der Urheberrechtsinhabers) handelt ist alles erlaubt, sowohl Up- als auch Download. 4. Der Download ist eine Grauzone a. wenn die Quelle des Downloads offensichtlich rechtswidrig ist, ist er illegal. b. sonst ist er vorerst legal, und gilt als Privatkopie. c. Einschränkung: Eine Straftat liegt erst vor, wenn eine "gewerbliche" Verwendung danach folgt, oder das Material wieder zum Upload freigegeben wird. 5. Der Upload ist illegal, wenn es ich um urheberrechtliches Material handelt bei dem der Anbieter kein Urheberrecht besitzt, dabei handelt es sich um eine Straftat. Wer sich einen tieferen Einblick gönnen möchte dem empfehlen wir folgende Links: Neues UrhG -- Das neue Urhebergesetz mit hervorgehobenen Änderungen UrhG FAQ -- Ein kleines FAQ zum Urheberrecht für die Rechtslage in Deutschland und Österreich. In Deutschland wurde die letzte Änderung am 15.09.03 vorgenommen. Allerdings ging es dabei hauptsächlich um die Vervielfältigung der Daten und das Umgehen von Kopierschutzsystemen. In weiteren Gesprächen wurde angedacht, das Recht auf die Privatkopie gänzlich abgeschafft werden soll. In den USA verklagt die RIAA momentan mehre Tauschbörsenuser, hierbei werden aber nur Leute mit über 1000 Dateien im Angebot und Top100 Hits berücksichtig. UPDATE: Vor wenigen Tagen hat die RIAA eine zweite Klagewelle gestartet. Die europäischen Äquivalente zur RIAA planen seit längerem eine ähnliche Aktion, die aber an den unterschiedlichen Rechtlagen in den Ländern scheitert. 37 Web Publishing Filesharing WS 03/04 9. Exkurse Hier sind alle Themen kurz angerissen, die nicht direkt mit Filesharing zu tun haben, aber trotzdem in diesem Zusammenhang genannt werden sollten, um einen besseren Überblick über die Geschichte und Entwicklung des Filesharing zu vermitteln. 9.1. Exkursion: Audioformate Mp3 Was ist Mp3? Der MPEG 1 Layer 3 Codec wurde ursprünglich vom Fraunhofer Institut für Integrierte Schaltungen schon 1987 erfunden und war damals ein revolutionärer Komprimierungsalgorithmus. 1992 wurde dieser Teil des MPEG 1-Formats. Da es aber eine erstaunlich gute Qualität bei sehr kleinen Dateigrößen hatte, popularisierte es sich schnell als eigener Standart. Was machte mp3 so besonders? Mp3 ermöglichte es die normalen Wav-Dateien die man von einer CD kopieren konnte, auf ungefähr ein Zehntel ihrer Größe zu reduzieren. Dadurch wurde aus einem 3-minütigen Lied, das im Wav-Format ungefähr 30 MB einnahm eine handliche 3 MB große Datei mit ungefähr gleicher Qualität. Durch diesen Kompressionserfolg wurde auch für den normalen User das Tauschen von Musik im Netz interessanter, durch die eher geringen Datentransferraten waren Wav-Dateien schon aus Kostengründen nicht lukrativ. Vergleich: 30MB Wav-Datei vs. 3MB Mp3-Datei 14.4 ca. 277 min ca. 27.7 min 32.2 ca. 140 min ca. 14 min 56.6 ca. 100 min ca. 10 min Für den Endnutzer stellte mp3 also kürzere Downloadzeiten und dadurch weniger Kosten dar. Die wachsende Popularität führte auch zu Weiterentwicklungen, so dass heute fast nur noch der Lame-Encoder verwendet wird um mp3 zu erzeugen. Jedoch steht mp3 nicht alleine auf dem Audiokompressionsmarkt, so dass es heute eine Vielzahl von Alternativen gibt, die versuchen mp3 den Thron abzuringen. Die besten Kandidaten wollen wir hier kurz vorstellen: OggVorbis Was ist OggVorbis? Bei OGG Vorbis handelt es sich um ein Open Source Projekt, welches einen Audiocoder beinhaltet der von den Leistungen in Kompression und Qualität locker mit MP3 mithalten kann. Zur Entstehung von OGG Vorbis kam es, da es bei dem freien MP3Encoder immer noch zu patentrechtlichen Schwierigkeiten kommt. Bei OGG Vorbis dagegen werden keinerlei Patente verletzt. 38 Web Publishing Filesharing WS 03/04 Vorteile gegenüber mp3: Ogg Vorbis ist als so genanntes Containerformat auch sehr flexibel in der Handhabung. Das Format erzeugt keine lästigen Lücken bei Live-Alben, ist also "gapless". Durch seine Architektur ist es möglich, Veränderungen (zum Beispiel in der Lautstärke) vorzunehmen, ohne die Musikdaten umzuschreiben. Gleichzeitig besitzt es die erstaunliche Eigenschaft des "Bitrate peeling". Dieses Verfahren ermöglicht eine Veränderung in der Bitrate, ohne die Klangqualität zu verändern. Wenn Sie zum Beispiel eine große Ogg Vorbis-Datei für eine Versendung per Mail verkleinern wollen, müssen Sie, im Gegensatz zu MP3, die Datei nicht extra in das ursprüngliche Wav-Format zurückkodieren und dann erneut berechnen. Dieser verlustbehaftete Vorgang erübrigt sich bei Ogg Vorbis. Nachteil: OggVorbis stellt höhere Ansprüche an die Hardware als Mp3, so dass eine Portierung auf portable Systeme nur langsam voranschreitet. MP3pro Was ist MP3pro? MP3pro verbindet das etablierte MP3-Format mit neuen Technologien. Bei der Umwandlung von Musik-Dateien wird der "normale" Ton wie bei MP3 kodiert, allerdings mit ungefähr halbierter Bitrate. Eine 64 Kbit/s MP3pro-Datei sollte nach Angaben der Entwickler die Qualität einer 128 Kbit/s Datei erreichen. Durch die Verwendung der Spectral Band Replication-Technologie (SBR) bleibt in der errechneten Datei im Vergleich zu MP3 die volle Bandbreite erhalten. Die SBR-Technologie greift insbesondere bei hohen Frequenzen, während sich für die tieferen Frequenzen nach wie vor der MP3-Codec verantwortlich zeichnet. Von Vorteil ist sicherlich die Abwärtskompatibilität zu MP3. Eine MP3Pro-Datei lässt sich also mit jedem MP3-Player abspielen, auch mit solchen, die diesen Codec nicht an Bord haben. Allerdings ist der Klang dann schlechter als bei einem Player, der MP3pro bereits unterstützt. Nachteil: MP3pro ist kostenpflichtig. WMA Was ist WMA? WMA (= Windows Media Audio) war Microsofts Antwort auf MP3. Das Format sieht die Integration von Kopierschutzverfahren vor (Digital Rights Management DRM) und ist daher auch für die Musikindustrie interessant. Vorteile: Im Gegensatz zu MP3 ist das WMA-Format multimedial ausgelegt und beinhaltet neben dem Audio-Codec auch einen Video-Codec. Über einen Datencontainer können *.WMA, *.WMV und *.ASF-Dateien abgespeichert werden, die neben Musik oder Video auch Links zu Webseiten oder Dokumenten enthalten können. Nachteile: Die Tonqualität lässt zu wünschen übrig. Selbst bei 192 Kbit/s liegt die Klangqualität komprimierter Audio-Files weit hinter den Erwartungen zurück. Bei 64 Kbit klingen klassische Stücke verzerrt. Bei Musiktiteln aus dem Bereich Rock oder Pop ist die Qualität der von MP3 ungefähr ebenbürtig. 39 Web Publishing Filesharing WS 03/04 9.2. Exkursion: Videoformate Schnell, mit der Verbreitung von Breitbandanschlüssen, wuchsen auch im Bereich des Filesharing die Datenmengen, so dass nicht mehr nur noch Musik sondern auch ganze Filme zum Download bereitgestellt wurden. In diesem Zusammenhang wollen wir kurz auf verschiedene Videoformate eingehen und sie grob vergleichen. Mpeg2/4 Endung: mpeg/mpg Gilt als Videostandard. Der auf DVDs zu findene Mpeg2 Codec wird langsam vom besseren Mpeg4-Codec abgelöst, einen kleinen Vergleich bietet die folgende Tabelle: Quelle: Chip Online 40 Web Publishing Filesharing WS 03/04 DivX Endung: avi Aktuelle Version: DivX 5.11 und DivX ;-) 3.11 Alpha DivX liegt in zwei Varianten vor, einmal in der kommerziellen DivX 5.x Version und in der etwas älteren gehackten Version 3.11 Alpha, wobei letztere nicht mehr mit der aktuellen DivX 5.x Version mithalten kann. Die 5.11 Version ist neben der Xvid Version das Beste was es momentan in dem komprimierten Videoformatbereich gibt, er bietet sehr gute Bildqualität bei flottem Arbeitstempo. Links DivX : Xvid Endung: avi Aktuelle Version: 1.0.0 rc1 Xvid ist die open-source Variante von DivX. Der Unterschied bei den Beiden ist minimal, Xvid bietet bessere Qualität. Bei der Detailschärfe entstehen dafür schneller Artefakte bei Actionszenen oder Explosionen. Link: Xvid Apple Quicktime Endung: mov Aktuelle Version: Quicktime 6.5 Ab Quicktime 6 setzt Apple auf Mpeg4 auf, so dass Quicktime Filme schon jetzt den Mpeg4 Standard erfüllen. Die Bildqualität ist gut und die Encodierung läuft auch recht schnell. Allerdings ist dies nur mit kostenpflichtigen Programmen möglich. Links: Apple Quicktime RealVideo Endung: rm Aktuelle Version: RealVideo 9 Die Bildqualität von RealVideo 9 ist gut. Artefaktbildung wird dadurch reduziert, dass der Codec sich auf die wichtigen Objekte im Bildvordergrund konzentriert. Dafür sehen die Farbverläufe in Hintergründen so aus, als wäre ein Weichzeichner darüber gelegt. Gerade vor bewegtem Hintergrund wie etwa Rauch, gehen Details und Schärfe verloren. Das größte Manko dabei ist aber immer noch die Player-Festlegung. Ohne Real One Player ist eine rmDatei nicht abspielbar und eine Hardwareunterstützung ist auch nicht in Sicht. Links: Real Networks 41 Web Publishing Filesharing WS 03/04 WindowsMediaVideo Endung: wmv, asf Aktuelle Version: WindowsMedia 9 Der Microsoft Videostandard erreicht erstmals in der 9er Version akzeptable Qualität und nähert sich der DivX-Qualität an. Hier liegt das Manko eher an der aufwendigen Encodierung die sehr lange dauern kann, im Verhältnis zu anderen Codecs. Auch hier sind wie bei RealVideo die Schwäche in den ruhigen Phasen der Videos zu finden. Es kommt zu Flimmern und ähnlichen Detailverlusten. Die Actionsequenzen sind fast tadellos. Links: Microsoft 9.3. Exkurs: Grabben und Rippen Was ist Grabben? Unter Grabben versteht man eine analoge Kopie einer CD. Was ist Rippen? Unter Rippen versteht man die digitale Kopie einer CD. In dieser Exkursion werden Programme vorgestellt, die es einem ermöglichen, Sicherheitskopien seiner AudioCDs und DVDs zu erstellen, sowie eigene Musik bzw. Videodateien in ein entsprechendes Format zu konvertieren. Der Schwerpunkt liegt dabei auf der Videobearbeitung. 1. Teil: Die Audio-CD Zum Erstellen einer Sicherheitskopie einer Audio-CD gibt es eine Vielzahl von Grabbern und Rippern. Hier wollen wir kurz CDex vorstellen. CDex Aktuelle Version: CDex 1.5.1 CDex ist sehr Einsteiger-freundlich, da es eine intuitive Oberfläche hat und schnell konfiguriert ist. Zudem bietet es neben den bereits enthaltenen Lame und Ogg Vorbis Codecs die Möglichkeit zahlreiche externe Encoder zu unterstützt (AAC, Musepack, VQF, WMA, ACM-Codecs). Mit CDex können nicht nur Audio CDs konvertiert werden, sondern auch WAV Dateien, wobei CDex als Benutzeroberfläche für verschiedene Encoder fungiert. Somit ist es auch möglich via CDex eigene Audiodateien in ein akzeptables Format zu bringen und so weiterzugeben. Links: CDex-- offizielle Homepage 42 Web Publishing Filesharing WS 03/04 2. Teil: DVD/Video-CD Im 2. Teil wollen wir uns kurz mit dem Erstellen von DVD-Sicherheitskopien und eigenen Filmen beschäftigen. DVD-Sicherheitskopie Mit Hilfe von CloneDVD und einem DVD-Brenner kann ganz einfach eine Kopie erstellt werden. Da das Handbuch sehr gut ist, verweise ich an dieser Stelle nur auf die EntwicklerSeite von Elby. Link: Elby CloneDVD -- offizielle Homepage Für alle anderen bietet sich das kleine Programm DVDx von labDV an. Allerdings ist die kostenlose Version nicht mehr frei verfügbar, so dass wir jedem der sich nicht anmelden will empfehlen, es einfach mal zu googlen. Link: www.labdv.com -- offizielle Homepage Eine sehr gute Anleitung, wie man damit arbeitet, findet man unter diesem Link http://www.blafusel.de/dvd_rip.html Ich denke, das sollte an dieser Stelle reichen da eine detaillierte Beschreibung des Vorgehens den Rahmen der Ausarbeitung sprengen würde. Als Videocapture-Tools (Voraussetzung eine TV-Karte) bietet sich VirtualDub Aktuelle Version: VirtualDub 1.5.10 VirtualDub ist Freeware und ein Alleskönner, was Video-Captures und Videobearbeitung angeht. Es verarbeitet AVI-Dateien bis zu einer Größe von 4GB und kann Ton und Video getrennt verarbeiten und synchronisieren. Als Capture-Tool akzeptiert es anstandslos jede Auflösung die über die TV-Karte herein kommt und es bietet die Möglichkeit jeden Audio/Videocodec zur Echtzeit-Kompression zu benutzen. Link: www.virtualdub.org -- offizielle Homepage Damit kann man dann VHS, Filme, Serien etc. aufnehmen und speichern. Um diese als VCD oder SVCD zu brennen braucht man noch TMPGEnc Aktuelle Version: TMPGEnc 2.521 TMPGEnc ist Semi-Freeware, es gibt eine 30 Tage Begrenzung für den Mpeg2 Encoder. Es bietet einen großen Funktionsumfang, unterstützt viele Formate, liefert sehr gute VCDQualität und akzeptable S-VCD-Qualität. Ab der 2.50 Version hat es auch sehr an Encodierungsgeschwindigkeit zugelegt, so dass es heute zu den besten Bearbeitungsprogrammen überhaupt zählt. Link: www.tmpgenc.net -- offizielle Homepage 43 Web Publishing Filesharing WS 03/04 9.4. Exkursion: Audio/Video-Player Windows Winamp Aktuelle Version: Winamp 5 final Erfunden von Justin Frankel im April 1997. Dieses Programm wurde zu einer "KillerApplikation" wie Napster. In den nachfolgenden 18 Monaten wurde Winamp 15 Millionen mal herrunter geladen, was dazu führte das Frankel eine Firma gründete, Nullsoft (kleine Ahnlehnung an Microsoft), in der fortan ganze Teams an der Entwicklung von Winamp beteiligt waren. Im Sommer 1999 wurde Nullsoft für ca. 80 Millionen US$ von AOL gekauft. Richtig bekannt wurde Winamp ab der 2.x Version da hier schon mehre Audioformate, das Streaming, sowie Skins (wechselbare Oberflächen die selbst designt werden können) unterstützt wurden. Einen kleinen Rückschritt machte Winamp in der 3er Version die auf Druck von AOL Time Warner verfrüht und Mängelbehaftet veröffentlicht wurde. Erst mit Veröffentlichung der 5er Version gelang es wieder an den Erfolg von Winamp 2.x anzuschließen, so dass Winamp wohl auch weiterhin an der Spitze der Audioplayer bleiben wird. In der 5er Version unterstützt Winamp fast alle gängigen Audioformate und hat einen eigenen Videoplayer, so dass auch Videos abgespielt werden können. Links: www.winamp.de - offizielle Homepage Mpex.net - gute deutsche Seite mit deutschen FAQ und Sprachdatei WindowsMediaPlayer Aktuelle Version: WindowsMediaPlayer 9 Ist der Microsoft StandardPlayer der ab der aktuellen 9er Version auch "ernst" genommen werden kann. Auch wenn er noch viel Unmut bei vielen Internetusern verursacht, da hier doch sehr viel Sicherheitslücken zu stopfen sind und sehr schnell bei "Abweichungen" vom Standard der Player den Dienst verweigert. Links: WindowsMediaPlayer - offizielle Homepage ZoomPlayer Aktuelle Version: ZoomPlayer 3.3 Der ZoomPlayer stellt eine sehr gute Alternative zum WindowsMediaPlayer dar. Er überzeugt durch seine vielen Konfigurationmöglichkeiten und seine Felixibilität. Alleiniges Manko die DVD Abspielfunktion gibt es nur in der kostenpflichtigen Pro Version. Links: ZoomPlayer - offizielle Homepage 44 Web Publishing Filesharing WS 03/04 Linux: XMMS Aktuelle Version: XMMS 1.2.8 XMMS ist der Linux Clone von Winamp (unterstützt allerdings nichts von Winamp). Entwickelt von Mikael and Peter Alm, auf der Grundlage von Winamp. XMMS heißt X MultiMedia System und spielt mp3, mod, wav und (mit Plugins) weitere Audiodateien. Links: www.xmms.org - offizielle Homepage Xine Aktuelle Version: Xine 0.9.13 Xine ist ein VideoPlayer für Linux der CDs, DVDs und VCDs abspielt und MultimediaElemente wie avi, mov , wmv, mp3 und Streaming unterstützt. Links: xinehq.de - offizielle Homepage Selflinux: Xine - gute deutsche Anleitung Plattformunabhängig: RealOne Player Aktuelle Version: RealOne Player 2.0 Den RealOne-Player gibt es sowohl für Linux als auch für Windows, er bietet als einziger Unterstützung für RealMedia-Dateien. Natürlich werden zusätzlich AVI, MP3, MPEG, MOV, WAV und Quicktime unterstützt. Links: www.real.com - offizielle Homepage Quicktime Aktuelle Version: Quicktime Player 6.5 StandardPlayer von Apple für Mov-Dateien. In der neusten Version werde neben den gängigen Formaten noch Flash 5 und ACC Audio unterstützt. Links: www.apple.com/quicktime - offizielle Homepage 45 Web Publishing Filesharing WS 03/04 9.5 Exkursion: Ad- und Spyware Spyware Als Spyware bezeichnet man Programme, die meistens ohne das Wissen des Anwenders, Informationen über den PC und das Online-Verhalten an Dritte übermitteln. Als erstes Unternehmen setzte die Firma Aureate (später Radiate) die Spyware auf der Festplatte ein. Ziel der Software war es, Werbung in Programme auf dem PC zu integrieren (Adware). Die Empfänger der Informationen können die Gewohnheiten des Anwenders beim Surfen nachvollziehen und dadurch gezielt Werbung über Adware schalten. Einige SpywareProgramme werden aber auch selbst aktiv und versuchen, das Verhalten des Anwenders zu beeinflussen, indem sie Suchen auf vorgegebene Seiten umlenken Funktionen des Browsers veränden Bannerwerbung und Pop-ups auf Grund des Verhaltens in andere Programme einspielen Adware Als Adware bezeichnet man Programme, die es Dritten ermöglichen jede Art von Werbung (meistens Banner) auf dem Rechner des Anwenders darzustellen. Diese Werbebanner werden meistens durch die gesammelten Spyware-Informationen auf jeden Anwender abgestimmt. Schutz vor Ad- und Spyware Der beste Schutz vor Ad- und Spyware ist wohl das kostenlose Ad-aware von Lavasoft. Es untersucht die Laufwerke und Registrierung nach Spyware und präsentiert die Ergebnisse. Der Anwender kann die beanstandeten Programme löschen, wobei auf Wunsch ein Backup in einem isolierten Verzeichnis behalten wird, um bei Problemen dann diese wiederherzustellen. Im Allgemeinen werden die Spyware/Adware-Bestandteile aber entfernt, ohne die Funktionalität von Programmen zu beeinträchtigen. Ad-aware Plus ist ein preisgünstiges Upgrade, das neben Ad-Watch (ein im Hintergrund laufender Adware-Scanner) noch einige Zusatzfunktionen bietet. Link: Lavasoft - offizielle Homepage 46 Web Publishing Filesharing 10. Quellen: Filesharing: http://www.slyck.com http://www.filesharingzone.de http://www.i-loo.com/filesharing http://www.heise.de/tp/deutsch/inhalt/te/8630/1.html http://www.kefk.net/P2P/Infrastruktur/Netzwerke/ http://www.freenet.de/freenet/computer/internet/filesharing/ Tools: http://www.mirc.com http://bitchx.org http://www.xchat.org http://www.audiogalaxy.com http://www.shareaza.com http://www.gnucleus.com http://www.limewire.com http://www.bearshare.com http://www.morpheus.com http://www.xolox.nl http://www.kazza.com http://www.mp3-world.net http://www.edonkey2000.com http://www.emule-project.net http://bitconjurer.org/BitTorrent http://bt.degreez.net http://www.napster.com http://www.itunes.com http://www.neo-modus.com http://dcplusplus.sourceforge.net http://www.overnet.com http://www.piolet.com http://www.blubster.com http://www.slsknet.org Rechtliches: http://www.internet4jurists.at/urh-marken/faq_urh1.htm Exkursionen: http://www.chip.de 47 WS 03/04