Grid Computing - Feldafinger Kreis
Transcription
Grid Computing - Feldafinger Kreis
Grid Computing Prof. Dr. José L. Encarnação Fraunhofer Institut für Graphische Datenverarbeitung (IGD) Symposium des Feldafingerkreises 2005 „Forschen für die Internetgesellschaft: Trends Technologien, Anwendungen“ Bad Honnef, 17. Januar 2005 Thesenpapier Grid Computing 1. Genese 2. Hypothesengerüst 3. Anwendungsreife 4. Handlungsempfehlungen Feldafinger Kreis 17.01.05 – Grid Computing Seite 2 Genese - I Was ist Grid-Computing? Begriff: geprägt im Jahre 1999 durch die Autoren der “Grid-Bibel” Ian Foster, Argonne National Laboratory Carl Kesselman, Information Sciences Inst., USC Fokussierung verschiedener IT-Entwicklunge auf einen Begriff Kernthema: Gemeinsame Nutzung vernetzter Ressourcen Feldafinger Kreis 17.01.05 – Grid Computing Seite 3 Genese - II Die „Vision“ Grid IT-Leistungen sind als „utility“ verfügbar wie Wasser, Gas und Strom Abrechnung nach Verbrauch Garantierte Verfügbarkeit, Sicherheit und Qualität Ort der Erzeugung ist irrelevant Feldafinger Kreis 17.01.05 – Grid Computing Seite 4 Genese - III Die „Vision“ Grid Grid: Definierte Menge von Ressourcen (Rechner, Speicher, Netze, Sensoren, Software, Daten), per Internet verbunden Abrechnung nach Verbrauch Grid Computing bedeutet - einfache, einheitliche (und sichere) Nutzung der Grid-Ressourcen - koordinierte Ressourcen-Nutzung durch mehrere Benutzer Grid Computing ist eine neue Abstraktionsebene: - Der Benutzer muss sich nicht mehr mit den Eigenheiten der einzelnen Systeme auseinander setzen - Er interagiert mit "dem Grid" und nicht mit einzelnen Ressourcen Feldafinger Kreis 17.01.05 – Grid Computing Seite 5 Genese - IV Grid-Computing: Warum jetzt? In der Vergangenheit Lokale Ressourcen-Nutzung - Teure und schwache Netzwerke Æ ökonomisch zwingend Wachstumsraten 2001-2010: - Computer: Faktor 60 - Netzbandbreite: Faktor 4000 Abb. aus Scientific American, Jan. 2001 Verteilte Ressourcen-Nutzung für immer mehr Anwendungen ökonomisch sinnvoll! Feldafinger Kreis 17.01.05 – Grid Computing Seite 6 Thesenpapier Grid Computing 1. Genese 2. Hypothesengerüst 3. Anwendungsreife 4. Handlungsempfehlungen Feldafinger Kreis 17.01.05 – Grid Computing Seite 7 Hypothesengerüst - I Grid-Ansätze in heutigen Projekten: Compute-Grids: Bündelung verteilter Rechen-Ressourcen Data-Grids: Gemeinsame Nutzung und Verarbeitung großer, verteilter Datenressourcen, Treibende Kraft: Hochenergiephysik (CERN) Ressource-Grids: Virtualisierung von Rechen-Ressourcen, On-Demand-Computing Service-Grids: SW-Services anbieten/ nutzen Cooperation-Grids: Virtuelle Organisationen, Telekooperation Feldafinger Kreis 17.01.05 – Grid Computing Seite 8 Hypothesengerüst - II IT-Umsetzung von Geschäftsprozessen Zentrales Thema der kommerziellen IT: Business Process Management Ziel: Kosteneinsparung durch Optimierung der Prozesse Früher: Vorherrschen von Einzellösungen - „Selbstgestrickte” Verknüpfungen von Anwendungen - Nachteile: Aufwendige Entwicklung, unflexibel, kaum wartbar Moderner Zugang: Service-orientierte Architektur (SOA) Kapselung von Anwendungskomponenten in „Web Services” Integrationsplattform: Zusammenbau von Services zu Prozessen Feldafinger Kreis 17.01.05 – Grid Computing Seite 9 Hypothesengerüst - III Was sind Web-Services? Weiterentwicklung des WWW: - Erste Schritte: Serverseitiges Scripting (z.B. ASP) - Aufruf von „Services“ statt (statischen) Dokumenten Verschieden SW-Plattformen für Web-Services, z.B.: - .NET (Microsoft) - WebSphere (IBM) - WebLogic (Bea) Interoperabilität gewährleistet durch Standards, insbesondere: - WSDL (Web Service Description Language) - SOAP (Simpel Object Access Protocoll) Moderner Zugang: Serviceorientierte Architektur (SOA) Internationale Standardisierung: W3C / OASIS Feldafinger Kreis 17.01.05 – Grid Computing Seite 10 Hypothesengerüst - IIIa Anatomie eines Web-Services? Beschreibung NUR der äußeren Schnittstelle: - Name des Services (Port-Type), z.B. „connectCRM“ - Zur Verfügung gestellte Funktionen (Operations), z.B. „getCustomerAdress“, „sendChristmasCard“, … • Definition der Input-Nachricht (XML, Input-Message) • Definition der Output-Nachricht (XML, Output-Msg.) Interne Details bleiben der Außenwelt verborgen! Beschreibung in XML Syntax: Web Service Description Language (WSDL) Unabhängigkeit von Betriebssystem und Programmiersprachen Standardisiertes Protokoll zur Kontaktaufnahme zwischen Services: Universal Description Discovery and Integration (UDDI) Feldafinger Kreis 17.01.05 – Grid Computing Seite 11 Hypothesengerüst - IIIb Nutzung von Web-Services Kommunikation mit SOAP = http + XML r e S ce i v d fin Kunde: Kunde: Service-Aufruf Service-Aufruf en Service ServiceBroker Broker (UDDI) (UDDI) Service aufrufen Se rv ice r eg is tri ere n Dienstleister: Dienstleister: Service-Angebot Service-Angebot Ergebnis Feldafinger Kreis 17.01.05 – Grid Computing Seite 12 Hypothesengerüst - IV Gründe für den Erfolg der Web-Service-Idee Unabhängigkeit von Hardware, Betriebssystem, Anwendungsserver … Klare Schnittstelle zwischen Services Alle Kommunikation in Klartext (XML) Vollständige Kapselung der darunter liegenden „Legacy“-Anwendungen Erleichterte Wiederverwendung (Baukasten) „Objektorientierte Programmierung auf höherer Stufe“ Feldafinger Kreis 17.01.05 – Grid Computing Seite 13 Hypothesengerüst - IVa Konvergenz von Web- und Grid-Services Neueste Entwicklung: OGSA/OGSI wird zur Basis des Web-Service-Standards WSRF (Web Service Resource Framework) Standardisierung im OASIS WSRF Technical Committee Grid-Service-Technologie kommt in den „Mainstream“ Größtes technisches Problem bei der Integration: - Einige Grid-Services sind „stateful“ - Web-Services sind „stateless“ (gedächtnislos) Feldafinger Kreis 17.01.05 – Grid Computing Seite 14 Hypothesengerüst - V Antidot gegen “Grid-Hype” Grid-Technologie eröffnet keine „grundsätzlich“ neuen Möglichkeiten Verteiltes Rechnen, Meta-Computing, Föderierung von Datenarchiven, sichere Kommunikation etc. gab es auch vorher Aber: Grid-Technologie zielt auf Vereinfachung: - Standard-Services statt vielfache Eigenentwicklungen - Flexibilität statt „festverdrahteter“ Lösungen Viele Anwendungen erst dadurch ökonomisch sinnvoll Feldafinger Kreis 17.01.05 – Grid Computing Seite 15 Thesenpapier Grid Computing 1. Genese 2. Hypothesengerüst 3. Anwendungsreife 4. Handlungsempfehlungen Feldafinger Kreis 17.01.05 – Grid Computing Seite 16 Qualitative Bewertung - I Internationaler Kontext In den USA: • Advanced Cyberinfrastructure Program (ACP) der NSF • Jährliches Fördervolumen: 1 Milliarde $ • Einzelheiten: http://www.cise.nsf.gov/sci/reports/toc.cfm In Europa: • Umfangreiche Ausschreibungen im 6. Rahmenprogramm der EU • Seit 2001: U.K. eScience-Programm, Förderung: 40 M£ / Jahr • Deutschland: eScience Initiative, Industrie-Grid, … Feldafinger Kreis 17.01.05 – Grid Computing Seite 17 Qualitative Bewertung - II Angebot von Services für externe Nutzer Beispiel: Zugriff auf Erdbeobachtungs-Datenarchive des DLR: Grid-Service-Interface für externe Nutzer Vereinheitlichung des Zugriffs auf verschiedene Archive (ESA, CEOS, …) Dadurch „Federation” von Archiven im Grid möglich „Added-Value-Services” können auf Standard-Interfaces aufbauen Bereits Grid-Projekte bei - ESA ESRIN - CEOS Grid Task Force Feldafinger Kreis 17.01.05 – Grid Computing Seite 18 Qualitative Bewertung - III Gemeinsame Ressourcen-Nutzung im Grid Ressourcen: Computer, File-Systeme, Großanlagen (?) Aufbau eines firmenweiten „Resource Grid“ Einbeziehung von Compute-Ressourcen außerhalb der Firma, z.B.: HPC-Portal bei HWW /http://www.hpcportal.de), „pay-peruse“ Feldafinger Kreis 17.01.05 – Grid Computing Seite 19 Thesenpapier Grid Computing 1. Genese 2. Hypothesengerüst 3. Anwendungsreife 4. Handlungsempfehlungen Feldafinger Kreis 17.01.05 – Grid Computing Seite 20 Handlungsempfehlungen - I Bmbf-Inititiative “Grid-Strategien in der Wirtschaft” Ziel: Beschreibung aktueller industrieller Grid-Szenarien Erkundung zukünftiger Szenarien Definition spezifischer Anforderungen der Wirtschaft an Grid-Software Identifikation zukünftiger Grid-Anwendungen und industrie-relevanter Forschungsthemen Positionspapier, Empfehlungen für Fördermaßnahmen Feldafinger Kreis 17.01.05 – Grid Computing Seite 21 Handlungsempfehlungen - II Virtual Enterprises Virtuelle Organisationen auf Projektebene: Großes Potential in verteilten Organisationen Einrichtungen, die an einer gemeinsamen Aufgabe arbeiten bilden eine virtuelle Organisation - Projekte - Hinzunahmen externer Partner Wesentlicher Nutzen der Grid-Technologie: Umfangreiche Sicherheitsmechanismen für Zugriffskontrolle und Kommunikation Vereinheitlichung der Nutzung der dezentral verteilten HPC-Ressourcen durch Grid-Infrastruktur Feldafinger Kreis 17.01.05 – Grid Computing Seite 22 Handlungsempfehlungen - III Vorteile der neuen Architektur Entwicklung einer Suite von speziellen Einzelkomponenten zu Anwendungskomponenten + generischen Middleware-Services Verbesserte Wiederverwendbarkeit der Services durch Abstraktion von den Objektdetails Übergang von - gemeinsamem Objektmodell und Daten-Schema zu - offenen, dynamischen Schemata (XML) + Übersetzungs-Service (XSLT) Komponenten leichter separat zu entwickeln Daten-Architektur jetzt WebDAV-enabled; einfacher anpassbar an verschiedene Umgebungen Feldafinger Kreis 17.01.05 – Grid Computing Seite 23 Handlungsempfehlungen - IV Die bleibende Herausforderung: Interface-Semantik Fundamentales Problem beim Datenaustausch zwischen Web- bzw. Grid-Services: exakte Datendefinition / Transformation zwischen Formaten Definition und Standardisierung von Interface-Semantiken: größte Ungelöste Aufgabe des Grid-Computing Feldafinger Kreis 17.01.05 – Grid Computing Seite 24 nwendungsreife hoch GRID 2010 mittel GRID 2006 GRID 2002 gering Feldafinger Kreis 17.01.05 – Grid Computing -- - = + ++ Seite 25 Wettbewerbsstellung Deutschland