Kapitel 3 Visualisierung chemischer Datenobjekte
Transcription
Kapitel 3 Visualisierung chemischer Datenobjekte
Kapitel 3 Visualisierung chemischer Datenobjekte Im vorausgehenden Kapitel wurden die allgemeinen Grundlagen der dreidimensionalen Visualisierung vermittelt. Dieses Kapitel widmet sich speziell der Darstellung chemischer Datenobjekte, wobei vor allem die portablen Ansätze zur Visualisierung chemischer Information im Vordergrund stehen. Nach einem kurzen Rückblick auf die historische Entwicklung molekularer 3D-Modelle werden die wichtigsten chemischen Darstellungsformen wie beispielsweise Strukturmodelle oder Modelle zur Visualisierung molekularer Oberflächen und Eigenschaften beschrieben. Der zweite Teil beschreibt die Bedeutung des Internets innerhalb der Chemie sowie die rasante Entwicklung chemischer, Internet-Applikationen. Dabei stehen auch hier vor allem die portablen Visualisierungsanwendungen im Vordergrund. Schließlich werden die drei grundsätzlichen, Client-Server-basierten Ansätze zur Vermittlung und Visualisierung chemischer Daten erläutert. Dabei wird vor allem der im Rahmen dieser Arbeit zum Einsatz gekommene Graphiktransferansatz näher beschrieben. 3.1 Molekulare Modelle und ihre Repräsentation 3.1.1 Ein historischer Rückblick Das menschliche Gehirn kann räumliche Beziehungen wie Abstände und Winkel wesentlich besser erfassen, wenn diese Information nicht als tabellarische Listen numerischer Daten vorliegt, sondern in Form von graphischen Modellen dargestellt wird. Seit fast einem halben Jahrhundert repräsentieren Chemiker deshalb molekulare Information in Form von Molekülmodellen. Vor der Einführung des Computers wurden molekulare Modelle in mühevoller und zeitaufwendiger Handarbeit aus Holz, Papier, Draht, Gummi, Plastik und auch anderen Materialien gefertigt. So modellierten beispielsweise Kendrew et al. 1958 das erste Messingmodell einer durch Röntgenkristallographie ermittelten Myoglobinstruktur [43]. In den darauf folgenden Jahren wurde eine Reihe weiterer Modelle entwickelt, von denen die von Byron 27 3 Visualisierung chemischer Datenobjekte Rubin entwickelten Byrons’s Bender am häufigsten verbreitet waren [44]. Diese Drahtmodelle repräsentierten das Backbone von Proteinstrukturen. Der wissenschaftliche Nutzen dieser Modelle zeigte sich nicht zuletzt bei einem wissenschaftlichen Treffen in den SiebzigerJahren als der Vergleich zweier mit Byron’s Bender-Modellen dargestellter Proteine das erste Indiz für die Existenz von Superfamilienstukturen lieferte [45]. Trotz der vielen Vorteile zeigten die physischen Modelle auch gravierende Mängel und Schwächen. Mit zunehmender Größe der dargestellten Strukturen erwiesen sich die Modelle als zunehmend unhandlicher und komplizierter im Aufbau. Darüber hinaus war die Ermittlung von Messgrößen wie Atomabstände und Atomwinkel sehr schwierig bis unmöglich. Durch die Entwicklung erster Computersysteme standen auch auf dem Gebiet des Molecular Modellings neue Wege zur Repräsentation struktureller Daten zur Verfügung. Dies war der Beginn der interaktiven molekularen Graphik. Die ersten dynamischen Molekülbilder wurden dabei 1964 von Levinthal im Projekt MAC am Electronic Systems Laboratory des Massachusetts Institute of Technology generiert [46, 47]. Die Moleküle wurden dabei auf einem selbstgebauten Display in Form von Linienzeichnungen dargestellt. Darüber hinaus besaß das System diverse Peripheriegeräte, die eine Modifikation der dargestellten Szene erlaubten. Das Kernstück war jedoch der sogenannte Crystal Ball, mit dem das Molekül um alle drei orthogonalen Achsen gedreht werden konnte. Die Kosten für dieses prototypische System waren mit 2.000.000 US Dollar entsprechend hoch. Während das MAC-System nicht nur zur Visualisierung von Molekülen entwickelt wurde, folgten in den darauf folgenden Jahren die ersten reinen Molecular Graphics-Systeme. Eines der ersten Systeme wurde 1970 von Langridge an der Princeton University aufgebaut [48, 49]. Das System basierte auf dem Picture System 2 von Evans & Sutherland und konnte neben den Bindungen auch farbige Atome anzeigen. Ein weiterer Meilenstein gelang Richardson et al. im Jahre 1977. Sie waren erstmals in der Lage eine komplette durch Röntgenkristallographie ermittelte Proteinstruktur zu visualisieren [50]. Eine Vielzahl von weiteren Strukturen folgte in den kommenden Jahren. Neben der ansteigenden Zahl an visualisierten Strukturen, nahmen auch die graphischen Fähigkeiten der Computersysteme zu. Durch Einführung der Rastergraphik (1974) und kurz darauf der farbfähigen Rastergraphik (1979) waren jetzt auch andere molekulare Repräsentationen möglich [51-53]. Neben der Darstellung von CPK-Modellen (vgl. Abschnitt 3.1.2.3) konnten man nun auch farbcodierte Bindungen und molekulare Oberflächen visualisieren. 28 3.1 Molekulare Modelle und ihre Repräsentation Die Ära der Evans & Southerland Computersysteme endete in der ersten Hälfte der Achtziger Jahre mit der Einführung der leistungsstärkeren und kostengünstigeren Workstations. Trotz fortlaufender Fortschritte in der Computergraphik und bei den Rechenleistungen bestimmen sie noch heute den Alltag im Molecular Modelling. Durch die rasante Entwicklung der 3D-Fähigkeiten von low-budget Graphikkarten innerhalb der letzten Jahre ist eine Hochleistungsvisualisierung von Molekülmodellen jetzt auch auf PC-Systemen möglich geworden. Einige der bis dato nur für Workstation-Plattformen erhältlichen Molecular Modelling-Programme werden mittlerweile auch als PC-basierte Versionen angeboten [54]. Die in dieser Arbeit vorgestellten Entwicklungen basieren ebenfalls auf dieser neuen Technologieform. 3.1.2 Struktur-Modelle 3.1.2.1 Wireframe-Modell Das bekannteste und zugleich älteste, computergestützte Modell zur Repräsentation molekularer Strukturen ist das Wireframe-Modell (Abbildung 3-1b). Dieses Modell ist auch unter anderen Namen wie beispielsweise Linienmodell oder Dreiding-Modell bekannt [55]. Dabei werden die Bindungen eines Moleküls durch farbcodierte Vektorlinien repräsentiert. Die Atome können mit dieser Methode nicht direkt angezeigt werden, sondern müssen aus den End- und Verzweigungspunkten des Linienmodells abgeleitet werden. Die Farbcodierung der Bindungen beruht im Allgemeinen auf der Art der Atomtypen oder des Bindungstyps. Darüber hinaus kann die Bindungsordnung durch die Anzahl der Linien zwischen zwei Atomen ausgedrückt werden. 3.1.2.2 Ball & Stick-Modell Eine für das menschliche Auge angenehmere Repräsentation stellt das Ball & Stick-Modell dar (Abbildung 3-1a). Im Gegensatz zum Wireframe-Modell werden hier Atome in Form von Kugeln und Bindungen in Form von Zylindern dargestellt. Die Größe und Farbe der Kugeln wird im Allgemeinen dazu benutzt um atomare Eigenschaften wir Atomradien, -typen und -ladungen darzustellen. Wie im Wireframe-Modell können die Bindungszylinder in Farbgebung und/oder Anzahl variieren, um Bindungstypen oder atomare Eigenschaften auszudrükken. Der entscheidende Vorteil dieser Repräsentation basiert jedoch auf einer wesentlich besseren räumlichen Darstellung. Vom Benutzer weiter entfernte Teile des Moleküls können besser identifiziert werden, da sie durch Atome und Bindungen, die näher zum Betrachter ausgerichtet sind, verdeckt werden. Dieser Eindruck wird durch den Einsatz von Techniken wie dem Gouraud-Shading [56] noch verstärkt. 29 3 Visualisierung chemischer Datenobjekte Abb. 3-1: Strukturdarstellungen von 3,5-Diaminophenol (generiert mit VRML File Creator (vgl. Abschnitt 4.1.2)): a) Ball & Stick-Repräsentation, b) Wireframe-Repräsentation, c) CPK-Modell, d) CappedDarstellung (Farbabbildung: Anhang A, Abbildung A-1). 3.1.2.3 Space filling-Modell Das von Corey, Pauling und Koltun entwickelte Space-filling-Modell ist besser unter dem Namen CPK-Modell bekannt [53] (Abbildung 3-1c). Wie in der Ball & Stick-Repräsentation werden die Atome in Form von Kugeln ausgedrückt. Da die Kugelradien den korrespondierenden van der Waals-Radien entsprechen und sich im Allgemeinen überschneiden kann auf die Repräsentation der Bindungen verzichtet werden. Das CPK-Modell ist im Gegensatz zu den anderen Modellen in der Lage, einen ersten Eindruck von den räumlichen Ausmaßen einer Struktur zu vermitteln. 3.1.2.4 Capped Sticks-Modell Das Capped Sticks-Modell kann als gegensätzliches Modell zum Space filling-Modell angesehen werden, da die molekulare Struktur nur durch die Bindungszylinder repräsentiert wird (Abbildung 3-1d). Die Kugeln sind auf die Größe der Zylinderdurchmesser zusammengeschrumpft und dienen lediglich zum Glätten der Zylinderenden. Analog zum Ball & StickModell vermittelt auch das Capped Sticks-Modell einen verbesserten räumlichen Eindruck im Vergleich zum Wireframe-Modell. 30 3.1 Molekulare Modelle und ihre Repräsentation 3.1.2.5 Modelle für biologische Makromoleküle Die Visualisierung biologischer Makromoleküle, die aus Hunderten oder Tausenden von Atomen bestehen, ist mit Hilfe der bereits beschriebenen Molekülmodelle nur bedingt möglich. Zum einen werden diese Modelle ab einigen Hundert Atomen sehr schnell unübersichtlich und zum anderen sind die erforderlichen Rechenleistungen zur interaktiven Visualisierung solcher Modelle zu hoch. Zur Lösung dieser Problematik wurden einige vereinfachte Molekülmodelle entwickelt, die in erster Linie zur Darstellung der Sekundärstruktur von Proteinen dienen [57]. Cylinder-Modell. Das Cylinder-Modell wird zur Kennzeichnung von Helices in Proteinstrukturen verwendet. Ribbon-Modell. Während helikale Sekundärstrukturen mit der Cylinder-Darstellung repräsentiert werden, hat sich zur Visualisierung von Faltblattstrukturen das Ribbon-Modell etabliert. Ribbon-Modelle ähneln in ihrem Aussehen flachen Bändern. Die Oberseite dieser Bänder ist dabei parallel zur Peptidbindung ausgerichtet. In weiterentwickelten Repräsentationen werden die flachen Bänder durch flache Pfeilstukturen ersetzt. Tube-Modell. Die Tube-Struktur besteht aus kleinen röhrenförmigen Gebilden, die zur Darstellung von sogenannten coils und turns verwendet wird. 3.1.2.6 Kristallographische Modelle Anorganische Verbindungen können häufig ebenfalls nicht mit den allgemeinen Strukturmodellen dargestellt werden, da sie auf komplexen Kristallstrukturen (Raumgruppen), Aggregaten oder Metallgittern basieren. Diese Verbindungen werden daher durch individuelle Polyeder wie beispielsweise Oktaeder und Tetraeder dargestellt. 3.1.3 Molekulare Oberflächen Zum Verständnis der diversen molekularen Wechselwirkungen reicht eine Betrachtung der Strukturdaten alleine nicht aus. Vielmehr muss dazu die räumliche Gestalt bzw. Hülle des Moleküls betrachtet werden. Die erste Definition einer solchen molekularen Hülle geht dabei auf Richards [58] zurück, der die molekulare Oberfläche als eine wasserzugängliche Hülle beschrieb. Darüber hinaus kann die molekulare Oberfläche aber auch in Abhängigkeit von der elektronischen Dichte betrachtet werden. Die Repräsentation der molekularen Oberflächen erfolgt dabei in der Regel in Form von Punktwolken, Gitternetzen (Meshes oder Chikken-Wire) oder soliden Hüllen, deren Transparenz beliebig variiert werden kann (Abbildung 3-2). 31 3 Visualisierung chemischer Datenobjekte Abb. 3-2: SES-Oberflächendarstellungen von Trinitrotoluol (generiert mit MolSurf (vgl. Abschnitt 4.1.5)): a) Semitransparente Solid-Repräsentation, b) Dot Cloud-Repräsentation, c) Chicken WireRepräsentation (Farbabbildung: Anhang A, Abbildung A-6a-c). Die folgenden Modelle beschreiben im Detail die verschiedenen Definitionen von molekularen Oberflächen. 3.1.3.1 Van der Waals-Oberfläche Die van der Waals-Oberfläche, die Solvent Accessible Surface (vgl. Abschnitt 3.1.3.3) und die Connolly-Oberfläche (vgl. Abschnitt 3.1.3.2) basieren auf der Definition von Richards. Die van der Waals-Oberfläche stellt dabei den einfachsten Vertreter dieser Oberflächen dar. Im Prinzip wird dabei die Oberfläche des CPK-Modells (vgl. Abschnitt 3.1.2.3) betrachtet, die sich durch Aufaddieren der einzelnen Atomsphären ergibt. Die van der Waals-Oberfläche stellt auch aus der Sicht der computergestützten Methoden die einfachste Oberflächenform dar, da sie sehr einfach zu generieren ist. 3.1.3.2 Connolly-Surface Die Connolly-Oberfläche [59, 60] zeichnet sich im Gegensatz zur van der Waals-Oberfläche durch eine ebenmäßigere Oberflächenstruktur aus. Die spitzen Übergänge zwischen den einzelnen Atomradien werden vermieden, indem man eine Kugel mit definiertem Radius (schematisch Darstellung des Lösungsmittels) über die CPK-Oberfläche rollt. Der Radius dieser Sphäre entspricht dabei im Allgemeinem dem effektiven Kugelradius des Wassermoleküls (1,4 Å). Die resultierende Oberfläche setzt sich dabei aus zwei Oberflächenarten zusammen: a) dem Teil der van der Waals-Oberfläche, der im direkten Kontakt zum Lösungsmittel (Kugel) steht und b) dem Teil der Lösungsmittel-Sphäre, der beim Kontakt mit zwei oder drei Atomen der Struktur vorliegt. Connolly-Oberflächen werden heute standardmäßig im Molecular Modelling eingesetzt, da sie den quantitativen und qualitativen Vergleich von verschiedenen Molekülen zulassen. 32 3.1 Molekulare Modelle und ihre Repräsentation 3.1.3.3 Solvent Accessible Surface (SAS) Unter den Solvent Accessible Surfaces versteht man im Allgemeinen eine bestimmte Klasse von Oberflächen, zu denen auch die Connolly-Oberfläche zählt. Darüber hinaus steht die Bezeichnung Solvent Accessible Surface auch für ein ganz bestimmtes, eigenständiges Modell einer Oberfläche. Dieses Oberflächenmodell geht dabei auf die Arbeiten von Lee und Richards zurück [61]. Während im Connolly-Verfahren die Kontaktflächen als Grundlage für die molekulare Oberfläche dienen, bestimmt im SAS-Verfahren das Zentrum der Lösungsmittelkugel die Gestalt der molekularen Oberfläche. Zum einen ist die Ausdehnung der resultierenden Oberfläche größer, zum anderen treten die Übergänge zwischen den einzelnen Atomen deutlicher hervor. 3.1.3.4 Solvent Excluded Surface (SES) Oberflächen großer Moleküle wie beispielsweise Proteinen können mittels der beschriebenen Methoden nicht mehr effektiv berechnet und dargestellt werden. Zur Darstellung der Oberfläche greift man daher auf weniger rechenintensive, harmonische Näherungsmethoden wie dem Solvent Excluded Surface-Ansatz zurück [62]. 3.1.3.5 Bindungstaschen-Oberflächen Diese molekulare Oberfläche leitet sich nicht wie in den anderen Fällen von der strukturellen Information eines Moleküls ab, sondern repräsentiert die Form der Active Site eines Proteins, die einen Liganden umgibt. Diese Repräsentionsform wird daher vor allem im Wirkstoffdesign eingesetzt, um die Volumen von Bindungstaschen oder molekulare Wechselwirkungsschichten darzustellen [63]. 3.1.3.6 Isowert-basierte Elektronendichte-Oberflächen Neben den vom CPK-Modell abgeleiteten Oberflächenbeschreibungen hat sich ein weiteres Modell zur Generierung molekularer Oberflächen etabliert. Grundlage dieses Modells ist die molekulare Elektronendichteverteilung. Durch Definition eines Grenzwertes für die Elektronendichte, dem sogenannten Isowert, ergibt sich eine Grenzschicht (Isofläche) [64]. Jeder Punkt auf dieser Oberfläche hat daher den gleichen Elektronendichtewert. Ein typischer Standardwert für die Elektronendichte zur Repräsentation solcher Oberflächen liegt bei 0.002 Atomeinheiten. Isowert-basierte Oberflächen kommen aber auch zur Repräsentation von Molekülorbitalen zum Einsatz (vgl. Abschnitt 3.1.4.1). 33 3 Visualisierung chemischer Datenobjekte 3.1.3.7 Experimentell ermittelte Oberflächen Eine vollkommen neue Möglichkeit zur Gewinnung von Oberflächen hat sich in den letzten Jahren durch enorme Fortschritte in der Elektronenmikroskopie ergeben. Im Gegensatz zu den oben beschriebenen Modellen, die durch Berechnungen ermittelt wurden, können mit Hilfe von neuen Technologien wie der Cryo-Elektronenmikroskopie molekulare Oberflächen auch experimentell ermittelt werden [65]. Die Moleküloberfläche ist dabei durch die Auflösung des experimentellen Ansatzes limitiert. Aktuelle Verfahren liefern mittlerweile Auflösungen von ca. 10 Å was somit die Visualisierung von Proteinstrukturen und Sekundärstrukturelementen ermöglicht [66]. Der Vorteil dieser Methodik beruht auf der Möglichkeit, molekulare Strukturen von nativen Makromolekülen zu beobachten. 3.1.4 Molekulare Eigenschaften Die Kenntnis der räumlichen Gestalt eines Moleküls reicht im Allgemeinen nicht aus, um komplexe, molekulare Wechselwirkungen zu verstehen. Vielmehr müssen molekulare Eigenschaften wie beispielsweise das elektrostatische Potential, hydrophile Eigenschaften oder auch Fähigkeiten zur Ausbildung von Wasserstoffbrücken mit in die Betrachtung einbezogen werden. Dabei kann zwischen drei Eigenschaftskategorien unterschieden werden. 3.1.4.1 Molekülorbitale (Isowert-basierte Eigenschaften) Ob Molekülorbitale zu der Klasse der molekularen Oberflächen oder doch eher zu den molekularen Eigenschaften zu zählen sind, ist in der Wissenschaft nicht unumstritten. Unbestritten ist jedoch, dass die Kenntnis von Molekülorbitalen insbesondere des HOMO (highest occupied molecular orbital) und LUMO (lowest unoccupied molecular orbital) wichtige Hinweise für ein besseres Verständnis von Reaktionen vermitteln kann. Darüber hinaus waren Molekülorbitale auch die ersten elektronischen Eigenschaften, die mit Hilfe einfacher Graphikhardware visualisiert wurden. Der Grund für diese frühe, graphische Repräsentation beruht auf der theoretischen Natur der Quantenchemie. Die schwer zugänglichen Grundlagen können mit Hilfe der graphischen Darstellung wesentlich schneller erfasst und verstanden werden als durch eine Sammlung numerischer Orbitalkoeffizienten. Die durch semi-empirische oder ab initio Verfahren generierten Molekülorbitale werden analog zu den bereits in Abschnitt 3.1.3.6 beschriebenen Elektronendichte-Oberflächen durch Isoflächen dargestellt. Orbitalanteile, die auf unterschiedlichen Vorzeichen der Wellenfunktion basieren, werden dabei häufig durch unterschiedliche Farben (beispielsweise rot und blau) repräsentiert. 34 3.1 Molekulare Modelle und ihre Repräsentation Neben den Molekülorbitalen können auch andere molekulare Eigenschaften wie das elektrostatische Potential oder die Spindichte mit Hilfe von Isowert-Oberflächen dargestellt werden. Im Regelfall werden diese skalaren Eigenschaften aber auf die in Abschnitt 3.1.3 beschriebenen Oberflächen abgebildet. 3.1.4.2 Skalare Eigenschaften Skalare Eigenschaften wie das elektrostatische Potential werden in der Regel durch Abbildung auf molekulare Oberflächen dargestellt. Diese Form einer höherdimensionalen Repräsentation erlaubt eine schnelle und einfache Identifikation relevanter Molekülregionen, die durch die Betrachtung reiner Strukturdaten nicht problemlos möglich wäre. Aus Sicht der Computergraphik sind dabei zwei grundsätzliche Ansätze zum Abbilden von Eigenschaften auf molekulare Oberflächen denkbar. Im ersten Fall wird den einzelnen Gitternetzpunkten der Oberfläche ein entsprechender Farbwert zugewiesen. Durch eine nachfolgende Interpolation der Farbwerte beim Verbinden der Gitterpunkte zu Linien (Chicken Wire) oder Flächen (Solid Sphere) ergibt sich eine Oberfläche mit einem kontinuierlichen Farbverlauf [56]. Alternativ zu diesem Ansatz können auch farbige Texturen auf der Oberfläche abgebildet werden [67, 68]. Im Folgenden werden die wichtigsten Vertreter diese Eigenschaftsklasse kurz vorgestellt. Elektrostatisches Potential. Das molekulare elektrostatische Potential (MEP) wurde als erstes von Bonaccorsi et al. [69] definiert und ist unbestritten die wichtigste und meistgenutzte Eigenschaft. Mit Hilfe des elektrostatischen Potentials lassen sich leicht molekulare Regionen ermitteln, die für die Reaktivität einer Verbindung eine große Bedeutung haben. Darüber hinaus spielt das MEP auch bei der Bildung von Protein-Ligand-Komplexen eine entscheidende Rolle. Für weitergehende Information zum elektrostatischen Potential wird der Übersichtsartikel von Murray und Politzer in der Encyclopedia of Computational Chemistry empfohlen [70]. Polarisierbarkeit und Hydrophobizität. Diese Eigenschaften spielen ebenfalls eine relevante Rolle bei der Betrachtung molekularer Wechselwirkungen. Im Gegensatz zum elektrostatischen Potential kommen diese Eigenschaften jedoch erst bei kleinen Abständen zwischen interagierenden Molekülregionen zum Tragen. Spindichte. Die Spindichte ist vor allem für die Betrachtung von Radikalen von Bedeutung, da durch die Visualisierung dieser Eigenschaft ungepaarte Elektronen schnell lokalisiert werden können. 35 3 Visualisierung chemischer Datenobjekte 3.1.4.3 Vektorielle Eigenschaften Das Abbilden molekularer Eigenschaften auf Moleküloberflächen ist nur im Fall von skalarfeldbasierten Werten möglich. Für die Visualisierung vektorieller Eigenschaften wie beispielsweise dem elektrischen Feld eines Moleküls oder der potentiellen Ausrichtung einer Wasserstoffbrücken-Bindung müssen alternative Darstellungsverfahren angewendet werden. Gerichtete Eigenschaften werden dabei in der Regel durch räumliche ausgerichtete Kegel oder durch Feldlinien repräsentiert. 3.1.4.4 Volumetrische Eigenschaften Die Visualisierung volumetrischer Eigenschaften spielt vor allem in anderen wissenschaftlichen Disziplinen wie der Medizin (z.B. Computertomographie) oder der Geologie (z.B. Konvektionsströme) eine bedeutende Rolle. Allerdings finden sich auch in der Chemie einige Anwendungsgebiete für diese Eigenschaften. Stellvertretend für diese Klasse von Eigenschaften sei hier nur die Wasserdichteverteilung bei Moleküldynamiksimulationen erwähnt. Die computergestützte Visualisierung dieser Eigenschaften wird im Allgemeinen durch zweioder dreidimensionale Texturen realisiert [68]. 3.1.5 Animationen Obwohl Animationen keine eigenständige Molekülmodellklasse darstellen, kommt dieser Repräsentationsform eine hohe Bedeutung bei der Interpretation dynamischer Prozesse zu. Animationen werden dabei nicht nur in forschungsorientierten Bereichen standardmäßig eingesetzt, sondern haben sich darüber hinaus auch als exzellente Werkzeuge in der chemischen Ausbildung erwiesen. Insbesondere Schwingungsmoden, Molecular Docking-Experimente, Molekulardynamik-Simulationen, Reaktionsvorgänge und Energieminimierungspfade können mit Hilfe von Animation anschaulich dargestellt werden. 3.2 Internetbasierte Applikationen in der Chemie Neben der bereits beschriebenen Tragweite der graphischen Datenverarbeitung hat noch eine andere computergestützte Technologie den chemischen Alltag in Forschung und Lehre nachhaltig beeinflusst – das Internet. 3.2.1 Die frühen Jahre: 1970 - 1993 Das Internet hat vor allem in den letzten Jahren einen enormen Zuwachs in seiner Größe und Bedeutung erfahren. Dabei ist es auch für Chemiker zu einem wichtigen Medium zur 36 3.2 Internetbasierte Applikationen in der Chemie Kommunikation und zum Austausch chemischer Information jeglicher Art geworden. Dies war jedoch nicht immer der Fall. Obwohl das Internet bereits 1969 als militärisches Netzwerk (ARPANET) gegründet und kurze Zeit später für die akademische und kommerzielle Nutzung zugänglich wurde, war es bis 1993/94 nur einem kleinen Kreis von Chemikern bekannt. Darüber hinaus wurde der Nutzen dieses neuen Mediums von vielen Naturwissenschaftlern nicht erkannt. Trotz des geringen Bekanntheitsgrades wurde das Internet in den ersten Jahren insbesondere von theoretischen Chemikern und sogenannten Computational Chemists in Anspruch genommen. Zu dieser Zeit beschränkte sich die Nutzung noch auf den durch FTP-Server vermittelten Austausch von Programmen, Daten und Dokumenten. Des Weiteren wurde 1984 vom STN-Konsortium der erste Online-Zugang zu einem der bedeutesten Chemieinformationsreservoire – den Chemical Abstract Service – angeboten. Neben diesen Angeboten wurde aber vor allem die eMail-Technologie zur weltweiten, wissenschaftlichen Kommunikation genutzt. Eine teilweise breitere Beachtung in der chemischen Gemeinschaft fand das Internet mit der Einführung des MIME-Standards (vgl. Abschnitt 2.2.1) im Jahre 1993 [31] und der Spezifikation chemischer MIME-Typen im darauf folgenden Jahr [6]. Diese Erweiterung erlaubte erstmals eine inhaltsbezogene Übermittlung und automatisierte Client-seitige Verarbeitung chemischer Daten. Die Kombination dieser zunächst für die eMail-Technologie entwickelten Erweiterung mit dem neuen Kommunikationsmedium World Wide Web (WWW) bildete schließlich die technische Basis für die nachfolgende, explosionsartige Nutzung des Internets. Das World Wide Web wurde dabei zunächst im CERN in Genf als in-house System zur effektiven und kostengünstigen Kommunikation zwischen Physikern auf der ganzen Welt entwikkelt und trat seinen Siegeszug mit der Verfügbarkeit von WWW-Clients, den sogenannten Browsern, an. 3.2.2 Vom Durchbruch bis zum Stand der Technik Die Gründe für den enormen Erfolg des Internets in der Chemie sind vielfältig, können aber vor allem auf die für chemische Daten ungünstigen Limitierungen des papierbasierten Druckmediums zurückgeführt werden. Mit Hilfe des WWW war es nun erstmals möglich auch andere, nicht-textuelle aber dennoch für die Chemie relevante Datentypen einer breiten Nutzerschaft zur Verfügung zu stellen. Darüber hinaus spielten hierbei auch andere Faktoren wie Zeit, Qualität und Weiterverarbeitungsmöglichkeit eine entscheidende Rolle. So waren zum Beispiel auf dem herkömmlichen Wege publizierte Daten an ihrem Erscheinungstag 37 3 Visualisierung chemischer Datenobjekte bereits veraltet und überholt. Durch den langen Publikationsweg gingen im Regelfall auch immer wieder Originaldaten verloren. Zum einen konnten Originaldaten aus Platzgründen nicht mit in einer Publikation mit aufgenommen werden. Somit war eine vorherige Reduktion der Daten nötig, was durch Analyse- und Interpretationsschritte erreicht wurde. Die Konsequenz dieses Vorgangs war eine erschwerte Weiterverarbeitung der publizierten Daten. Ein weiteres Problem, das zum Verlust von Originaldaten führte, war der Umstand, dass es während des Publikationsprozesses immer wieder zu Transkriptionsfehlern kam, die in letzter Konsequenz die veröffentlichten Daten unbrauchbar machten. Das World Wide Web war und ist ein Medium, das diese Probleme löste. Während sich die ersten chemisch orientierten HTML (Hyper Text Markup Language)Seiten noch auf textuelle und bildliche Darstellungen beschränkten, folgten bald auch Webangebote, die den Austausch und die Weiterverarbeitung von chemischen Daten wie dem Proteindatenbankformat (PDB) [71] oder dem MDL Molfile Format [72] erlaubten. Dabei wurde mit Hilfe von Hyperlinks eine Verknüpfung zu einem chemischen Austauschformat in einer HTML-Seite eingebettet. Beim Anklicken dieses Links wurde dann die MIME-codierte Datei an den Client gesendet. Bei entsprechender Konfiguration des Clients wurde anschließend ein Hilfsprogramm gestartet, das die Bearbeitung oder die Visualisierung der Daten gestattete. Erste, auf diesem Prinzip beruhende Arbeiten wurden 1994 von Henry Rzepa und Mitarbeitern präsentiert [3, 6]. Die Visualisierung der Moleküldaten wurde dabei durch plattformabhängige Programme wie beispielsweise XMol [73], EyeChem [74] oder RasMol [19] bewerkstelligt, wobei RasMol zwischen 1994 und 1995 den Stellenwert eines de-facto Standards einnahm. Eine weiterentwickelte Form dieses Datenaustausches war durch die Entwicklung der Chemical Structure Markup Language (CSML) möglich [3]. Dabei wurden zunächst eine PDB-Datei wie beschrieben an den Client übermittelt und mit RasMol visualisiert. Die Webseite enthielt darüber hinaus jedoch auch eine GIF-Datei, in der verschiedene Bereiche mit Hyperlinks verknüpft waren (image map). Durch Auswahl eines bestimmten Bereiches wurde eine sogenannte CSML-Datei an den Client übermittelt. Bei den gesendeten Daten handelte es sich um RasMol-Skriptanweisungen, die mit Hilfe eines Skriptprogramms an RasMol weitergeleitet wurden und somit zusätzliche Darstellungsmöglichkeiten erlaubten. Diese Technik wurde unter anderem dazu genutzt, um NMR-Daten und metabolische Pfade zu visualisieren. Ein Nachteil dieser Technik war jedoch die Limitierung auf UNIX-basierte Systeme. Ein weiteres UNIX-abhängiges System basierte auf der EyeChem-Umgebung. EyeChem war eine modulare Erweiterung des IRIS Explorers und erlaubte die Betrachtung und Manipulation einer chemischen Szene von mehreren Workstations aus. Durch Entwicklung spezieller Module und Nutzung des Web-Browser Mosaic sowie dem integriertem Common Client 38 3.2 Internetbasierte Applikationen in der Chemie Interface (CCI) war eine WWW-basierte Kommunikation zwischen entfernten EyeChemApplikationen möglich [75]. Dieser Ansatz realisierte somit die erste Form eines webfähigen, chemischen Expertensystems. Während die oben genannten Ansätze das Vorhandensein und Starten von Browserexternen Applikationen erforderten, wurde mit Einführung der Netscape-Plugin-Technologie im Jahre 1995 nun auch die Einbettung von Hilfsprogrammen in das Browserfenster möglich. Das erste chemische Plugin namens Chime wurde dabei von der Firma MDL im Rahmen ihres Softwarepakets Chemscape entwickelt [32]. Das auf RasMol aufbauende Plugin beherrscht die wichtigsten Strukturdarstellungsformen und ist auch in der Lage Oberflächen sowie einfache Animationen zu repräsentieren. Darüber hinaus wurde das Plugin in den letzten Jahren mit einer Reihe an zusätzlichen Funktionalitäten wie beispielsweise einer weiterentwickelten Skriptfunktion ausgerüstet. Chime hat sich bis heute als wichtigstes Visualisierungsplugin behauptet und bot auch die Grundlage für fortgeschrittene Applikationen wie dem Protein-Explorer [76]. Neben Chime wurden bis heute eine ganze Reihe weiterer Plugins entwickelt. Stellvertretend sollen hier nur das JCAMP-DXPlugin [77] zur Darstellung von Spektren, das ChemDraw/Chem3D Net-Plugin von CambridgeSoft [78] und das WebLab-Plugin [79] zur Darstellung von Eigenschaften und Polymeren genannt werden. Die Kombination von Plugins wie beispielsweise von Chime und JCAMP-DX-Plugin zur Darstellung von Spektren wurde ebenfalls beschrieben [80]. Mittlerweile wurde JCAMP-DX von der Firma MDL in Chime integriert. Ein vollkommen anderer Weg zur Datenübertragung wurde mit dem Internet-Standard VRML (vgl. Abschnitt 2.2.5) möglich. Während in den oben beschriebenen Ansätzen chemische Austauschformate zum Client übertragen werden, wird mit VRML eine dreidimensionale, graphische Szene an den Client gesendet. Im Gegensatz zum Austausch von chemischen Strukturdateien entfällt dabei die Installation diverser Applikationen mit unterschiedlichen Benutzerschnittstellen und somit auch die Limitierung dieser Anwendungen. Da mit einem VRML-Viewer beliebige dreidimensionale Szenen betrachtet werden können, ist auch die Repräsentation exotischer Daten wie beispielsweise ionischen Gitterstrukturen, Flüssigkristallen oder auch Molekülorbitalen und molekulare Oberflächen mit assoziierten Eigenschafen möglich. Die ersten chemischen VRML-Anwendungen wurden von Casher et al. im Dezember 1994 generiert [74, 75] und ermöglichten die Visualisierung von Wireframe-, Ball & Stick-, CPK- und Ribbon-Modellen. Diese Ansätze erlaubten zudem die Visualisierung von Molekülorbitalen und elektrostatischen Potentialen [81] als auch die Darstellung von intermolekularen Wechselwirkungen [82]. Vollhardt und Brickmann nutzten die neue Technologie, um Proteinstrukturen und komplexe Proteinoberflächen sowie Moleküleigenschaften zu visualisieren [83, 84]. Darüber hinaus entwickelten sie interaktive 39 3 Visualisierung chemischer Datenobjekte Online-Dienste zur Generierung von VRML-Szenen aus PDB-Dateien und zur Darstellung von Atomorbitalen [9]. Die beschriebenen VRML-Applikationen basieren auf VRML1.0 und erlauben lediglich die Visualisierung von statischen 3D-Szenen. Durch die Einbettung von Hyperlinks konnten zwar andere VRML-Szenen oder externe HTML-Seiten interaktiv aufgerufen werden, jedoch waren fortgeschrittene Benutzerinteraktionen und Animationen erst durch Einführung des VRML97-Standards möglich. Die erste chemische VRML-Applikation, die auf diesem Standard basierte, ermöglichte die animierte Darstellung von Schwingungsmoden [85]. Die Auswahl von Spektrenpeaks in einer Bilddatei führte zur Darstellung der korrespondierenden Schwingung in einem VRML-Plugin. Weitere auf dem VRML97 Standard basierende Beispiele folgten in den darauf folgenden Jahren [86, 87]. Zur Realisierung der oben beschriebenen Ansätze müssen zuvor externe Applikationen oder plattformabhängige Plugins installiert werden. Diese Voraussetzung wurde durch die plattformunabhängige Programmiersprache Java (vgl. Abschnitt 2.2.4) hinfällig. Mit Hilfe von Java können Standalone-Applikationen programmiert werden. Interessanter ist jedoch die Möglichkeit, sogenannte Applets zu entwickeln. Applets werden wie normale Daten an den Client übermittelt und dort mit Hilfe einer Java Virtual Machine im Browser oder direkt auf dem Client ausgeführt. Da Java eine plattform- und betriebssystemunabhängige Sprache ist können die Programme im Gegensatz zu Plugins oder externen Programmen auf jedem beliebigen Client ausgeführt werden. Eines der ersten chemischen Applets war der Strukturviewer von ChemSymphony [11]. Mittlerweile sind eine Reihe von Applets für fast jede chemische Problemstellung entwickelt worden. Einige dieser Applikationen erlauben dabei auch den Zugriff auf externe Datenbanken oder ermöglichen die Kommunikation zwischen Client und Server [88]. Zertifizierte Applets können auch auf lokale Ressourcen zugreifen und sind somit in der Lage, chemische Austauschformate direkt einzulesen und zu bearbeiten. Neben zahlreichen kommerziellen Applets sind mittlerweile auch eine Reihe von OpenSource-Entwicklungen erschienen. Diese Programme werden dabei von einer offenen Gemeinschaft von Programmierern entwickelt. Einige bekannte Vertreter sind das JChemPaint-Applet [89] und das JMol-Applet[90], welche im Rahmen des OpenScienceProjekts [91] entstanden sind. Eine relativ neue Erweiterung des Java-Standards ist Java3D. Java3D erlaubt die Hardware-unterstützte Darstellung von dreidimensionalen Szenen. Mittlerweile sind auch die ersten chemischen Anwendungen erschienen, die von der Java3D Application Programing Interface (API) Gebrauch machen [88, 92]. Neben den beschriebenen internetbasierten Applikationen zur Visualisierung von Molekülmodellen wurden auch zahlreiche andere Anwendungen und Methoden entwickelt 40 3.3 Client-Server-Ansätze zur chemischen Visual- wie beispielsweise Datenbanken [93, 94], die Chemical Markup Language (CML) [95], Dienste zur interaktiven Berechnung von Daten [96, 97] und elektronische Journale [7]. Diese Entwicklungen spielten für diese Arbeit keine relevante Rolle und werden anderer Stelle beschrieben [98]. 3.3 Client-Server-Ansätze zur chemischen Visualisierung Im vorausgegangenen Abschnitt wurde bereits deutlich, dass verschiedene Ansätze für die Client-Server-basierte Vermittlung und Visualisierung chemischer Daten realisiert werden können. Die grundsätzlichen Transferstrategien werden im Folgenden zusammengefasst und diskutiert. 3.3.1 Datentransfer Beim Datentransfer wird chemische Information in MIME-codierter Form von einem Server an einen Client übermittelt. Das Internet bzw. Intranet dient bei diesem Ansatz als reines Kommunikationsmedium. Die übermittelten Daten werden anschließend auf der Clientseite mit Hilfe von externen Programmen oder Plugins bearbeitet und/oder visualisiert. Der entscheidende Vorteil dieses Ansatz ist, dass die chemischen Originaldaten an den Client gesendet werden und dort für beliebige Weiterverarbeitungsschritte zur Verfügung stehen. Die zur Visualisierung eingesetzten Standalone-Programme und Plugins werden zudem für die zugrundeliegende Clientplattform kompiliert und optimiert, was sich unter anderem mit deutlichen Geschwindigkeitsvorteilen bei der Visualisierung äußert. Plattformabhängige Standalone-Applikationen sind darüber hinaus häufig mächtige Programmpakete, die über fortgeschrittene Werkzeuge und Optionen zur Bearbeitung und Visualisierung der Daten verfügen. Somit steht dem Benutzer in diesem Ansatz ein größtmögliches Maß an Freiheitsgraden bei der Generierung der Visualisierungen als auch bei der Interaktion und Manipulation der Daten zur Verfügung. Der Datentransfer-Ansatz birgt jedoch nicht nur Vorteile. Die Visualisierung und Bearbeitung der chemischen Daten setzt zunächst die Installation entsprechender Standalone-Programme oder Plugins voraus. Da diese Programme in der Regel für die Handhabung eines bestimmten Problems wie beispielsweise der Visualisierung einer dreidimensionalen Struktur konzipiert sind, muss häufig eine ganze Reihe an diversen Applikationen mit unterschiedlichen Benutzerschnittstellen auf dem Client installiert werden. Dieser Umstand ist vor allem für firmeninterne Intranet-Systeme mit einigen hundert oder Tausend Einzelplatzrechnern unbrauchbar, da die Installation und Wartung der vielen Einzelprogramme aus Zeit- und Kosten-Gründen nicht zu realisieren ist. 41 3 Visualisierung chemischer Datenobjekte 3.3.2 Softwaretransfer Eine mögliche Lösung der oben beschriebenen, Datentransfer-basierten Probleme bietet der Softwaretransfer-Ansatz. Bei diesem Ansatz werden neben der chemischen Information auch plattformunabhängige Applikationen zur Bearbeitung der Daten an den Client übermittelt. Die Programme basieren in der Regel auf der Programmiersprache Java und können deshalb auf beliebigen Plattformen und Betriebssystemen ausgeführt werden. Die Plattformunabhängigkeit hat jedoch auch ihren Preis. Java-Programme können nicht direkt von dem Betriebssystem des Clients ausgeführt werden, sondern benötigen eine Virtual Machine. Dadurch sind Java-Applikationen in der Regel etwas langsamer als Plugins oder plattformabhängige Standalone-Programme. Auf der anderen Seite können Java-Applikationen aber auch so entwickelt werden, dass sie Client-seitig vorhandene Rechen- und Graphikressourcen nutzen können [99, 100]. Java-Applets können für beliebig komplexe Problemstellungen entworfen werden und erlauben darüber hinaus die Kommunikation untereinander oder mit Plugins, wodurch auch kombinierte Anwendungen zur Darstellung von zwei oder mehreren Datenobjekten möglich sind (z.B. Strukturen und Spektren). Java-Applikationen kamen im Rahmen dieser Arbeit vor allem zur Unterstützung der verschiedenen Graphiktransfer-Ansätze zum Einsatz. 3.3.3 Graphiktransfer Beim Graphiktransfer werden in der Regel weder chemische Daten noch Programme über das Netzwerk versendet. Vielmehr wird nur eine graphische Szene an den Client übermittelt und dort dargestellt. Ein in der Chemie häufig eingesetzter Vertreter dieses Ansatzes ist die Virtual Reality Modelling Language (VRML). Dabei werden in fertiger Form vorliegende oder interaktiv erzeugte VRML-Dateien an den Client übersandt. Auf der Clientseite ist zur Darstellung der Szene nur ein einziger Viewer mit einer einheitlichen Benutzerschnittstelle erforderlich. Als rein graphisches Austauschformat gibt es in VRML keine Limitierung bei der Darstellung chemischer Information. Somit können auch exotische Sachverhalte dargestellt und die Szenen mit zusätzlicher Information wie Texten oder Hyperlinks ausgestattet werden. Aus diesem Grunde war und ist VRML das einzige Medium, welches den Austausch komplexer, molekularer Oberflächen erlaubt. Aktuelle VRML-Anwendungen in der Chemie [86, 101] dienen vor allem zur plattformunabhängigen Repräsentation chemischer Datenobjekte, die nicht mit aktuellen Standardsapplikationen dargestellt werden können, und werden daher auch von vielen kommerziellen Programmpaketen als alternatives Ausgabeformat angeboten. Auf diesem Wege kann zwar chemische Information einfach und plattformungebunden dargestellt werden, aber die Mög- 42 3.3 Client-Server-Ansätze zur chemischen Visual- lichkeit zur Interaktion mit den chemischen Daten wird durch diesen Prozess stark eingeschränkt. Zudem ist eine Weiterverarbeitung der Daten nicht mehr möglich. Bei Betrachtung der Visualisierungspipeline in Abschnitt 2.1.2 wurde deutlich, dass der große Vorteil der dreidimensionalen Visualisierung vor allem in den zahlreichen Möglichkeiten zur Benutzerinteraktion begründet liegt. Dabei wurde angenommen, dass die komplette Visualisierungspipeline auf nur einem System ausgeführt wird. Beim Graphiktransfer in einem Client-Server-System können die diversen Module der Visualisierungspipeline beliebig zwischen Client und Server aufgeteilt werden (siehe Abbildung 3-3). Interaktion Simulation Datenbank Rohdaten Filter Mapper Bilder Video Renderer Sensoren Server Netzwerk Client Darstellung Client-Server Visualisierungspipeline Abb. 3-3: Aufteilung der Stufen der Visualisierungspipeline in einem Client-Server-System. Die Visualisierungspipeline und die sich durch die Aufteilung der Module ergebenden Client-Server-Strategien [102] standen bei der Entwicklung der in diesem Kapitel beschriebenen Anwendungen im Vordergrund. Die Wahl einer geeigneten Strategie hängt dabei von einer Reihe von Faktoren ab: Art und Größe der Daten, Bandbreite und Latenz des Netzwerks, graphische und numerische Fähigkeiten der vorhandenen Client- und Server-Rechner. Grundsätzlich können drei verschiedene Strategien unterschieden werden: hybride Strategien, Client-seitige Strategien und Server-seitige Strategien. Die einzelnen Strategien sowie ihre Vor- und Nachteile werden im folgenden Kapitel anhand von im Rahmen dieser Arbeit entwickelten Visualisierungsapplikationen beschrieben. 43 3 Visualisierung chemischer Datenobjekte 44