Kapitel 3 Visualisierung chemischer Datenobjekte

Transcription

Kapitel 3 Visualisierung chemischer Datenobjekte
Kapitel 3
Visualisierung chemischer Datenobjekte
Im vorausgehenden Kapitel wurden die allgemeinen Grundlagen der dreidimensionalen
Visualisierung vermittelt. Dieses Kapitel widmet sich speziell der Darstellung chemischer
Datenobjekte, wobei vor allem die portablen Ansätze zur Visualisierung chemischer Information im Vordergrund stehen. Nach einem kurzen Rückblick auf die historische Entwicklung
molekularer 3D-Modelle werden die wichtigsten chemischen Darstellungsformen wie beispielsweise Strukturmodelle oder Modelle zur Visualisierung molekularer Oberflächen und
Eigenschaften beschrieben.
Der zweite Teil beschreibt die Bedeutung des Internets innerhalb der Chemie sowie die
rasante Entwicklung chemischer, Internet-Applikationen. Dabei stehen auch hier vor allem
die portablen Visualisierungsanwendungen im Vordergrund.
Schließlich werden die drei grundsätzlichen, Client-Server-basierten Ansätze zur Vermittlung und Visualisierung chemischer Daten erläutert. Dabei wird vor allem der im Rahmen
dieser Arbeit zum Einsatz gekommene Graphiktransferansatz näher beschrieben.
3.1 Molekulare Modelle und ihre Repräsentation
3.1.1
Ein historischer Rückblick
Das menschliche Gehirn kann räumliche Beziehungen wie Abstände und Winkel wesentlich besser erfassen, wenn diese Information nicht als tabellarische Listen numerischer Daten
vorliegt, sondern in Form von graphischen Modellen dargestellt wird. Seit fast einem halben
Jahrhundert repräsentieren Chemiker deshalb molekulare Information in Form von Molekülmodellen. Vor der Einführung des Computers wurden molekulare Modelle in mühevoller und
zeitaufwendiger Handarbeit aus Holz, Papier, Draht, Gummi, Plastik und auch anderen Materialien gefertigt. So modellierten beispielsweise Kendrew et al. 1958 das erste Messingmodell einer durch Röntgenkristallographie ermittelten Myoglobinstruktur [43]. In den darauf
folgenden Jahren wurde eine Reihe weiterer Modelle entwickelt, von denen die von Byron
27
3 Visualisierung chemischer Datenobjekte
Rubin entwickelten Byrons’s Bender am häufigsten verbreitet waren [44]. Diese Drahtmodelle repräsentierten das Backbone von Proteinstrukturen. Der wissenschaftliche Nutzen dieser Modelle zeigte sich nicht zuletzt bei einem wissenschaftlichen Treffen in den SiebzigerJahren als der Vergleich zweier mit Byron’s Bender-Modellen dargestellter Proteine das erste
Indiz für die Existenz von Superfamilienstukturen lieferte [45].
Trotz der vielen Vorteile zeigten die physischen Modelle auch gravierende Mängel und
Schwächen. Mit zunehmender Größe der dargestellten Strukturen erwiesen sich die Modelle
als zunehmend unhandlicher und komplizierter im Aufbau. Darüber hinaus war die Ermittlung von Messgrößen wie Atomabstände und Atomwinkel sehr schwierig bis unmöglich.
Durch die Entwicklung erster Computersysteme standen auch auf dem Gebiet des Molecular Modellings neue Wege zur Repräsentation struktureller Daten zur Verfügung. Dies war der
Beginn der interaktiven molekularen Graphik. Die ersten dynamischen Molekülbilder wurden
dabei 1964 von Levinthal im Projekt MAC am Electronic Systems Laboratory des Massachusetts Institute of Technology generiert [46, 47]. Die Moleküle wurden dabei auf einem selbstgebauten Display in Form von Linienzeichnungen dargestellt. Darüber hinaus besaß das
System diverse Peripheriegeräte, die eine Modifikation der dargestellten Szene erlaubten. Das
Kernstück war jedoch der sogenannte Crystal Ball, mit dem das Molekül um alle drei orthogonalen Achsen gedreht werden konnte. Die Kosten für dieses prototypische System waren
mit 2.000.000 US Dollar entsprechend hoch.
Während das MAC-System nicht nur zur Visualisierung von Molekülen entwickelt wurde,
folgten in den darauf folgenden Jahren die ersten reinen Molecular Graphics-Systeme. Eines
der ersten Systeme wurde 1970 von Langridge an der Princeton University
aufgebaut [48, 49]. Das System basierte auf dem Picture System 2 von Evans & Sutherland
und konnte neben den Bindungen auch farbige Atome anzeigen.
Ein weiterer Meilenstein gelang Richardson et al. im Jahre 1977. Sie waren erstmals in der
Lage eine komplette durch Röntgenkristallographie ermittelte Proteinstruktur zu
visualisieren [50]. Eine Vielzahl von weiteren Strukturen folgte in den kommenden Jahren.
Neben der ansteigenden Zahl an visualisierten Strukturen, nahmen auch die graphischen
Fähigkeiten der Computersysteme zu. Durch Einführung der Rastergraphik (1974) und kurz
darauf der farbfähigen Rastergraphik (1979) waren jetzt auch andere molekulare Repräsentationen möglich [51-53]. Neben der Darstellung von CPK-Modellen (vgl. Abschnitt 3.1.2.3)
konnten man nun auch farbcodierte Bindungen und molekulare Oberflächen visualisieren.
28
3.1 Molekulare Modelle und ihre Repräsentation
Die Ära der Evans & Southerland Computersysteme endete in der ersten Hälfte der Achtziger Jahre mit der Einführung der leistungsstärkeren und kostengünstigeren Workstations.
Trotz fortlaufender Fortschritte in der Computergraphik und bei den Rechenleistungen
bestimmen sie noch heute den Alltag im Molecular Modelling.
Durch die rasante Entwicklung der 3D-Fähigkeiten von low-budget Graphikkarten innerhalb der letzten Jahre ist eine Hochleistungsvisualisierung von Molekülmodellen jetzt auch
auf PC-Systemen möglich geworden. Einige der bis dato nur für Workstation-Plattformen
erhältlichen Molecular Modelling-Programme werden mittlerweile auch als PC-basierte Versionen angeboten [54]. Die in dieser Arbeit vorgestellten Entwicklungen basieren ebenfalls
auf dieser neuen Technologieform.
3.1.2
Struktur-Modelle
3.1.2.1 Wireframe-Modell
Das bekannteste und zugleich älteste, computergestützte Modell zur Repräsentation molekularer Strukturen ist das Wireframe-Modell (Abbildung 3-1b). Dieses Modell ist auch unter
anderen Namen wie beispielsweise Linienmodell oder Dreiding-Modell bekannt [55]. Dabei
werden die Bindungen eines Moleküls durch farbcodierte Vektorlinien repräsentiert. Die
Atome können mit dieser Methode nicht direkt angezeigt werden, sondern müssen aus den
End- und Verzweigungspunkten des Linienmodells abgeleitet werden. Die Farbcodierung der
Bindungen beruht im Allgemeinen auf der Art der Atomtypen oder des Bindungstyps. Darüber hinaus kann die Bindungsordnung durch die Anzahl der Linien zwischen zwei Atomen
ausgedrückt werden.
3.1.2.2 Ball & Stick-Modell
Eine für das menschliche Auge angenehmere Repräsentation stellt das Ball & Stick-Modell
dar (Abbildung 3-1a). Im Gegensatz zum Wireframe-Modell werden hier Atome in Form von
Kugeln und Bindungen in Form von Zylindern dargestellt. Die Größe und Farbe der Kugeln
wird im Allgemeinen dazu benutzt um atomare Eigenschaften wir Atomradien, -typen und
-ladungen darzustellen. Wie im Wireframe-Modell können die Bindungszylinder in Farbgebung und/oder Anzahl variieren, um Bindungstypen oder atomare Eigenschaften auszudrükken. Der entscheidende Vorteil dieser Repräsentation basiert jedoch auf einer wesentlich
besseren räumlichen Darstellung. Vom Benutzer weiter entfernte Teile des Moleküls können
besser identifiziert werden, da sie durch Atome und Bindungen, die näher zum Betrachter
ausgerichtet sind, verdeckt werden. Dieser Eindruck wird durch den Einsatz von Techniken
wie dem Gouraud-Shading [56] noch verstärkt.
29
3 Visualisierung chemischer Datenobjekte
Abb. 3-1:
Strukturdarstellungen von 3,5-Diaminophenol (generiert mit VRML File Creator (vgl. Abschnitt
4.1.2)): a) Ball & Stick-Repräsentation, b) Wireframe-Repräsentation, c) CPK-Modell, d) CappedDarstellung (Farbabbildung: Anhang A, Abbildung A-1).
3.1.2.3 Space filling-Modell
Das von Corey, Pauling und Koltun entwickelte Space-filling-Modell ist besser unter dem
Namen CPK-Modell bekannt [53] (Abbildung 3-1c). Wie in der Ball & Stick-Repräsentation werden die Atome in Form von Kugeln ausgedrückt. Da die Kugelradien den korrespondierenden van der Waals-Radien entsprechen und sich im Allgemeinen überschneiden kann
auf die Repräsentation der Bindungen verzichtet werden. Das CPK-Modell ist im Gegensatz
zu den anderen Modellen in der Lage, einen ersten Eindruck von den räumlichen Ausmaßen
einer Struktur zu vermitteln.
3.1.2.4 Capped Sticks-Modell
Das Capped Sticks-Modell kann als gegensätzliches Modell zum Space filling-Modell
angesehen werden, da die molekulare Struktur nur durch die Bindungszylinder repräsentiert
wird (Abbildung 3-1d). Die Kugeln sind auf die Größe der Zylinderdurchmesser zusammengeschrumpft und dienen lediglich zum Glätten der Zylinderenden. Analog zum Ball & StickModell vermittelt auch das Capped Sticks-Modell einen verbesserten räumlichen Eindruck
im Vergleich zum Wireframe-Modell.
30
3.1 Molekulare Modelle und ihre Repräsentation
3.1.2.5 Modelle für biologische Makromoleküle
Die Visualisierung biologischer Makromoleküle, die aus Hunderten oder Tausenden von
Atomen bestehen, ist mit Hilfe der bereits beschriebenen Molekülmodelle nur bedingt möglich. Zum einen werden diese Modelle ab einigen Hundert Atomen sehr schnell unübersichtlich und zum anderen sind die erforderlichen Rechenleistungen zur interaktiven
Visualisierung solcher Modelle zu hoch. Zur Lösung dieser Problematik wurden einige vereinfachte Molekülmodelle entwickelt, die in erster Linie zur Darstellung der Sekundärstruktur von Proteinen dienen [57].
Cylinder-Modell. Das Cylinder-Modell wird zur Kennzeichnung von Helices in Proteinstrukturen verwendet.
Ribbon-Modell. Während helikale Sekundärstrukturen mit der Cylinder-Darstellung
repräsentiert werden, hat sich zur Visualisierung von Faltblattstrukturen das Ribbon-Modell
etabliert. Ribbon-Modelle ähneln in ihrem Aussehen flachen Bändern. Die Oberseite dieser
Bänder ist dabei parallel zur Peptidbindung ausgerichtet. In weiterentwickelten Repräsentationen werden die flachen Bänder durch flache Pfeilstukturen ersetzt.
Tube-Modell. Die Tube-Struktur besteht aus kleinen röhrenförmigen Gebilden, die zur
Darstellung von sogenannten coils und turns verwendet wird.
3.1.2.6 Kristallographische Modelle
Anorganische Verbindungen können häufig ebenfalls nicht mit den allgemeinen Strukturmodellen dargestellt werden, da sie auf komplexen Kristallstrukturen (Raumgruppen), Aggregaten oder Metallgittern basieren. Diese Verbindungen werden daher durch individuelle
Polyeder wie beispielsweise Oktaeder und Tetraeder dargestellt.
3.1.3
Molekulare Oberflächen
Zum Verständnis der diversen molekularen Wechselwirkungen reicht eine Betrachtung der
Strukturdaten alleine nicht aus. Vielmehr muss dazu die räumliche Gestalt bzw. Hülle des
Moleküls betrachtet werden. Die erste Definition einer solchen molekularen Hülle geht dabei
auf Richards [58] zurück, der die molekulare Oberfläche als eine wasserzugängliche Hülle
beschrieb. Darüber hinaus kann die molekulare Oberfläche aber auch in Abhängigkeit von
der elektronischen Dichte betrachtet werden. Die Repräsentation der molekularen Oberflächen erfolgt dabei in der Regel in Form von Punktwolken, Gitternetzen (Meshes oder Chikken-Wire) oder soliden Hüllen, deren Transparenz beliebig variiert werden kann
(Abbildung 3-2).
31
3 Visualisierung chemischer Datenobjekte
Abb. 3-2:
SES-Oberflächendarstellungen von Trinitrotoluol (generiert mit MolSurf (vgl. Abschnitt 4.1.5)):
a) Semitransparente Solid-Repräsentation, b) Dot Cloud-Repräsentation, c) Chicken WireRepräsentation (Farbabbildung: Anhang A, Abbildung A-6a-c).
Die folgenden Modelle beschreiben im Detail die verschiedenen Definitionen von molekularen Oberflächen.
3.1.3.1 Van der Waals-Oberfläche
Die van der Waals-Oberfläche, die Solvent Accessible Surface (vgl. Abschnitt 3.1.3.3)
und die Connolly-Oberfläche (vgl. Abschnitt 3.1.3.2) basieren auf der Definition von
Richards. Die van der Waals-Oberfläche stellt dabei den einfachsten Vertreter dieser Oberflächen dar. Im Prinzip wird dabei die Oberfläche des CPK-Modells (vgl. Abschnitt 3.1.2.3)
betrachtet, die sich durch Aufaddieren der einzelnen Atomsphären ergibt. Die
van der Waals-Oberfläche stellt auch aus der Sicht der computergestützten Methoden die
einfachste Oberflächenform dar, da sie sehr einfach zu generieren ist.
3.1.3.2 Connolly-Surface
Die Connolly-Oberfläche [59, 60] zeichnet sich im Gegensatz zur van der Waals-Oberfläche durch eine ebenmäßigere Oberflächenstruktur aus. Die spitzen Übergänge zwischen
den einzelnen Atomradien werden vermieden, indem man eine Kugel mit definiertem Radius
(schematisch Darstellung des Lösungsmittels) über die CPK-Oberfläche rollt. Der Radius
dieser Sphäre entspricht dabei im Allgemeinem dem effektiven Kugelradius des Wassermoleküls (1,4 Å). Die resultierende Oberfläche setzt sich dabei aus zwei Oberflächenarten zusammen: a) dem Teil der van der Waals-Oberfläche, der im direkten Kontakt zum Lösungsmittel
(Kugel) steht und b) dem Teil der Lösungsmittel-Sphäre, der beim Kontakt mit zwei oder drei
Atomen der Struktur vorliegt. Connolly-Oberflächen werden heute standardmäßig im
Molecular Modelling eingesetzt, da sie den quantitativen und qualitativen Vergleich von verschiedenen Molekülen zulassen.
32
3.1 Molekulare Modelle und ihre Repräsentation
3.1.3.3 Solvent Accessible Surface (SAS)
Unter den Solvent Accessible Surfaces versteht man im Allgemeinen eine bestimmte
Klasse von Oberflächen, zu denen auch die Connolly-Oberfläche zählt. Darüber hinaus steht
die Bezeichnung Solvent Accessible Surface auch für ein ganz bestimmtes, eigenständiges
Modell einer Oberfläche. Dieses Oberflächenmodell geht dabei auf die Arbeiten von Lee und
Richards zurück [61]. Während im Connolly-Verfahren die Kontaktflächen als Grundlage für
die molekulare Oberfläche dienen, bestimmt im SAS-Verfahren das Zentrum der Lösungsmittelkugel die Gestalt der molekularen Oberfläche. Zum einen ist die Ausdehnung der resultierenden Oberfläche größer, zum anderen treten die Übergänge zwischen den einzelnen
Atomen deutlicher hervor.
3.1.3.4 Solvent Excluded Surface (SES)
Oberflächen großer Moleküle wie beispielsweise Proteinen können mittels der beschriebenen Methoden nicht mehr effektiv berechnet und dargestellt werden. Zur Darstellung der
Oberfläche greift man daher auf weniger rechenintensive, harmonische Näherungsmethoden
wie dem Solvent Excluded Surface-Ansatz zurück [62].
3.1.3.5 Bindungstaschen-Oberflächen
Diese molekulare Oberfläche leitet sich nicht wie in den anderen Fällen von der strukturellen Information eines Moleküls ab, sondern repräsentiert die Form der Active Site eines Proteins, die einen Liganden umgibt. Diese Repräsentionsform wird daher vor allem im
Wirkstoffdesign eingesetzt, um die Volumen von Bindungstaschen oder molekulare Wechselwirkungsschichten darzustellen [63].
3.1.3.6 Isowert-basierte Elektronendichte-Oberflächen
Neben den vom CPK-Modell abgeleiteten Oberflächenbeschreibungen hat sich ein weiteres Modell zur Generierung molekularer Oberflächen etabliert. Grundlage dieses Modells ist
die molekulare Elektronendichteverteilung. Durch Definition eines Grenzwertes für die Elektronendichte, dem sogenannten Isowert, ergibt sich eine Grenzschicht (Isofläche) [64]. Jeder
Punkt auf dieser Oberfläche hat daher den gleichen Elektronendichtewert. Ein typischer Standardwert für die Elektronendichte zur Repräsentation solcher Oberflächen liegt bei
0.002 Atomeinheiten.
Isowert-basierte Oberflächen kommen aber auch zur Repräsentation von Molekülorbitalen
zum Einsatz (vgl. Abschnitt 3.1.4.1).
33
3 Visualisierung chemischer Datenobjekte
3.1.3.7 Experimentell ermittelte Oberflächen
Eine vollkommen neue Möglichkeit zur Gewinnung von Oberflächen hat sich in den letzten Jahren durch enorme Fortschritte in der Elektronenmikroskopie ergeben. Im Gegensatz zu
den oben beschriebenen Modellen, die durch Berechnungen ermittelt wurden, können mit
Hilfe von neuen Technologien wie der Cryo-Elektronenmikroskopie molekulare Oberflächen
auch experimentell ermittelt werden [65]. Die Moleküloberfläche ist dabei durch die Auflösung des experimentellen Ansatzes limitiert. Aktuelle Verfahren liefern mittlerweile Auflösungen von ca. 10 Å was somit die Visualisierung von Proteinstrukturen und Sekundärstrukturelementen ermöglicht [66]. Der Vorteil dieser Methodik beruht auf der Möglichkeit,
molekulare Strukturen von nativen Makromolekülen zu beobachten.
3.1.4
Molekulare Eigenschaften
Die Kenntnis der räumlichen Gestalt eines Moleküls reicht im Allgemeinen nicht aus, um
komplexe, molekulare Wechselwirkungen zu verstehen. Vielmehr müssen molekulare Eigenschaften wie beispielsweise das elektrostatische Potential, hydrophile Eigenschaften oder
auch Fähigkeiten zur Ausbildung von Wasserstoffbrücken mit in die Betrachtung einbezogen
werden. Dabei kann zwischen drei Eigenschaftskategorien unterschieden werden.
3.1.4.1 Molekülorbitale (Isowert-basierte Eigenschaften)
Ob Molekülorbitale zu der Klasse der molekularen Oberflächen oder doch eher zu den
molekularen Eigenschaften zu zählen sind, ist in der Wissenschaft nicht unumstritten. Unbestritten ist jedoch, dass die Kenntnis von Molekülorbitalen insbesondere des HOMO (highest
occupied molecular orbital) und LUMO (lowest unoccupied molecular orbital) wichtige
Hinweise für ein besseres Verständnis von Reaktionen vermitteln kann.
Darüber hinaus waren Molekülorbitale auch die ersten elektronischen Eigenschaften, die
mit Hilfe einfacher Graphikhardware visualisiert wurden. Der Grund für diese frühe, graphische Repräsentation beruht auf der theoretischen Natur der Quantenchemie. Die schwer
zugänglichen Grundlagen können mit Hilfe der graphischen Darstellung wesentlich schneller
erfasst und verstanden werden als durch eine Sammlung numerischer Orbitalkoeffizienten.
Die durch semi-empirische oder ab initio Verfahren generierten Molekülorbitale werden analog zu den bereits in Abschnitt 3.1.3.6 beschriebenen Elektronendichte-Oberflächen durch
Isoflächen dargestellt. Orbitalanteile, die auf unterschiedlichen Vorzeichen der Wellenfunktion basieren, werden dabei häufig durch unterschiedliche Farben (beispielsweise rot und
blau) repräsentiert.
34
3.1 Molekulare Modelle und ihre Repräsentation
Neben den Molekülorbitalen können auch andere molekulare Eigenschaften wie das elektrostatische Potential oder die Spindichte mit Hilfe von Isowert-Oberflächen dargestellt werden. Im Regelfall werden diese skalaren Eigenschaften aber auf die in Abschnitt 3.1.3
beschriebenen Oberflächen abgebildet.
3.1.4.2 Skalare Eigenschaften
Skalare Eigenschaften wie das elektrostatische Potential werden in der Regel durch Abbildung auf molekulare Oberflächen dargestellt. Diese Form einer höherdimensionalen Repräsentation erlaubt eine schnelle und einfache Identifikation relevanter Molekülregionen, die
durch die Betrachtung reiner Strukturdaten nicht problemlos möglich wäre.
Aus Sicht der Computergraphik sind dabei zwei grundsätzliche Ansätze zum Abbilden von
Eigenschaften auf molekulare Oberflächen denkbar. Im ersten Fall wird den einzelnen Gitternetzpunkten der Oberfläche ein entsprechender Farbwert zugewiesen. Durch eine nachfolgende Interpolation der Farbwerte beim Verbinden der Gitterpunkte zu Linien (Chicken Wire)
oder Flächen (Solid Sphere) ergibt sich eine Oberfläche mit einem kontinuierlichen
Farbverlauf [56]. Alternativ zu diesem Ansatz können auch farbige Texturen auf der Oberfläche abgebildet werden [67, 68].
Im Folgenden werden die wichtigsten Vertreter diese Eigenschaftsklasse kurz vorgestellt.
Elektrostatisches Potential. Das molekulare elektrostatische Potential (MEP) wurde als
erstes von Bonaccorsi et al. [69] definiert und ist unbestritten die wichtigste und meistgenutzte Eigenschaft. Mit Hilfe des elektrostatischen Potentials lassen sich leicht molekulare
Regionen ermitteln, die für die Reaktivität einer Verbindung eine große Bedeutung haben.
Darüber hinaus spielt das MEP auch bei der Bildung von Protein-Ligand-Komplexen eine
entscheidende Rolle. Für weitergehende Information zum elektrostatischen Potential wird der
Übersichtsartikel von Murray und Politzer in der Encyclopedia of Computational Chemistry
empfohlen [70].
Polarisierbarkeit und Hydrophobizität. Diese Eigenschaften spielen ebenfalls eine relevante Rolle bei der Betrachtung molekularer Wechselwirkungen. Im Gegensatz zum elektrostatischen Potential kommen diese Eigenschaften jedoch erst bei kleinen Abständen zwischen
interagierenden Molekülregionen zum Tragen.
Spindichte. Die Spindichte ist vor allem für die Betrachtung von Radikalen von Bedeutung, da durch die Visualisierung dieser Eigenschaft ungepaarte Elektronen schnell lokalisiert
werden können.
35
3 Visualisierung chemischer Datenobjekte
3.1.4.3 Vektorielle Eigenschaften
Das Abbilden molekularer Eigenschaften auf Moleküloberflächen ist nur im Fall von skalarfeldbasierten Werten möglich. Für die Visualisierung vektorieller Eigenschaften wie beispielsweise dem elektrischen Feld eines Moleküls oder der potentiellen Ausrichtung einer
Wasserstoffbrücken-Bindung müssen alternative Darstellungsverfahren angewendet werden.
Gerichtete Eigenschaften werden dabei in der Regel durch räumliche ausgerichtete Kegel
oder durch Feldlinien repräsentiert.
3.1.4.4 Volumetrische Eigenschaften
Die Visualisierung volumetrischer Eigenschaften spielt vor allem in anderen wissenschaftlichen Disziplinen wie der Medizin (z.B. Computertomographie) oder der Geologie (z.B.
Konvektionsströme) eine bedeutende Rolle. Allerdings finden sich auch in der Chemie einige
Anwendungsgebiete für diese Eigenschaften. Stellvertretend für diese Klasse von Eigenschaften sei hier nur die Wasserdichteverteilung bei Moleküldynamiksimulationen erwähnt. Die
computergestützte Visualisierung dieser Eigenschaften wird im Allgemeinen durch zweioder dreidimensionale Texturen realisiert [68].
3.1.5
Animationen
Obwohl Animationen keine eigenständige Molekülmodellklasse darstellen, kommt dieser
Repräsentationsform eine hohe Bedeutung bei der Interpretation dynamischer Prozesse zu.
Animationen werden dabei nicht nur in forschungsorientierten Bereichen standardmäßig eingesetzt, sondern haben sich darüber hinaus auch als exzellente Werkzeuge in der chemischen
Ausbildung erwiesen. Insbesondere Schwingungsmoden, Molecular Docking-Experimente,
Molekulardynamik-Simulationen, Reaktionsvorgänge und Energieminimierungspfade können mit Hilfe von Animation anschaulich dargestellt werden.
3.2 Internetbasierte Applikationen in der Chemie
Neben der bereits beschriebenen Tragweite der graphischen Datenverarbeitung hat noch
eine andere computergestützte Technologie den chemischen Alltag in Forschung und Lehre
nachhaltig beeinflusst – das Internet.
3.2.1
Die frühen Jahre: 1970 - 1993
Das Internet hat vor allem in den letzten Jahren einen enormen Zuwachs in seiner Größe
und Bedeutung erfahren. Dabei ist es auch für Chemiker zu einem wichtigen Medium zur
36
3.2 Internetbasierte Applikationen in der Chemie
Kommunikation und zum Austausch chemischer Information jeglicher Art geworden. Dies
war jedoch nicht immer der Fall. Obwohl das Internet bereits 1969 als militärisches Netzwerk
(ARPANET) gegründet und kurze Zeit später für die akademische und kommerzielle Nutzung
zugänglich wurde, war es bis 1993/94 nur einem kleinen Kreis von Chemikern bekannt. Darüber hinaus wurde der Nutzen dieses neuen Mediums von vielen Naturwissenschaftlern nicht
erkannt.
Trotz des geringen Bekanntheitsgrades wurde das Internet in den ersten Jahren insbesondere von theoretischen Chemikern und sogenannten Computational Chemists in Anspruch
genommen. Zu dieser Zeit beschränkte sich die Nutzung noch auf den durch FTP-Server vermittelten Austausch von Programmen, Daten und Dokumenten. Des Weiteren wurde 1984
vom STN-Konsortium der erste Online-Zugang zu einem der bedeutesten Chemieinformationsreservoire – den Chemical Abstract Service – angeboten. Neben diesen Angeboten wurde
aber vor allem die eMail-Technologie zur weltweiten, wissenschaftlichen Kommunikation
genutzt.
Eine teilweise breitere Beachtung in der chemischen Gemeinschaft fand das Internet mit
der Einführung des MIME-Standards (vgl. Abschnitt 2.2.1) im Jahre 1993 [31] und der Spezifikation chemischer MIME-Typen im darauf folgenden Jahr [6]. Diese Erweiterung
erlaubte erstmals eine inhaltsbezogene Übermittlung und automatisierte Client-seitige Verarbeitung chemischer Daten.
Die Kombination dieser zunächst für die eMail-Technologie entwickelten Erweiterung mit
dem neuen Kommunikationsmedium World Wide Web (WWW) bildete schließlich die technische Basis für die nachfolgende, explosionsartige Nutzung des Internets. Das
World Wide Web wurde dabei zunächst im CERN in Genf als in-house System zur effektiven und kostengünstigen Kommunikation zwischen Physikern auf der ganzen Welt entwikkelt und trat seinen Siegeszug mit der Verfügbarkeit von WWW-Clients, den sogenannten
Browsern, an.
3.2.2
Vom Durchbruch bis zum Stand der Technik
Die Gründe für den enormen Erfolg des Internets in der Chemie sind vielfältig, können
aber vor allem auf die für chemische Daten ungünstigen Limitierungen des papierbasierten
Druckmediums zurückgeführt werden. Mit Hilfe des WWW war es nun erstmals möglich
auch andere, nicht-textuelle aber dennoch für die Chemie relevante Datentypen einer breiten
Nutzerschaft zur Verfügung zu stellen. Darüber hinaus spielten hierbei auch andere Faktoren
wie Zeit, Qualität und Weiterverarbeitungsmöglichkeit eine entscheidende Rolle. So waren
zum Beispiel auf dem herkömmlichen Wege publizierte Daten an ihrem Erscheinungstag
37
3 Visualisierung chemischer Datenobjekte
bereits veraltet und überholt. Durch den langen Publikationsweg gingen im Regelfall auch
immer wieder Originaldaten verloren. Zum einen konnten Originaldaten aus Platzgründen
nicht mit in einer Publikation mit aufgenommen werden. Somit war eine vorherige Reduktion
der Daten nötig, was durch Analyse- und Interpretationsschritte erreicht wurde. Die Konsequenz dieses Vorgangs war eine erschwerte Weiterverarbeitung der publizierten Daten. Ein
weiteres Problem, das zum Verlust von Originaldaten führte, war der Umstand, dass es während des Publikationsprozesses immer wieder zu Transkriptionsfehlern kam, die in letzter
Konsequenz die veröffentlichten Daten unbrauchbar machten. Das World Wide Web war
und ist ein Medium, das diese Probleme löste.
Während sich die ersten chemisch orientierten HTML (Hyper Text Markup Language)Seiten noch auf textuelle und bildliche Darstellungen beschränkten, folgten bald auch Webangebote, die den Austausch und die Weiterverarbeitung von chemischen Daten wie dem Proteindatenbankformat (PDB) [71] oder dem MDL Molfile Format [72] erlaubten. Dabei
wurde mit Hilfe von Hyperlinks eine Verknüpfung zu einem chemischen Austauschformat in
einer HTML-Seite eingebettet. Beim Anklicken dieses Links wurde dann die MIME-codierte
Datei an den Client gesendet. Bei entsprechender Konfiguration des Clients wurde anschließend ein Hilfsprogramm gestartet, das die Bearbeitung oder die Visualisierung der Daten
gestattete. Erste, auf diesem Prinzip beruhende Arbeiten wurden 1994 von Henry Rzepa und
Mitarbeitern präsentiert [3, 6]. Die Visualisierung der Moleküldaten wurde dabei durch plattformabhängige Programme wie beispielsweise XMol [73], EyeChem [74] oder RasMol [19]
bewerkstelligt, wobei RasMol zwischen 1994 und 1995 den Stellenwert eines de-facto Standards einnahm.
Eine weiterentwickelte Form dieses Datenaustausches war durch die Entwicklung der
Chemical Structure Markup Language (CSML) möglich [3]. Dabei wurden zunächst eine
PDB-Datei wie beschrieben an den Client übermittelt und mit RasMol visualisiert. Die Webseite enthielt darüber hinaus jedoch auch eine GIF-Datei, in der verschiedene Bereiche mit
Hyperlinks verknüpft waren (image map). Durch Auswahl eines bestimmten Bereiches wurde
eine sogenannte CSML-Datei an den Client übermittelt. Bei den gesendeten Daten handelte
es sich um RasMol-Skriptanweisungen, die mit Hilfe eines Skriptprogramms an RasMol weitergeleitet wurden und somit zusätzliche Darstellungsmöglichkeiten erlaubten. Diese Technik
wurde unter anderem dazu genutzt, um NMR-Daten und metabolische Pfade zu visualisieren.
Ein Nachteil dieser Technik war jedoch die Limitierung auf UNIX-basierte Systeme.
Ein weiteres UNIX-abhängiges System basierte auf der EyeChem-Umgebung. EyeChem
war eine modulare Erweiterung des IRIS Explorers und erlaubte die Betrachtung und Manipulation einer chemischen Szene von mehreren Workstations aus. Durch Entwicklung spezieller
Module und Nutzung des Web-Browser Mosaic sowie dem integriertem Common Client
38
3.2 Internetbasierte Applikationen in der Chemie
Interface (CCI) war eine WWW-basierte Kommunikation zwischen entfernten EyeChemApplikationen möglich [75]. Dieser Ansatz realisierte somit die erste Form eines webfähigen, chemischen Expertensystems.
Während die oben genannten Ansätze das Vorhandensein und Starten von Browserexternen Applikationen erforderten, wurde mit Einführung der Netscape-Plugin-Technologie
im Jahre 1995 nun auch die Einbettung von Hilfsprogrammen in das Browserfenster möglich.
Das erste chemische Plugin namens Chime wurde dabei von der Firma MDL im Rahmen ihres
Softwarepakets Chemscape entwickelt [32]. Das auf RasMol aufbauende Plugin beherrscht
die wichtigsten Strukturdarstellungsformen und ist auch in der Lage Oberflächen sowie
einfache Animationen zu repräsentieren. Darüber hinaus wurde das Plugin in den letzten
Jahren mit einer Reihe an zusätzlichen Funktionalitäten wie beispielsweise einer
weiterentwickelten Skriptfunktion ausgerüstet. Chime hat sich bis heute als wichtigstes
Visualisierungsplugin behauptet und bot auch die Grundlage für fortgeschrittene
Applikationen wie dem Protein-Explorer [76]. Neben Chime wurden bis heute eine ganze
Reihe weiterer Plugins entwickelt. Stellvertretend sollen hier nur das JCAMP-DXPlugin [77] zur Darstellung von Spektren, das ChemDraw/Chem3D Net-Plugin von
CambridgeSoft [78] und das WebLab-Plugin [79] zur Darstellung von Eigenschaften und
Polymeren genannt werden. Die Kombination von Plugins wie beispielsweise von Chime und
JCAMP-DX-Plugin zur Darstellung von Spektren wurde ebenfalls beschrieben [80].
Mittlerweile wurde JCAMP-DX von der Firma MDL in Chime integriert.
Ein vollkommen anderer Weg zur Datenübertragung wurde mit dem Internet-Standard
VRML (vgl. Abschnitt 2.2.5) möglich. Während in den oben beschriebenen Ansätzen
chemische Austauschformate zum Client übertragen werden, wird mit VRML eine
dreidimensionale, graphische Szene an den Client gesendet. Im Gegensatz zum Austausch
von chemischen Strukturdateien entfällt dabei die Installation diverser Applikationen mit
unterschiedlichen Benutzerschnittstellen und somit auch die Limitierung dieser
Anwendungen. Da mit einem VRML-Viewer beliebige dreidimensionale Szenen betrachtet
werden können, ist auch die Repräsentation exotischer Daten wie beispielsweise ionischen
Gitterstrukturen, Flüssigkristallen oder auch Molekülorbitalen und molekulare Oberflächen
mit assoziierten Eigenschafen möglich. Die ersten chemischen VRML-Anwendungen wurden
von Casher et al. im Dezember 1994 generiert [74, 75] und ermöglichten die Visualisierung
von Wireframe-, Ball & Stick-, CPK- und Ribbon-Modellen. Diese Ansätze erlaubten zudem
die Visualisierung von Molekülorbitalen und elektrostatischen Potentialen [81] als auch die
Darstellung von intermolekularen Wechselwirkungen [82]. Vollhardt und Brickmann nutzten
die neue Technologie, um Proteinstrukturen und komplexe Proteinoberflächen sowie
Moleküleigenschaften zu visualisieren [83, 84]. Darüber hinaus entwickelten sie interaktive
39
3 Visualisierung chemischer Datenobjekte
Online-Dienste zur Generierung von VRML-Szenen aus PDB-Dateien und zur Darstellung
von Atomorbitalen [9].
Die beschriebenen VRML-Applikationen basieren auf VRML1.0 und erlauben lediglich
die Visualisierung von statischen 3D-Szenen. Durch die Einbettung von Hyperlinks konnten
zwar andere VRML-Szenen oder externe HTML-Seiten interaktiv aufgerufen werden, jedoch
waren fortgeschrittene Benutzerinteraktionen und Animationen erst durch Einführung des
VRML97-Standards möglich. Die erste chemische VRML-Applikation, die auf diesem
Standard basierte, ermöglichte die animierte Darstellung von Schwingungsmoden [85]. Die
Auswahl von Spektrenpeaks in einer Bilddatei führte zur Darstellung der korrespondierenden
Schwingung in einem VRML-Plugin. Weitere auf dem VRML97 Standard basierende
Beispiele folgten in den darauf folgenden Jahren [86, 87].
Zur Realisierung der oben beschriebenen Ansätze müssen zuvor externe Applikationen
oder plattformabhängige Plugins installiert werden. Diese Voraussetzung wurde durch die
plattformunabhängige Programmiersprache Java (vgl. Abschnitt 2.2.4) hinfällig. Mit Hilfe
von Java können Standalone-Applikationen programmiert werden. Interessanter ist jedoch die
Möglichkeit, sogenannte Applets zu entwickeln. Applets werden wie normale Daten an den
Client übermittelt und dort mit Hilfe einer Java Virtual Machine im Browser oder direkt auf
dem Client ausgeführt. Da Java eine plattform- und betriebssystemunabhängige Sprache ist
können die Programme im Gegensatz zu Plugins oder externen Programmen auf jedem
beliebigen Client ausgeführt werden. Eines der ersten chemischen Applets war der
Strukturviewer von ChemSymphony [11]. Mittlerweile sind eine Reihe von Applets für fast
jede chemische Problemstellung entwickelt worden. Einige dieser Applikationen erlauben
dabei auch den Zugriff auf externe Datenbanken oder ermöglichen die Kommunikation
zwischen Client und Server [88]. Zertifizierte Applets können auch auf lokale Ressourcen
zugreifen und sind somit in der Lage, chemische Austauschformate direkt einzulesen und zu
bearbeiten. Neben zahlreichen kommerziellen Applets sind mittlerweile auch eine Reihe von
OpenSource-Entwicklungen erschienen. Diese Programme werden dabei von einer offenen
Gemeinschaft von Programmierern entwickelt. Einige bekannte Vertreter sind das
JChemPaint-Applet [89] und das JMol-Applet[90], welche im Rahmen des OpenScienceProjekts [91] entstanden sind.
Eine relativ neue Erweiterung des Java-Standards ist Java3D. Java3D erlaubt die
Hardware-unterstützte Darstellung von dreidimensionalen Szenen. Mittlerweile sind auch die
ersten chemischen Anwendungen erschienen, die von der Java3D Application Programing
Interface (API) Gebrauch machen [88, 92].
Neben den beschriebenen internetbasierten Applikationen zur Visualisierung von
Molekülmodellen wurden auch zahlreiche andere Anwendungen und Methoden entwickelt
40
3.3 Client-Server-Ansätze zur chemischen Visual-
wie beispielsweise Datenbanken [93, 94], die Chemical Markup Language (CML) [95],
Dienste zur interaktiven Berechnung von Daten [96, 97] und elektronische Journale [7].
Diese Entwicklungen spielten für diese Arbeit keine relevante Rolle und werden anderer
Stelle beschrieben [98].
3.3 Client-Server-Ansätze zur chemischen Visualisierung
Im vorausgegangenen Abschnitt wurde bereits deutlich, dass verschiedene Ansätze für die
Client-Server-basierte Vermittlung und Visualisierung chemischer Daten realisiert werden
können. Die grundsätzlichen Transferstrategien werden im Folgenden zusammengefasst und
diskutiert.
3.3.1
Datentransfer
Beim Datentransfer wird chemische Information in MIME-codierter Form von einem Server an einen Client übermittelt. Das Internet bzw. Intranet dient bei diesem Ansatz als reines
Kommunikationsmedium. Die übermittelten Daten werden anschließend auf der Clientseite
mit Hilfe von externen Programmen oder Plugins bearbeitet und/oder visualisiert.
Der entscheidende Vorteil dieses Ansatz ist, dass die chemischen Originaldaten an den Client gesendet werden und dort für beliebige Weiterverarbeitungsschritte zur Verfügung stehen.
Die zur Visualisierung eingesetzten Standalone-Programme und Plugins werden zudem für
die zugrundeliegende Clientplattform kompiliert und optimiert, was sich unter anderem mit
deutlichen Geschwindigkeitsvorteilen bei der Visualisierung äußert. Plattformabhängige
Standalone-Applikationen sind darüber hinaus häufig mächtige Programmpakete, die über
fortgeschrittene Werkzeuge und Optionen zur Bearbeitung und Visualisierung der Daten verfügen. Somit steht dem Benutzer in diesem Ansatz ein größtmögliches Maß an Freiheitsgraden bei der Generierung der Visualisierungen als auch bei der Interaktion und Manipulation
der Daten zur Verfügung.
Der Datentransfer-Ansatz birgt jedoch nicht nur Vorteile. Die Visualisierung und Bearbeitung der chemischen Daten setzt zunächst die Installation entsprechender Standalone-Programme oder Plugins voraus. Da diese Programme in der Regel für die Handhabung eines
bestimmten Problems wie beispielsweise der Visualisierung einer dreidimensionalen Struktur
konzipiert sind, muss häufig eine ganze Reihe an diversen Applikationen mit unterschiedlichen Benutzerschnittstellen auf dem Client installiert werden. Dieser Umstand ist vor allem
für firmeninterne Intranet-Systeme mit einigen hundert oder Tausend Einzelplatzrechnern
unbrauchbar, da die Installation und Wartung der vielen Einzelprogramme aus Zeit- und
Kosten-Gründen nicht zu realisieren ist.
41
3 Visualisierung chemischer Datenobjekte
3.3.2
Softwaretransfer
Eine mögliche Lösung der oben beschriebenen, Datentransfer-basierten Probleme bietet
der Softwaretransfer-Ansatz. Bei diesem Ansatz werden neben der chemischen Information
auch plattformunabhängige Applikationen zur Bearbeitung der Daten an den Client übermittelt. Die Programme basieren in der Regel auf der Programmiersprache Java und können deshalb auf beliebigen Plattformen und Betriebssystemen ausgeführt werden. Die
Plattformunabhängigkeit hat jedoch auch ihren Preis. Java-Programme können nicht direkt
von dem Betriebssystem des Clients ausgeführt werden, sondern benötigen eine Virtual
Machine. Dadurch sind Java-Applikationen in der Regel etwas langsamer als Plugins oder
plattformabhängige Standalone-Programme. Auf der anderen Seite können Java-Applikationen aber auch so entwickelt werden, dass sie Client-seitig vorhandene Rechen- und Graphikressourcen nutzen können [99, 100]. Java-Applets können für beliebig komplexe
Problemstellungen entworfen werden und erlauben darüber hinaus die Kommunikation untereinander oder mit Plugins, wodurch auch kombinierte Anwendungen zur Darstellung von
zwei oder mehreren Datenobjekten möglich sind (z.B. Strukturen und Spektren).
Java-Applikationen kamen im Rahmen dieser Arbeit vor allem zur Unterstützung der verschiedenen Graphiktransfer-Ansätze zum Einsatz.
3.3.3
Graphiktransfer
Beim Graphiktransfer werden in der Regel weder chemische Daten noch Programme über
das Netzwerk versendet. Vielmehr wird nur eine graphische Szene an den Client übermittelt
und dort dargestellt. Ein in der Chemie häufig eingesetzter Vertreter dieses Ansatzes ist die
Virtual Reality Modelling Language (VRML). Dabei werden in fertiger Form vorliegende
oder interaktiv erzeugte VRML-Dateien an den Client übersandt. Auf der Clientseite ist zur
Darstellung der Szene nur ein einziger Viewer mit einer einheitlichen Benutzerschnittstelle
erforderlich. Als rein graphisches Austauschformat gibt es in VRML keine Limitierung bei
der Darstellung chemischer Information. Somit können auch exotische Sachverhalte dargestellt und die Szenen mit zusätzlicher Information wie Texten oder Hyperlinks ausgestattet
werden. Aus diesem Grunde war und ist VRML das einzige Medium, welches den Austausch
komplexer, molekularer Oberflächen erlaubt.
Aktuelle VRML-Anwendungen in der Chemie [86, 101] dienen vor allem zur plattformunabhängigen Repräsentation chemischer Datenobjekte, die nicht mit aktuellen Standardsapplikationen dargestellt werden können, und werden daher auch von vielen kommerziellen
Programmpaketen als alternatives Ausgabeformat angeboten. Auf diesem Wege kann zwar
chemische Information einfach und plattformungebunden dargestellt werden, aber die Mög-
42
3.3 Client-Server-Ansätze zur chemischen Visual-
lichkeit zur Interaktion mit den chemischen Daten wird durch diesen Prozess stark eingeschränkt. Zudem ist eine Weiterverarbeitung der Daten nicht mehr möglich.
Bei Betrachtung der Visualisierungspipeline in Abschnitt 2.1.2 wurde deutlich, dass der
große Vorteil der dreidimensionalen Visualisierung vor allem in den zahlreichen Möglichkeiten zur Benutzerinteraktion begründet liegt. Dabei wurde angenommen, dass die komplette
Visualisierungspipeline auf nur einem System ausgeführt wird. Beim Graphiktransfer in
einem Client-Server-System können die diversen Module der Visualisierungspipeline beliebig zwischen Client und Server aufgeteilt werden (siehe Abbildung 3-3).
Interaktion
Simulation
Datenbank
Rohdaten
Filter
Mapper
Bilder
Video
Renderer
Sensoren
Server
Netzwerk
Client
Darstellung
Client-Server Visualisierungspipeline
Abb. 3-3:
Aufteilung der Stufen der Visualisierungspipeline in einem Client-Server-System.
Die Visualisierungspipeline und die sich durch die Aufteilung der Module ergebenden Client-Server-Strategien [102] standen bei der Entwicklung der in diesem Kapitel beschriebenen Anwendungen im Vordergrund. Die Wahl einer geeigneten Strategie hängt dabei von
einer Reihe von Faktoren ab: Art und Größe der Daten, Bandbreite und Latenz des Netzwerks, graphische und numerische Fähigkeiten der vorhandenen Client- und Server-Rechner.
Grundsätzlich können drei verschiedene Strategien unterschieden werden: hybride Strategien,
Client-seitige Strategien und Server-seitige Strategien.
Die einzelnen Strategien sowie ihre Vor- und Nachteile werden im folgenden Kapitel
anhand von im Rahmen dieser Arbeit entwickelten Visualisierungsapplikationen beschrieben.
43
3 Visualisierung chemischer Datenobjekte
44