Meloncillo – eine graphische Benutzeroberfläche zur musikalischen

Transcription

Meloncillo – eine graphische Benutzeroberfläche zur musikalischen
Meloncillo – eine graphische
Benutzeroberfläche zur musikalischen
Raumklangsteuerung mit
Implementierung einer
OSC-Schnittstelle zur Klangsynthese
Magisterarbeit
von Hanns Holger Rutz, Matr.-Nr. 192946
Technische Universität Berlin
Kommunikationswissenschaft
Betreuer: Prof. Dr. Stefan Weinzierl
La musique du futur? Sûrement basée sur le son et au-delà des notes“
”
(Edgard Varèse 1947)
Varèses Denken war empirisch. Er interessierte sich dafür,
”
wie es klang – nicht wie es gemacht war.“
(Morton Feldman 1966)
Die selbständige Anfertigung versichere ich an Eides Statt.
Inhaltsverzeichnis
1 Einführung
1.1 Begriff der Raumklangsteuerung . . . . . . . . . .
1.1.1 Abgrenzung zu Auralisationsverfahren . . .
1.1.2 Abgrenzung zu Live-Diffusionsverfahren . .
1.2 Historische Wurzeln . . . . . . . . . . . . . . . . .
1.3 Vorhandene Software zur Raumklangsteuerung . .
1.3.1 APB-Tools Σ 1 . . . . . . . . . . . . . . . .
1.3.2 zplane.development z.matrix . . . . . . . .
1.3.3 Wonder . . . . . . . . . . . . . . . . . . . .
1.3.4 Surround Panning Objekte . . . . . . . . .
1.4 Hardware basierte Raumklangsteuerung . . . . . .
1.5 Raumklang-Synthese Plug-Ins . . . . . . . . . . . .
1.5.1 VBAP – Vector Based Amplitude Panning
1.5.2 IRCAM Spat˜ . . . . . . . . . . . . . . . .
1.5.3 Spatialisierung mit CSound . . . . . . . . .
1.6 Notwendigkeit einer neuen Raumklangsteuerung .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
5
8
8
9
10
10
12
13
13
14
16
16
17
18
19
2 Entwicklung des Programms Meloncillo
2.1 Tendenzen in der Entwicklung von Musiksoftware . . . .
2.2 Designspezifikation für eine neue Raumklangsteuerung .
2.2.1 Trennung von Oberfläche und Signalverarbeitung
2.2.2 Abstraktion vom Synthesemodell . . . . . . . . .
2.2.3 Anwender mit und ohne Programmiererfahrung .
2.2.4 Unabhängigkeit vom Betriebssystem . . . . . . .
2.2.5 Zwei grundlegende Objekttypen . . . . . . . . .
2.2.6 Echtzeit und Offline Modus . . . . . . . . . . . .
2.2.7 Diskrete Datenströme . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20
20
21
21
22
23
23
24
24
25
.
.
.
.
.
.
.
.
26
26
28
28
30
31
32
32
33
3 Programmarchitektur
3.1 Sprache und Arbeitsumgebung . .
3.2 Packages Überblick . . . . . . . . .
3.3 Session . . . . . . . . . . . . . . . .
3.4 Receiver, ReceiverCollection . . . .
3.5 Transmitter, TransmitterCollection
3.6 Timeline . . . . . . . . . . . . . . .
3.7 Events . . . . . . . . . . . . . . . .
3.8 Threads . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Inhaltsverzeichnis
4 Graphische Benutzeroberfläche
4.1 Surface : zweidimensionale Momentansicht
4.1.1 Hilfs-Paletten und Werkzeuge . . .
4.1.2 ReceiverEditor . . . . . . . . . . .
4.1.3 Matrix Meter . . . . . . . . . . . .
4.2 Timeline : horizontale Zeitdarstellung . .
4.2.1 Trajektorien Daten-Format . . . .
4.2.2 Transport Palette . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
35
35
37
39
40
40
41
43
5 Plug-In Schnittstellen
5.1 Offline (Nicht-Echtzeit) . . . . . . . .
5.2 Realtime (Echtzeit) . . . . . . . . . . .
5.3 Common Lisp für Java . . . . . . . . .
5.3.1 Die LispPlugIn Klasse . . . . .
5.3.2 Ein Beispielscript . . . . . . . .
5.4 Open Sound Control . . . . . . . . . .
5.4.1 Protokollübersicht . . . . . . .
5.4.2 Implementierung in Meloncillo
5.4.3 Anbindung an SuperCollider .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
44
44
46
49
50
51
54
54
56
57
6 Resumé
6.1 Anwendungsbeispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
62
67
68
Literaturverzeichnis
70
Anhang: Abbildungen, Quelltexte
73
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1 Einführung
Die vorliegende Magisterarbeit beschreibt den Entwurf und die Realisierung einer SoftwareApplikation zur musikalischen Raumklangsteuerung. Das im wesentlichen aus einer graphischen Benutzeroberfläche bestehende Programm mit dem Namen Meloncillo“ erlaubt die
”
Gestaltung von Trajektorien in einem zweidimensionalen Raum und kann in Verbindung
mit einem existierenden Klangsynthese-Programm wie SuperCollider dazu verwendet werden,
verräumlichte Klänge zu berechnen oder in Echtzeit abzuspielen. Für die Echtzeit-Steuerung
ist eine Open Sound Control (OSC) Schnittstelle vorgesehen. Eine script-gesteuerte Plug-In
Schnittstelle ermöglicht es, unterschiedliche Modelle der Verräumlichung zu benutzen.
Die Arbeit ist dadurch motiviert, daß die Raumklangsteuerungen, die dem Autor bekannt
sind, zu wenig gestalterische Freiheiten bieten oder nicht ohne weiteres für die heute gängigen
Computer-Plattformen verfügbar sind. Das hier vorgestellte Programm soll neue Sichtweisen
auf musikalische Räumlichkeit öffnen.
CD-ROM
Der Quelltext und die Quelltext-Dokumentation können aus Platzgründen nicht abgedruckt
werden. Eine CD-ROM ist beigefügt, die alle nötigen Dateien enthält:
•
Quelltext
•
HTML Dokumentation aller Pakete und Klassen (javadoc)
•
Xcode IDE Projekt-Datei
•
kompiliertes Programm und Mac OS X Application Wrapper
•
externe Bibliotheken
•
Beispiel-Script, -Session und -Klänge
1.1 Begriff der Raumklangsteuerung
Der Begriff Raumklang enthält bereits ein musikalisches Element, während die englische
Übersetzung, etwa spatial sound, einen physikalischeren Charakter bekommt – sound kann
rückübersetzt auch Schall heißen. Physikalische Begriffe wären Raumschall oder Raumakustik.1
Zwischen Raumklang und Raumakustik besteht ein wesentlicher Unterschied: Raumakustik
beschreibt den Klang des Raumes, während Raumklang die Gestaltung von Klang im Raum
meint. Da eine musikalische Aufführung meist in einem geschlossenen Raum stattfindet, muß
1
vgl. [Haller 1995], S. 75
5
1 Einführung
sich der Komponist natürlich auch mit Raumakustik befassen. Das ist jedoch nicht Gegenstand dieser Arbeit. Raumakustik tritt beispielsweise nicht bei Kopfhörerübertragung oder
Beschallung im offenen Feld auf. Ein anderer Fall ohne äußere Raumeinwirkung sind Körperschallübertragung und Körperstimulation durch Aktuatoren.2
Die ganz unterschiedlich akzentuierten Aspekte von Räumlichkeit sind eines der Hauptmerkmale von Klangkunst und Klanginstallation. Für einen Überblick sei auf die Artikel des
Katalogs Klangkunst zum Festival Sonambiente 1996 hingewiesen3 . Ein paar Beispiele: In
Bill Fontanas Klangbrücke Köln-Tokyo wird das akustische Bild zweier sehr weit voneinander entfernter Orte auf der Welt durch Satelliten-Transmission ausgetauscht. Die Arbeit steht
in gewissem Kontext zu der von Murray Schafer entwickelten Idee der Klangökologie. Alvin
Lucier läßt dagegen in I’m Sitting in a Room die Resonanzen der Aufführungsorte sprechen,
La Monte Young verwendete stehende Wellen. In soundbits von Robin Minard wird die Räumlichkeit nicht nur durch dem Objekt Gegenüberstehen, sondern gleichfalls durch Herantreten
und Entlangschreiten an diesem ausgedehnten und in die Architektur integrierten Gebilde
erfahren.
Die begriffliche Nähe von Raumklang und Raumakustik kann leicht zu Verwirrungen führen:
Der Komponist orientiert sich am geometrischen Raum und versucht, in dessen
”
erkennbaren Grenzen einen ebenfalls erkennbaren, d.h. erhörbaren Klangraum zu
schaffen. Dieser Klangraum kann dem geometrischen Raum entsprechen, er muß
es nicht.“ 4
Raum“ wird in zwei unterschiedlichen Bedeutungen benutzt, obwohl Hans Peter Haller ver”
sucht, die Verschiedenheit durch die Attribute geometrisch respektive klanglich zu betonen.5
Viele Metaphern in der Musik sind räumlich-geometrischer Natur, so spricht man beispielsweise von einer hohen Tonlage, einer melodischen Linie oder Kontur; die Menge der verwendeten Töne bildet den Ton-Raum6 . Herbert Eimert unterscheidet neben diesem metaphorischen
Raum zwischen dem Musik-Raum, der durch die Raumakustik bestimmt ist, und dem musi”
kalischen Vorstellungsraum, wie er in der Phantasie des Komponisten besteht, wie er vom
Hörer nachvollzogen wird und wie er sich in den Noten, im Notationsraum der aufgezeichneten Musik niederschlägt.“ 7 Wird Musik räumlich verteilt wiedergegeben, so kann dieser
neue Raum für das Ohr ein gekrümmter, nicht euklidischer Raum“ sein. Eimert nennt die”
sen Raum einen Raummusik-R[aum], in dem die Tonbewegung in die räumlich-plastische
”
Konfiguration der Klangfelder überführt wird.“
Die Verortung dieser Arbeit wird klarer, wenn wir den Begriff der Steuerung betrachten.
Haller gibt eine sehr ingenieursmäßige Beschreibung von Klangsteuerung:
2
Beim Klanganzug der Künstlerin Lynn Pook werden sechzehn Lautsprecher am Körper befestigt – Der
”
menschliche Körper wird zum Klangraum“. Das Beispiel zeigt, daß Raumerfahrung nicht nur durch (echte
oder simulierte) von unterschiedlichen Seiten auf das Ohr treffende Schallwellen gemacht werden kann.
Dazu zählen auch einige Arbeiten von Bernhard Leitner.
3
[de la Motte-Haber 1996]
4
[Haller 1995], S. 75. Kurz davor geht Haller explizit darauf ein, daß bei der Gestaltung von Klangwegen die
Interaktion mit der Raumakustik bedacht werden muß.
5
Bezeichnenderweise beginnt Martin Supper in seinem Buch über Elektronische Musik ([Supper 1997]) das
Kapitel über Raumklang mit einem Zitat von Rudolf Carnap über die Konfusion, die durch die unterschiedliche Verwendung des Raumbegriffs entsteht.
6
[Eimert/Humpert 1973], S. 271f
7
ebd.
6
1 Einführung
Klangsteuerung in der Elektronischen Klangumformung bedeutet weder Trans”
formation noch Selektion einer Tonquelle. Sie kann für beide eine kontrollierende
Funktion übernehmen, hat jedoch auf die direkte Erweiterung eines Klangspektrums keinen Einfluß. Klangsteuerung heißt – wie der Name aussagt – Steuerung
von Klanginformationen jeglicher Art, von Instrumenten oder Stimmen, original
oder elektronisch bearbeitet.“ 8
Anders ausgedrückt ist Klangsteuerung ein formgebender Prozeß, der auf einer hierarchisch
übergeordneten Ebene stattfindet. Die Prozeßhaftigkeit, der dynamische Charakter der Klangsteuerung, wird durch weitere Bezugnahme auf Regelungstechnik wie auch die kontrollie”
rende Funktion“ unterstrichen.9 In Hallers Geräten wird zur Kontrolle oft ein Mikrophon
benutzt, das während der Performance eine Klangumformung steuert. In den klassischen
nach MUSIC V modellierten Musiksprachen bezeichnen Kontrolldaten diejenigen Daten, die
dynamisch über die Zeit – und in der Regel mit konstanter Rate abgetastet – Einfluß auf
Klangparameter und -transformationen nehmen.10
Raumklangsteuerung wird nun definiert als ein Mittel zur dynamischen Formgebung von
Bewegungen, Verteilungen und Transformationen von Klängen, die räumlich, das heißt über
mehrere Lautsprecher wiedergeben werden sollen. Das bedeutet, daß die Mehrkanaligkeit
bereits in den Klangverteilungen und -transformationen angelegt ist und explizit gestaltet
werden kann. Beispiel: Wenn ein monophoner Ausgangsklang mit unterschiedlichem Frequenzgang gefiltert und auf verschiedenen Lautsprechern ausgeben wird, ist das eine Form
von Raumklang, denn der Klang wurde räumlich gestaltet. Der benutzte Filter ist jedoch
nur dann als Raumklangsteuerung zu bezeichnen, wenn in ihm selbst a) die dynamische,
zeitveränderliche Steuerung und b) die Variation des Frequenzganges über verschiedene Ausgangskanäle (oder allgemein eine räumliche Situation) vorhanden sind. Umgekehrt wird ein
Objekt zur Raumklangsteuerung, wenn es andere Objekte – ob einen Mixer oder ein Filter
spielt dabei keine Rolle – dynamisch räumlich kontrolliert, zum Beispiel indem es für jeden
Ausgangskanal einen separaten Filter ansteuert.
Das Adjektiv in musikalischer Raumklangsteuerung soll unterstreichen, was in der eingangs
zitierten Aussage Morton Feldmans über Edgard Varèse zum Ausdruck kommt, und was
Trevor Wishart nur unmerklich variiert, wenn er in Audible Design schreibt:
We [composers] may embark on signal-processing procedures which will appear
”
bizarre to the scientifically sophisticated [...] The question we must ask as musicians however is not, are these procedures scientifically valid, or even predictable,
but rather, do they produce aesthetically useful results on at least some types of
sound materials.“ 11
Dies ist nicht als Aufforderung zu verstehen, unwissenschaftlich zu sein, sondern im Gegenteil,
sich wissenschaftlicher Erkenntnisse zu bedienen, aber sich – also hier das Programm – nicht
auf das zu beschränken, was zunächst wissenschaftlich oder physikalisch plausibel scheint.
8
[Haller 1995], S. 67.
vgl. auch [Eimert/Humpert 1973], S. 328
10
Die Rate dieser Daten wird als Controlrate, abgekürzt kr, bezeichnet und liegt aus rechenökonomischen
Gründen meist etwa ein bis zwei Größenordnungen unter der Abtastrate für Audiodaten.
11
[Wishart 1994], S. 5
9
7
1 Einführung
Musikalische Raumklangsteuerung bedeutet sowohl, daß nicht-physikalische Raumvorstellungen umgesetzt werden können, als auch, daß Brücken zu algorithmischer Komposition vorgesehen sind.
1.1.1 Abgrenzung zu Auralisationsverfahren
Auralisation ist ein Verfahren, das unter Verwendung physikalischer oder mathematischer
Modelle das Schallfeld, in dem sich eine Klangquelle befindet, reproduziert und dem Hörer den
Eindruck vermittelt, tatsächlich an einer bestimmten Position in diesem Schallfeld zu sein.12
Ein anderer Ausdruck ist somit Soundfield Reproduction, zu deutsch Schallfeldreproduktion, als Unterkategorie von (virtueller) Raumakustik. Die wichtigsten technischen Verfahren
sind die Binauraltechnik, das heißt die Raumsimulation durch Einbezug der Kopfübertragungsfunktion (HRTF) und Wiedergabe über Kopfhörer, und die als Transaural-Technik
bezeichnete Lautsprecher-Variante im reflexionsarmen Raum. Daneben wird auch die neuere
Wellenfeldsynthese (WFS) als Auralisationstechnik verwendet.13
Das Ziel der Raumklangsteuerung ist nicht die Auralisation. Kurz dargestellt werden soll
jedoch das WFS Programm Wonder (Abschnitt 1.3.3), da es sich explizit als musikalische
Raumklangsteuerung versteht. Das in dieser Arbeit entwickelte Programm kann natürlich mit
einem Auralisationsverfahren verknüpft werden, es ist allerdings nicht speziell dafür konzipiert. Insbesondere sind Binaural- und Ambisonics-Rendering durch Steuerung von CSound
möglich (siehe Abschnitt 1.5.3). Es wird jedoch nicht auf die akustischen Grundlagen der
Schallfeldreproduktion und des räumlichen Hörens eingegangen.14
1.1.2 Abgrenzung zu Live-Diffusionsverfahren
Das Haupteinsatzgebiet der Software soll in der Komposition liegen, das heißt sie soll optimiert werden für eine Arbeitsweise,
•
in der die Zeitebene der Bearbeitung von der Zeitebene der Performance des Stückes
entkoppelt ist
•
in der die Daten nichtlinear bearbeitet werden
•
in der sich die Bearbeitung über mehrere Sitzungen erstreckt
•
in der Bearbeitungen evtl. verworfen werden
Dies resultiert sowohl aus persönlichen Präferenzen als auch aus der Tatsache, daß im Bereich
der Live-Elektronik bereits sehr mächtige Werkzeuge vorhanden sind. Es ist nicht Aufgabe
dieser Arbeit, eine Software wie Max/MSP zu überbieten, stattdessen soll genau an den
Punkten angesetzt werden, die durch die weitgehende Fixierung auf Echtzeit-Fähigkeit in
Max nicht oder nur ungenügend beachtet werden. Weitere Erläuterung dazu folgen in der
Designspezifikation.
12
sinngemäß nach [Kleiner et al. 1993]
Eine sehr knappe Einführung zu WFS geben [de Vries/Boone 1999]; eine mit Medien aufbereitete Website
ist http://wfs.topicbase.net/
14
Siehe dazu z.B. [Stuart 1996] oder [Schneider 1995], S. 1–22. Im Aufsatz von D. G. Malham wird die Schallfeldreproduktion am Ambisonics Verfahren erläutert ([Malham 1998]).
13
8
1 Einführung
Aus diesem Grund wird auch nicht weiter auf spezielle Live-Diffusions-Strategien eingegangen. Kurz genannt werden soll zumindest die akusmatische Diffusion, in der in der Regel
ein ein- oder zweikanaliges Stück mit Hilfe einer Live-Mischung ( Interpretation“) auf eine
”
Vielzahl unterschiedlicher Lautsprecher verteilt wird, wobei die variablen Charakteristiken
der Lautsprecher gezielt als instrumentale Formung des Klanges betrachtet werden.15
1.2 Historische Wurzeln
Obwohl der Raum als Parameter auch in der klassischen Musik nicht unbekannt war, sich
zum Beispiel in der räumlichen Aufteilung der Instrumentengruppen manifestierte, in der
Ausnutzung der Raumakustik in Kirchen für Chöre usw., und ohne auf spezielle Projekte
wie die utopische Universe Symphony von Charles Ives einzugehen,16 beginnt die gezieltere
Auseinandersetzung mit dem Einsatz von Lautsprechern in der elektronischen und konkreten
Musik, das heißt in den 50er Jahren.17 In Karlheinz Stockhausens Gesang der Jünglinge von
1956 werden fünf kreisförmig angeordnete Lautsprecher-Gruppen verwendet, die das Publikum umgeben, statt ihm frontal zu begegnen.18 Auch in der fünf Jahre davor uraufgeführten Symphonie pour un homme seul von Pierre Schaeffer und Pierre Henry (1950) werden
die Klänge von im Raum verteilten Lautsprechergruppen wiedergegeben. Im Gegensatz zu
Stockhausen ist diese Verteilung weniger Ergebnis eines strikten Auskomponierens, sondern
geschieht durch eine Live-Interpretation auf den unterschiedlich klingenden LautsprecherInstrumenten.
Neben der Erfindung des Radios als der Verräumlichung des Klanges – indem zwischen Sender
und Empfänger praktisch beliebige Distanzen liegen können – ist die Auseinandersetzung mit
Zeit in der Malerei als symmetrischer Gegenpart dafür zu nennen, daß Anfang des 20. Jahrhunderts die Musik begann sich zu verräumlichen. Der einer älteren Generation angehörende,
nach Amerika ausgewanderte Franzose Edgard Varèse arbeitete seit 1929 am letztlich nicht
realisierten Werk Espace, das diese neue Aufmerksamkeit bereits im Titel zeigt. Realisiert
worden ist 1958 das bekannte Poème Électronique für den Pavillon der Firma Philips auf
der Weltausstellung jenes Jahres. Mehrere hundert Lautsprecher auf den Innenflächen des
von Le Corbusier und Iannis Xenakis entworfenen zeltartigen Baus standen ihm für eine
räumliche Komposition zur Verfügung. Das Ausgangsmaterial von Varèse hatte die Form
eines Tonbands mit drei Spuren, von denen zwei stereophonisch verteilt werden konnten und
die dritte aufgezeichneten Raumhall enthielt. Die räumliche Verteilung geschah mit Hilfe
von synchronen Bändern, die Steuerbefehle für Relais enthielten. Die Relais schalteten die
Lautsprecher-Gruppen ein und aus, mit denen sich bestimmte Klangbewegungen realisieren ließen. Angeblich hat Varèse die Intonation“ der Bewegungen der Verantwortung der
”
Ingenieure überlassen.19
15
vgl. [Gertig et al. 1995], S. 325
vgl. [de la Motte-Haber 1996], S. 209
17
Mit dem Beginn des Rundfunks datieren die ersten Lautsprecher in die 20er Jahre, vgl. [Ruschkowski 1998],
S. 56–60; der Aspekt der räumlichen Wiedergabe mittels mehrerer Lautsprecher spielte dabei noch keine
Rolle.
18
[Ruschkowski 1998], S. 242, 252f
19
[de la Motte-Haber 1993], S. 83–110. Nach einem Drehbuch von Le Corbusier wurden zur Musik von Varèse
Dias an die Wände projiziert.
16
9
1 Einführung
1.3 Vorhandene Software zur Raumklangsteuerung
Bei der Entwicklung einer neuen Software ist zunächst zu betrachten, welche bestehenden
Lösungen bereits existieren und wo ihre Vorteile und Nachteile liegen. Ohne Anspruch auf
Vollständigkeit und ohne auf die Vielzahl individueller Patches in Sprachen wie Max einzugehen, sollen die gängigsten Programme vorgestellt werden. Die auf Hardware basierenden Implementationen werden kurz im Anschluß dargestellt. Darauf folgt eine kursorische
Übersicht über Raumklang-Syntheseverfahren, die in Form von Plug-Ins durch eine HostApplikation gesteuert werden können.
Die Grundkonzepte unterscheiden sich in den meisten Fällen nicht von der Pionier-Arbeit
John Chownings20 zu Beginn der 70er Jahre. Darin beschreibt er die akustischen Merkmale
der räumlichen Ortung (interaurale Intensitäts- und Laufzeitunterschiede) und schlägt vor,
zur Simulation räumlicher Distanz variable Reverberation und Frequenz-Filterung zu benutzen. Nach seinem Modell wird mit Hilfe von quadrophonisch den Hörer umgebenden Lautsprechern ein virtueller Raum um den tatsächlichen Abhörraum konstruiert. Die Klangquelle
wird zwischen jeweils benachbarten Lautsprechern gepannt21 , durch variables Delay entsteht
ein Doppler-Shift in Abhängigkeit von der Geschwindigkeit der Bewegung. Die Bewegungen können entweder mit einer mechanischen Eingabevorrichtung in Echtzeit22 oder in Form
einfacher geometrischer Pfade direkt vom Computer erzeugt werden.
Eine Verfeinerung dieses Prinzips wurde später unter anderen im CMusic System von F.
Richard Moore vollzogen.23 Dabei werden zusätzlich die ersten Reflexionen der Klangquelle
von den Wänden des virtuellen Raumes mit einer Tapped-Delay-Line simuliert. Desweiteren
besitzen die Klangquellen eine Abstrahlcharakteristik, die sich aus einer richtungsabhängigen
Lautstärke-Dämpfung ergibt. In CMusic können die Dimensionen der vier Wände des virtuellen und des Abhörraumes bestimmt und die Länge der Hallfahne festgelegt werden. Der
Unit-Generator24 space synthetisiert den Klang im Raum. Das separate Programm sndpath
dient dem Erstellen von Trajektorien-Dateien, die mit dem quad UGen in CMusic eingelesen
werden können.25
1.3.1 APB-Tools Σ 1
Σ 1 (sprich Sigma-One) steht am Beginn der Betrachtung, weil es die flexibelste Raumklangsteuerung darstellt und hinsichtlich der Oberfläche als auch für die Receiver Objekte in dem
hier entwickelten Programm Vorbild war. Technische Details und Funktionsweise können so-
20
[Chowning 1971]
Das englische Wort Panning läßt sich leider schlecht übersetzen. Es beschreibt den Einstellvorgang des
Panoramas, das heißt die Positionierung eines Klangs im (Stereo-)Bild.
22
Eine Wiedergabe in Echtzeit war noch nicht möglich; der Klang wurde nach Ende der Aufzeichnung vom
Computer synthetisiert.
23
[Moore 1983]
24
Zu MUSIC-V vgl. [Ruschkowski 1998], S. 287–291. Eine Übersicht über die MUSIC-V Familie mit Verknüpfungen zum Konzept der Unit-Generatoren bietet http://www.wordiq.com/definition/MUSIC-N
25
siehe dazu [Moore 1985], S.61f, 76–78 und [Loy 1985]. Die Pfade sind durch Stützpunkte definiert, zwischen
denen mit Hilfe von Spline-Funktionen interpoliert wird.
21
10
1 Einführung
Abbildung 1.1: Σ 1 Oberfläche
wohl in der Magisterarbeit von Thomas Schneider26 , auf deren Basis das Programm entstand,
als auch im Online-Manual27 nachgelesen werden.
Σ 1 ist eine Standalone-Applikation für Mac OS Classic, die über eine Mixer-Matrix bis zu 32
Eingangssignale auf bis zu 24 Ausgangskanäle verteilen kann. Die Matrix wird auf Digidesign
ProTools TDM Hardware realisiert und verwendet dazu softwareseitig die Digidesign Audio
Engine (DAE). Dies stellt zugleich Hauptmanko und Hauptvorteil des Programms dar. Zum
einen ist teure Hardware nötig28 , zum anderen arbeitet das Programm nicht mehr mit DAE
Version 5.1 und höher zusammen. Bis eine Neuauflage des Programms erscheint, muß also
– da pro Bootpartition nur eine DAE existieren kann – zum Betrieb eine separate Mac OS
8 oder 9 Partition gebootet werden. Vorteil der DAE Benutzung ist die Möglichkeit, TDM
Plug-Ins verwenden und direkt Spuren aus ProTools Sessions einspielen zu können, wobei
allerdings nur die Regionen-Positionen und die Volume-Automation erkannt werden.
Die Flexibilität des Programms resultiert, abgesehen von der hohen Zahl der Ein- und
Ausgänge, aus der Möglichkeit, Schallquellen auf beliebigen zweidimensionalen Pfaden bewegen und die sogenannten virtuellen Lautsprecher frei positionieren und konfigurieren zu
können. Jedem virtuellen Lautsprecher kann eine benutzerdefinierte Richtcharakteristik“
”
gegeben werden, indem zwei sogenannte Coverage-Tables editiert werden. Die Empfindlichkeit der virtuellen Lautsprecher ergibt sich dabei aus der Summe einer distanzabhängigen
und einer richtungsabhängigen Dämpfung, so daß sich neben Kugel, Niere, Keule und Acht
eine Vielzahl möglicher Charakteristiken ergibt.
Die Oberfläche von Σ 1 besteht aus der zweidimensionalen Raumansicht, Stage genannt,
einem Transport-Fenster, einem Mixer- und Aux-Fenster und einer Region-Playlist sowie einer
Reihe von Werkzeug- und Aktions-spezifischen Dialogen. In Abbildung 1.1 sind Beispiele für
26
[Schneider 1995], S. 39–82. Sein Programm wurde mit Hilfe von Max und externem MIDI-Mixer realisiert,
entspricht jedoch vom gesamten Konzept und der Oberfläche her dem späteren Σ 1.
27
http://apbtools.com bzw. http://apbtools.com/PDFs/SIGMA1_MANUAL.pdf
28
Pro Tools d24 + MIX Farm, Pro Tools MIX oder Pro Tools MIX Plus. Es gibt einen sogenannten OfflineModus, darin ist jedoch keine Audioausgabe möglich.
11
1 Einführung
eine Stage-Anordnung (links) und Coverage-Tables (rechts) abgebildet. Die diskusförmigen
Objekte in der Stage-Ebene stellen die Mittelpunkte der virtuellen Lautsprecher dar, um sie
herum ist die Charakteristik durch abgestufte Farben dargestellt. Die kleinen ballförmigen
Objekte stellen die beweglichen Schallquellen dar. Ihre Bewegungspfade sind als Linienzüge
sichtbar.
Neben der Aufzeichnung von Pfaden in Echtzeit durch Bewegen der Maus29 gibt es die
Möglichkeit, im Offline-Modus Linien und Kreise zu zeichnen und Pfade zu kopieren, zu
verschieben und zu löschen.
Die Berechnung der Ausgangsklänge erfolgt als Intensitätspanning mit Hilfe der dynamischen
M × N Matrix, die aus den M Eingangskanälen und N Ausgangskanälen besteht. Jede Zelle
(m, n) enthält den Quellklang (Zeile m) multipliziert mit der Lautstärkeinformation, die aus
dem Abstand des Klanges von und seinem Winkel zu einem Lautsprecher (Spalte n) gewonnen
wird. Die Summierung einer Spalte ergibt das Ausgangssignal für den jeweiligen Lautsprecher.
1.3.2 zplane.development z.matrix
Einen ähnlichen Ansatz wie Σ 1 verfolgt z.matrix der Firma zplane.development. Wie der
Name andeutet, arbeitet z.matrix ebenfalls mit einer Matrix von Eingangs- und Ausgangskanälen, die Größe ist auf 16 × 16 beschränkt. Auch hier hat man sich auf eine HardwarePlattform festgelegt, die DSP-Karten der Firma Creamware (Pulsar und Scope), was dem
Programm ähnlich wie Σ 1 fast zum Verhängnis wurde, als Creamware im Jahr 2003 Insolvenz anmelden mußte. Mittlerweile hat eine Nachfolgefirma die Creamware-Produkte übernommen, aber die Zukunft der DSP-Systeme ist noch nicht endgültig gesichert.
Das Kernelement der Oberfläche ist die Surface, wieder ein zweidimensionales Momentanbild
mit beweglichen Icons für Lautsprecher und Klangquellen. Daneben existieren Level-Meter
für die Ein- und Ausgänge. Ein Element, das in Σ 1 nicht vorhanden ist, ist der Sweat Spot,
der optimale Abhörpunkt, der bei Mehrkanalbeschallung automatisch entsteht, wenn Panning nach dem Prinzip der Phantomschallquellen arbeitet. z.matrix gleicht unterschiedliche
Entfernungen der Lautsprecher zum Sweat Spot durch ein gegensätzliches Delay aus, so daß
– vorausgesetzt der Hörer sitzt in einer identischen Kopie der Szenerie tatsächlich im Sweat
Spot – alle direkten Wellenfronten kohärent (gleichzeitig) beim Hörer ankommen. Da aus der
Forschung zum räumlichen Hören bekannt ist, daß unterschiedliche Indizien bei der Ortung in
komplexer Weise zusammenwirken, versucht man hier, die Ortung durch Laufzeitunterschiede zu minimieren, so daß sie sich nur an den Intensitäten orientieren kann. Interessant ist
ferner die Möglichkeit, mehrere Quellen in Master/Slave Anordnung zu gruppieren, so daß
die Slave-Objekte dem Master entweder in kartesischen oder polaren Koordinaten folgen.
Im Gegensatz zu Σ 1 besteht keine fixierte Pixelauflösung der Surface, sie läßt sich beliebig
vergrößern, und Quellen können frei benannt werden.
In z.matrix lassen sich die Lautsprecher-Charakteristiken nicht explizit einstellen, allerdings
gibt es einen Divergenz-Parameter für jede Quelle und die Möglichkeit einer Lautstärken-
29
Das Handbuch erwähnt außerdem, daß ein MIDI Joystick oder Dataglove verwendet werden können, macht
dazu allerdings keinerlei weitere Angaben, so daß davon auszugehen ist, daß diese Funktion noch in Planung
ist (zumal das Handbuch als preliminary“ bezeichnet wird).
”
12
1 Einführung
Abnahme in Abhängigkeit der Distanz einer Quelle vom Mittelpunkt der Surface. Zusätzlich
ist pro Quelle ein mit variablen Delays realisierter Doppler-Effekt einschaltbar.
1.3.3 Wonder
Wonder von Marije Baalman30 ist ein Akronym für Wavefield Synthesis of New Dimensions of
”
Electronic Music in Realtime“. Es stellt eine Oberfläche für das Faltungsprogramm BruteFIR
dar, das gemäß den Prinzipien der Wellenfeldsynthese die Eingangssignale verzögert, dämpft
und filtert, bevor sie auf die einzelnen Kanäle eines Lautsprecher-Arrays gegeben werden.
Um Klänge im virtuellen Raum zu bewegen, müssen die Wellenfelder dynamisch erzeugt
werden, das heißt die FIR Filter kontinuierlich überblendet werden. Mit einem Raster wird
festgelegt, von welchen Orten aus der Klang abstrahlen kann. Die Abstrahlung kann alternativ
kugelförmig (als Punktquelle) oder planar (als ebene Welle) erfolgen. Zusätzlich können erste
Reflexionen simuliert werden.
Die Bewegungen können linear zwischen manuell eingegebenen Breakpoints stattfinden oder
im Realtime Modus als Mausbewegung aufgezeichnet werden. Um zu gewährleisten, daß die
Bewegungen synchron mit der Audiowiedergabe abgespielt werden, wird Wonder durch eine
von Daniel Plewe programmierte Open Sound Control Schnittstelle ferngesteuert. Beispielsweise kann ein Max/MSP Patch gleichzeitig die Audio Dateien abspielen und BewegungsKoordinaten an Wonder senden.
Sehr interessant ist die geplante Erweiterung um geometrisch ausgedehnte Klangquellen.
1.3.4 Surround Panning Objekte
Mittlerweile sind die Mixer in allen gängigen Harddisk-Recording-Programmen um SurroundFähigkeiten erweitert worden. Mit den Automations-Engines dieser Programme vereint, stellen sie einfache Raumklangsteuerungen dar. Der Aufbau in den verschiedenen Programmen
ähnelt sich dabei sehr stark. Die Automation geschieht meist spurorientiert, das heißt für
jeden Kanalzug des Mischers existieren neben der Audiospur zusätzlich Spuren für jeden
automatisierten Parameter, wie Lautstärke, Equalizer oder Panorama. Die Automation kann
in der Regel live aufgezeichnet werden, also durch Bewegen von Software-Reglern mit der
Maus – oder externen Controllern wie MIDI-Fadern –, während der Transport läuft. Für
eine Offline-Editierung wird eine Breakpoint-Darstellung der Automationsdaten über oder
unter den Audio-Regionen im Arrangier-Fenster eingeblendet. Mehrdimensionale Parameter
wie ein Surround-Pan werden aus separaten eindimensionalen Werten zusammengesetzt, wie
zum Beispiel Front↔Rear.
Die Panner orientieren sich alle an den Filmformaten, so daß man sich lediglich entscheiden
kann, ob man 5.1“ oder 10.2“ usw. mischen möchte. Die graphische Oberfläche ist eine zwei”
”
dimensionale Fläche, auf der die Lautsprecher als Icons abgebildet sind, angeordnet entweder
im Rechteck oder kreisförmig. Entsprechend wird das Panorama in das Informations-Paar
Azimut/Divergenz oder das Tripel Front-Position/Rear-Position/Front-Rear zerlegt. Emagic
30
http://gigant.kgw.tu-berlin.de/~baalman/
13
1 Einführung
Abbildung 1.2: Panning Objekte in Digital Performer
Logic Pro (Version 6) verwendet den polaren Ansatz, Digidesign ProTools TDM (Version 6)
den kartesischen Ansatz mit dem Tripel-Vektor. Mark Of The Unicorn’s Digital Performer
(Version 4) beinhaltet dagegen beide Modelle und darüber hinaus ein weiteres PanoramaPlug-In, das eine Reverb-Einheit und weitere akustische Modellingfunktionen wie Dopplereffekt und Kopfabschattung enthält.31 Abbildung 1.2 zeigt die Surround-Panner von Digital
Performer.
Von Drittanbietern gibt es diverse Plug-Ins für diese Harddisk-Recording-Programme, die
auf Surround-Formate abgestimmt sind, so zum Beispiel das 360◦ Surround Tools“ Paket
”
der Firma Waves, das Mixer-, Reverb-, Spatializer- und Dynamik-Plug-Ins für die TDM
Schnittstelle enthält.32 Ein weiteres Beispiel ist das Reverb-Plug-In RealVerb 5.1 der Firma
Kind Of Loud. Alle erhältlichen Surround-Plug-Ins hier aufzuführen, würde den Rahmen
sprengen, zumal sich der Markt für Plug-Ins laufend ändert.
1.4 Hardware basierte Raumklangsteuerung
Bevor Computer schnell genug waren, mußten Raumklangsteuerungen mit Hilfe von spezieller
Hardware realisiert werden. Da das Anwendungsfeld kaum kommerzielles Potential besitzt –
wenn man von Surround-Joysticks für Digitalpulte absieht –, handelt es meist um einzelne
Spezialanfertigungen für ein Studio oder ein Projekt.
Das von Hans Peter Haller und Peter Lawo gebaute Halaphon hat durch seine Verankerung im Freiburger Experimentalstudio der Heinrich-Strobel-Stiftung (Südwestrundfunk)
und den Einsatz in Konzerten von beispielsweise Luigi Nono einige Bekanntheit erlangt. In
der ursprünglichen Fassung von 1971 wurden die Lautstärken von vier Lautsprechern mittels
spannungsgesteuerter Verstärker (VCA) geregelt.33 Jeder VCA ist mit einem Oszillator ver-
31
Inwieweit hier eine HRTF Filterung stattfindet, ist unklar. Leider stand mir das Programm nicht zur
Verfügung, und MOTU bietet keinerlei Demoversionen an. Auch spricht die Produktbeschreibung von
einem vierten kartesischen Panner mit der Bezeichnung n-Panner ; worin er sich von dem im Bild gezeigten
TriPan unterscheidet, bleibt ebenfalls unklar.
32
siehe http://waves.com/default.asp?url=content.asp?id=56
33
Die Erläuterung folgt den Ausführungen in [Haller 1995], S. 77–90
14
1 Einführung
bunden, der bestimmte Hüllkurvenverläufe realisieren kann. Durch zeitlich programmierten
Ablauf der Hüllkurven und Umschalten der Zuordnung von Kanälen zu Lautsprechern lassen
sich bewegte Phantomschallquellen realisieren. Das Gerät wurde im Laufe der Zeit an neue
technische Entwicklungen angepaßt und die Kanalzahl erhöht. Haller griff die Ideen Chownings auf (vgl. Abschnitt 1.2), erweiterte den Signalweg im Halaphon um Harmonizer zur
Simulation von Doppler-Effekten, einen Frequenz-Filter und ein Hallgerät. Die Hüllkurven
konnten schließlich graphisch an einem Bildschirm erstellt, abgespeichert und wieder geladen werden. Für den Einsatz des Halaphons in Konzert-Situationen kann der Ablauf live
gesteuert werden. So kann eine Klangbewegung zum Beispiel direkt durch die Dynamik des
Mikrophonsignals eines Instruments verlangsamt oder beschleunigt werden.
Andere Hardware basierte Systeme gehen ähnlich dem Halaphon von einer Art programmierbarem Mischpult aus. Das Problem vorhandener Mischpulte ist meist die beschränkte Zahl
von Ausgangskanälen und die eingeschränkten Routingmöglichkeiten. Für den Raumklangeinsatz müssen gerade die Verteilmöglichkeiten groß sein, während die Zahl der Eingangskanäle untergeordnet ist. Ein solches umgedrehtes“ Mischpult ist der Topoph24, den Sukan”
dar Kartadinata für die Installations-Projekte des Duos <sabine schäfer // joachim krebs>
gebaut hat.34 Ein Hauptrechner steuert mit einem Sequenzer sowohl die Klangerzeuger – zum
Beispiel Sampler – als auch per MIDI einen zweiten Computer, der Raumbeschreibungen in
einzelne Steueranweisungen umrechnet, die wiederum per MIDI an den Steuercomputer des
Mischpults geleitet werden. Das Mischpult verteilt die Audiosignale mit Hilfe von VCAs, die
vom Steuercomputer kontrolliert werden.
Ebenso verteilt die Raumklangsteuerung RKS.1 von Werner Schaller Ausgangssignale mit
einem VCA-Mischer auf bis zu 24 Lautsprecher.35 Mit einem graphischen Editor können
Figuren“ erstellt und per MIDI an den Mischer übertragen werden. Die für eine Figur ver”
wendeten Kanäle können beliebig gewählt werden und müssen nicht benachbarte Lautsprecher repräsentieren. Das Mapping von Kanälen auf Lautsprecher kann später leicht angepaßt
werden.
MIDI war eine der wichtigsten Schnittstellen, um Computer mit Hardware Peripherie zu verbinden. Die Vorarbeit von Σ 1 basierte noch auf einem Max-Patch, das einen Mischer über
MIDI ansteuerte. Einige Jahre früher, 1988, wurde an der TU Berlin ein MIDI Mischer
gebaut, der bis zu 15 Eingangssignale auf 4 Ausgangskanäle verteilen konnte. Um einen
hohen Rauschabstand zu gewährleisten, wurden dabei multiplizierende D/A Wandler statt
VCAs eingesetzt. Das Programm arbeitete mit einem Nulldurchgangs-Detektor, der Knackgeräusche minimierte, die durch die grobe Rasterung der Lautstärke-Stufen entstanden. Der
MIDI Mischer von Torsten Radtke wurde dann 1990 von Thomas Seelig um eine graphische Benutzeroberfläche erweitert, die auf einem Atari Computer lief. Dadurch konnten die
Klangquellen geometrisch plaziert und bewegt werden.36
34
http://www.topophonien.de/2.5-w-d-topoph24.html
vgl. [Hein 1999], S. 106
36
[Radtke 1988] resp. [Seelig 1990]
35
15
1 Einführung
1.5 Raumklang-Synthese Plug-Ins
In diesem Abschnitt sollen einige Plug-Ins und Unit-Generatoren vorgestellt werden, die interessante Synthese-Ansätze für Raumklang darstellen, von sich aus jedoch keine oder kaum
graphische Steuermöglichkeiten bieten. Im Zusammenhang mit der Entwicklung einer Steueroberfläche stellen sie potentielle Synthese- Maschinen“ dar (vgl. Abschnitte 2.2.1 und 2.2.2).
”
1.5.1 VBAP – Vector Based Amplitude Panning
Vector Based Amplitude Panning ist, wie der Begriff vermuten läßt, keine feststehende Software, sondern ein bestimmtes Modell von räumlicher Klangverteilung. Dieses wurde von dem
Finnländer Ville Pulkki entwickelt und steht in Form eines freien Plug-Ins für CSound, Max/
MSP und Pure Data zur Verfügung.37
VBAP verallgemeinert ein auf der sogenannten Tangenten-Regel beruhendes Modell des
Stereo-Pannings auf eine beliebige zweidimensionale (2-D VBAP) oder dreidimensionale (3-D
VBAP) Anordnung von Lautsprechern. Dabei erfolgt ein Amplitudenpanning über die jeweils
zwei respektive drei Lautsprecher, die der Klangquelle am dichtesten sind. VBAP liefert
nur die Gain-Werte, die Programm-Umgebung, in der VBAP eingesetzt wird, muß selbst
dafür sorgen, daß unterschiedliche Abstände der Lautsprecher zum Hörer durch entsprechende Delays nivelliert werden, damit als auditorischer Cue nur die Intensitätsunterschiede
wirken.38 Die durch die Tupel oder Tripel aufgespannten Teilebenen bzw. -räume werden so
berechnet, daß sie sich nicht überschneiden und im Falle einer Bewegung der Klangquelle
automatisch ein weicher Übergang von einem Teilraum in den anderen stattfindet.39
Da die Forschung ergeben hat, daß bei diesem Verfahren der Eindruck der Ausdehnung der
Quelle (spread ) unterschiedlich ist, je nachdem ob ein Klang von einem oder mehreren Lautsprechern (Phantomschallquelle) abgestrahlt wird, wurde ein Divergenzverfahren integriert.
Das Grundkonzept des VBAP, daß eine Quelle maximal von zwei respektive drei Lautsprechern repräsentiert wird, wird dabei durch einen Trick aufrecht erhalten: Aus einer Quelle
werden mehrere beieinander liegende Quellen gemacht, die intern summiert werden. Der Abstand dieser Quellen voneinander hängt von der Höhe der gewählten Divergenz ab.40
VBAP als Plug-In allein ist noch keine vollwertige Raumklangsteuerung, allerdings läßt sich
eine solche mit wenigen Klicks erstellen, wie der Max/MSP-Patch in Abbildung 1.3 zeigt.
Hier wurde der Azimut-Parameter automatisiert, indem mit der Maus der Knopf im Panel
links oben bewegt wird. Alternativ wird durch Klicken auf start rotation“ eine gleichmäßige
”
Kreisbewegung ausgeführt.41 Als Klang wird ein Mono-Soundfile verwendet.
Grundsätzlich verarbeitet ein VBAP Objekt die Steuerdaten für einen Quellklang; sollen
mehrere Klänge unabhängig bewegt werden, müssen weitere VBAP Instanzen erzeugt werden.
37
http://www.acoustics.hut.fi/~ville/software/ . Dort ist auch noch ein älteres Standalone-Demo für
SGI Computer zu finden.
38
vgl. [Pulkki 2001], S. 16f
39
Im Falle der dreidimensionalen Anordnung wird der Klang im Übergangspunkt nur noch von den zwei
Lautsprechern abgestrahlt, die beiden Teilräumen gemeinsam sind.
40
ebd., S. 18
41
vorausgesetzt natürlich, die Lautsprecher sind, wie im define_loudspeakers Objekt zu sehen, kreisförmig
angeordnet.
16
1 Einführung
Abbildung 1.3: VBAP Anwendung in Max/MSP
Das Lautsprecher-Setup im abgebildeten Patch ist kreisförmig in der horizontalen Ebene (2D),
daher wird die Bewegung in der Vertikalen (Elevation 42 ) nicht benutzt. Die Divergenz läßt
sich mit dem Schieberegler einstellen.
1.5.2 IRCAM Spat˜
Das Spat˜ Plug-In, von Jean-Marc Jot und Olivier Warusfel am IRCAM entwickelt,43 hat
einen integrierteren Ansatz als VBAP. Das kommerziell vertriebene Paket besteht aus einer
Reihe zusammengehöriger Objekte für Max/MSP oder IRCAM’s jMax. Insgesamt vier Stufen
durchläuft ein Klang, bis er an den Ausgangskanälen oder Lautsprechern angelangt:
•
Source~ versieht ein Quellsignal mit einer optionalen Entzerrung und variablem Delay,
womit ein Doppler Effekt erzeugt werden kann
•
Room~ ist eine synthetische Multikanal-Reverb-Einheit
•
Pan~ verteilt die Quelle und das Hallsignal im Raum
•
Out~ versieht die zu den Ausgangskanälen geleiteten Klänge mit einer optionalen Entzerrung und einstellbarem Delay und kompensiert so Nichtlinearitäten im Frequenzgang
der Lautsprecher und deren Abstand vom Hörer
Prinzipiell lassen sich die Objekte einzeln benutzen, beispielsweise kann ein Klang direkt in
den Panner geschickt und dessen Output direkt an Lautsprecher gegeben werden, wenn man
auf psychoakustische Modellierung und virtuellen Hall verzichten möchte. Etwas ungewöhnlich mag die Reihenfolge der Module wirken, wonach der Panner hinter dem Hallobjekt sitzt.
Der Grund dafür ist, daß in Pan~ die Lautsprecher-Konfiguration bestimmt wird. Das Room~
Objekt produziert einen formatunabhängigen Hall, der dann in Pan~ je nach Aufstellung der
Lautsprecher mit einer Ambisonics-Matrizierung verteilt wird.
42
43
im VBAP External das dritte Inlet
siehe [Jot/Warusfel 1995]
17
1 Einführung
Abbildung 1.4: Perzeptive Parameter in Spat˜
Das Pan~-Objekt von Spat˜ erlaubt bis zu acht Lautsprecher in einer horizontalen Ebene mit
einstellbaren Winkeln. Für Kopfhörer-Wiedergabe kann auch eine Binaural-Faltung benutzt
werden. Die Positionierung der Quelle wird wie beim VBAP mit den Parametern Azimut und
Elevation eingestellt, allerdings läßt sich ein Quellsignal im Source~ Objekt verzögern und
mit dem Raumprozessor so bearbeiten, daß Nähe- oder Ferne-Effekte entstehen.
Für jede der vier genannten Signal-Stufen gibt es ein Low-Level Kontroll-Objekt, mit dem
die wichtigsten Parameter eingestellt werden können, beispielsweise Room_ für die Earlyund Late-Reflections-Charakteristik des Room~ Objekts. Für Spat~ selbst wurde der spezielle Spat_OPer Patch entwickelt, der in Abbildung 1.4 zu sehen ist. Spat_OPer enthält
perzeptions-basierte“ Parameter, die dann intern auf die DSP Parameter umgerechnet wer”
den. Statt direkt die Raumgröße in physikalischen Einheiten bestimmen zu können, hat man
sich dafür entschieden, qualitative Parameter zu benutzen.
Interessant ist vor allem der Subpatcher, der sich hinter der Bezeichnung radiation verbirgt.
Er enthält eigentlich nur zwei parametrische Dreiband-Equalizer. Mit einer geeigneten dynamischen Steuerung jedoch kann die Klangfarben-Änderung simuliert werden, die entsteht,
wenn eine Klangquelle mit richtungsabhängiger Abstrahlung bewegt wird.
Eine einfache Steueroberfläche wird bereits in Form des Circ Patchers von Gerhard Eckel
mitgeliefert. Bis zu drei Klangquellen können auf einem quadratischen Feld bewegt werden.
Neben Azimut und Distanz wird auch die Abstrahlcharakteristik in Form eines Kreissegments
dargestellt. Die Kontrolldaten von Circ können mit den Spat_Circ und Pan_Circ Patches
so umgerechnet werden, daß die Klangquelle entsprechend der Mausbewegung folgt und die
Radiation-Filterkurven verändert werden.
1.5.3 Spatialisierung mit CSound
Für CSound existieren verschiedene Verräumlichungs-Opcodes. Neben dem beschriebenen
VBAP gibt es die einfachen quadrophonen Panner locsig (polar), pan und space (kartesisch), einen Ambisonics-Panner namens spat3d und einen Binaural-Panner namens hrtfer.
Der Ambisonics-Panner benötigt als Parameter die Position der Klangquelle (x, y, z). Eine
Verzögerung ist ebenfalls vorgesehen, diese läßt sich allerdings nicht dynamisch verändern
– in diesem Fall muß ein anderer CSound Opcode wie vdelayx benutzt werden. Für die
Generierung von Nachhall kann eine spezielle Tabelle angegeben werden, die die Distanzen
und Absorptionswerte für die sechs Wände eines virtuellen kubischen Raumes beschreibt.
18
1 Einführung
spat3d erzeugt ausgangsseitig die vier B-Format Signale W, X, Y, Z. Diese kann man sich
als virtuelle Aufnahmen eines Soundfield-Mikrophons vorstellen, das aus drei orthogonalen
Achter-Charakteristiken und einer Kugel besteht. Mit geeigneten Matrizierungsformeln lassen
sich daraus Signale für beliebig angeordnete Lautsprecher gewinnen.44 spat3d beinhaltet
außerdem eine Stereo-Mixdown Option.
Der Binaural-Panner hrtfer benötigt eine Datei mit Impulsantworten für die Kopfübertragungsfunktion. Das Format ist leider nicht dokumentiert, jedoch gibt es eine entsprechende
Datei auf dem CSound FTP Server. Die Synthese-Parameter sind Azimut und Elevation, eine
entfernungsabhängige Dämpfung oder Verhallung muß separat programmiert werden.
1.6 Notwendigkeit einer neuen Raumklangsteuerung
Das Feld an Raumklang-Software, die flexibel zu gebrauchen ist, ohne daß der Komponist
selbst umfangreiche Programmierarbeiten erledigen muß, ist also recht übersichtlich. Auf die
Einführung der DVD und die zunehmende Verbreitung kleiner Surroundsysteme in Wohnzimmerkinos haben zwar alle Hersteller gängiger kommerzieller Software mit der Erweiterung ihrer Produkte um Surround-Ausgabe-Möglichkeiten reagiert. Viel mehr als eine leichte
Extrapolation der bisherigen Stereo-Technologien hat dabei aber kaum stattgefunden.
Eine Raumklang-Steuerung, die einfach zu bedienen ist, dabei jedoch größtmögliche Flexibilität bietet und den Benutzer nicht auf ein enges Anwendungsfeld beschränkt, die außerdem
einen kompositorischen Umgang mit Raumgestaltung nicht nur erlaubt sondern auch fördert,
und mit der an bereits bestehende Klangsynthese-Software angeknüpft werden kann, ist eine
Lücke, die mit diesem Magisterarbeitsprojekt geschlossen werden soll.
44
Zu Ambisonics und dem B-Format siehe [Malham 1998].
19
2 Entwicklung des Programms Meloncillo
2.1 Tendenzen in der Entwicklung von Musiksoftware
In der gegenwärtigen Entwicklung von Software im Bereich experimenteller Musik sind folgende Tendenzen zu entdecken: Zum einen das rasche Anwachsen der Open-Source Community,
das heißt der Entwicklung von Programmen, deren Quelltexte öffentlich zugänglich sind und
die oft in gemeinsamer Arbeit mehrerer Programmierern entstehen. Zu nennen sind CSound
– an Universitäten entstanden, war es bereits vor der Entwicklung im Open-Source Verfahren kostenlos zugänglich –, SuperCollider, das im Zuge des Wechsels des Autors James
McCartney zu Apple Inc. in ein Open-Source Projekt umgewandelt wurde, zahlreiche kleinere
Programme wie RTcmix, und auch ein Teil der IRCAM Software – vielleicht am beachtlichsten, wenn man die ansonsten eher verschlossene Vertriebspolitik bedenkt –, darunter die
graphische Klangsynthese-Sprache jMax und eine Umgebung für algorithmische Komposition, OpenMusic. Für das Betriebssystem Linux, das selbst Open-Source ist, entwickelt sich
momentan eine eigene Audio Community. Mit den Soundeditoren snd und Audacity, dem
MIDI Sequenzer Rosegarden und dem Harddisk-Recording-Tool Ardour, den plattformübergreifenden Klangsynthese-Programmen jMax, SuperCollider, CSound und Pure Data sowie
der Unterstützung professioneller Soundkarten u.a. von RME steht eine günstige Arbeitsumgebung bereit.
Eine logische Folge daraus ist, daß Programmierer viel mehr Möglichkeiten haben, Schnittstellen zwischen diesen Programmen zu entwerfen. Auch kommerzielle Musiksoftwarefirmen
sind sich bewußt, daß sie den Mehrwert ihrer gewerblich angebotenen Programme erheblich
steigern können, wenn sie eine Entwicklergemeinde finden, die für eine Schnittstelle programmiert, die ihre Software unterstützt. Als wichtiger Anstoß darf die Einführung des VST PlugIn Standards der Firma Steinberg gelten, der sich schnell auf mehreren Rechnerplattformen
und über die Basisapplikation Cubase hinaus durchgesetzt hat.
Der Wunsch, mehrere Audioprogramme miteinander zu verbinden, manifestiert sich seitdem
in zahlreichen Schnittstellen. Im kommerziellen Sektor ist ReWire zu nennen, einer gemeinsamen Entwicklung der Firmen Propellerhead und Steinberg. Im Open-Source Bereich ist ein
ähnlicher Versuch mit dem virtuellen Patchsystem Jack zu beobachten, einer zunächst auf
Linux entwickelten Audiotreiber-Schnittstelle, die mittlerweile auch auf den anderen Rechnerplattformen verfügbar ist und die u.a. von SuperCollider, jMax, PD, Ardour, Rosegarden und
snd unterstützt wird. Die durchschlagendste Entwicklung im Open-Source Bereich dagegen
beschäftigt sich nicht direkt mit dem Transport von Audioströmen, sondern der gegenseitigen
Kontrolle und Highlevel-Steuerung von Programmen. Es handelt sich um ein Kommunikationsprotokoll mit dem Namen Open Sound Control (OSC), das von Matt Wright und Adrian
Freed am Zentrum für Neue Musik und Audiotechnologie CNMAT (Universität Berkeley)
entwickelt wurde.
20
2 Entwicklung des Programms Meloncillo
In gewisser Weise als inoffizieller Nachfolger von MIDI1 gedacht, werden in OSC mit einem
Textkommando beginnende Nachrichten versandt. Definiert ist nur die Syntax, welche konkreten Befehle eine Applikation versteht, ist dabei nicht festgelegt. OSC eignet sich damit
besonders für offene Systeme, die der Benutzer zum Teil oder vollständig selbst programmieren kann, wie SuperCollider, dessen Synthese-Engine in der Version 3 vollständig über OSC
gesteuert wird und das damit als Paradebeispiel für OSC gelten kann, Max/MSP oder Pure
Data (PD). Damit wird es zum ersten Mal möglich, daß zum Beispiel ein Max/MSP Patch
Teile oder die gesamte Klangsynthese an SuperCollider delegiert und sich auf die graphische
Oberfläche als wesentliche Stärke von Max konzentrieren kann.2 Und dies, ohne daß der Anwender einen C-Compiler bedienen und eigene sogenannte Externals oder Unit-Generatoren
programmieren muß.
Ein wichtiger Aspekt in der Entwicklung neuer Musiksoftware wird damit die Anstrengung
sein, Stärken bereits bestehender Systeme auf neue Art und Weise miteinander zu verknüpfen.
2.2 Designspezifikation für eine neue Raumklangsteuerung
Die Kernelemente der neuen Software sollen sein:
•
Trennung von Oberfläche und Signalverarbeitung. Dabei weitgehende Beschränkung
auf eine graphische Benutzeroberfläche und Rückgriff auf externe klanggenerierende
Programme
•
Abstraktion der Oberfläche von dem zugrundeliegenden Synthesemodell
•
Unterstützung sowohl von Anwendern ohne Programmiererfahrung, als auch von solchen, die mittels Musikprogrammiersprachen weitergehenden Einfluß auf die BewegungsGestaltung und Klangsynthese nehmen möchten
•
Betriebssystemunabhängige Implementierung
Desweiteren wurden folgende Entscheidungen zur Programmarchitektur gefällt:
•
Komplementarität aus zwei grundlegenden Objekttypen
•
Komplementarität aus Echtzeit und Offline Anwendung mit Schwerpunkt auf NichtEchtzeit-Betrieb
•
Diskretisierung von Datenströmen
Die genannten Aspekte werden im folgenden erläutert:
2.2.1 Trennung von Oberfläche und Signalverarbeitung
Da für die Entwicklung einer graphischen Benutzeroberfläche und eines SignalverarbeitungsKernels grundsätzlich andere Programmiertechniken verwendet werden – weil auch verschie-
1
2
Ein Überblick über die MIDI Schnittstelle ist zum Beispiel in [Ruschkowski 1998], S. 371–412 zu finden.
Tatsächlich war Pyrite“, ein Vorläufer der SuperCollider Language Application, einmal ein Max Objekt,
”
vgl. [McCartney 1996]
21
2 Entwicklung des Programms Meloncillo
dene Designziele existieren3 –, spricht vieles für eine Trennung dieser beiden Programmteile.
Sind diese Teile hinreichend modularisiert, ergibt sich vor allem der Vorteil, daß größere Änderungen in einem Teil vorgenommen werden können, ohne in den jeweils anderen Part eingreifen zu müssen. Dieselbe Oberfläche kann möglicherweise mit unterschiedlichen austauschbaren
Signalverarbeitungs-Modulen arbeiten und umgekehrt. Außerdem können Alterungserscheinungen abgefedert werden:
This architecture allows to define user-interfaces that provide access to exactly
”
the functionality that is needed by the user, while the back-end can be scaled to
a compromise between the current needs and the hardware possiblities.“ 4
Die gegenwärtigen Klangsynthese Programme sind vom Gesichtspunkt der Signalverarbeitung sehr ausgereift und effizient. Dies kann dagegen nicht von ihren Benutzeroberflächen
gesagt werden, wenn man SuperCollider oder CSound betrachtet. Max/MSP hat eine sehr
ausgereifte Benutzeroberfläche, die Programmierung größer angelegter Patches kann jedoch
leicht unübersichtlich werden, und das Programm ist sehr stark auf den Echtzeit Betrieb ausgerichtet. Von normalen Desktop Anwendungen erwartete Features wie Drag-and-Drop oder
Clipboard Austausch sind höchstens rudimentär vorhanden. Eine klare Trennung von einem
Patch als Instrument und den eingestellten Parametern als Dokument oder Stück ist nicht
vorhanden.
Die zu entwickelnde Software soll sich aus dieser Überlegung heraus weitgehend auf die Oberfläche konzentrieren und im Falle der Signalverarbeitung die Stärken der vorhandenen Programme nutzen.
2.2.2 Abstraktion vom Synthesemodell
In dem Moment, wo die Oberfläche prinzipiell von der Signalverarbeitung getrennt ist, läßt
sich noch ein weiterer Abstraktionsschritt vollführen: Zwischen die Datenstrukturen, die hinter den Oberflächen-Elementen verborgen sind, und der Klangsynthese wird eine Vermittlungsinstanz eingesetzt, die dafür sorgt, daß sich trotz einheitlicher Oberfläche unterschiedliche Arten oder Modelle von Signalverarbeitungen realisieren lassen. Diese Instanz soll eine
kompakte und leicht zu programmierende Script-Sprache sein.
Das bedeutet zum Beispiel, daß Meloncillo weder zu wissen braucht, in welchem exakten
Format und in welcher Reihenfolge die Syntheseengine die Quelldaten benötigt, noch, ob bei
der Synthese eine reine Amplituden-Matrizierung oder eine Kombination mit Filtern oder
Delays verwendet wird. Dies ist die Voraussetzung dafür, daß verschiedene Programme als
Syntheseengines benutzt werden können, ohne auf deren Eigenheiten und Stärken verzichten
zu müssen.
3
Während es in der Signalverarbeitung vor allem um Recheneffizienz und -genauigkeit geht, muß eine Oberfläche in erster Linie Anforderungen an Ergonomie und Konsistenz mit betriebssystemspezifischen StyleGuides erfüllen. Die Programmierung des Oberfläche legt grundsätzlich viel stärkeres Gewicht auf die
Wartbarkeit und Flexibilität des Quellcodes, auch wenn dies nicht immer mit bestmöglicher Performanz
vereinbar ist. Da das Event-Handling nicht auf exaktes Timing angewiesen ist, können hier andere Entwurfsschemata verwendet werden.
4
[Zmölnig et al. 2003]. Der Autor weist auch auf den Vorteil hin, Oberfläche und Audio-Engine auf verschiedenen Rechnern laufen lassen zu können.
22
2 Entwicklung des Programms Meloncillo
Diese Abstraktion ist zugleich der Garant dafür, daß ein Komponist mit Meloncillo neue Ideen
verwirklichen kann, ohne daß jede Idee in der Programmstruktur a priori vorgedacht worden
sein muß. Das weiche Element zwischen Oberfläche und DSP Instanz federt die Erfordernis
ab, bei Entwürfen zu neuen Klangsynthese-Verfahren wieder in den Quelltext von Meloncillo
eingreifen zu müssen.
2.2.3 Anwender mit und ohne Programmiererfahrung
In der elektroakustischen Musik sind zwei unterschiedliche Künstler-Charaktere anzutreffen:
Die einen finden Gefallen daran, selbst die instrumentalen Grundlagen ihrer Stücke zu entwickeln – die ja, anders als in der Instrumentalmusik, nicht automatisch gegeben sind – oder
musikalische Strukturen mit Hilfe von Algorithmen zu erzeugen. Sie besitzen Programmiererfahrung und begegnen rein graphisch orientierten Programmen mit Skepsis. Die andere
Gruppe entwickelt ihre kompositorischen Vorstellungen eher unabhängig von den technischen Rahmenbedingungen der Software und sucht nach Mitteln, diese Vorstellungen mit
möglichst intuitiv zu bedienenden Programmen umzusetzen. Der Gedanke, ästhetische Ideen
ingenieursmäßig auf technische Abläufe herunterzubrechen, schreckt sie ab.
Die graphische Oberfläche soll so gestaltet werden, daß sie von Benutzern bedient werden
kann, deren Computer-Kenntnisse nicht viel weiter reichen als nötig ist, um mit ProTools zu
arbeiten. Der tiefere Eingriff in das Programm und die Verknüpfung mit anderen Programmen wie CSound oder SuperCollider soll durch Definition von Plug-In Schnittstellen geöffnet
werden.
2.2.4 Unabhängigkeit vom Betriebssystem
Applikationen, die über den reinen Charakter eines Utility“ hinausgehen, haben in der Regel
”
eine längere Lebensdauer als das Betriebssystem, für das sie ursprünglich vorgesehen waren.
Dies gilt selbstredend für Programme mit langer Tradition wie CSound, Max, CDP oder die
IRCAM Software. Aber auch jüngere Programme waren beispielsweise von dem Neuanfang
Apple’s mit Mac OS X betroffen. Eine zu enge Festlegung auf ein bestimmtes Betriebssystem
kann das frühzeitige Ende eines Programmes bedeuten, wenn Zeit oder Geld fehlen, jede
Migration mitzumachen, oder wenn eine Plattform mehr oder weniger komplett verschwindet
wie im Falle von Atari, NeXT oder SGI. Benutzer sind oft gezwungen, sich für eine bestimmte
Plattform zu entscheiden, weil es ihr Geldbeutel diktiert, weil eine bestimmte für sie wichtige
Software nur auf dieser Plattform existiert, oder weil sie in einem Studio arbeiten, das auf
diese Plattform ausgerichtet ist.
Die momentan wichtigsten Betriebssysteme im Musikkontext sind Mac OS X, Linux und
Windows XP. Mit den meisten Sprachen läßt sich plattformunabhängig programmieren.
Schwierigkeiten entstehen dann, wenn über eine reine Consolen-Ausgabe hinaus zum Beispiel
eine graphische Oberfläche oder Interaktion mit der Computer-Peripherie (Audio-Hardware)
gewünscht sind. Folgende Möglichkeiten stehen zur Verfügung:
23
2 Entwicklung des Programms Meloncillo
•
eine Sprache mit plattformunabhängigen Bibliotheken wie Java.
•
kommerzielle Produkte wie Xanalysis LispWorks5 , die auf den drei genannten Plattformen einschließlich der Bibliotheken kompilieren. Der Preis von LispWorks beträgt
1000 $, eine Weiterentwicklung als Open-Source Projekt scheidet damit auch aus.
•
eine plattformunabhängige Sprache wie ANSI C oder C++, die mit freien Bibliotheken
gelinkt wird. Verbreitet ist Trolltech’s QT Bibliothek6 , die allerdings entweder unter
der GPL (siehe Abschnitt 3.1) oder kostenpflichtig lizensiert ist. Eine Alternative ist
die Verwendung von Tk/Tcl; die Flexibilität und Ästhetik der erstellten GUIs ist eher
bescheiden.7
2.2.5 Zwei grundlegende Objekttypen
Bei der Betrachtung der vorhandenen Raumklang-Software fällt auf, daß die graphische Oberfläche meist zwei Typen von Objekten kennt: Klangquellen und Lautsprecher. Diese korrespondieren im Signalfluß mit den Eingängen und Ausgängen. Die Beschränkung auf zwei
interagierende Objekte trägt dazu bei, daß die Struktur des Programmes sehr klar bleibt. Die
feste Rollenzuteilung steht einer flexiblen Anwendung jedoch im Wege. Diese zwei Objekte
sollen also rollenunabhängig sein und dennoch komplementäre, sich ergänzende Eigenschaften
besitzen:
•
Ein Receiver ist ein statisches Objekt, das eine flächenförmige Ausdehnung besitzt
und seine Charakteristik – genannt Sensitivität – aus einer Funktion des Ortes auf
dieser Fläche gewinnt.
•
Ein Transmitter ist ein punktförmiges Objekt, das seine Charakteristik aus einer
Bewegung als Funktion der Zeit gewinnt.
Die Bezeichnungen wurden aus Ermangelung besserer Begriffe gewählt und sollen nicht
darüber hinweg täuschen, daß ein Receiver keinesfalls die Rolle eines passiven und ein Transmitter keinesfalls die Rolle eines aktiven Elements übernehmen muß. Vielmehr stehen beide
in einer Beziehung zueinander, die je nach gewähltem Synthesemodell nutzbar gemacht werden kann. Obgleich zum Beispiel die Receiver rein optisch den virtuellen Lautsprechern von
Σ 1 ähneln, können sie auch Klangfelder repräsentieren, die durch Transmitter als bewegte
”
Mikrophone“ abgetastet werden.
2.2.6 Echtzeit und Offline Modus
Im Prozeß des Komponierens gibt es unterschiedliche, sich abwechselnde Formen von Zeit
(vgl. Abschnitt 1.1.2). Ein Stück kann über die Dauer von Wochen bis Jahren entstehen, die
einzelnen Sektionen müssen nicht chronologisch gewachsen sein. Der Vorteil von schnellen
Computern – der auch ein Nachteil sein kann – ist die Möglichkeit, unmittelbar die Resultate eines halbfertigen Stückes anhören zu können. Es ist also anzustreben, daß an dem
5
http://www.lispworks.com/
http://www.trolltech.com/products/qt/
7
Der CSound Frontend Cecilia ist ein Beispiel für eine gelungene Nutzung von Tk/Tcl. Trevor Wisharts
Soundloom Frontend für CDP ist ebenfalls in Tk/Tcl geschrieben. Ebenso die Oberfläche von Pure Data.
Ein halbwegs angenehmes Arbeitsgefühl will sich jedoch – zumindest unter Mac OS X – nicht einstellen.
6
24
2 Entwicklung des Programms Meloncillo
Stück gearbeitet werden kann, indem die performative Zeit des Stücks angehalten wird und
beispielsweise Teile verkürzt oder umgruppiert werden, und zugleich in Echtzeit kontrolliert
werden kann, ob das Ergebnis den Wünschen entspricht. Da vielfach auch eine gestische
Beschreibung von räumlichen Bewegungen gewünscht ist, sollen solche Gesten in Echtzeit
aufgezeichnet werden können. Ein Offline Modus ist auch vom signalverarbeitungstechnischen Gesichtspunkt wünschenswert, weil dadurch Modelle realisiert werden können, deren
Berechnung in Echtzeit aus Gründen der CPU-Kapazität derzeit ausscheidet.
2.2.7 Diskrete Datenströme
Die Funktionswerte der in Abschnitt 2.2.5 genannten Basisobjekte können analytischer und
diskretisierter Natur sein. Eine analytische Beschreibung eines Receivers wäre etwa: Die Sensitivität ist umgekehrt proportional zur Entfernung (f (d) ∼ 1/d). Eine diskretisierte Beschreibung wäre: gegeben sei eine Tabelle mit 1000 Punkten, die durch Abtastung der Funktion
f (dn ) = 1/dn ; dn = n · extent/1000 entstanden ist. Die Sensitivität an einem Punkt mit dem
Abstand d vom Receiver entspricht dem Tabellenwert mit dem Index round(d · 1000/extent).
Entsprechend kann die Bewegung eines Transmitters analytisch durch eine beliebige Kette
von Funktions-Abschnitten gedacht werden: Der Transmitter bewege sich zwischen Sekunde 10 und Sekunde 20 mit konstanter Geschwindigkeit von Punkt (0.25, 0.25) nach Punkt
(0.667, 0.8). Die diskrete Beschreibung wiederum wäre eine Abtastung dieser analytischen
Funktion an gleichmäßig voneinander entfernten Stützpunkten.
Der Vorteil einer analytischen Beschreibung ist die Exaktheit, denn durch die Abtastung
entstehen zwangsläufig Aliasing-Fehler. Eine analytische Beschreibung ist auch viel kompakter, denn im vorangegangenen Beispiel wird die Linie durch zwei Punkte beschrieben,
während eine Abtastung bei 100 Hz für die Bewegung über zehn Sekunden bereits 1000
Punkte benötigt. Soll zu einem späteren Zeitpunkt die Linie verkürzt oder verlängert oder
verlagert werden, so entstehen keine Artefakte und die gesamte Komposition bleibt sehr
sauber“.
”
Die Abtastung hat jedoch entscheidende Vorteile: Der Datenstrom kann an beliebigen Stellen
zerschnitten und umgeordnet werden, ohne daß dadurch kompliziertere Berechnungen nötig
sind. Bei einer Beschreibung mit Hilfe von Breakpoints müssen in diesem Fall neue Punkte eingefügt werden. Soll jetzt zusätzlich eine Sektion rotiert werden, beginnt die Umrechnung der
Breakpoint-Funktionen kompliziert zu werden, es sind trigonometrische Funktions-Abschnitte
nötig. Soll weiterhin eine Unregelmäßigkeit erzeugt werden, kann dem diskreten Datenstrom
einfach Rauschen hinzugefügt werden; in der Breakpoint-Darstellung ist dies nicht möglich,
es müßten also zahlreiche zufällige Punkte erzeugt werden, womit man de facto bei einer gesampelten Funktion endet und zugleich einen immensen Verwaltungsaufwand hat. Der Vorteil
der diskreten Datenströme ist ferner, daß der Datendurchsatz unabhängig von der Editierung
konstant bleibt. Aus diesen Gründen soll zumindest den Transmittern ein diskretes Modell
zugrundegelegt werden. Für die Receiver spielt die Wahl eine eher untergeordnete Rolle.
Obwohl bekannt ist, daß das Ohr eine relativ schlechte räumliche Auflösung besitzt, sollen
die Samples der Transmitter-Trajektorien eine Auflösung von 32-Bit Floating Point und eine
beliebige Abtastrate haben. So wird auch durch wiederholte Transformationen die Signalqualität nicht frühzeitig beeinträchtigt. Der Benutzer kann die Rate seinen Wünschen gemäß
anpassen und beispielsweise mit Modulationen im Audio-Frequenzbereich experimentieren.
25
3 Programmarchitektur
Konventionen
Im Fließtext werden programmiersprachliche Schlüsselwörter, Namen von Klassen, Paketen
und Variablen in Schreibmaschinenschrift gesetzt. In den Klassendiagrammen wird eine
Auszeichnung nach Abbildung 3.1 vorgenommen.
3.1 Sprache und Arbeitsumgebung
Meloncillo wurde mit Java 1.4.2 SE entwickelt1 . Als integrierte Programmierumgebung (IDE) diente Apple Xcode Version 1.12 . Die
Entwicklung fand auf einem G4/800 mit Mac OS 10.3 statt.
Interface
implementor/
subclass
Ein Kernelement von Java ist jedoch die Möglichkeit, vollkommen
Abstract Class
plattformunabhängige Programme zu erstellen. Voraussetzung ist,
daß auf der Zielplattform eine sogenannte Virtual Machine (VM)
Class
verfügbar ist. Die VM enthält einen Just-in-Time (JIT) Compiler, der die vorkompilierten Java Klassen in dem Moment, in dem
instance variable
sie benötigt werden, übersetzt. Eine Vielzahl der Bibliotheken des
instanceof
Standard-API arbeitet sehr eng mit nativen (plattformabhängigen)
Collection
Bibliotheken zusammen – dies gilt beispielsweise für die GraphikAusgabe –, so daß die Performance von Java Applikationen im allgemeinen sehr hoch ist. Als für Echtzeitanwendungen hinderlich
wird oft angesehen, daß der Programmierer keine Kontrolle über
Abbildung 3.1: Legende
den automatischen Garbage-Collector hat3 . Tatsächlich entscheidender ist das Fehlen von präzisen Clock Objekten, die erst für
kommende Java Versionen angekündigt sind. Dieses Problem wird
bei der Echtzeit-Schnittstelle erläutert.
1
Zur Sprachspezifikation von Java siehe [Gosling et al. 2000]. Diese hat sich über die verschiedenen Versionen
praktisch nicht geändert, neu in Version 1.4 ist lediglich das Konzept der Assertions (siehe http://java.
sun.com/j2se/1.4.2/docs/guide/lang/assert.html) Die wesentlichen Änderungen zu Vorgängerversionen bestehen stets aus der Erweiterung der Bibliotheken. Wichtige Bibliotheken von Version 1.4, auf die
in Meloncillo zurückgegriffen wird, sind u.a. die java.util.prefs (für Preferences) und java.nio (NewI/O für Eingabe- und Ausgabeströme) Packages. SE ist die Standard-Edition von Java, deren SDK frei
erhältlich ist, daneben gibt es noch eine Enterprise-Edition (EE), die hier jedoch keine Rolle spielt.
2
kurz vor Fertigstellung wurde auf Version 1.5 gewechselt
3
Im Gegensatz zu C++ werden in Java nur in Ausnahmefällen finalize Methoden, d.h. Methoden zur Freigabe von Ressourcen nicht mehr benötigter Objekte, explizit benutzt. Stattdessen verfolgt der GarbageCollector, wann ein Objekt nicht mehr referenziert wird und damit freigegeben werden kann. Diese Freigaben erfolgen in unregelmäßigen Intervallen und können damit das Echtzeit-Timing beeinträchtigen.
26
3 Programmarchitektur
Meloncillo wurde erfolgreich auf Mac OS X und mit der Sun VM auf Windows XP und
Linux/KDE getestet. Sun’s Linux Support beschränkt sich auf Intel-Prozessoren, auf PowerPC
(Macintosh) Computern ist eine alternative VM wie Blackdown erforderlich. Die Blackdown
PPC Version reicht momentan leider nur bis Java 1.2.2.4
Java wurde als Sprache gewählt, weil der objekt-orientierte Ansatz (OOP) sich hervorragend
für die Entwicklung modularer Systeme eignet. Da der Hauptaspekt von Meloncillo auf der
Programmierung der graphischen Oberfläche liegt, spielt Java hier mit den Technologien
Swing und Java2D seine Vorteile gegenüber C++ aus.
Swing ist eine umfangreiche Bibliothek zum Erzeugen von GUI Objekten wie Fenstern,
Menüs, Buttons, Listen, Textfeldern usw. Es bietet ein ausgereiftes Event-Management5 und
eine Vielzahl von Layout-Managern6 an. Für das tatsächliche Aussehen der GUI Elemente
wird ein austauschbares Look-and-Feel verwendet, so daß sich Java Programme an die Optik
nativer Programme anlehnen können.
Java2D ist eine Graphikbibliothek für zweidimensionale Oberflächen, auf die später noch
genauer eingegangen wird. Im Zuge der Anbindung von Meloncillo an Open Sound Control kann auf die Packages java.net (Netzwerk-Funktionen) und java.nio (Input/Output
Funktionen und Buffer) zurückgegriffen werden. Durch die automatische Garbage-Collection
und umfangreiche Debugging Möglichkeiten zur Laufzeit (Java Reflection) wird die Programmentwicklung und -wartung erheblich erleichtert. Nicht zuletzt ausschlaggebend für die
Sprachwahl ist die umfangreiche Erfahrung des Autors mit Java.
Neben den Standard-Java-Bibliotheken werden folgende externe Bibliotheken verwendet:
•
MRJAdapter von Steve Roy stellt Funktionen zur Verfügung, mit denen das Programm
sich besser an das Look-and-Feel von Mac OS anpassen kann, ohne dadurch seine
Plattformunabhängigkeit einbüßen zu müssen.7
•
Jatha von Micheal Hewett stellt eine kompakte Common Lisp Umgebung mit Brückenfunktionen zu Java dar und wird im Plug-In Teil genauer erläutert.
Beide Bibliotheken stehen unter der GNU Lesser General Public License (LGPL) und lassen
sich damit rechtlich unkompliziert benutzen8 .
4
http://www.blackdown.org/java-linux/java2-status/index.html
Events sind hier Ereignisse, die durch Aktionen des Benutzers an GUI Elementen ausgelöst werden. Ein
ActionEvent kann z.B. durch Klicken auf einen Button ausgelöst werden, ein ComponentEvent durch Vergrößern eines Objekts bei Änderung der Fenstergröße. Die Applikation installiert sogenannte Listener, d.h.
Callback-Interfaces, die Benachrichtigungen über diese Events bekommen.
6
Ein Layout-Manager benutzt ein bestimmtes Modell, um die GUI Elemente dynamisch, d.h. zur Laufzeit und in Abhängigkeit von der Fenstergröße, Schriftgröße usw., anzuordnen. Einfache Manager verwenden z.B. ein Raster-Modell, andere benutzen Modelle mit elastischen Modulen zwischen Objekten
(javax.swing.SpringLayout). Im Sinne der Objektorientierung fragen sie die Objekte nach ihren bevorzugten, minimalen und maximalen Ausmaßen.
7
MRJAdapter verwaltet z.B. grundlegende Menü-Punkte wie Preferences und Quit. Es erlaubt das Versehen von Dokumentdateien mit sogenannten Creator-Codes und File-Types. http://www.roydesign.net/
mrjadapter/
8
Diese von der Free Software Foundation erarbeite Lizenz für Open-Source Bibliotheken sichert wie die
bekanntere General Public License (GPL) die Rechte des Benutzers – er darf zum Beispiel die Software
selbst modifizieren –, hat jedoch aus Sicht des Programmierers, der diese Bibliothek benutzen will, den
Vorteil, daß dessen eigene Applikation nicht wie im Falle der GPL ebenfalls frei (unkommerziell und OpenSource) sein muß. http://www.gnu.org/licenses/lgpl.html
5
27
3 Programmarchitektur
3.2 Packages Überblick
Inhaltlich zusammengehörige Klassen werden zu Paketen (packages) zusammengefaßt, dabei
wird üblicherweise eine durch Punkte getrennte, von links nach rechts absteigende Hierarchie
benutzt, die an Internet-URLs anlehnt ist. Dadurch können später andere Pakete ergänzt
werden, ohne daß Namenskonflikte auftreten. Das hierarchisch oberste Paket (root) heißt
de.sciss.meloncillo. Es enthält die Klasse Main, die von der VM gestartet wird und die
Klasse Session, die das Dokument des Programms beschreibt (Abschnitt 3.3). Die untergeordneten Packages sind:
•
debug : Fehlerkontrolle während der Programmentwicklung
•
edit : Editierungen, die rückgängig gemacht werden können (Undo/Redo)
•
gui : Graphical User Interface Elemente
•
io : Datei Input/Output
•
lisp : Lisp-Interpreter und Erweiterungen
•
math : mathematische Funktionen und Signalverarbeitung
•
net : Netzwerkobjekte (Open Sound Control)
•
plugin : allgemeine Plug-In Schnittstelle
•
realtime : Echtzeit Plug-In Schnittstelle
•
receiver : Receiver-Objekte, -Gruppen, -Ereignisse
•
render : Offline Plug-In Schnittstelle
•
timeline : Timeline-Objekte
•
transmitter : Transmitter-Objekte, -Gruppen, -Ereignisse
•
util : verschiedene Hilfsklassen
3.3 Session
Meloncillo ist als Single-Document-Application (SDA) konzipiert, das heißt, der Benutzer
hat es stets mit einem aktuellen Dokument zu tun, das alle relevanten Datenobjekte enthält.
Diese Objekte werden beim Löschen des Dokuments entfernt, beim Laden des Dokuments
ausgetauscht, bestehen also für die Dauer einer Sitzung. Das zentrale Dokument in der Applikation wird daher – in Analogie zu Digidesign ProTools und ähnlichen Programmen9 –
als Session bezeichnet. Die Session Klasse besteht im wesentlichen aus den drei Objekten ReceiverCollection10 , TransmitterCollection und Timeline, wie in Abbildung 3.2
gezeigt. Diese sind direkt als öffentliche Instanzvariablen zugänglich.
9
Ein Gegenbeispiel für eine Multi-Document-Application ist Emagic Logic Pro, bei dem grundsätzlich beliebig viele Dokumente gleichzeitig geöffnet sein können. Dies erhöht allerdings die Anforderungen an den
Programmierentwurf erheblich, so daß auf ein MDA Design verzichtet wurde.
10
Collection ist ein grundlegendes, im Paket java.util enthaltenes interface, das die Gruppierung
von Elementen beschreibt und Methoden zum Hinzufügen und Entfernen von Elementen definiert.
ReceiverCollection und TransmitterCollection enthalten ähnlich benannte Wrapper-Methoden für die
Gruppe von Receivern und Transmittern, die sie verwalten.
28
3 Programmarchitektur
Session
receiverCollection
transmitterCollection
timeline
Timeline
rate
length
position
visibleSpan
selectionSpan
ReceiverCollection
collReceivers
collSelection
TransmitterCollection
collTransmitters
collSelection
Receiver
ReceiverEditor
Transmitter
TransmitterEditor
AbstractReceiver
AbstractReceiverEditor
AbstractTransmitter
AbstractTransmitterEditor
SigmaReceiverEditor
SimpleTransmitter
SigmaReceiver
distanceTable
rotationTable
rcv
SimpleTransmitterEditor
mte
trns
Abbildung 3.2: Session Struktur
Sowohl Session, als auch ReceiverCollection, TransmitterCollection und Timeline
implementieren das Interface11 XMLRepresentation. Dieses ist über zwei Methoden definiert:
Quelltext 3.1: XMLRepresentation.java (io package)
public interface XMLRepresentation
{
public void toXML( Document domDoc, Element node ) throws IOException;
public void fromXML( Document domDoc, Element node ) throws IOException;
}
XML steht für Extensible Markup Language und ist eine aus SGML hervorgegangene Datenbeschreibungs-Sprache, die vom W3C (World Wide Web Consortium) standardisiert wird12 .
Das Interface besagt, daß die Session in eine XML Node umgewandelt werden kann oder
seine Elemente aus einer XML Node regeneriert werden können13 . Diese Methoden werden
benutzt, um die Session abzuspeichern und zu laden. XML bietet zahlreiche Vorteile, darunter
die einfache Lesbarkeit der Dateien im Textformat ( human readable“) und die automatische
”
11
Java Interfaces definieren Methoden, die ein Objekt implementiert. Der Ausdruck Interface ist recht zutreffend, weil es sich dabei in der Regel um Fähigkeiten handelt, die nicht spezifisch für eine bestimmte Klasse
sind, sondern eher die Schnittstelle zu einer anderen Technologie beschreiben. Während eine Klasse nur
eine Superclass beerben kann, kann sie beliebig viele Interfaces implementieren. Das zweite Interface, das
Session implementiert, heißt FilenameFilter und ist im Paket java.io definiert. Es besagt, daß Session
die Fähigkeit besitzt, Dateinamen nach einem bestimmten Prinzip zu filtern. Dies wird benutzt, um beim
Öffnen der Session nur XML Dateien anzuzeigen.
12
http://www.w3.org/XML/1999/XML-in-10-points . Zur Einführung sei auch auf die FAQ http://www.ucc.
ie/xml/ verwiesen.
13
Ein XML Dokument besteht aus einer hierarchischen Baumstruktur mit Knoten, die Nodes genannt werden.
29
3 Programmarchitektur
Verifizierung der Dateien anhand einer Document Type Definition (DTD). Die Entwicklung
einer DTD ist ein nicht ganz triviales Unterfangen, und Meloncillo Sessions benutzen im
Moment noch keine explizite DTD.
Wird die Session abgespeichert, enthält die XML Datei die entsprechenden Repräsentationen
der Session Objekte und der Collection-Elemente – Receiver und Transmitter –, die ihrerseits das Interface unterstützen. Mit abgespeichert werden ferner Programm Preferences, die
für die Session relevant sind. Große binäre Datenmengen wie die Trajektorien der Transmitter können nicht zufriedenstellend mit XML dargestellt werden und werden daher in einem
speziellen Unterordner unabhängig von der Session-Datei abgespeichert.
3.4 Receiver, ReceiverCollection
Das ReceiverCollection Objekt verwaltet die Receiver einer Session. Es beinhaltet Methoden zum Hinzufügen und Entfernen von Receivern. Ein Subset von Methoden dupliziert diese
Collection-Operationen in Hinblick auf eine Untergruppe der Receiver, nämlich die Gruppe
der ausgewählten Receiver. Dies bezieht sich auf die graphische Oberfläche, auf der der Benutzer ein oder mehrere Receiver auswählen kann. Die ausgewählten Receiver werden optisch
anders dargestellt und stellen die Untergruppe der Receiver dar, auf die Editierungs-Befehle
wie Ausschneiden, Kopieren, Umbenennen oder Bewegen wirken. Die selektionsbezogenen
Methoden beginnen mit dem Term selection. Kann zum Beispiel mit ReceiverCollection.
contains() befragt werden, ob ein Receiver in der Gruppe aller Receiver enthalten ist, so
liefert ReceiverCollection.selectionContains() Auskunft darüber, ob ein Receiver der
Gruppe der ausgewählten Receiver angehört usw.
Die eigentlichen Receiver Objekte werden fast ausschließlich über das Receiver Interface
angesprochen, das im folgenden abgedruckt ist:
Quelltext 3.2: Receiver.java (receiver package)
public interface Receiver
{
public static final DataFlavor receiverFlavor =
new DataFlavor( Receiver.class, null );
public void setAnchor( Point2D newAnchor );
public void setSize( Dimension2D newSize );
public Point2D getAnchor();
public Dimension2D getSize();
public Rectangle2D getBounds();
public void setName( String newName );
public String getName();
public void setDirectory( File f );
public File getDirectory();
public void getSensitivities( float[][] points, float[] sense,
int off, int stop, int step );
public Shape getOutline();
public Class getDefaultEditor();
}
Die Entscheidung, für die Receiver ein Interface zu definieren, begründet sich durch den
Abstraktionsgrad, der den Receivern zugeschrieben werden soll. Außerdem erlaubt es einer
30
3 Programmarchitektur
Klasse, gleichzeitig das Receiver und Transmitter Interface zu implementieren. Die Abstraktion besteht darin, beispielsweise nicht festzulegen, daß ein Receiver kreisförmige Ausmaße
haben muß und seine Charakteristik aus einer Distanz- und einer Rotationstabelle schöpft,
sondern nur zu definieren,
•
daß der Receiver über einen Ankerpunkt und ein äußeres, seinen Umriß umspannendes
Rahmenrechteck verfügen soll (getAnchor() und getBounds()).
•
daß der Receiver über einen Namen identifiziert werden kann (getName())
•
daß der Receiver durch eine schematische Umrißlinie dargestellt werden kann (getOutline())14
•
daß der Receiver eine bestimmte ortsabhängige Sensitivität besitzt (getSensitivities).
points ist eine Liste von kartesischen Koordinaten; die Sensitivitäten an diesen Punkten werden als Ergebnis in das Array sense geschrieben.
•
daß es einen Standard-Editor gibt, um den Receiver zu bearbeiten (getDefaultEditor())
Um diese grundlegenden Methoden nicht jedesmal vollständig implementieren zu müssen,
wurde die Klasse AbstractReceiver entworfen, von der dann spezielle Receiver wie der
später beschriebene SigmaReceiver erben können.
Die File bezogenen Methoden waren nötig, um das Laden und Abspeichern der Daten,
die den Receiver konstituieren, zu ermöglichen. Sie hätten vielleicht besser in einem eigenen
Interface untergebracht werden sollen.
DataFlavor gehört zum Paket java.awt.datatransfer und beschreibt die Möglichkeit, ein
Objekt für Clipboard- oder Drag-and-Drop Operationen zu formatieren. Das Feld receiverFlavor beschreibt das Wrapper-Format, mit dem Receiver beim Benutzen der Funktionen
Ausschneiden / Kopieren / Einfügen dargestellt werden.
3.5 Transmitter, TransmitterCollection
Die theoretische Komplementarität von Receivern und Transmittern soll auch in der Programmstruktur deutlich werden. TransmitterCollection beschreibt damit spiegelbildlich
alle Gruppierungsfunktionen, die in ReceiverCollection vorhanden sind, wendet sie jedoch
auf die Transmitter einer Session an. Entsprechend ist Transmitter ein Interface, das verschiedene konkrete Transmitter mit unterschiedlichen Datenmodellen unterfüttern können:
Quelltext 3.3: Transmitter.java (transmitter package)
public interface Transmitter
{
public void setName( String newName );
public String getName();
public void setDirectory( File f );
public File getDirectory();
public Class getDefaultEditor();
public MultirateTrackEditor getTrackEditor();
}
14
java.awt.Shape ist eines der grundlegenden Interfaces von Java2D, das beliebig geformte Umrißlinien oder
Flächen beschreibt
31
3 Programmarchitektur
Mit der Methode getTrackEditor wurde jedoch schon eine weitgehende Festlegung getroffen.
Sie liefert ein Objekt, das die Trajektorien des Transmitters verwaltet. Um in einer späteren Programmversion andere Datenmodelle zu verwenden als das gegenwärtige der Klasse
SimpleTransmitter, sollte hier wahrscheinlich statt der konkreten Klasse MultirateTrackEditor ebenfalls ein Interface TrackEditor zurückgeliefert werden.
Analog zu Receiver gibt es eine basale implementierende Klasse AbstractTransmitter, von
der konkrete Transmitter erben können.
3.6 Timeline
Das Timeline Objekt beschreibt die Länge der Session, die gegenwärtige Zeitposition und die
Sample-Rate der Trajektorien. Sie verwaltet zwei Teilbereiche, selectionSpan – der aktuell
ausgewählte Zeitbereich, der von Editierungs-Operationen betroffen ist – und visibleSpan –
der im TimelineFrame dargestellte Zeitausschnitt.
3.7 Events
Objekte sollten von dem Innenleben anderer Objekte so wenig wie möglich wissen, sie kennen
nur die öffentlich gemachten Methoden.15 Um die Flexibilität zu wahren, sollte die Interaktion
zwischen Objekten von unten“ realisiert werden; das bedeutet, daß ein Objekt sich möglichst
”
selbst darum kümmern sollte, an benötigte Informationen zu gelangen, statt diesen Vorgang
durch ein hierarchisch übergeordnetes Objekt zu initiieren.
Die ReceiverCollection braucht zum Beispiel nicht wissen, welche Objekte daran interessiert sind, auf Receiver zuzugreifen. Stattdessen bietet sie eine standardisierte Schnittstelle
an, über die sich Interessenten registrieren lassen können. Die einzig erforderliche Gemeinsamkeit dieser Interessenten ist die Implementierung eines Listener Interfaces. Hier das Beispiel
des ReceiverCollectionListeners:
Quelltext 3.4: ReceiverCollectionListener.java (receiver package)
public interface ReceiverCollectionListener
extends EventListener
{
public void receiverCollectionChanged( ReceiverCollectionEvent e );
public void receiverCollectionTransformed( ReceiverCollectionEvent e );
public void receiverCollectionSelected( ReceiverCollectionEvent e );
}
Die ReceiverCollection bietet Methoden zum Anmelden und Abmelden eines ReceiverCollectionListeners an. Wenn eine Veränderung eines Receivers oder einer Gruppe von
Receivern auftritt, so werden alle angemeldeten Listener benachrichtigt, indem eine der im
Quelltext 3.4 gezeigten Callback-Methoden aufgerufen wird. Klickt der Benutzer zum Beispiel
einen Receiver an, so stellt dies eine Veränderung der Gruppe der selektierten Receiver dar,
15
Methoden, die mit dem Schlüsselwort public beginnen; Methoden, die protected deklariert werden, sind
innerhalb desselben Pakets öffentlich.
32
3 Programmarchitektur
und die Methode receiverCollectionSelected jedes einzelnen Listeners wird aufgerufen.
Genauere Informationen zu dem Ereignis kann er dem ReceiverCollectionEvent Argument
entnehmen.
Der Vorteil von diesem Konzept, das in ähnlicher Art auch von den Java AWT und Swing Paketen verwendet wird, ist die Möglichkeit, daß sich neue Objekte dynamisch in die Eventverarbeitung einklinken können. Alle Objekte, die Events generieren – neben den drei Bestandteilen der Session sind dies vor allem GUI Elemente wie VectorEditor usw. –, implementieren
das Interface EventManager.Listener. Sie generieren ein Hilfsobjekt, den EventManager,
der den eigentlichen Dispatcher darstellt, das heißt die Verwaltung der Listener und des
Event-Queue übernimmt und neu eingetroffene Ereignisse weiterleitet. Um das Multitasking
berechenbar zu machen, werden in Analogie zum Event System von Java Swing alle Events
von Meloncillo ebenfalls über den Swing Event Thread verteilt.
3.8 Threads
Der Event Thread16 ist der Hauptthread in Meloncillo. Alle Reaktionen auf das GUI werden zunächst innerhalb des Event Threads bearbeitet. Preferences Änderungen, die zumindest in der Apple VM einen separaten Dispatcher verwenden, werden mit der Hilfsklasse
LaterInvocationManager ebenfalls an den GUI Event Thread delegiert.
Wenn zeitaufwendige Prozesse anstehen, zum Beispiel das Öffnen einer Session, das Rendern
von Trajektorien-Daten oder das Bounce-to-Disk, muß ein zweiter Thread gestartet werden,
um die Reaktivität der GUI nicht zu stoppen. Dies geschieht in der Regel durch eine neue
Instanz von ProcessingThread.17
Ein weiterer wichtiger Thread ist der Transport, ein Objekt, das die Echtzeit-Verarbeitung
verwaltet. Dieser Thread wird zum Programmstart generiert und pausiert, wenn der Transport gestoppt ist; während des Wartens auf Transport-Befehle findet keine CPU Belastung
statt. Damit der Rhythmus der Uhr-Ticks im Echtzeit-Betrieb nicht beeinträchtigt wird, versendet das Lisp Realtime Plug-In (Abschnitt 5.3.1) OSC Datenpakete nicht aus dem Transport, sondern aus einem weiteren Thread.
Der letzte wichtige Fall für eigenständige Threads ist der Empfang von OSC Nachrichten,
der von der Klasse OSCReceiver bewerkstelligt wird. Der Thread pausiert automatisch, wenn
keine Nachrichten eintreffen. Erreicht ein neues Datagramm den Empfänger, wird der Thread
16
Threads sind nebenläufige Prozesse. Zwar arbeiten in der Regel nur ein oder zwei Prozessoren im Computer, das Betriebssystem schaltet jedoch in rascher Reihenfolge zwischen den aktiven Threads um, so daß
praktisch mehrere Aufgaben (Tasks) gleichzeitig bewerkstelligt werden können. In Java ist ein bestimmter Thread – der Event Dispatcher Thread – für die gesamte GUI Verwaltung zuständig, einschließlich
der Bekanntmachung von Eingabe-Ereignissen (z.B. Mausbewegungen, Button-Klicks) und dem Aufruf
von Methoden, die die GUI Elemente zeichnen (paint Methode). Zur Einführung in Java-Threads siehe
[Lea 1997], S. 8–26
17
Wenn der Prozeß synchronisiert ist (einen blockierenden sogenannten Monitor auf ein Objekt besitzt),
werden die Dispatcher währenddessen angehalten, so daß Veränderungen erst im Anschluß weitergeleitet
werden. Zum Beispiel werden beim Öffnen einer Session viele verschiedene Änderungen an der Gruppe der Receiver und Transmitter vorgenommen. Diese Veränderungen werden weitergeleitet, wenn der
Lade-Vorgang abgeschlossen ist, um eine Deadlock-Situation, die durch konkurrierende Synchronisierungsversuche entstünde, zu vermeiden.
33
3 Programmarchitektur
fortgesetzt, und er benachrichtigt alle registrierten Listener. OSC wird im Abschnitt 5.4.2
beschrieben.
Objekte, auf die potentiell von verschiedenen Threads zugegriffen werden kann, müssen
synchronisiert werden, das heißt mit einem Mechanismus ausgestattet sein, der Interferenzen unterbindet, die zu undefinierten Zuständen in oder ungültigen Informationen über
diese Objekte führen. Dafür wurde die Klasse LockManager entwickelt, die über das einfache Synchronisations-Konzept von Java hinaus zwischen geteilten Lese- und exklusiven
Schreib-Zugriffen unterscheidet.18 Die Session besitzt einen LockManager für die Objekte
ReceiverCollection, TransmitterCollection und Timeline.
18
vgl. [Lea 1997], S. 133–136 und 169–171
34
4 Graphische Benutzeroberfläche
4.1 Surface : zweidimensionale Momentansicht
Das graphische Hauptelement der meisten Raumklangsteuerungen ist eine schematische Sicht
auf das räumliche Szenario. Dabei handelt es sich oft um eine zweidimensionale Momentansicht. Durch Bewegen der Zeitachsen-Position oder Starten des Transports werden die dynamischen Objekte animiert. Diesem Videoschirm-Paradigma“ folgt auch Meloncillo. Während
”
einige Programme auch dreidimensionale Raumansichten bieten1 oder als Middleware für Virtual Reality 3D-Applikationen fungieren2 , folgt die planare Editierung aus der ausschließlichen Zweidimensionalität gegenwärtiger Computersysteme (Bildschirm, Maus/Joystick/
Tablett).
Die Surface Klasse ist zuständig für die 2D-Sicht in Meloncillo. Eine solche Darstellung ist
in Abbildung 4.1 abgedruckt. Receiver und Transmitter werden durch kleine rote respektive grüne Fadenkreuze dargestellt, die mit dem Namen der Objekte versehen sind. Die
Umrißlinie der Receiver ist gestrichelt dargestellt. Optional wird die Sensitivität der Receiver in Grauschattierungen gezeigt. Wird die Zeitachsen-Position verändert, bewegen sich
die Transmitter entsprechend. Um die Trajektorien besser beurteilen zu können, werden sie
optional eingeblendet: Ein grüner gestrichelter Pfad stellt den Verlauf der Trajektorien der
ausgewählten Transmitter im ausgewählten Zeitabschnitt dar. Die Auflösung, d.h. die Zahl
der Stützpunkte, wird automatisch heruntergeschaltet, wenn der Zeitabschnitt größer wird,
um eine ausreichende Geschwindigkeit der Graphikdarstellung zu gewährleisten. Das Konzept
der stufenweise aufgelösten Trajektoriendaten wird im Abschnitt 4.2.1 erläutert.
Alle Graphikbefehle sind im Rahmen von Java2D realisiert, dadurch läßt sich das Surface
Fenster stufenlos vergrößern. Alle Objektkoordinaten werden in einem virtuellen Raum ausgedrückt, der auf die Größe 1.0×1.0 normalisiert ist. Dazu implementiert Surface das Interface
VirtualSurface:
Quelltext 4.1: VirtualSurface.java (gui package)
public interface VirtualSurface
{
public Point2D snap( Point2D freePt, boolean virtual );
public Point2D screenToVirtual( Point2D screenPt );
public Point2D virtualToScreen( Point2D virtualPt );
public Rectangle virtualToScreenClip( Rectangle2D virtualClip );
public Shape virtualToScreen( Shape virtualShape );
public Shape screenToVirtual( Shape screenShape );
}
1
2
vgl. die IEM-Cube Software in [Zmölnig et al. 2003]. Siehe auch [Momenti/Wessel 2003].
vgl. das Scream Projekt in [Leahy 2004], das eine Anbindung an 3D Spiele und Multimedia vorsieht; ähnlich
das Sonificator Projekt in [Mühlethaler/Schuppisser 2004], für das eine graphische Java3D Anwendung
geschrieben wurde.
35
4 Graphische Benutzeroberfläche
Abbildung 4.1: Surface Fenster
Abbildung 4.2: Hilfspaletten
VirtualSurface beschreibt also Methoden, um Koordinaten (wie sie beispielsweise von
der Maus generiert werden) von der Bildschirm-Ebene in die virtuelle Ebene und umgekehrt zu transformieren. Die Objekte Point2D und Rectangle2D sind Teil des Hauptpakets
von Java2D, java.awt.geom. Darin sind vor allem das Interface Shape und die Klasse
AffineTransform interessant: Shape beschreibt eine beliebige zweidimensionale geometrische Form, die in eine Folge von einfachen Segmenten (den PathIterator) zerlegt werden
kann. Shape Objekte können darauf getestet werden, ob sie bestimmte Punkte enthalten
oder andere Shape Objekte überschneiden. Einige Klassen, die Shape implementieren, bieten
Menge-Operatoren wie UND- oder Exklusive-ODER Verknüpfung.
Mit einer AffineTransform lassen sich geometrische Skalierungen, Scherungen und Rotationen beschreiben. Diese können auf Point2D und Shape Objekte angewandt werden. Die
graphische Realisation findet in einem Graphics2D Kontext statt. Die Methode fill zeichnet dabei mit beliebiger Farbe, Verlauf oder Muster die Flächeninhalte von Shapes. Die
Methode draw zeichnet mit beliebiger Strichstärke und Form die Umrißlinie von Shapes.
Das Graphics2D Objekt bietet die Möglichkeit, sogenannte RenderingHints zu setzen und
damit die Qualität der Graphik, zum Beispiel bei Skalierungen oder der Verwendung von
Anti-Aliasing Techniken, zu kontrollieren.
Trotz der hohen Performance von Java2D muß in der Echtzeit-Umgebung versucht werden,
aufwendige Graphikoperationen wie Skalierungen und semitransparentes Zeichnen zu minimieren. Dazu werden die statischen Elemente in ein Offscreen-Image gerendert, das dann
relativ schnell wiederholt gezeichnet werden kann. Die Darstellung der Receiver-Sensitivität
36
4 Graphische Benutzeroberfläche
selbst ist eine grob aufgelöste Bitmap-Graphik (8-Bit Graustufen), deren Berechnung relativ
langsam ist.
4.1.1 Hilfs-Paletten und Werkzeuge
In der Abbildung 4.2 sind zwei Hilfs-Paletten zu sehen, die weitere Funktionalität für die
Surface und andere Objekte bereitstellen. Die ObserverPalette stellt kontextsensitive TextInformationen dar. Sie enthält verschiedene Karten, die in Abhängigkeit von der BenutzerAktion umgeschaltet werden. Wählt der Benutzer beispielsweise einen Receiver aus, wird
die Rcv“-Karte angezeigt. Sie enthält die exakten Koordinaten des Anker-Punktes (Mittel”
punktes) des Receivers, seine Ausdehnung und seinen Namen. Diese Angaben können durch
Texteingabe geändert werden. Durch Anwählen einer Gruppe von Receivern können diese
gleichzeitig verändert und ausgerichtet werden. Die weiteren Karten des Observers betreffen
die ausgewählten Transmitter und die Timeline. Die Csr“-Karte stellt die aktuellen Maus”
koordinaten (im virtuellen Bezugssystem) dar.
Die ToolPalette stellt die grundlegenden Editierungsfunktionen für die Surface bereit. Von
links nach rechts zu sehen sind
•
Auswahl-Werkzeug : Es dient der Auswahl und dem Bewegen von Receivern
•
Linien-Werkzeug : Zum Generieren linearer Trajektorien-Verläufe
•
Kurven-Werkzeug : Generiert Trajektorien-Verläufe anhand von kubischen Kurven
•
Kreissegment-Werkzeug : Generiert Trajektorien, die entlang einer Kreisbahn verlaufen
•
Freihand-Werkzeug : Dient der Echtzeit-Aufzeichnung von Mausbewegungen
•
Blending-Option : Versieht die Editierungen mit einer Überblendung (Crossfade)
Linien, Kurven und Kreissegmente sind Offline-Werkzeuge, sie arbeiten unabhängig vom
Transport. Der Benutzer bestimmt einen Zeitausschnitt, über den sich der TrajektorienAbschnitt erstrecken soll. Er zieht die werkzeugspezifische Grundform, die durch zwei Stützpunkte definiert ist. Anschließend kann er durch Anfassen und Ziehen der Kontrollpunkte
die Form anpassen. Mit Tastaturbefehlen (Escape und Return) wird die Geste abgebrochen
oder ausgeführt (gerendert). Über eine spezielle Tastenkombination kann eine Serie von zusammenhängenden Segmenten gezeichnet werden.
Da diese drei Werkzeuge analytische (durch eine Funktion beschriebene) Formen darstellen,
können sie an beliebigen Punkten ausgewertet werden. Aufgrund dieser Überlegung wurde
ein Velocity-Modus integriert, der dem Benutzer erlaubt, die Start- und Endgeschwindigkeit
der Bewegung zu beeinflussen. Um zu verdeutlichen, was damit gemeint ist, sehen wir uns
die dafür vorgesehenen Methoden in der Super-Klasse AbstractGeomTool an:
37
4 Graphische Benutzeroberfläche
Quelltext 4.2: AbstractGeomTool.java (gui package)
public abstract class AbstractGeomTool
extends AbstractTool
implements KeyListener
{
[...]
protected boolean canAccelerate()
{
return true;
}
protected boolean initFunctionEvaluation( Point2D[] ctrlPoints )
{
return false;
}
protected void evaluateFunction( float[] warpedTime, float[][] interpBuf,
int len ) {}
[...]
}
Die Fähigkeit, die Funktion an variablen Zeitpunkten auszuwerten, wird durch die Methode canAccelerate erfragt. Die Methode initFunctionEvaluation dient der Initialisierung von Parametern, die nur einmal berechnet werden müssen. Der eigentlichen Methode
evaluateFunction wird ein Array von Zeit-Werten übergeben, die monoton steigend aber
nicht linear verteilt sein müssen. Die Bezeichnung warpedTime besagt, daß die EingangsZeitwerte ungleichmäßig angeordnet sind, die ihnen zugeordneten (in der Methode berechneten) Funktionswerte jedoch als mit konstanter Sampling-Rate abgetasteter TrajektorienAbschnitt aufgefaßt werden.
Mit anderen Worten, wenn eine Strecke mit dem Linien-Werkzeug gezeichnet und die Funktion so ausgewertet wird, daß die Eingangs-Zeitwerte zu Beginn dichter beieinander liegen als
zum Schluß, so ergibt sich eine lineare Bewegung des Transmitters, deren Geschwindigkeit
zunimmt.3 Durch Doppelklick auf die Surface wird dem Benutzer eine einfache Möglichkeit
gegeben, die Start- und Endgeschwindigkeit der geometrischen Form anzupassen. Der Verlauf
der Geschwindigkeit wird mit einer kubischen Funktion so berechnet, daß unabhängig von
den Einstellungen des Benutzers der gewählte Zeitabschnitt exakt ausgefüllt wird. Die Geschwindigkeit wird durch eine transparente gelbe Hüllkurve dargestellt, die der geometrischen
Grundform folgt (Graudarstellung in Abbildung 4.3).
In einer zukünftigen Version sollte die Möglichkeit, mehrere Linienzüge nacheinander zu zeichnen, so erweitert werden, daß auch der Geschwindigkeitsvektor im Schnittpunkt zwischen zwei
Segmenten stetig ist.
Die Funktion des Freihand-Tools wird im Abschnitt über den Transport dargestellt.
Um beim Einzeichnen von Trajektorien-Abschnitten zu vermeiden, daß ein Transmitter
sprunghaft den Ort wechselt, kann durch Aktivierung der Blending-Option ein automatischer Crossfade zwischen den vorherigen und den neuen Trajektorien-Daten erzeugt werden.
Dies ist auch hilfreich beim Filtern der Trajektorien mit Plug-Ins, die in vielen Fällen eine
Unstetigkeit an den Rändern des gefilterten Zeitausschnittes erzeugen. Ebenso kann mit einer
3
Die Geschwindigkeit ist proportional zu ∆twarped /T mit T = Sampleperiode der Trajektorien.
38
4 Graphische Benutzeroberfläche
Abbildung 4.3: Bézier-Kurve mit variabler Geschwindigkeit
langen Blending-Dauer der Output einfacher Filter ein- und ausgeblendet werden, so daß eine
dynamische Transformation stattfindet, obwohl die Filter selbst keine zeitvariablen Parameter
besitzen.
4.1.2 ReceiverEditor
Mit Doppelklick auf den Anker eines Receivers wird ein Editor geöffnet (Abbildung 4.4), mit
dem die Sensitivität des Receivers eingestellt werden kann. Grundsätzlich sind Receiver und
ReceiverEditor Interfaces in Meloncillo, so daß sich verschiedene Modelle für die Berechnung
der Sensitivität integrieren lassen. In der aktuellen Version ist lediglich eine Klasse von Receivern vorhanden, der SigmaReceiver, der in Analogie zu Σ 1 eine Kreuzung zweier Tabellen
vorsieht: Die Distance-Tabelle beschreibt die Empfindlichkeit des Receivers in Abhängigkeit
eines Abstandes vom Anker-Punkt. Die Rotation-Tabelle beschreibt die Abhängigkeit vom
Winkel, den ein Transmitter zum Anker-Punkt des Receivers einnimmt. Die Tabellen-Werte
sind momentan linear skaliert und werden daher multipliziert:
sense(r, φ) = distance table[r] · rotation table[φ]
Dadurch lassen sich alle Standard-Formen von Kugel bis Niere und Acht beschreiben. Da
die Tabellen hinreichend groß sind (jeweils 1024 Punkte4 ), lassen sich durch harte Kanten
oder Rauschen auch experimentelle nicht-stetige Empfindlichkeitsverläufe realisieren. Dazu
stehen per Popup-Menü verschiedene Signalgeneratoren und mathematische Operationen zur
Verfügung. Um Zipper-Noise bei langsamen Bewegungen und tieffrequenten harmonischen
Tönen zu vermeiden, werden die Tabellen-Werte linear interpoliert.
Im klassischen Amplituden-Panning werden die Sensitivitäten direkt auf Lautstärken gemappt. Durch Vergrößern der Receiverfläche und Editieren der Tabellen lassen sich praktisch
alle Panning-Verläufe umsetzen und Divergenzen simulieren. Wird ein anderes Verfahren
benutzt, beispielsweise VBAP, so sind für das reine Panning nur die Receiver-Koordinaten
von Bedeutung; die Sensitivität kann in diesem Fall ganz anders genutzt werden, etwa als
Parameter für die Ansteuerung eines Raumhalls, einer Filterung oder Verzerrung.5
4
5
Dies wird in einer zukünftigen Version vom Benutzer konfigurierbar sein.
In einer zukünftigen Version wird es eine weitere Receiver-Klasse geben, die gar keine Sensitivitäts-Daten
generiert und somit effektiv ist, wenn darauf ohnehin verzichtet wird, wie z.B. in einer HRTF Synthese.
39
4 Graphische Benutzeroberfläche
Abbildung 4.4: Editor für SigmaReceiver
Abbildung 4.5: Matrix Meter
4.1.3 Matrix Meter
Der Observer zeigt während der Tabellen-Editierung die exakte Sensitivität eines Receivers
an. Um zu kontrollieren, wie der Übergang von einem Receiver zum nächsten verläuft, kann
das sogenannte Matrix Meter Fenster eingeblendet werden (Abbildung 4.5). Es zeigt jeweils
eine Zeile oder Spalte der aus Transmittern und Receivern gebildeten Matrix an. Durch Klick
auf einen Transmitter Namen werden die momentanen Empfindlichkeiten aller Receiver an der
Stelle dargestellt, an der sich dieser Transmitter befindet. Umgekehrt werden durch Klick auf
einen Receiver Namen die Sensitivitäten dieses Receivers zu allen momentanen TransmitterPositionen dargestellt. In einer zukünftigen Version wird das Meter optional logarithmisch
dargestellt6 , außerdem sollen die exakten Werte im Observer ausgegeben werden.
4.2 Timeline : horizontale Zeitdarstellung
Für einen simultanen Überblick über den Verlauf der Trajektorien und die Gesamtform der
Komposition sorgt das TimelineFrame (Abbildung 4.6). Ähnlich dem Arrangier-Fenster eines
Harddisk-Recording-Programms ist hier die Zeitachse horizontal aufgetragen, während die
verschiedenen Spuren, die die Trajektorien der Transmitter zeigen, vertikal angeordnet sind.
Jede Spur besteht aus zwei eindimensionalen Vektoren, die die kartesischen Koordinaten
(x, y) der Trajektorien zeigen. Möglicherweise zeigt eine zukünftige Version optional eine
Polar-Koordinaten-Sicht. Die kartesische Darstellung hat jedoch den Vorteil, daß sie der internen Datendarstellung entspricht und somit schnell gezeichnet werden kann, davon abgesehen
müßten Winkel mit der Periode 2π umgebrochen werden.
6
Die jetzige Darstellung ist linear.
40
4 Graphische Benutzeroberfläche
Abbildung 4.6: Timeline Fenster
Abbildung 4.7: Transport
Palette
Die Darstellung der Koordinaten-Vektoren erfolgt mit einem VectorEditor, dadurch ist das
direkte Einzeichnen mit der Maus möglich. Komfortabler ist jedoch die Editierung auf der
Surface oder mittels Filterung, wie sie im Plug-In Kapitel beschrieben wird. Die Editierung,
die typischerweise im Timeline Fenster gemacht wird, ist das Ausschneiden, Kopieren und
Einfügen von Trajektorien-Abschnitten. Am oberen Rand des Fensters ist eine Zeitachse zu
erkennen. Durch Klicken mit der Maus kann die gegenwärtige Zeitposition, die durch die
vertikale rote Linie symbolisiert wird, verschoben werden. Durch Halten der Umschalttaste
kann eine Region selektiert werden, die durch dunklere Schattierung hervorgehoben wird.
Durch Klick auf die Namen der Transmitter-Spuren können diese Transmitter selektiert und
deselektiert werden. Die Cut- und Copy-Befehle wirken auf die Trajektorien-Ausschnitte, die
durch die selektierten Transmitter und den selektierten Zeitausschnitt bestimmt sind. Die
Paste-Operation fügt den Clipboard-Inhalt in die Trajektorien der gewählten Transmitter
ein, an der Stelle, an der sich die Zeitposition befindet.
4.2.1 Trajektorien Daten-Format
Die Darstellung des Timeline Fensters kann horizontal und vertikal vergrößert und verkleinert werden. Durch die Diskretisierung der Trajektorien kann der Fall auftreten, daß durch
Herauszoomen ein Ausschnitt dargestellt wird, dem mehrere Tausend bis Hunderttausende
von Frames entsprechen. Eine solch große Zahl von Frames einzulesen ist sowohl zu zeit- als
auch zu speicherintensiv. Die Lösung besteht in einer Unterabtastung der Trajektorien. Dies
geschieht in mehreren Schritten, um stets eine optimale Auflösung zur Verfügung zu haben.
Jede Dezimations-Stufe verringert die Frame-Rate um den Faktor vier. Da VectorEditor die
Daten als Vektorgraphik darstellt, wird der Umschaltpunkt so gelegt, daß maximal doppelt
soviele und minimal halb soviele Punkte wie die aktuelle Fensterbreite gezeichnet werden.
Insgesamt werden sechs dezimierte Tracks pro Trajektorie berechnet. Angenommen den extrem unwahrscheinlichen Fall, daß die Framerate in der Größenordnung von Audioraten liegt,
zum Beispiel 48 kHz, so besitzt der am stärksten dezimierte Track (Faktor 1/4096) eine Rate
41
4 Graphische Benutzeroberfläche
1/1
:4
1/4
:4
1/16
Abbildung 4.8: Dezimation von Trajektorien
von ca. 12 Hz. Wenn innerhalb einer Fensterbreite eine halbe Stunde dargestellt werden sollte,
wäre damit eine Puffergröße von 21094 Frames verbunden. In dem wahrscheinlicheren Fall
einer Framerate von 4800 Hz oder weniger könnte eine volle Stunde mit gerade 4219 dezimierten Frames dargestellt werden, was einen geringen RAM-Verbrauch und geringe CPU
Belastung bedeutet.
Die gespeicherte Session enthält die Trajektorien in Form von Floating-Point Dateien in einem
separaten Unterordner trns. Die dezimierten Dateien werden momentan nicht gespeichert,
sondern beim Laden einer Session adhoc erstellt, was akzeptabel schnell verläuft. Die im temporären Verzeichnis gespeicherten dezimierten Trajektorien benötigen ca. 1/3 der Größe der
Originaldatei. Die Editierung der Trajektorien geschieht nicht-destruktiv, das heißt, die Originaldatei wird bis zum Abspeichern der Session nicht verändert. Die Verwaltung dieser nichtlinearen und nicht-destruktiven Editierung übernimmt die Klasse MultirateTrackEditor
(MTE), die im wesentlichen sieben SubsampleTrackEditoren verwaltet. Diese repräsentieren
die Trajektorien-Daten in voller respektive dezimierter Rate. Um auch bei stärkerer Dezimation eine möglichst gute Annäherung an die Signaleigenschaften zu erhalten, wird in jeder
Stufe aus den jeweils vier Ausgangsframes jedes dezimierten Frames der Median berechnet.
Abbildung 4.8 zeigt zwei Stufen des Dezimations-Prozesses.
Der MTE verwaltet eine sogenannte TrackList, eine chronologische Liste aus TrackSpan
Objekten, die wie folgt aussehen:
Quelltext 4.3: TrackSpan.java (io package)
public class TrackSpan
{
public Span span;
public final InterleavedFloatFile f;
public long offset;
[...]
}
Span ist eine Klasse, die sehr häufig in Meloncillo benutzt wird. Sie beschreibt eine Zeitspanne
durch Angabe eines Start- und Endframes. Die Spannen der Track-Liste fügen sich nahtlos
aneinander. Wird eine Session geöffnet, so besteht die Liste lediglich aus einem TrackSpan, der
die gesamte Dauer der Session umfaßt. Wird jetzt ein Teil der Trajektorie herausgeschnitten,
so wird diese TrackSpan durch zwei neue ersetzt, die die Spannen vor und nach dem Schnitt
beschreiben. Die Datei vom Typ InterleavedFloatFile, die die Trajektorien-Daten enthält,
42
4 Graphische Benutzeroberfläche
bleibt unverändert. Das Feld offset wird jedoch stets so angepaßt, daß es auf den richtigen
Punkt innerhalb dieser Datei zeigt. Wird jetzt eine Trajektorie zum Beispiel mit dem LinienWerkzeug überzeichnet, so wird der neue Abschnitt in einer temporären Datei gerendert
und in Form einer neuen TrackSpan in die Track-Liste eingefügt. Gegebenenfalls wird am
Insert-Punkt die alte TrackSpan in zwei separate Objekte aufgeteilt.
Der MTE sorgt dafür, daß nach jeder Editierung der Trajektorien die Dezimations-Files
auf den aktuellen Stand gebracht werden. Die SubsampleTrackEditoren enthalten ebenfalls
eine Liste von TrackSpans, deren Spannen jedoch durch die spezialisierte BiasedSpan Klasse
beschrieben werden. BiasedSpan sorgt dafür, daß die Rundungsfehler, die durch die Unterabtastung hinsichtlich der Start- und Stopframes entstehen, stets minimiert werden.
4.2.2 Transport Palette
Abbildung 4.7 zeigt ein Fenster mit einfachen Transport-Funktionen. Der Transport ist eng
mit der Realtime-Engine des Programms verknüpft. Er enthält einen eigenen Event-Dispatcher, der registrierte Listener über Start- und Stop-Vorgänge informiert. Die Palette enthält
einen Play- und Stop-Button und einen Loop-Umschalter. Das ballförmige Symbol ganz rechts
aktiviert das Realtime-Plug-In, das im nächsten Kapitel beschrieben wird.
Der Transport dient neben dem Realtime-Preview auch dem Aufzeichnen von TransmitterBewegungen in Echtzeit. Während der Transport läuft, kann mit dem Freihand Werkzeug
auf der Surface entlanggefahren werden. Die Bewegung wird zwischen den Stützpunkten
linear interpoliert. Die Editierung wird gerendert, wenn der Mausknopf losgelassen wird. Das
impliziert, daß die Bewegung im Moment des Zeichnens noch nicht über das Preview-Plug-In
zu hören ist. Eine Lösung dafür wird in der nächsten Programm-Version angestrebt.
43
5 Plug-In Schnittstellen
An drei Punkten wird im Programm auf ein Plug-In Konzept zurückgegriffen:
•
Filterung von Trajektorien
•
Bouncen (Rendern) der Klang-Synthese auf Harddisk
•
Realtime Vorschau der Klang-Synthese
Die Verwaltung dieser Plug-In Typen übernehmen drei Objekte, die das PlugInHost Interface
implementieren: Es sind FilterDialog, BounceDialog und RealtimeFrame. Das Diagramm
5.1 zeigt die Hierarchie der am Plug-In Konzept beteiligten Klassen und Interfaces.
5.1 Offline (Nicht-Echtzeit)
Die nicht-echtzeit-basierten Filter- und Bounce-Plug-Ins implementieren das Interface RenderPlugIn:
Quelltext 5.1: RenderPlugIn.java (render package)
public interface RenderPlugIn
extends PlugIn
{
public boolean producerBegin( RenderContext context, RenderSource source )
throws IOException;
public boolean producerRender( RenderContext context, RenderSource source )
throws IOException;
public boolean producerFinish( RenderContext context, RenderSource source )
throws IOException;
public void producerCancel( RenderContext context, RenderSource source )
throws IOException;
}
Es übernimmt als Subinterface von PlugIn eine Methode zur Generierung einer Plug-InOberfläche (getSettingsView()), die vom RenderHost innerhalb eines Fensters dargestellt
wird. Der Host reagiert auf die Aktionen des Benutzers. Wenn dieser den Render-Vorgang
startet, ruft er nacheinander nach dem Push-Verfahren die Methoden producerBegin, producerRender und producerFinish des Plug-Ins auf, wobei producerRender gegebenenfalls
mehrfach mit Teilblöcken der zu rendernden Zeit aufgerufen wird.
44
5 Plug-In Schnittstellen
PlugIn
PlugInHost
RealtimePlugIn
RenderPlugIn
RealtimeConsumer
RealtimeHost
Transport
RenderHost
BasicRenderDialog
BounceDialog
LispRealtimePlugIn
LispRenderPlugIn
LispBounce
TimeWarpFilter
RenderConsumer
FilterDialog
VectorTransformFilter
LispFilter
Abbildung 5.1: Plug-In Interfaces und Klassen
Im Falle des Trajektorien-Filters müssen die gefilterten Daten wieder zurück zur Applikation
fließen. Dazu übergibt der Host dem Plug-In ein Objekt, das das Interface RenderConsumer
implementiert. Es ist ganz ähnlich dem RenderPlugIn aufgebaut:
Quelltext 5.2: RenderConsumer.java (render package)
public interface RenderConsumer
{
public boolean consumerBegin( RenderContext context, RenderSource source )
throws IOException;
public boolean consumerRender( RenderContext context, RenderSource source )
throws IOException;
public boolean consumerFinish( RenderContext context, RenderSource source )
throws IOException;
public void consumerCancel( RenderContext context, RenderSource source )
throws IOException;
}
Das Plug-In fungiert dann als eigener Host, der den Consumer mit Datenblocks füttert. Der
FilterDialog ist bidirektional aufgebaut – das heißt, er empfängt die gefilterten Trajektorien
und fügt sie wieder in die Session ein –, implementiert daher sowohl RenderHost als auch
RenderConsumer. Grundsätzlich werden zwei Typen von Daten unterschieden, die während
der Plug-In Bearbeitung Informationen liefern: statische Daten, die in einem PlugInContext
Objekt zusammengefaßt sind – beispielsweise die gesamte zu bearbeitende Zeitspanne, die
beteiligten Transmitter und Receiver. Und dynamische Datenströme, die blockweise generiert
werden und in Form des RenderSource Objekts zur Verfügung stehen.
Wenn das Plug-In durch Aufruf von producerBegin initialisiert wird, kann es sogenannte
Request-Felder im RenderSource ausfüllen und gibt damit bekannt, welche Datenströme
45
5 Plug-In Schnittstellen
Abbildung 5.2: Plug-Ins zur Trajektorien-Filterung
erzeugt werden müssen. Ein Plug-In kann zum Beispiel nur an den Trajektorien-Daten (wie
im Falle der Filter-Klassen) oder nur an den Sensitivitäten der beteiligten Receiver interessiert
sein.
Für die Filterung von Trajektorien stehen momentan drei Plug-Ins bereit, deren SettingsViews in Abbildung 5.2 zu sehen sind.
•
Der TimeWarpFilter ordnet anhand einer Tabelle die Eingangszeitwerte (Ordinate) den
Ausgangszeitwerten (Abszisse) zu, d.h. traj 0 (t) ← traj(f (t)). Eine absteigende Gerade
bewirkt, daß die ursprünglichen Bewegungen rückwärts wieder gegeben werden. Eine
Parabel würde ein Vorwärts- und Rückwärtslaufen simulieren, ein Sägezahn mit drei
Perioden würde die ausgewählte Trajektorie dreimal mit dreifacher Geschwindigkeit
wiederholen.
•
Der VectorTransformFilter bietet die Möglichkeit, x und y Werte (alternativ Radius
und Winkel zu einem Bezugspunkt) mit einer mathematischen Funktion zu bearbeiten. Unter anderem steht ein Funktionsgenerator zur Verfügung, mit dem sich einfache
geometrische Figuren wie Spiralen und Linien oder das Hinzufügen von Unregelmäßigkeiten (Rauschen) realisieren lassen.
•
Der LispFilter stellt ein frei programmierbares Plug-In dar, das über Common Lisp
Scripte gesteuert wird. Es wird in Abschnitt 5.3 erklärt.
5.2 Realtime (Echtzeit)
Aus Abbildung 5.1 geht hervor, daß momentan genau ein RealtimeHost und ein RealtimePlugIn existieren. Die implementierenden Klassen sind Transport und LispRealtimePlugIn. Transport ist der Motor des Echtzeit-Betriebs. Er ist ein spezieller Thread, der läuft,
wenn der Play-Knopf der Transport-Palette gedrückt wird. RealtimeConsumer können sich
bei ihm registrieren, so daß sie im Benachrichtigungs-Rhythmus mit neuen Informationen
46
5 Plug-In Schnittstellen
Klasse
Surface
MeterFrame
TimelineFrame
TransportPalette
Request
traj
sense
clock
clock
Rate
30 Hz
15 Hz
30 Hz
15 Hz
Aktivität
Nachführung der Transmitter Bewegungen
Monitoring der Sensitivitäten
Animation der Zeitachsen-Positions-Linie
Update des Zeitachsen-Positions-Textfeldes
Abbildung 5.3: RealtimeConsumer Profile
versorgt werden. Die Genauigkeit der Uhr-Information in Java liegt bei einer Millisekunde.
Die Methode Thread→sleep( long millis, int nanos ) kann benutzt werden, um den
Thread für eine bestimmte Zahl zu pausieren. Die suggerierte Genauigkeit im Bereich von
Nanosekunden ist jedoch überhaupt nicht gegeben. Selbst wenn eine Millisekunde lang gewartet wird, ist nicht garantiert, daß der Thread wirklich nach einer Millisekunde fortgesetzt
wird. Deshalb wird im Transport-Kern ein Mechanismus benutzt, der laufend die aktuelle
und die geforderte Rate vergleicht und entsprechend kürzer oder länger wartet. Der entstehende Jitter ist optisch irrelevant und tangiert die externe Klangsynthese nicht, die Daten
blockweise erhält und ihren eigenen Scheduler hat.
Im Gegensatz zur Trajektorien-Filterung und Bounce-to-Disk gibt es im Echtzeit-Betrieb
mehrere Consumer. Das bedarf einer Erläuterung: Im Klassen-Diagramm ist zu erkennen, daß
LispRealtimePlugIn sowohl RealtimePlugIn als auch RealtimeConsumer implementiert.
Worin besteht der Unterschied? Das Plug-In ist dafür zuständig, mit externen KlangsyntheseProgrammen zu kommunizieren. Das Interface beinhaltet Methoden zum Aktivieren und
Deaktivieren des Plug-Ins, das heißt, es kann auf Bypass geschaltet werden. Der eigentliche
Datenaustausch jedoch ist Teil des Consumer Interfaces. Neben dem Lisp Plug-In gibt es
weitere Consumer in Meloncillo, die in Abbildung 5.3 gelistet sind.
Je nach Anwendung sind also unterschiedliche Datenraten gefragt. Die tabellierten Klassen
sind alle Teil der graphischen Oberfläche und benötigen daher nur Raten, die einen optisch
fließenden Eindruck vermitteln. Die verschiedenen Requests werden dynamisch verwaltet von
einem Objekt, das eng mit Transport zusammenarbeitet, dem RealtimeProducer:
Quelltext 5.3: RealtimeProducer.java (realtime package)
public class RealtimeProducer
implements LaterInvocationManager.Listener
{
[...]
public RealtimeProducer.Source source;
[...]
public void changeContext( RealtimeContext c ) { [...] }
public void requestProduction( Span blockSpan, boolean even,
long deadline ) { [...] }
public void produceNow( Span blockSpan, boolean even ) { [...] }
public void produceOffhand( long currentPos ) { [...] }
[...]
}
Der RealtimeProducer produziert blockweise die geforderten Daten innerhalb des Event
Threads. Eine neue Anfrage wird vom Transport durch Aufruf der requestProduction Methode gestellt. Der RealtimeProducer soll darin die Daten, die zur Zeitspanne blockSpan
gehören, produzieren. Um Dropouts zu vermeiden, darf er dafür maximal deadline Milli-
47
5 Plug-In Schnittstellen
0
16
32
48
64
80
traj : 1/1
sense : 1/2
96
112
128
plugin sense read : 1/2
plugin notification : 1/8
surface traj read / timeline frame notif. : 1/16
transport palette notif. : 1/32
Abbildung 5.4: Realtime Datenströme
sekunden benötigen. Mit anderen Worten, der RealtimeProducer wird bereits im voraus
beauftragt, einen neuen Block Daten zu generieren. Diese Daten sind in Arrays des source
Objekts gespeichert. Die Consumer streichen im Clock-Rhythmus zirkulär durch diese Puffer.
Jedesmal, wenn die aktuelle Zeit den Puffer-Anfang oder die Puffer-Mitte überschreitet, wird
die jeweils obsolete Puffer-Hälfte, spezifiziert durch den even Parameter, aktualisiert.
Wenn der Transport gestartet wird, muß ein voller Block vorproduziert werden, dazu dient die
Methode produceNow. Da die Oberfläche auch auf manuelles Ziehen der Zeitachsen-PositionsLinie durch den Benutzer reagieren soll, ohne daß der Transport läuft, wurde die Methode
produceOffhand eingeführt, die nur ein einzelnes Zeitframe produziert. Wenn der Benutzer die Session verändert, zum Beispiel Receiver löscht oder hinzufügt, müssen die Puffer
neu angelegt werden. Dazu werden die Consumer kurzzeitig angehalten, der Kontext mittels
changeContext aktualisiert, und ein neues Profil von allen Consumern angefordert.
Wie findet die Koordination zwischen mehreren gewünschten Datenraten statt? Nehmen wir
dazu an, daß neben den in Tabelle 5.3 aufgeführten Consumern ein Lisp-Echtzeit-Plug-In
läuft. Die Session habe eine Trajektorien-Datenrate von 500 Hz1 . Nehmen wir an, das PlugIn steuert den SuperCollider-Synthesizer, dessen Controlrate ca. 690 Hz beträgt. Das Plug-In
fordere aus Gründen der CPU Belastung Sensitivitäten mit maximal 345 Hz an. Nehmen wir
weiter an, ein voller Datenpuffer entspräche etwa 1/4 Sekunde, nämlich 128 Frames. Dann
ergibt sich ein Datenstrom-Produktions- und Konsumptions-Schema nach Abbildung 5.4.
Der RealtimeProducer produziert prinzipiell Trajektorien-Daten (traj ) mit voller Datenrate
– also durchgängig alle 128 Frames eines Blocks –, da sie direkt von der Harddisk gelesen werden und eine Unterabtastung eher Rechenzeit vergeuden als sparen würde. Sensitivitäts-Daten
(sense)werden nur produziert, wenn sie nachgefragt werden. Der einzige Request kommt vom
Realtime Plug-In (345 Hz). Grundsätzlich müssen die Faktoren der Unterabtastungen einer
Zweierpotenz entsprechen, somit ergeben sich hier 250 Hz beziehungsweise eine Schrittweite von zwei Frames. Alle ungeraden Frame-Indices des Puffers werden ignoriert und haben
keinen gültigen Inhalt.
Der Transport sorgt dafür, daß die Consumer mit der von ihnen angegebenen Rate benachrichtigt werden2 . Auch hier gilt die Zweierpotenz-Regel, so daß sich die leicht veränderten
Frequenzen von 31.25 Hz bzw. 15.625 Hz ergeben. Im Falle von blockverarbeitenden Con-
1
2
Die Voreinstellung beträgt 1 kHz.
Notification, in der Abbildung mit notif.“ abgekürzt.
”
48
5 Plug-In Schnittstellen
sumern wie dem Plug-In ist die Benachrichtigungs-Rate in der Regel niedriger als die Rate
der angeforderten Daten-Ströme. Im gezeigten Beispiel beträgt sie 1/8 der vollen Rate. Die
Erklärung dafür wird im Abschnitt 5.4.3 in Zusammenhang mit der SuperCollider Anbindung
geliefert.
5.3 Common Lisp für Java
Die Lisp-Plug-Ins sind weniger dafür gedacht, direkte Manipulationen zum Beispiel der Trajektorien zu vollbringen, vielmehr sollen sie ein elastisches Bindeglied zu externen Klangsynthese Programmen sein. Aus diesem Grund wurde in einer frühen Version des Programms
ein XML-Script zur Steuerung der externen Programme benutzt. XML erweist sich jedoch als
unpraktisch, wenn programmiersprachliche Konstrukte wie Schleifen (do-while) oder Bedingungen (if-then-else) benötigt werden. Diese hätten alle zu Fuß“ in den XML Interpreter
”
eingebaut werden müssen. Stattdessen wurde eine einfach strukturierte, kompakte, in Java
integrierbare Interpreter-Sprache gesucht.
Die Wahl fiel auf Common Lisp: Die Syntax ist sehr überschaubar3 , mehrere algorithmische
Musiksprachen basieren auf Lisp4 , und es gibt mit Jatha eine einfache freie Implementation
in Java. Micheal Hewett entwickelte Jatha über die letzten zehn Jahre, und es erweist sich
als zuverlässig im Betrieb. Ein paar der Vorteile von Jatha:
•
maximale rechtliche Freiheit durch GLPL Lizenz
•
kompakte Bibliothek (232 KB)
•
plattformunabhängig
•
Ausnutzung des automatischen Garbage-Collectors von Java
•
sehr einfache Konvertierung zwischen primitiven Lisp und Java Datentypen
•
neue Funktionen lassen sich durch einfache Java Klassen bereitstellen
•
neue Symbole können von Java aus in das Environment eingefügt werden
•
kann als reines API ohne eigene Console oder GUI verwendet werden
Die wesentlichen Nachteile sind die eher langsame Geschwindigkeit – trotz gegenteiliger Behauptungen des Autors – und der geringe Funktionsumfang. In der Selbstbeschreibung heißt
es sehr zurückhaltend, Jatha implementiere a large part of the core of Common Lisp“ 5 . Das
”
bedeutet unter anderem, daß praktisch keine weitergehenden APIs eingebaut sind. Zum Beispiel gibt es keine Funktionen zum Lesen und Schreiben von Files. Auch Standard-Konzepte
wie Streams, Arrays und Macros fehlen komplett. Im Rahmen der Anforderung als einfaches
Scripting-Bindeglied wurden diese Nachteile in Kauf genommen.
3
zur Sprache Common Lisp vgl. [Mayer 1995]
z.B. OpenMusic und Common Music, RSC als SuperCollider Client in Scheme, sowie die Klangsynthese
Sprache Common Lisp Music.
5
http://jatha.sourceforge.net/doc/short-description.html
4
49
5 Plug-In Schnittstellen
5.3.1 Die LispPlugIn Klasse
Oberklasse für alle Lisp basierten Plug-Ins ist die Klasse LispPlugIn.
•
Sie stellt eine standardisierte Oberfläche bereit, die eine Auswahl-Box für die konkreten
Lisp Scripte (Sourcecodes) enthält und die Möglichkeit bietet, GUI Elemente darzustellen, die direkt von den Scripten erzeugt werden (vgl. Abb. 5.2 rechts).
•
Sie verwaltet die Jatha Umgebung und stellt zusätzliche Funktionen und Symbole zur
Verfügung.
•
Sie stellt die Methode executeLisp zur Verfügung, mit der zur Renderzeit beliebige
im Script definierte Funktionen ausgeführt werden können.
Die Namen dieser Funktionen hängen vom Plug-In Typ ab. Für die Filterung von Trajektorien werden in Analogie zum RenderPlugIn Interface (Quellcode 5.1) die benutzerdefinierten Lisp Funktionen prepare, render und cleanup ausgeführt. prepare ermöglicht dem
Script, grundlegende Initialisierungen durchzuführen und Requests anzumelden. render wird
im Gegensatz zu RenderPlugIn→producerRender() nur einmal ausgeführt. Dies geschieht,
nachdem die angeforderten Datenströme in Form von temporären Dateien bereitgestellt
wurden, so daß hier üblicherweise der Aufruf des externen Klangsynthese-Programms, z.B.
CSound, erfolgen kann. Aufräumarbeiten wie das Schließen oder Löschen von Dateien werden
in der cleanup Funktion erledigt.
Die zusätzlich von Meloncillo bereitgestellten Lisp Funktionen beinhalten unter anderem:
•
Öffnen von Audio-Dateien (AIFF, IRCAM oder AU Format)
•
Allokation und Beschreiben von Byte-Puffern (als Ersatz für den fehlenden VectorDatentyp)
•
Öffnen und Beschreiben von Dateien
•
Erweiterte String-Operationen wie Formatierung von Zahlen und Pattern Matching mit
Regulären Ausdrücken
•
Versenden von UDP Datagrammen (vgl. Abschnitt 5.4.2)
•
Generierung von OSC Paketen (vgl. Abschnitt 5.4.2)
•
Festlegung von Quelldaten und Zieldaten Requests (d.h. welche Trajektorien- und Sensitivitätsdaten benötigt und zurückgeliefert werden)
•
Ausführen von externen Programmen
•
Erzeugen von GUI Elementen
Die GUI Elemente dienen dazu, dem Benutzer die wichtigsten Script Parameter in Form
von Checkboxes und Textfeldern zu präsentieren, ohne daß dieser für jede Session separate
Script-Dateien editieren muß. GUI Elemente werden in der speziellen Funktion create-gui
definiert.
Das Script erhält außerdem ein Dictionary6 , das die wichtigsten statischen Parameter enthält.
Hier kann das Script nachschlagen, wieviele Transmitter und Receiver beim Rendern beteiligt
sind, was ihre Namen sind usw., wie hoch die Datenrate ist und welche Werte die Plug-In
6
in Form des speziellen Lisp-Datentyps LispHashTable
50
5 Plug-In Schnittstellen
relevanten Preferences-Settings haben, etwa die voreingestellte Audio-Rate und der voreingestellte Pfad zur CSound Applikation.
5.3.2 Ein Beispielscript
Während die Besonderheiten für Echtzeit-Scripte im folgenden Abschnitt erläutert werden,
wird hier das Beispiel einer Trajektorien Filterung mit CSound durchgegangen. Nehmen wir
an, CSound soll die Trajektorien tiefpaßfiltern, so daß die Transmitter-Bewegungen weniger
hektisch und dafür flüssiger werden.7 Das Lisp Script ist in der Datei "csfl-smooth.lisp"
gespeichert. Wenn es im Filter Dialog ausgewählt wird (Abb. 5.2 rechts), wird der Quelltext geladen und übersetzt. Anschließend wird die Funktion create-gui ausgeführt, die ein
numerisches Eingabefeld für die Filter-Frequenz erzeugt:
(defun create−gui NIL
(progn
(gadget−make NIL "LABEL" ’(1 1) "Cutoff Frequency" NIL)
(gadget−make filter−freq "NUMBER" ’(2 1) 1.0 (list "Hz" 0.0 1000.0 0.01))
T
; success
)
)
Der erste gadget-make Befehl erzeugt die Beschriftung. Die Argumente für gadget-make
sind (1) ein Lisp-Symbol, das stets den aktuellen Wert des GUI-Elements – in diesem Fall die
Frequenz – enthält, (2) der Gadget-Typ, (3) die Position des Gadget auf der Oberfläche, (4)
der voreingestellte Wert, (5) spezifische Optionen – hier die physikalische Einheit der Werte
und die erlaubten Minimum- und Maximum-Werte. Die Funktion liefert T (wahr) zurück um
zu signalisieren, daß keine Fehler aufgetreten sind.
Durch Klick auf den Process-Knopf wird die Filterung gestartet. Ein RenderContext der
gerade ausgewählten Transmitter und des Zeitausschnitts wird erstellt. Die Lisp-Funktion
prepare wird ausgeführt:
(defun prepare NIL
(progn
(setq colltrns (gethash "TRANSMITTERS" cillo))
(setq numtrns (length colltrns))
(setq prefs (gethash "PREFERENCES" cillo))
(setq timeline (gethash "TIMELINE" cillo))
(setq duration (− (gethash "STOP" timeline) (gethash "START" timeline)))
(setq sense−rate (gethash "SENSERATE" prefs))
(setq trnsidx 0)
(trnsiter ’(progn
(let ((trns (elt colltrns trnsidx))
(bufidx trnsidx)
(temp−input−file (temp−file−make))
(temp−output−file (temp−file−make)))
(audio−file−open bufidx temp−input−file
"raw" "float32" sense−rate 2)
(source−request "TRAJ" trnsidx bufidx)
(target−request "TRAJ" trnsidx temp−output−file)
7
Der Einfachheit halber wird die Ausführung weiter im Indikativ geschrieben.
51
5 Plug-In Schnittstellen
(setf−gethash "INPUT−FILE" trns temp−input−file)
(setf−gethash "OUTPUT−FILE" trns temp−output−file)
)
))
T
; success
)
)
Mit der Funktion gethash werden der RenderContext und die Programm-Preferences ausgelesen. Die Hashtable cillo wird als globales Symbol von LispPlugIn erzeugt. Die Liste
der Transmitter colltrns, die Zahl der Transmitter numtrns, die Länge des Zeitausschnitts
duration und die Datenrate sense-rate werden ermittelt. In einer Schleife8 wird für jeden Transmitter eine Eingabe- und Ausgabe-Datei im temporären Verzeichnis erzeugt. Mit
audio-file-open wird das Eingabeformat festgelegt, hier eine raw“ 9 Datei für 32bit Floa”
ting-Point Samples und zwei Kanäle. Diese Datei wird über den Identifier bufidx als Ziel
für die Quelldaten bestimmt (source-request). Dem Lisp-Plug-In wird mitgeteilt, daß die
Zieldaten in einer Datei temp-output-file zu erwarten sind. Für die spätere Verwendung
in der render Funktion werden die Dateinamen in der Hashtable gespeichert, die für jeden
Transmitter existiert.
Nachdem die Funktion zurückkehrt, arbeitet das Lisp-Plug-In die Requests ab und schreibt
die angeforderten Trajektorien-Daten in die temporären Dateien. Anschließend ruft es die
Script Funktion render auf:
(defun render NIL
(progn
(setq trnsidx 0)
(setq return−code 0)
(trnsiter ’(progn
(let ((trns (elt colltrns trnsidx))
(bufidx trnsidx)
(csd−file (temp−file−make ".csd")))
(file−close bufidx) ; close traj data files
; −−−− create CSound unified Orc/Sco file −−−−
(file−open 1977 csd−file "w")
(file−write 1977 (concat
"<CSoundSynthesizer>\\n<CsInstruments>\\n"
"nchnls = 2\\n"
"#include \"smooth.orc\"\\n"
"</CsInstruments>\\n<CsScore>\\n"
"i88 0 " duration "\\n"
"i14 0 " duration " \"" (gethash "INPUT−FILE" trns) "\" "
filter−freq "\\n"
"</CsScore>\\n</CSoundSynthesizer>\\n"
))
(file−close 1977)
; −−−− launch csound −−−−
(let ((exec−args
(list (gethash "CSOUNDAPP" prefs) "−A" "−3" "−o"
(gethash "OUTPUT−FILE" trns)
"−r" sense−rate "−k" sense−rate csd−file)))
8
Mangels einer Iterations-Funktion in Jatha wurde dafür eine hier nicht abgedruckte rekursive Funktion
trnsiter definiert, die die Variable trnsidx von 0 bis numtrns - 1 hochzählt.
9
D.h. ohne Header – headerless – nur aus den Audio-Frames bestehend
52
5 Plug-In Schnittstellen
(println (concat "\\n∗∗∗∗∗ Transmitter \""
(gethash "NAME" trns) "\" executing:\\n"
(concat−args exec−args)))
(setq return−code (execute parse−cs−output exec−args NIL
(car (path−split csd−file))))
(println (concat "Exited with return code " return−code))
(if (not (eql return−code 0)) (setq trnsidx numtrns) NIL)
)
)
))
(eql return−code 0)
; success if return code is 0
)
)
Da CSound sich etwas schwierig tut, mehrkanalige Dateien zu schreiben, ruft das Script
CSound jeweils getrennt für die einzelnen Transmitter auf; in jedem Durchgang der Iteration
wird eine Text-Datei geöffnet (file-open), in der die CSound Score generiert wird. Das Script
bindet das bereits auf der Harddisk gespeicherte Orchestra-File "smooth.orc" ein (siehe
Quelltext 5.4) und schreibt zwei Instrumenten-Aufrufe: i88 und i14. Instrument 88 ist ein
Hilfsinstrument, daß in Intervallen den Processing-Fortschritt in die Console schreibt. Instrument 14 liest die Trajektorien ein, filtert sie mit einem reson Unit-Generator der gewählten
Frequenz und schreibt das Ergebnis in das CSound Ausgabefile.
CSound selbst wird durch die Lisp-Funktion execute gestartet. Der Pfad zu CSound wird
durch Auslesen des Preferences-Feldes CSOUNDAPP ermittelt. Das erste Argument von execute
ist eine Callback-Funktion im Script, die die Console-Ausgabe des ausgeführten Programmes
auswertet. Sie leitet diese Console-Ausgabe einfach mittels println in die Console von Meloncillo um und filtert die von Instrument 88 generierten Strings heraus, um stattdessen mit
progression-set die Fortschritts-Anzeige von Meloncillo zu aktualisieren:
(defun parse−cs−output (textline)
(if (and (eql 10 (length textline)) (eql "CILLO " (substring textline 0 6)))
(progression−set
(car (format−parse "{0,number}" (substring textline 6 10))))
; else
(println textline)
)
)
Nachdem alle execute Befehle ausgeführt wurden, kehrt die Funktion render zurück. Das
Lisp-Plug-In kopiert nun die von CSound generierten neuen Trajektorien-Dateien zurück in
die Session und ruft abschließend die Script-Funktion cleanup auf.
Quelltext 5.4: smooth.orc
; read a transmitter path and write its lowpass
; filtered transformation back to the output file
; p4 = traj input path; p5 = cutoff frequency [Hz]
instr 14
; bug in CSound 4.23f11 −− channels are swapped
aty atx diskin p4, 1, 0, 0, 6 ; path, pitch, offset, wrap, format
aoutx
reson
atx, 0, p5, 1
aouty
reson
aty, 0, p5, 1
outch
1, aoutx
outch
2, aouty
endin
53
5 Plug-In Schnittstellen
; print progress information every 2 seconds
instr 88
iweight
=
1.0 / p3
kschoko
times
printks "CILLO %.2f\\n", 2, kschoko ∗ iweight
endin
5.4 Open Sound Control
Open Sound Control (OSC) wurde am CNMAT in Berkeley von Matt Wright und Adrian
Freed entwickelt. Es ist als Kommunikationsprotokoll gedacht, mit dem sich Computer und
Computeranwendungen, insbesondere Multimedia-Hardware und -Software verständigen können. Das Grundkonzept wurde von den Autoren auf der ICMC 1997 vorgestellt.10 Nachdem
der Boom im Bereich von Software-Synthesizern begonnen hatte und neue schnelle ComputerSchnittstellen wie Firewire und USB sich durchzusetzen begannen, stellte sich die Frage, wie
voneinander getrennte Komponenten ihre Daten austauschen sollten. Die MusikinstrumenteIndustrie (Yamaha) hatte bereits vorgeschlagen, auf dem etablierten MIDI Standard aufzubauen. OSC hingegen versucht, die offensichtlichen Beschränkungen des damals 14-jährigen
MIDI Standards zu umgehen: MIDI ist unskalierbar – der Befehlssatz ist festgelegt und
überdies hochproblematisch11 –, hat eine viel zu geringe Datenrate (31.25 kbs), kennt nur
eine beschränkte Zahl von Adressaten (MIDI-Kanäle) und kann praktisch keine zwei Befehle
gleichzeitig ausführen.
5.4.1 Protokollübersicht
In der Erkenntnis, daß Transport-Protokolle und Hardware-Interfaces sich schneller ändern
können als ein Musik-Kommunikations-Protokoll, wurde OSC transportunabhängig definiert.
Es ist jedoch an die Erfordernisse von Netzwerk-Transport wie UDP angepaßt und geht von
einer Paket (Datagramm) Struktur aus. OSC Befehle sind in einem OSC-Paket verpackt,12
das leicht als UDP-Datagramm versandt werden kann. Zwei Typen von OSC-Paketen werden
unterschieden: Messages und Bundles. Bundles gruppieren synchron auszuführende Messages oder weitere Bundles in einem einzelnen Paket. Sie beginnen mit dem speziellen String
"#bundle" gefolgt von einem sogenannten Time-Tag, das den Zeitpunkt beschreibt, zu dem
die enthaltenen Messages auszuführen sind.13
Eine Message enthält den eigentlichen Befehl. Sie besteht aus einem URL-ähnlichen symbolischen Adreß-String und einer beliebigen Zahl von binär kodierten Argumenten. Die symbolische Message-Adresse wird vom Empfänger ausgewertet, in einer objekt-orientierten Umgebung üblicherweise von links nach rechts hierarchisch absteigend, so daß eine Adresse wie
10
[Wright/Freed 1997]
Dazu zählt die ideologische Festlegung auf Tasteninstrumente mit 127 Halbtonschritten; natürlich ist MIDI
anders interpretierbar, aber die Umdefinierung von Controller-Changes oder das Hantieren mit SysExBefehlen kann nur als Notbehelf betrachtet werden.
12
Die aktuellen Spezifikationen sind unter der Adresse http://www.cnmat.berkeley.edu/OpenSoundControl/
OSC-spec.html zu finden.
13
Die zwei oder mehreren kommunizierenden Objekte sind dafür verantwortlich, daß sie auf dieselbe SystemZeit zugreifen. Innerhalb desselben Computers ist dies automatisch gegeben, in einem Netzwerk müssen
sich die Systeme ggf. per Network-Time-Protocol (NTP) prüfen an einer Netzwerk-Uhr orientieren.
11
54
5 Plug-In Schnittstellen
z.B. "/synth/oscillators/sawtooth/set-frequency" zuerst an das Synthesizer-Objekt
geschickt wird, das sie an die Oszillator-Sektion weitergibt, die wiederum an den SägezahnGenerator, der dann den Befehl zum Ändern der Frequenz ausführt. Im Gegensatz zu MIDI
kann sich der Adreß-Raum grundsätzlich dynamisch verändern. Das ursprüngliche OSC Protokoll sieht folgende spezielle Message-Adressen vor:
•
Wildcards wie ’*’ oder ’?’, die es erlauben, eine Nachricht an mehrere Adressaten zu
verschicken, deren Adressen auf das Wildcard Pattern passen
•
Objekt-spezifische Informations-Anfragen, die durch Zurücksenden einer Nachricht beantwortet werden14
•
Anfragen zum Adreß-Raum, d.h. zu den verfügbaren Unteradressen eines Objekts
•
Anfragen zu den erwarteten Argumenten und Daten-Typen eines Befehls
•
Eine "/documentation" Anfrage, die einen Text zurückliefern soll, der vom Benutzer
gelesen werden kann
•
Eine "/current-value" Anfrage, die den aktuellen Parameter-Wert (etwa die OszillatorFrequenz im obigen Beispiel) zurückliefern soll
Sechs Jahre nach Einführung von OSC gibt es bereits zahlreiche OSC-Implementationen.
Der Umfang, in dem Time-Tags, Pattern-Matching und die speziellen Messages unterstützt
werden, variiert jedoch erheblich. Eine klarere Rollen-Teilung der kommunizierenden Objekte
wird in den Ausdrücken OSC-Server und OSC-Client deutlich.15 Im Client/Server-Modell
stellt der Server Dienste zur Verfügung, ein oder mehrere Clients benutzen diese Dienste,
die Kommunikation verläuft überwiegend in Richtung Server, der gegebenenfalls AntwortNachrichten zurückschickt.
Das CNMAT führt eine Liste an Applikationen, die OSC unterstützen,16 sie ist allerdings
unvollständig und zum Teil obsolet. Zu den Musik- und Klang-Programmen zählen SuperCollider, Max/MSP, PD, jMax, OpenMusic, RTcmix und Siren. Im Bereich Multimedia
sind OSC-Anbindungen an Macromedia Flash (flosc) und Director (OSCar) zu nennen. Am
IRCAM wurde mit EtherSense ein Sensor-Gerät für Live-Performances entwickelt, das direkt
OSC über Ethernet an einen Computer überträgt. Das vom CNMAT herausgegebene OSCKit, eine OSC-Bibliothek in C, wurde in weitere Sprachen wie Java, Objective-C, Common
Lisp und Ruby übertragen.
In der Implementation von OSC in James McCartneys SuperCollider wurde eine entscheidende Erweiterung des Protokolls vorgenommen, die sich übergreifend durchgesetzt hat: Die
wenigsten Implementationen unterstützen derzeit das Type-Querying, also das Abfragen der
Daten-Typen für Message-Parameter. In der Praxis ist dem Client oder Anwender bereits
bekannt, wie die Messages eines Servers aufgebaut sind. Auf der Server-Seite wiederum muß
ein allgemeines OSC-Empfangs-Objekt in der Lage sein, die Message-Argumente korrekt zu
dekodieren, bevor sie vom eigentlichen Adressaten weiterverarbeitet werden.17 Daher wurde
der Type-Tag-String in OSC-Messages eingeführt. Er stellt das erste Argument jeder Message
14
Der Sender wird nicht direkt in der Message vermerkt, kann jedoch normalerweise vom Transport-Layer
erfragt werden. UDP Datagramme enthalten z.B. eine Return-Adresse.
15
vgl. [Wright et al. 2003]. Die Ausdrücke sind offenkundig von SuperCollider 3 übernommen.
16
http://www.cnmat.berkeley.edu/OpenSoundControl/
17
Das Max-External OpenSoundControl zum Beispiel generiert eine Liste mit Max-Primitives aus den empfangenen OSC-Nachrichten; diese wird dann normalerweise über OSC-route an die Adressaten verteilt. Ohne
Type-Tags kann OpenSoundControl also nur raten“, welche Daten-Typen gemeint sind.
”
55
5 Plug-In Schnittstellen
dar und besteht aus einem Komma-Charakter gefolgt von einer Kette von Type-Charakteren,
die den Daten-Typ aller Argumente angeben. Die wichtigsten Typen sind ’i’ für 32bit lineare
ganze Zahlen, ’f’ für 32bit Floating-Point Zahlen, ’s’ für Strings oder Symbole und ’b’ für den
sogenannten ’Blob’, einen binären Datenblock. Type-Tags machen komplizierte ArgumentPrüfung und Heuristiken überflüssig.
5.4.2 Implementierung in Meloncillo
Die eigentlichen OSC-Klassen von Meloncillo befinden sich im Paket net. Es sind
•
OSCPacket : Superclass von Messages und Bundles, die Methoden zum En- und Dekodieren von Paketen enthält
•
OSCMessage : Die Message Klasse, die Java-Primitives in Binärform kodiert bzw. aus
der binären empfangenen Nachricht dekodiert
•
OSCBundle : Die Bundle Klasse. Messages und Bundles werden zunächst einzeln hinzugefügt und anschließend in Binärform kodiert. Neben den normalen absoluten TimeTags des OSC Standards werden die relativen Time-Tags des SuperCollider NonRealTime-Modus (NRT) unterstützt
•
OSCReceiver : Objekte dieser Klasse können in einem eigenen Thread auf das Eintreffen
von Nachrichten warten
•
OSCListener : Listener für einen OSCReceiver, der beim Empfang von Nachrichten
informiert wird
•
OSCException : Klasse für OSC-bezogene Fehler
Während sich die Klassen zunächst an die bereits existente Java-Bibliothek JavaOSC18 anlehnten, wurden sie aus Gründen der Effizienz und etwas umständlichen Art von JavaOSC
neu programmiert und auf die nötigsten Elemente beschränkt. Sie unterstützen momentan
kein Pattern-Matching19 und keine mit Brackets (’[’, ’]’) getypten Arrays20 , außerdem gibt es
keinen separaten Dispatcher. Stattdessen wird mit entsprechenden Methoden der java.net
und java.nio Pakete einfach ein DatagramChannel geöffnet, die zu versendenden Pakete in
einen ByteBuffer kodiert (dies erledigt OSCPacket) und mit write in den DatagramChannel
geschickt.
Im Paket lisp existieren die Wrapper-Klassen OSCBundleSendPrimitive und OSCBundleSendAndWaitPrimitive. Sie stehen den Lisp Scripten zur Verfügung. Während die erste
Funktion ein OSC-Bundle asynchron verschickt, wartet die zweite Funktion nach dem Versand für eine angegebene Zeit auf eine bestimmte Rückmeldung. Konkrete Beispiele für den
Gebrauch von OSC-Messages in Lisp werden im Abschnitt 5.4.3 gezeigt.
18
http://www.mat.ucsb.edu/~c.ramakr/illposed/javaosc.html
Dies macht nur für OSC-Server Sinn. Ein Client-Listener kann jedoch auf die mächtigen Funktionen von
java.util.regex zurückgreifen. Den gegenwärtigen Diskussionen des Forums [email protected]
kann darüber hinaus entnommen werden, daß sich das Pattern-Konzept in zukünftigen OSC Versionen
voraussichtlich ändern wird.
20
Dies auch vor dem Hintergrund, daß sclang ebenfalls keine Brackets benutzt, sondern Arrays einfach direkt
in die einzelnen Elemente auflöst.
19
56
5 Plug-In Schnittstellen
5.4.3 Anbindung an SuperCollider
SuperCollider is an environment for real time audio synthesis which runs on a
”
Power Macintosh with no additional hardware“ [McCartney 1996]
Diese knappe Beschreibung der ersten Version von SuperCollider aus dem Jahre 1996 trifft
im wesentlichen noch für Version 3 zu, obwohl das Programm konzeptuell einige Änderungen
erfahren hat.21 Während SuperCollider 1 gerade aus der Fusion zweier Vorläuferprogramme
hervorging, einer Klangsynthese-Sprache (Synth-O-Matic) und einer Interpreter-Umgebung
für Max (Pyrite), besteht der wesentliche Unterschied von Version 3 zu Version 2 darin, daß
es sich eigentlich wieder um zwei unabhängige Programme handelt, die SuperCollider Language Application (kurz sclang) und die SuperCollider Synthesis Engine (kurz scsynth).
sclang bietet eine auf der Sprache SmallTalk basierende Programmierumgebung, die zur
Klanggenerierung mit scsynth über OSC kommuniziert. scsynth hat grundsätzlich nichts
mit SmallTalk oder überhaupt einer höheren Sprache zu tun. Der einfache Befehlssatz, der
aus ca. 50 einzelnen Kommandos eines flachen Adreßraums besteht22 , und die Effizienz der
DSP Algorithmen prädestinieren scsynth dazu, von Frontends verschiedenster Art als reine
Rechenmaschine verwendet zu werden, mit der der Anwender nicht direkt etwas zu tun bekommt. In dieser Konstellation wird SuperCollider als Server und die Steueranwendung als
Client bezeichnet.
Ein Beispiel für einen SuperCollider Client ist die in einer Fußnote in Abschnitt 4.1 erwähnte
Scream Umgebung bzw. die damit erstellte Applikation AmbiGranusampler. Ein weiteres Beispiel ist der dort ebenfalls kurz dargestellte Sonificator, der ähnlich wie Scream als ProgrammSchnittstelle (API) für Audio-Patches konzipiert ist, auf der lightweight Java Applikationen
aufsetzen können.
Da Meloncillo fast nichts von SuperCollider weiß – dies liegt in der Obhut der Scripte –,
läßt sich prinzipiell auch sclang als Server benutzen, wodurch komplexere algorithmische
Verfahren möglich sind. Der Einfachheit halber wird jedoch nur ein Beispiel für die direkte
Kommunikation mit scsynth dargestellt. Im Gegensatz zu sclang wurde der Synth Server
bereits auf andere Plattformen portiert und kann unter Mac OS X, Linux i386, Linux PPC
und Win32 benutzt werden. Da Meloncillo die OSC Messages über UDP an SuperCollider
versendet, kann SuperCollider auch auf einem anderen Rechner als Meloncillo laufen, wenn
diese Rechner über ein LAN verbunden sind. Die Synchronisation der Uhren beider Rechner
ist hingegen noch ungelöst (vgl. Abschnitt 6.2).
SuperCollider kann sowohl in Echtzeit, als auch in einem speziellen NonRealTime-Modus
(NRT) gestartet werden. Mit wenigen Anpassungen lassen sich die Lisp Scripte und SuperCollider Patches gleichzeitig für Realtime-Synthese und Bounce-to-Disk verwenden, da SuperCollider im NRT Modus weiterhin über OSC gesteuert wird. Die OSC-Bundles werden dabei
sequentiell aus einer Datei gelesen, statt sie in Echtzeit zu empfangen.
21
22
siehe dazu [McCartney 2002]
Deren Zahl halbiert sich etwa, wenn man eng verwandte Befehle zusammenfaßt, wie /b_set und /b_setn für
das Beschreiben eines Puffers. Flacher Adreßraum bedeutet, daß Kommandos nicht hierarchisch geschachtelt und durch Schrägstriche getrennt werden, also ein Puffer beispielsweise direkt mit "/b_free 789" statt
"/buffer/789/free" freigegeben wird.
57
5 Plug-In Schnittstellen
Root Node
numTrns = Zahl der Transmitter (5)
numRcv = Zahl der Receiver (4)
Master Group
Input Group
Mix Group
Phasor Synth
Control−Bus
0...numTrns−1
Vektor aus Input Synths
Matrix aus Mix Synths
Audio−File Buffer
Audio−Bus
Audio−File Buffer
Audio−Bus
Audio−File Buffer
Audio−Bus
Audio−File Buffer
Audio−Bus
Audio−File Buffer
Audio−Bus
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Sense−Buf
Matrix aus Sensitivitäts−Puffern
Audio−Hardware−Output
Sense−Buf
Audio−Hardware−Output
Sense−Buf
Audio−Hardware−Output
Sense−Buf
Audio−Hardware−Output
Sense−Buf
0...numRcv−1
Abbildung 5.5: Nodes, Busse und Buffer für einen Amplituden-Mixer in SuperCollider
Beispiel eines einfachen Amplituden-Pannings
scsynth verwaltet in gewisser Analogie zum MUSIC V Konzept Synthesizer, die aus UnitGeneratoren bestehen. Ein solcher durch eine UGen-Graph-Function beschriebener Synthesizer ist ein Knoten-Punkt in einem hierarchischen Baum, den scsynth verwaltet. Neben
Synth-Nodes gibt es Group-Nodes, die mehrere Synthesizer oder Gruppen zusammenfassen.
Eine Gruppe ist eine Liste aus Knoten. Neue Knoten werden entweder an den Anfang oder
das Ende der Liste gesetzt. Innerhalb einer Gruppe werden die Knoten in der Reihenfolge ihrer Position in der Liste abgearbeitet. Die Reihenfolge ist entscheidend beim Entwurf
eines Patches – wird zum Beispiel ein Soundfile eingelesen (Input-Knoten) und auf einen
Bus geschickt, auf den ein Mixer zugreifen soll (Mix-Knoten), so muß der Input-Knoten vor
dem Mix-Knoten ausgeführt werden. In den OSC Messages werden Synthesizer und Gruppen
durch eine eindeutige ganze Zahl, die Node-ID, angesprochen, die jedoch keinen Einfluß auf
die Reihenfolge der Abarbeitung hat.
58
5 Plug-In Schnittstellen
Ebenfalls klassisch in SuperCollider ist die Trennung zwischen Controlrate- und AudiorateSignalen. Diese laufen über ein globales Bussystem, was vor allem hinsichtlich der AudioDaten den Vorteil hat, daß beliebig viele Synthesizer aus einem Audio-Bus lesen oder in einem
Audio-Bus zusammengemischt werden können. Neben Bussen gibt es Puffer, die intern oder
per OSC blockweise beschrieben werden können.
Um einen einfachen Matrix-Mixer nach dem Amplituden-Panning Prinzip zu realisieren, werden Gruppen und Synthesizer nach dem in Abbildung 5.5 dargestellten Schema kreiert. Drei
verschiedene Synthesizer kommen zum Einsatz, die in sclang programmiert wurden:
Quelltext 5.5: synthdef-sources.sc
// reads input from sound file
// and writes it to an audio bus
SynthDef( "cillo−input", {
arg i aInBuf, i aOutBus, i gain = 1.0;
Out.ar( bus: i aOutBus, channelsArray:
DiskIn.ar( numChannels: 1, bufnum: i aInBuf ) ∗ i gain );
}).writeDefFile( p );
// mixing pipe taking an input audio
// bus, a control buf for amplitude
// modulation and an audio output bus
SynthDef( "cillo−mix", {
arg i aInBus, i aOutBus, i kInBuf, i kPhasorBus;
Out.ar( bus: i aOutBus, channelsArray: In.ar( bus: i aInBus ) ∗
BufRd.kr( numChannels: 1, bufnum: i kInBuf,
phase: In.kr( bus: i kPhasorBus )));
}).writeDefFile( p );
// one phasor object represents something
// like a synchronized motor for all
// control rate amplitude buffer reads.
// a trigger is fired twice per buffer cycle
SynthDef( "cillo−phasor", {
arg i rate, i bufSize, i kPhasorBus;
var clockTrig, phasorTrig, clockRate, phasorRate, controlRate;
controlRate
phasorRate
clockRate
clockTrig
phasorTrig
=
=
=
=
=
SampleRate.ir / 64;
i rate / controlRate;
2 ∗ i rate / i bufSize;
Impulse.kr( freq: clockRate );
PulseDivider.kr( trig: clockTrig, div: 2, start: 1 );
SendTrig.kr( in: clockTrig, id: 0, value: PulseCount.kr( trig: clockTrig ));
Out.kr( bus: i kPhasorBus, channelsArray: Phasor.kr( trig: phasorTrig,
rate: phasorRate, start: 0, end: i bufSize ));
}).writeDefFile( p )
cillo-input liest mit dem DiskIn UGen ein Soundfile ein und schreibt es auf einen Bus,
cillo-mix mischt einen Eingangsbus (Soundfile) auf einen Ausgangsbus (Soundkarten-Ausgang). Die Lautstärke wird aus Puffern gelesen, die blockweise mit dem OSC Befehl "/b_setn"
von Meloncillo gefüllt werden. Der Phasor-Synthesizer generiert ein Sägezahn-Signal, das
diese Puffer zyklisch abtastet. Die Instantiierung der Gruppen und Synthesizer erfolgt vom
Lisp-Script aus mit der osc-bundle-send[-and-wait] Funktion. Hier ein Beispiel:
59
5 Plug-In Schnittstellen
(datagram−channel−open 1977 "localhost" 57110)
(if (null (osc−bundle−send−and−wait 1977 0.0 (list
(list "/g new" master−group 1 0
input−group 0 master−group
mix−group
1 master−group)
(list "/d load" synthdefs))
"/done" 2000
))
(println "TIMEOUT! group creation, definition load")
; else
NIL
)
1977 ist der Identifier für den in der ersten Zeile geöffneten Datagramm-Kanal. Das Bundle
enthält die zwei Messages "/g_new" zur Erzeugung der Gruppen-Knoten und "/d_load" zum
Einlesen der Synthesizer-Definitionen aus einer Festplatten-Datei. Die letzten beiden Argumente der OSC-Funktion legen fest, daß maximal zwei Sekunden auf die Antwort-Nachricht
"/done" gewartet werden soll. Die Funktion liefert diese Antwort-Nachricht zurück oder NIL,
wenn innerhalb dieser Zeitspanne nicht geantwortet wurde.
Während der Realtime Modus aktiv ist, werden die Transport-Befehle an das Lisp-Script
weitergegeben. Es muß dafür die Funktionen position, play und stop definieren. Aus
Performance-Gründen wird das Script nicht damit beauftragt, kontinuierlich OSC-Nachrichten
zum Auffüllen der Sense-Puffer zu erzeugen. Stattdessen übergibt es der im Realtime-Modus
etwas modifizierten source-request Funktion einen vorher mit dem Skelett der OSC-Message
("/b_setn") initialisierten Byte-Buffer und eine Liste von Anweisungen, die auf diesem Puffer
ausgeführt werden sollen:
(source−request "SENSE" (cons trnsidx rcvidx) 1978 (list
(list "INT" bufidx msgbuf−off)
(list "VAR" "BUFOFF" (+ msgbuf−off 4))
(list "STREAM" (+ msgbuf−off 12))
(list "SEND" 1977)
))
1978 ist der Identifier des Byte-Buffers, in den die Nachricht kodiert wird. Die Befehlsliste bewirkt, daß der (SuperCollider-)Puffer-Index und der Puffer-Lese-Index jeweils ersetzt und die
Sensitivitätsdaten ("STREAM") übertragen werden, bevor die Nachricht an den DatagrammKanal mit dem Identifier 1977 versandt wird.
Meloncillo kennt darüber hinaus einen speziellen Sync-Befehl23 : Der Phasor in Quelltext 5.5 sendet zweimal pro
Durchlauf mit dem SendTrig UGen eine OSC-Nachricht "/tr" an Meloncillo. Dadurch wird der Versand neuer
Sensitivitäts-Puffer ausgelöst. Würde Meloncillo nach seiner internen Uhr die Puffer versenden, könnten diese
manchmal zu früh ankommen. Neue Trigger-Befehle werden mehrfach pro Puffer-Periode ausgewertet, dies ist
der Grund für die spezielle Notification-Rate in Abbildung 5.4. Gleichzeitig kann das Programm überprüfen,
ob Drop-Outs aufgetreten sind und meldet dies dem Benutzer. Für eine zukünftige Version wird geprüft, ob
sich die Synchronisierung einfacher durch die Time-Tags der Bundles lösen läßt.
Das Script und die SynthDefs können als Ausgangspunkt dienen, mit neuen Synthese-Modellen
zu experimentieren. Die Input-Synths könnten zum Beispiel durch Live-Inputs ersetzt wer-
23
(target-request "SYNC" 0 <datagram-channel-id>)
60
5 Plug-In Schnittstellen
den24 , zwischen die Input- und Mix-Stufe kann eine Filter, (Doppler-)Delay oder VerzerrerEinheit gesetzt werden. Die Mix-Stufe selbst kann modifiziert werden, oder ihre Ausgänge
auf weitere Busse statt direkt auf die Hardware-Outputs geschickt werden.
24
Da scsynth allerdings kein MIDI versteht, muß noch eine Lösung zur Synchronisierung z.B. mit einem
Harddisk-Recording-Programm gefunden werden. Man kann versuchen, dazu sclang zu verwenden.
61
6 Resumé
6.1 Anwendungsbeispiel
Abschließend sollen an einem SuperCollider Patch ein paar Möglichkeiten des Programms
demonstriert werden. Ausgangspunkt ist ein Synthesizer nach Abbildung 5.5. Er soll wie
folgt erweitert werden:
•
zuschaltbarer Doppler-Effekt für die Transmitter-Bewegungen
•
zuschaltbarer räumlich gerichteter Verzerrer
•
zuschaltbarer Hall
•
optionale Umkehrung des Modells, so daß die Receiver die Ausgangsklänge symbolisieren und die Transmitter diese Klangfelder als bewegte Mikrophone“ abtasten und zu
”
den Lautsprechern leiten
Doppler-Effekt
Der Doppler-Effekt beschreibt das Phänomen, daß sich die wahrgenommene Tonhöhe eines
Klangkörpers in Abhängigkeit von seiner Bewegung relativ zum Beobachter verändert. Nähert
sich der Klangkörper dem Beobachter, so wird die Wellenlänge effektiv verkürzt und die
Tonhöhe steigt, der umgekehrte Fall tritt auf, wenn sich der Klangkörper wegbewegt. Um
einen Doppler-Effekt zu realisieren, bedient man sich einer variablen interpolierenden DelayLine. Die momentane Delay-Zeit korrespondiert mit dem Abstand der Klangquelle vom Beobachter und beträgt im Medium Luft bei Raumtemperatur etwa ∆t = ∆d/(344m/s).
Der Doppler-Effekt wird als Insert in den Signalfluß gesetzt. Ein Insert kann in SuperCollider realisiert werden, indem ein Audio-Bus mittels In.ar eingelesen und das Ergebnis mit
ReplaceOut.ar zurückgeschrieben wird. Zur Berechnung des Doppler-Shifts werden im Lisp
Script mit weiteren (source-request) Befehlen nun zusätzlich zu den Sensitivitäten auch
die Trajektorien-Koordinaten angefordert. Für die Beobachter-Position wird vereinfachend
der Surface-Mittelpunkt (0.5, 0.5) angenommen, dies läßt sich später leicht parametrisieren.
Die Trajektorien-Daten werden analog zum Mix-Synth (Quelltext 5.5) mit einem durch den
Phasor betriebenen BufRd abgetastet. Das aus X- und Y-Koordinaten bestehende StereoSignal wird mit Select UGens aufgetrennt und die Distanz nach dem Satz des Pythagoras
berechnet:
62
6 Resumé
Quelltext 6.1: cillo-doppler.sc
SynthDef( "cillo−doppler", {
arg i aBus, i kInBuf, i kPhasorBus, i extent = 0.04;
var traj, dly;
traj= BufRd.kr( numChannels:
phase: In.kr( bus: i
dly = ((Select.kr( which: 0,
(Select.kr( which: 1,
2, bufnum: i kInBuf,
kPhasorBus ));
array: traj ) − 0.5).squared +
array: traj ) − 0.5).squared).sqrt ∗ i extent;
ReplaceOut.ar( bus: i aBus, channelsArray: DelayC.ar(
in: In.ar( bus: i aBus ), maxdelaytime: 2 ∗ i extent, delaytime: dly ));
}).writeDefFile( p );
Der Benutzer bestimmt die Raum-Größe auf der graphischen Oberfläche des Lisp Plug-Ins.
Der Normalisierungsfaktor für die Delay-Zeit i_extent wird bereits im Lisp Script berechnet. DelayC ist eine kubisch interpolierende Delay-Line. maxdelaytime bestimmt die interne
Puffergröße und muß so gewählt sein, daß keine Verzögerungen auftreten, die größer als dieser
Wert sind.
Verzerrer
Unter Verzerrung kann man allgemein eine Signaltransformation verstehen, die nicht durch
ein lineares System beschrieben werden kann. Eine einfache Verzerrung ist beispielsweise die
Transformation y ← x2 . Ein Verzerrer kann mit einem Median-Filter gebaut werden. Wenn
man jeweils von wenigen benachbarten Samples den Median berechnet, werden kurze Spikes
eliminiert. Subtrahiert man nun das Originalsignal, bleiben hauptsächlich diese kurzen Signalspitzen übrig. Das Differenz-Signal wird mit dem geglätteten Median-Signal moduliert. Mit
einem Amplituden-Envelope-Follower kann das verzerrte Signal grob an die ursprüngliche
Lautstärke angepaßt werden.
Der Verzerrer soll von einem Richtungsvektor gesteuert werden. Ein zusätzlicher Transmitter
wird dafür benutzt. Er bekommt den speziellen Namen ’d’ (Distortion) und wird aufgrund
dieses Namens vom Lisp Script erkannt und separat behandelt. Für jeden Ausgangskanal wird
ein Distortion-Synth erzeugt, der in Abhängigkeit von diesem d-Transmitter zwischen dem
trockenen und verzerrten Signal überblendet. Das Mischungsverhältnis wird aufgrund des
Winkels, den der d-Transmitter und der jeweilige Receiver zum Surface-Mittelpunkt bilden,
gewählt. Wenn A die gegenwärtige Position des d-Transmitters, B der Surface-Mittelpunkt
und C der Ankerpunkt des Receivers sind, ergibt sich der Winkel nach
arctan
(Cx −Bx )·(Ay −By )−(Cy −By )·(Ax −Bx )
(Cx −Bx )·(Ax −Bx )+(Cy −By )·(Ay −By)
Das Mischungsverhältnis wird daraus so berechnet, daß bei einem Winkel von 0◦ nur die
Verzerrung, bei 180◦ nur das trockene Signal zu hören ist. Mit einem Divergenz-Parameter
i_narrow läßt sich die Verlauf zwischen 0◦ und 180◦ einstellen. Hier die Synthesizer-Definition:
63
6 Resumé
Quelltext 6.2: cillo-distortion.sc
SynthDef( "cillo−distortion", {
arg i aBus, i kInBuf, i kPhasorBus, i locX, i locY,
i gain = 2.0, i narrow = 4.0;
var traj, dtrajx, dtrajy, dstatx, dstaty, da, dry, mix, med, flt,
norm mul, norm add;
dstatx =
dstaty =
norm mul=
norm add=
traj
dtrajx
dtrajy
i locX − 0.5;
i locY − 0.5;
−1.0 / pi;
1.0;
= BufRd.kr( numChannels: 2, bufnum: i kInBuf,
phase: In.kr( bus: i kPhasorBus ));
= Select.kr( which: 0, array: traj ) − 0.5;
= Select.kr( which: 1, array: traj ) − 0.5;
// delta angle normalized to 0.0 ... 1.0
// (where 1.0 is 0 degrees, 0.5 is +/− 90 degrees,
// 0.0 is 180 degrees)
da
= abs( atan2( (dstatx ∗ dtrajy) − (dstaty ∗ dtrajx),
(dstatx ∗ dtrajx) + (dstaty ∗ dtrajy) )) ∗ norm mul + norm add;
mix
= min( 1.0, (dtrajx.squared + dtrajy.squared) / 0.125 ) ∗
da.pow( i narrow );
dry
med
flt
= In.ar( bus: i aBus );
= Median.ar( length: 3, in: dry );
= Normalizer.ar( in: (dry − med) ∗ med,
level: Amplitude.kr( in: dry, mul: i gain ), dur: 0.005 );
ReplaceOut.ar( bus: i aBus, channelsArray: Median.ar(
length: 3, in: flt, mul: mix, add: DelayN.ar(
in: dry, mul: 1.0 − mix, delaytime: 0.1, maxdelaytime: 0.01 )));
}).writeDefFile( p );
Das trockene Signal muß mit DelayN verzögert werden, um den Look-Ahead des MedianFilters auszugleichen und Kammfilter-Effekte bei der Überblendung zu verhindern.
Hall
Mit Allpass-Filtern kann man einen primitiven Hall simulieren. Ähnlich dem Verzerrer verwenden wir ein Session-Objekt zur Steuerung des Halls: Einen zusätzlichen Receiver mit dem
speziellen Namen ’e’ (Echos). Angenommen, die normalen Receiver befinden sich in einer
kreisförmigen Anordnung. Dann kann der e-Receiver einfach in deren Mitte plaziert werden;
wird ein Transmitter von der Kreisbahn zur Mitte hin abgelenkt, so wird sein Signal in die
Hall-Sektion gegeben. Der Einfachheit halber ist der Input dieser Hall-Sektion ein Mono-Bus,
und für jeden Ausgangskanal wird dieses Mono-Signal mit einem Allpass-Filter verhallt, das
eine zufällige variierende Delay-Zeit hat:
64
6 Resumé
Normaler Modus
Input Group
Doppler Group
Mix Group
Echo + Distortion Group
Input−Synth
Echo−Synth
Mix−Synths
Matrix
...
Input−Synth
Sense−Bufs
(e−Receiver)
...
numInputs
Sense−Buf
Matrix
Echo−Synth
(insert)
Doppler−Synth
Audio−Output
Audio−Output
...
Traj−Buf
Matrix
Distortion−Synth
...
(insert)
...
Doppler−Synth
Distortion−Synth
Traj−Buf
(d−Transmitter)
numInputs = Zahl der Transmitter
numOutputs = Zahl der Receiver
numOutputs
Umgedrehter Modus
Distortion Group
Input−Synth
Mix Group
Doppler Group
Sense−Buf
Matrix
Mix−Synths
Matrix
...
Input−Synth
(insert)
(insert)
Distortion−Synth
...
Audio−Output
...
Traj−Buf
(d−Transmitter)
Audio−Output
Distortion−Synth
Doppler−Synth
...
numInputs
Input Group
Doppler−Synth
Traj−Buf
Matrix
numInputs = Zahl der Receiver
numOutputs = Zahl der Transmitter
numOutputs
Abbildung 6.1: Erweiterter SuperCollider Synthesizer
65
6 Resumé
Abbildung 6.2: Steuerelemente und Script Oberfläche für den erweiterten Synth
Quelltext 6.3: cillo-echo.sc
SynthDef( "cillo−echo", {
arg i aInBus, i aOutBus;
Out.ar( bus: i aOutBus,
channelsArray: LPZ2.ar( in: AllpassL.ar( in: In.ar( bus: i aInBus ),
maxdelaytime: 0.31, delaytime:
LFNoise1.kr( 0.1, mul: 0.1, add: 0.2 ), decaytime: 3 )
)
);
}).writeDefFile( p );
Der Lowpass-Filter LPZ2 dunkelt die Hallfarbe etwas ab.
Modell-Umkehrung
Um das Modell so umzukehren, daß die Receiver Klangfelder darstellen und die Transmitter bewegte Mikrophone/Lautsprecher, muß das Lisp Script so verändert werden, daß Receiver durch abstrakte Output-Objekte und Transmitter durch abstrakte Input-Objekte ersetzt werden. In der Initialisierung kann dann die Zuordnung einfach umgetauscht werden.
Zusätzlicher Aufwand entsteht dadurch, daß die Indices der Transmitter und Receiver bei
der Quelldaten-Anforderung mit (source-request) nicht umgedreht werden dürfen. Auch
müssen die Gruppen-Knoten unterschiedlich angeordnet werden, damit die Reihenfolge der
DSP-Blöcke korrekt bleibt. Wenn man davon ausgeht, daß die Verzerrer unabhängig vom
Modell immer die Receiver bearbeiten und der Doppler immer auf die Transmitter einwirkt
(die Receiver sind ja unbewegt und können daher keinen Doppler-Shift erzeugen), ergeben
sich die beiden Schemata nach Abbildung 6.1.
Das Lisp Script scrt-demo.lisp ist zusammen mit einer Beispiel-Session und BeispielKlängen auf der beigefügten CD-ROM enthalten. Die vom Script generierten GUI Para-
66
6 Resumé
meter sind in Abbildung 6.2 rechts zu sehen. Der Normal-Modus, in dem die Transmitter
den Soundfiles zugeordnet sind, ist angewählt. Die Surface links zeigt einen Ausschnitt der
d-Transmitter Trajektorie zum Steuern der Verzerrung. Zu sehen ist auch der kreisförmige
Umriß des in der Mitte plazierten e-Receivers zum Ansteuern des Halls.
6.2 Probleme
Während der Entwicklung der vorliegenden Arbeit sind keine ungelösten Probleme im internen Programmverhalten aufgetreten. Die Thread-Synchronisierung hat einige Zeit in Anspruch genommen und insbesondere in der Anfangsphase viele Bugs enthalten. Dasselbe gilt
für die dynamische Anpassung an Preferences-Änderungen mit dem java.util.prefs Paket.
Insbesondere hat sich als nachteilig erwiesen, daß es einen eigenen Event-Dispatcher verwendet, der außerhalb des AWT Threads läuft, und daß die Ereignisse keine Informationen
darüber tragen, wer die Preferences verändert hat, so daß umfangreiche Vorkehrungen zur
Verhinderung von Deadlocks getroffen werden mußten. Die interne Umstellung aller Objekte
beim Laden einer Session hätte eleganter durch einen zentralen Mechanismus gelöst werden
können.
Das Programm enthält in der aktuellen Version 0.66 noch zahlreiche kleinere Bugs, die nicht
vital für die Benutzung sind. Mit dem Update der Apple Java VM von Version 1.4.2 03 nach
1.4.2 05 kurz vor Fertigstellung der Arbeit wurde die Graphikdarstellung des Timeline Fensters im Echtzeit Modus leider sehr langsam und flackert.1 Dieses Problem ist vermutlich auf
eine Änderung des Double-Buffering Mechanismus zurückzuführen und muß in der nächsten
Version von Meloncillo dringend beseitigt werden.
Ungelöst sind noch Probleme beim Betrieb im Netzwerk. Obwohl in der Anfangsphase ein Test erfolgreich lief, in dem auf einem Computer Meloncillo und auf dem anderen SuperCollider lief, wurde die Realtime-Engine von Meloncillo aus Performance-Gründen
später neu geschrieben. Weitere jüngst vorgenommene Tests ergaben, daß die beiden Rechner nicht synchron bleiben. Die Zeitspanne, die vergeht, bis die ersten Dropouts auftreten,
schwankt je nach Rechner-Paar zwischen einer halben Minute und einer Viertelstunde. Da die
Clock-Unterschiede eigentlich so klein sein sollten, daß bei entsprechend gewählten PufferGrößen ein Synchronisationsverlust erst nach einer Zeitspanne in der Größenordnung von
Stunden auftreten kann, muß die Ursache im Timing-Schema des OSC-Datenversands gesucht werden. Möglicherweise läßt sich das Problem lösen, indem die OSC-Befehle zum
Puffer-Update mit Time-Tags versehen werden.2 Nichtsdestotrotz sollte langfristig eine SlaveSynchronisierung in Meloncillo integriert werden, um eine synchronen Betrieb mit HarddiskRecording-Programmen zu ermöglichen.
1
Man kann sich momentan nur behelfen, indem das Fenster zeitweilig geschlossen wird. Ein positiver Aspekt
des VM Updates ist das Verschwinden eines Bugs, der sich in gelegentlichen Stack-Overflows äußerte, die
innerhalb der Bibliotheken auftraten und damit unmöglich zu eliminieren waren.
2
Ein Vorteil des gegenwärtigen Mechanismus – der Versand nach Aufforderung durch eine /tr Nachricht –
besteht darin, daß eine Anbindung an Max/MSP leichter zu realisieren ist, denn die OSC-Externals von
Max/MSP behandeln Time-Tags derzeit nicht automatisch.
67
6 Resumé
6.3 Ausblick
Die weitere Entwicklung des Programms kann in Detailverbesserungen und größere Ergänzungen und Umstrukturierungen unterteilt werden. Zur ersten Kategorie zu zählen sind
•
Anpassung der Oberfläche und Tastatur-Shortcuts unter Linux und Windows
•
konfigurierbare Farbgebung
•
Dehnen und Kürzen des Zeitabschnitts im Filter Dialog (Resampling)
•
Verbesserung der geometrischen Zeichentools
•
Entwicklung einer DTD für die Session-Datei
•
Shuffle- und Slip-Modus für Timeline-Operationen analog zu ProTools
Die größeren Ergänzungen hängen im wesentlichen davon ab, wie sich das Programm in der
Praxis bewährt. Wichtige Elemente werden sein
•
Stabile Realtime Performance im Netzwerk
•
Synchronisierung mit Harddisk-Recording Programmen
•
Anbindung an Max/MSP 4.5
•
Erweiterung der Timeline um frei setzbare Markierungen
•
evtl. Erweiterung um eine Layer-Struktur
•
Erweiterung der Receiver und Transmitter Interfaces um Attribute
•
script-generierte Preferences Karten
Wie bereits geschildert, bricht die Synchronisation momentan bei Betrieb im Netzwerk
früher oder später zusammen. Obwohl sich das Problem voraussichtlich leicht lösen läßt,
wird eine Unterstützung von OSC-Time-Tags angestrebt. Wenn eine Slave-Synchronisierung
in Meloncillo eingebaut wird, sollte zugleich ein grundlegendes Konzept für eine OSC-Server
Schnittstelle entworfen werden.
Eine einfache Timecode Steuerung (z.B. auf MIDI-Timecode Basis) sollte entwickelt werden,
so daß ein synchrones Einspielen von Spuren aus einem Harddisk-Recording Programm
möglich wird; momentan müssen die zu spatialisierenden Klänge zunächst gebounct werden,
was sehr hinderlich ist. Eine Zwischenlösung kann wahrscheinlich mit sclang erreicht werden.
Es läßt sich ebenso wie scsynth von einem OSC-Client steuern. Ein OSCresponderNode
Objekt müßte auf den Transport-Start in Meloncillo reagieren und einen entsprechenden
MIDI Befehl an eine Applikation wie Logic Pro weiterleiten.
Das Ansteuern von Max/MSP macht momentan wenig Sinn, weil das OSC-Objekt otudp
read von Matt Wright alle Message-Argumente in primitive Max-Typen übersetzt, was für
das Senden großer Floating-Point Puffer ungeeignet ist. Max/MSP 4.5 bietet eine integrierte Java-Schnittstelle (mxj) an. Ein einfaches Plug-In soll dafür entwickelt werden, das die
Sensitivitäts-UDP-Pakete empfängt und direkt in MSP-Puffer schreibt.
Um ein Stück besser überblicken zu können, sind Zeitmarker erforderlich. Diese könnten
auch mit Scripten generiert werden oder von Scripten ausgelesen und zur Klangsynthese
benutzt werden.
68
6 Resumé
Wenn, wie im letzten Beispiel gezeigt, mit mehreren Klangtransformationen gearbeitet wird,
kann die Surface schnell unübersichtlich werden. Zu überlegen ist, wie möglichst einfach die
Form einer Ebenen-Struktur in die Session gebracht werden kann. Diese Ebenen könnten
entweder optisch umgeschaltet oder überlagert dargestellt werden.
Receiver und Transmitter sollten mit einer Attribute-Mappe ausgestattet werden. Um
einfache Features zu integrieren, wie zum Beispiel die Möglichkeit, Transmitter stummzuschalten oder solo abzuhören, müssen die Scripte momentan spezielle GUI Felder auf ihre
Plug-In Oberflächen addieren. Er wäre effektiver, mit einem einfachen get und set Mechanismus den Transmittern und Receivern beliebige Attribute hinzuzufügen, die dann auch
von den Editoren unterstützt werden. Ein Transmitter Editor könnte dann Solo- und MuteButtons direkt im Timeline Fenster darstellen. Getrennte Methoden wie getName, setName,
getAnchor, setAnchor würden in diesem allgemeinen Attribute-System aufgelöst werden.
Von Beta-Testern ist der Wunsch geäußert worden, eine Input/Output Konfiguration für
die Audio-Hardware in Meloncillo vornehmen zu können. Das kollidiert zunächst mit der
Grundidee, daß das Programm nichts über konkrete Signalverarbeitung weiß. Eine Alternative
wären Preferences-Karten, die dynamisch von Scripts generiert werden. Wenn in einer der
nächsten Versionen die Anbindung an Max/MSP realisiert ist, müßten die Preferences nicht
innerhalb des Programmes erweitert, sondern lediglich ein zusätzliches Preferences-Script
angemeldet werden.
Die Hauptaufgabe wird jedoch sein, das Programm ausführlicher durch möglichst viele verschiedene Anwender in der Praxis zu erproben.
69
Literaturverzeichnis
[Chowning 1971]
John Chowning, The Simulation of Moving Sound Sources. Journal
of the AES Vol. 19, No. 1, Januar 1971 (Nachdruck in Computer
Music Journal Vol. 1 No. 3, Juni 1977, S. 48–52)
[Eimert/Humpert 1973]
Herbert Eimert / Hans Ulrich Humpert, Das Lexikon der elektronischen Musik (Artikel Raum“, Raumton“, Raumakustik“ und
”
”
”
Steuerung“). Regensburg 1973
”
Frank Gertig / Julia Gerlach / Golo Föllmer, Musik..., verwandelt
– Das Elektronische Studio der TU Berlin 1953–1995. Hofheim
1995
[Gertig et al. 1995]
[Gosling et al. 2000]
James Gosling / Bill Joy / Guy Steele / Gilad Bracha, The Java
Language Specification, 2nd Edition. Boston 2000. Online publiziert: http://java.sun.com/docs/books/jls/second_edition/
html/j.title.doc.html
[Haller 1995]
Hans Peter Haller, Das Experimentalstudio der Heinrich-StrobelStifung des Südwestfunks Freiburg 1971–1989 : Die Erforschung
der Elektronischen Klangumformung und ihre Geschichte (Band 1,
Zur Technik der Elektronischen Klangumformung). Baden-Baden
1995
[Hein 1999]
Folkmar Hein, Von der Quadrophonie zur Raumklangsteuerung –
Überlegungen zur Konzeption des neuen TU-Studios. In: Bernhard
Feiten / Folkmar Hein / Axel Röbel / Werner Schaller (Hrsg.),
Impulse und Antworten – Festschrift für Manfred Krause. Berlin
1999, S. 85–110
[Jot/Warusfel 1995]
Jean-Marc Jot / Olivier Warusfel, Spat˜ : A Spatial Processor for
Musicians and Sound Engineers. CIARM: International Conference
on Acoustics and Musical Research, Mai 1995
[Kleiner et al. 1993]
Mendel Kleiner / Bengt-Inge Dalenbäck / Peter Svensson, Auralization – An Overview. Journal of the AES Vol. 41, No. 11, November 1993, S. 861-875
[Lea 1997]
Doug Lea, Concurrent Programming in Java – Entwurfsprinzipien
und Muster. Bonn 1997
[Leahy 2004]
Michael Leahy, SCREAM – SuperCollider Resource for ElectroAcoustic Music. Online-Publikation 2004:
http://audio.egregious.net/scream/whitepapers/scream_
whitepaper.v1.1.1.pdf
70
Literaturverzeichnis
[Loy 1985]
Gareth Loy, SNDPATH. In: Computer Audio Research Laboratory
(CARL) Program Guide. La Jolla 1985
[Mayer 1995]
Otto Mayer, Programmieren in COMMON LISP. Heidelberg, 1995
[Malham 1998]
D. G. Malham, Spatial Hearing Mechanisms and Sound Reproduction. Online-Publikation 1998: http://www.york.ac.uk/
inst/mustech/3d_audio/ambis2.htm
[McCartney 1996]
James McCartney, SuperCollider: A New Real Time Synthesis Language. ICMC Paper 1996
[McCartney 2002]
James McCartney, Rethinking the Computer Music Language:
SuperCollider. In: Computer Music Journal Vol. 26, No. 4, Winter
2002, S. 61–68
[Momenti/Wessel 2003]
Ali Momenti / David Wessel, Characterizing and Controlling Musical Material Intuitively with Geometric Models. Proc. of the 2003
Conference on New Interfaces for Musical Expression (NIME-03),
Montreal, S. 54–62
[Moore 1983]
F. Richard Moore, A General Model for Spatial Processing of
Sounds. Computer Music Journal Vol. 7, No. 3, Herbst 1983,
S. 6–15
[Moore 1985]
F. Richard Moore, The CMusic Sound Synthesis Program. La Jolla
1985
[de la Motte-Haber 1996] Helga de la Motte-Haber (Red.), Klangkunst. Katalog von Sonambiente – Festival für Hören und Sehen. Hrsg. von der Akademie
der Künste, Berlin 1996
[de la Motte-Haber 1993] Helga de la Motte-Haber, Die Musik von Edgard Varèse. Hofheim
1993
[Mühlethaler/Schuppisser 2004] Christian Mühlethaler / Alexander Schuppisser, Sonificator
– A Java Framework for writing Applications that use SuperCollider as Sound-Engine. Vortrag auf der Linux Audio Developer
(LAD) Conference 2004. Online-Slides: http://www.linuxdj.
com/audio/lad/contrib/zkm_meeting_2004/slides/friday/
muehletaler+schuppisser-supercollider.pdf
[Pulkki 2001]
Ville Pulkki, Spatial Sound Generation and Perception by Amplitude Panning Techniques. Espoo, 2001
[Radtke 1988]
Torsten Radtke, Entwurf und Bau eines computergesteuerten 4Kanal-Mischers nach ARD-Pflichtenheft. Diplomarbeit TU Berlin
1988
[Ruschkowski 1998]
André Ruschkowski, Elektronische Klänge und musikalische Entdeckungen. Stuttgart 1988
[Schneider 1995]
Thomas Schneider, Programm zur Steuerung multipler Audiosignale zur Simulation räumlich bewegter Schallquellen. Magisterarbeit TU Berlin 1995
71
Literaturverzeichnis
[Seelig 1990]
Thomas Seelig, Entwicklung einer grafischen Benutzeroberfläche
für ein MIDI-gesteuertes quadrophones Mischpult. Magisterarbeit
TU Berlin 1990
[Stuart 1996]
J. Robert Stuart, The Psychoacoustics of Multichannel Audio. AES
UK Audio for New Media Conference, Paper ANM-12, 1996
[Supper 1997]
Martin Supper, Elektroakustische Musik und Computermusik:
Geschichte, Ästhetik, Methoden, Systemen. Darmstadt 1977
[de Vries/Boone 1999]
Diemer de Vries / Marinus M. Boone, Wave Field Synthesis and
Analysis Using Array Technology. Proc. IEEE Workshop on Appl.
of Signal Proc. to Audio and Acoustics, New Paltz, Oktober 1999
[Wishart 1994]
Trevor Wishart, Audible Design : A Plain and Easy Introduction
to Practical Sound Composition. York 1994
[Wright/Freed 1997]
Matthew Wright / Adrian Freed, Open SoundControl : A New
Protocol for Communicating with Sound Synthesizers. Proc. of
the 1997 Intl. Computer Music Conference (ICMC), Thessaloniki,
S. 101–104
[Wright et al. 2003]
Matthew Wright / Adrian Freed / Ali Momenti, OpenSound Control : State of the Art 2003. Proc. of the 2003 Conference on New
Interfaces for Musical Expression (NIME-03), Montreal, S. 153–159
[Zmölnig et al. 2003]
Johannes Zmölnig / Alois Sontacchi / Winfried Ritsch, The IEMCube : A Periphonic Re-/Production System. Proc. of the AES
24th Intl. Conference, 2003, S. 21–25
72
Anhang: Abbildungen, Quelltexte
Abbildungsverzeichnis
1.1
1.2
1.3
1.4
Σ 1 Oberfläche . . . . . . . . . . . . .
Panning Objekte in Digital Performer
VBAP Anwendung in Max/MSP . . .
Perzeptive Parameter in Spat˜ . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
14
17
18
3.1
3.2
Legende . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Session Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
29
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
Surface Fenster . . . . . . . . . . . . . . . .
Hilfspaletten . . . . . . . . . . . . . . . . .
Bézier-Kurve mit variabler Geschwindigkeit
Editor für SigmaReceiver . . . . . . . . . .
Matrix Meter . . . . . . . . . . . . . . . . .
Timeline Fenster . . . . . . . . . . . . . . .
Transport Palette . . . . . . . . . . . . . . .
Dezimation von Trajektorien . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
36
36
39
40
40
41
41
42
5.1
5.2
5.3
5.4
5.5
Plug-In Interfaces und Klassen . . . . . . . . . . . . . . . . . . . . . .
Plug-Ins zur Trajektorien-Filterung . . . . . . . . . . . . . . . . . . . .
RealtimeConsumer Profile . . . . . . . . . . . . . . . . . . . . . . . . .
Realtime Datenströme . . . . . . . . . . . . . . . . . . . . . . . . . . .
Nodes, Busse und Buffer für einen Amplituden-Mixer in SuperCollider
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
45
46
47
48
58
6.1
6.2
Erweiterter SuperCollider Synthesizer . . . . . . . . . . . . . . . . . . . . . .
Steuerelemente und Script Oberfläche für den erweiterten Synth . . . . . . .
65
66
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Quelltexte
3.1
3.2
3.3
3.4
4.1
4.2
4.3
5.1
5.2
XMLRepresentation.java (io package) . . . . . .
Receiver.java (receiver package) . . . . . . . . . .
Transmitter.java (transmitter package) . . . . . .
ReceiverCollectionListener.java (receiver package)
VirtualSurface.java (gui package) . . . . . . . . .
AbstractGeomTool.java (gui package) . . . . . .
TrackSpan.java (io package) . . . . . . . . . . . .
RenderPlugIn.java (render package) . . . . . . .
RenderConsumer.java (render package) . . . . . .
73
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
30
31
32
35
38
42
44
45
Quelltexte
5.3
5.4
5.5
6.1
6.2
6.3
RealtimeProducer.java
smooth.orc . . . . . .
synthdef-sources.sc . .
cillo-doppler.sc . . . .
cillo-distortion.sc . . .
cillo-echo.sc . . . . . .
(realtime package)
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
74
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
47
53
59
63
64
66