Regular and irregular Gabor multiplier with application to
Transcription
Regular and irregular Gabor multiplier with application to
Regular and irregular Gabor multiplier with application to psychoacoustic masking. Peter Balazs 1 Einleitung: Die Bedeutung der Signalverarbeitung ([30],[27]) in der heutigen Zeit ist unumstritten. Man kann davon sprechen, dass jeder Fortschritt in der Signalverarbeitung direkt in der Technologie und Informationsverarbeitung angewandt wird. Ohne die modernen Signalverarbeitungsmethoden wären Technologien wie z.B. das Handy, UMTS , ADSL oder digitales Fernsehen nicht möglich. Neben den in den oben erwähnten Technologien verwendete technischen Codern sind auch perzeptive Coder möglich. Es ist in der Psychoakustik bekannt ([8],[24]), dass nicht alle ZeitFrequenz Daten wahrgenommen werden können, es gibt redundante Signalteile. Bei Vorhandensein eines Signals muss ein anderes Signal einen gewissen Pegel überschreiten, um überhaupt wahrgenommen werden zu können. Diesen Effekt, die sogenannte Maskierung, gibt es sowohl im Zeit- wie auch im Frequenzbereich. Er kann einerseits dazu verwendet werden, um psychologische Effekte beim Hören besser erklären zu können, andererseits um Daten zu kodieren, was etwa bereits im MP3 Format verwendet wird. Gabor Analysis ([17],[13]) ist die mathematische Bezeichnung für die diskrete Zeit-FrequenzAnalyse mit einer gefensterten Fourier Transformation. Die kontinuierliche oder diskrete Kurzzeit-Fourier-Transformation wird an bestimmten Punkten in der Zeit Frequenz Ebene abgetastet. G(g, α, β) = {Tαk Mβn g : k, n ∈ Zd } hf, Mβn Tαk gi = ST F Tg (f )(αk, βn) Viele Fragen lassen sich mit der mathematischen Theorie beantworten, wie zum Beispiel wann ein Signal nach einer Analyse wieder perfekt rekonstruiert werden kann. Anders als bei der Verwendung einer diskreten STFT kann man über die Gabor Analyse auch die Eigenschaften im Kontinuierlichen, d.h. im Modell, betrachten. Zusätzlich zum regulären Fall kann auch der irreguläre Fall (irregular sampling, nicht äquidistantes Abtasten) betrachtet werden. Gabor Mulitplier ([11],[7]) sind Masken auf der Zeit-Frequenz Ebene. Mg (f ) = XX k mk,n · ST F Tg (f )(αk,βn) Tαk Mβn g 0 n Sie sind somit das Mittel um Signalmodifikationen, zeitvariante Filter wie den Effekt der Maskierung darzustellen. Viele Fragen über das Verhalten dieser Operatoren im Kontinuierlichen sind derzeit ungeklärt. Eine Verallgemeinerung auf das (neue) Konzept der Frame Multiplier bietet die Möglichkeit Eigenschaften herauszuarbeiten, die auf alle Gabor Multiplier, 1 reguläre und irreguläre, angewendet werden können. Weiters können damit auch andere Analyse/Synthese Methoden wie Wavelet- und Gammatone Filterbänke bearbeitet werden, sofern diese nur die Rekonstruktionseigenschaft erfüllen, dass sie ein Frame bilden: X A · kf k2 ≤ |hf, gk i|2 ≤ B · kf k2 ∀ f ∈ H k Das in dieser Arbeit zu untersuchende Eigenwertverhalten der Gabor-Multiplier (und der Gabor Frame Operatoren als Spezialfall) zeigt in ersten Versuchen interessante Eigenschaften. Da viele Eigenwert-Methoden die Daten in “signifikantere“ und weniger signifikante Teile zerlegen können, liegt der Ansatz nahe, Maskierung als Eigenwert-Problem zu behandeln. Weiters ergibt sich die Möglichkeit ein für die Audio-Perzeption optimales (oder auch nur besonders “gutes“) Gabor System zu suchen. Gabor Multiplier können viele verschiedenen Operatoren approximieren, sodass nach einer möglichst guten Beschreibung des psychoakustischen Effekt der Maskierung in diesem Kontext geforscht werden soll. 2 Ziel: 1. Klärung der offenen Fragen der mathematischen Grundlagen, insbesondere • Weiterentwicklung der Frame Multiplier • Approximation von Hilbert Schmidt Operatoren durch Gabor Mulitplier • Eigenwertanalyse der Gabor Multiplier und Frame Operatoren 2. Beschreibung und Test der Anwendbarkeit in der Psychoakustik, insbesondere • Implementierung des Maskierungsfilter als Zeit-Frequenz Filter • Untersuchung der Eignung verschiedener Gabor-Systeme zur Beschreibung der Perzeption • Beschreibung des Effekts der Maskierung als Eigenwertproblem 3. Vergleich zu bestehenden Modellen und Algorithmen 4. Ausweitung / Erweiterung auf den irregulären Fall 3 Plan: Dieses Thema kann in diesem Zeitrahmen nicht ausgeschöpft, aber ein wesentlicher Fortschritt geleistet werden. Insbesondere kann danach die Forschungstätigkeit auf konkrete Einzelergebnisse konzentriert werden. Durch das umfangreiche Thema ist der zusammenhängende Zeitraum von sechs Monaten notwendig. Dieses wurde umfangreich gewählt, da es starke Zusammenhänge gibt, jedoch (noch) nicht abschätzbar ist, in welchem Bereich welche Fortschritte gemacht werden können. Ergebnisse liegen teilweise vor oder sind zu erwarten, inbesondere in den Bereichen FrameMultiplier, Eigenfunktionen von Gabor Frame Operatoren, Approximation von Operatoren durch Gabor Multiplier und bei der Implementierung eines Zeit-Frequenz Maskierungs Algorithmus. 2 In Österreich wurde und wird zu diesem Thema geforscht, einerseits am Institut für Schallforschung der Akademie der Wissenschaften andererseits bei NuHAG am mathematischen Institut der Universität Wien. Die beiden französischen Institute, Groupe de Traitement du Signal, LATP/ CMI, Université de Provence, Marseille unter der Leitung von Prof. Bruno Torrésani und Modélisation, Synthèse et Contrôle des Signaux Sonores et Musicaux, LMA, CNRS Marseille unter der Leitung von Prof. Richard Kronland-Martinet, arbeiten seit Längerem eng zusammen, um die Verbindung mathematische Theorie und Praxis zu gewährleisten. Da man sich dort gerade mit dem Effekt der Maskierung im Bogen Theorie - Praxis und Mathematik - Akustik beschäftigt, erscheint eine Zusammenarbeit ideal. Neben der Erarbeitung der mathematischen Theorie, konzeptionell (“on paper“) aber auch in Computerexperimenten, wird an diesen Instituten auch die Gelegenheit geboten, (einfache) psychoakustische Experimente durchzuführen. 3 Literatur [1] P. Balazs, Polynome über Gruppen, Master Thesis Univ. Wien (2001) [2] P. C. Casazza, The Art of Frame Theory, Taiwanese J. Math., vol.4, no. 2, pp. 129-202 (2000) [3] O. Christensen, Frame decompositions in Hilbert Spaces, PhD. thesis, Univ. Aarhus (1993) [4] O. Christensen An Introduction To Frames And Riesz Bases, Birkhäuser Boston (2003) [5] J. B. Conway, A Course in Functional Analysis, Springer New York (1990) [6] R.E.Crochiere, A Weighted Overlap-Add Method of Short-Time Fourier Analysis / Synthesis, IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-28, No.1, Feb. 1980 (1980) [7] M. Dörfler, Gabor Analysis for a Class of Signals called Music, Diisertation Univ. Wien (2002) [8] G. Eckel, Ein Modell der Mehrfachverdeckung für die Analyse musikalischer Schallsignale, Dissertation, Universität Wien (1989) [9] Y. Eldar, H. Bök H. Bölcskei, Geometrically Uniform Frames, IEEE Trans. Inform. Theory, vol. 49, pp. 993-1006, Apr. 2003. (2003) [10] H.Fastl, Beschreibung dynamischer Hörempfindungen anhand von MithörschwellenMustern, Habilitation TU München (1981) [11] H. G. Feichtinger, K. Nowak, A First Survey of Gabor Multipliers, in [14] [12] H.G. Feichtinger, W. Kozek, Operator Quantization on LCA Groups, in [13] [13] H. G. Feichtinger, T. Strohmer, Gabor Analysis and Algorithms - theory and Applications, Birkhäuser Bosten (1998) [14] H. G. Feichtinger, T. Strohmer, Advances in Gabor Analysis, Birkhäuser Bosten (2003) [15] H. G. Feichtinger, G. Zimmermann, A Banach space of test functions for Gabor analysis, in [13] [16] J.L. Flanagan; R. M. Golden, Phase Vocoder, Bell Syst. Tech., vol. 45, p 1493-1509 (1966); reprinted in [29] [17] K. Gröchenig, Foundations of Time-Frequency Analysis, Birkhäuser Boston (2001) [18] W.M. Hartmann, Signals, Sounds, and Sensation, Springer (1998) [19] H. Heuser, Lehrbuch der Analysis 2, Teubner Stuuttgart (1991) [20] Y. Katznelson, An introduction to Harmonic Analysis, Dover Publications New York (1976) 4 [21] H. Lausch, W. Nöbauer, Algebra of Polynomials, North-Holland Publishing, London (1973) [22] Y. Liu, Y. Wang, The uniformity of non-uniform Gabor bases, Advances in Computational Mathematics 18: 345-355 (2003) [23] B. Moore, Perceptual Consequences of Cochlear Damage, Oxford Medical Publications (1995) [24] B. Moore, An Introduction to the Psychology of Hearing, Academic Press Limited London (1989) [25] F.R. Moore, Elements of Computer Music, Prentice-Hall, Inc. (1990) [26] M. B. Monagan et al., MAPLE 7 Programming Guide, Waterloo Maple Inc. (2001) [27] A. V. Oppenheimer, R.W. Schafer, Zeitdiskrete Signalverarbeitung , 3.Auflage, Oldenbourg (1999) [28] M.R. Portnoff, Implementation of the Digital Phase Vocoder Using the Fast Fourier Transform, IEEE Trans. Acoust., Speech, and Signal Processing, vol. ASSP-24, 243-248 (1976); reprinted in [29] [29] R.W. Schafer, J.D. Markel (editor), Speech Analysis, IEEE Press (1979) [30] S. D. Stearns, D.R. Hush, Digitale Verarbeitung analoger Signale , 7. Auflage, Oldenbourg (1999) [31] Thomas Strohmer, Numerical algorithms for discrete Gabor expansions,in [13] [32] Dirk Werner, Funktionalanalysis, Springer Berlin (1995) 5