Regular and irregular Gabor multiplier with application to

Transcription

Regular and irregular Gabor multiplier with application
to psychoacoustic masking.
Peter Balazs
1
Einleitung:
Die Bedeutung der Signalverarbeitung ([30],[27]) in der heutigen Zeit ist unumstritten. Man
kann davon sprechen, dass jeder Fortschritt in der Signalverarbeitung direkt in der Technologie
und Informationsverarbeitung angewandt wird. Ohne die modernen Signalverarbeitungsmethoden wären Technologien wie z.B. das Handy, UMTS , ADSL oder digitales Fernsehen nicht
möglich.
Neben den in den oben erwähnten Technologien verwendete technischen Codern sind auch
perzeptive Coder möglich. Es ist in der Psychoakustik bekannt ([8],[24]), dass nicht alle ZeitFrequenz Daten wahrgenommen werden können, es gibt redundante Signalteile. Bei Vorhandensein eines Signals muss ein anderes Signal einen gewissen Pegel überschreiten, um überhaupt
wahrgenommen werden zu können. Diesen Effekt, die sogenannte Maskierung, gibt es sowohl
im Zeit- wie auch im Frequenzbereich. Er kann einerseits dazu verwendet werden, um psychologische Effekte beim Hören besser erklären zu können, andererseits um Daten zu kodieren,
was etwa bereits im MP3 Format verwendet wird.
Gabor Analysis ([17],[13]) ist die mathematische Bezeichnung für die diskrete Zeit-FrequenzAnalyse mit einer gefensterten Fourier Transformation. Die kontinuierliche oder diskrete
Kurzzeit-Fourier-Transformation wird an bestimmten Punkten in der Zeit Frequenz Ebene
abgetastet.
G(g, α, β) = {Tαk Mβn g : k, n ∈ Zd }
hf, Mβn Tαk gi = ST F Tg (f )(αk, βn)
Viele Fragen lassen sich mit der mathematischen Theorie beantworten, wie zum Beispiel wann
ein Signal nach einer Analyse wieder perfekt rekonstruiert werden kann. Anders als bei der
Verwendung einer diskreten STFT kann man über die Gabor Analyse auch die Eigenschaften
im Kontinuierlichen, d.h. im Modell, betrachten. Zusätzlich zum regulären Fall kann auch der
irreguläre Fall (irregular sampling, nicht äquidistantes Abtasten) betrachtet werden.
Gabor Mulitplier ([11],[7]) sind Masken auf der Zeit-Frequenz Ebene.
Mg (f ) =
XX
k
mk,n · ST F Tg (f )(αk,βn) Tαk Mβn g 0
n
Sie sind somit das Mittel um Signalmodifikationen, zeitvariante Filter wie den Effekt der
Maskierung darzustellen. Viele Fragen über das Verhalten dieser Operatoren im Kontinuierlichen sind derzeit ungeklärt. Eine Verallgemeinerung auf das (neue) Konzept der Frame Multiplier bietet die Möglichkeit Eigenschaften herauszuarbeiten, die auf alle Gabor Multiplier,
1
reguläre und irreguläre, angewendet werden können. Weiters können damit auch andere Analyse/Synthese Methoden wie Wavelet- und Gammatone Filterbänke bearbeitet werden, sofern
diese nur die Rekonstruktionseigenschaft erfüllen, dass sie ein Frame bilden:
X
A · kf k2 ≤
|hf, gk i|2 ≤ B · kf k2 ∀ f ∈ H
k
Das in dieser Arbeit zu untersuchende Eigenwertverhalten der Gabor-Multiplier (und der Gabor Frame Operatoren als Spezialfall) zeigt in ersten Versuchen interessante Eigenschaften. Da
viele Eigenwert-Methoden die Daten in “signifikantere“ und weniger signifikante Teile zerlegen können, liegt der Ansatz nahe, Maskierung als Eigenwert-Problem zu behandeln. Weiters
ergibt sich die Möglichkeit ein für die Audio-Perzeption optimales (oder auch nur besonders
“gutes“) Gabor System zu suchen. Gabor Multiplier können viele verschiedenen Operatoren
approximieren, sodass nach einer möglichst guten Beschreibung des psychoakustischen Effekt
der Maskierung in diesem Kontext geforscht werden soll.
2
Ziel:
1. Klärung der offenen Fragen der mathematischen Grundlagen, insbesondere
• Weiterentwicklung der Frame Multiplier
• Approximation von Hilbert Schmidt Operatoren durch Gabor Mulitplier
• Eigenwertanalyse der Gabor Multiplier und Frame Operatoren
2. Beschreibung und Test der Anwendbarkeit in der Psychoakustik, insbesondere
• Implementierung des Maskierungsfilter als Zeit-Frequenz Filter
• Untersuchung der Eignung verschiedener Gabor-Systeme zur Beschreibung der Perzeption
• Beschreibung des Effekts der Maskierung als Eigenwertproblem
3. Vergleich zu bestehenden Modellen und Algorithmen
4. Ausweitung / Erweiterung auf den irregulären Fall
3
Plan:
Dieses Thema kann in diesem Zeitrahmen nicht ausgeschöpft, aber ein wesentlicher Fortschritt
geleistet werden. Insbesondere kann danach die Forschungstätigkeit auf konkrete Einzelergebnisse konzentriert werden. Durch das umfangreiche Thema ist der zusammenhängende Zeitraum von sechs Monaten notwendig. Dieses wurde umfangreich gewählt, da es starke Zusammenhänge gibt, jedoch (noch) nicht abschätzbar ist, in welchem Bereich welche Fortschritte
gemacht werden können.
Ergebnisse liegen teilweise vor oder sind zu erwarten, inbesondere in den Bereichen FrameMultiplier, Eigenfunktionen von Gabor Frame Operatoren, Approximation von Operatoren
durch Gabor Multiplier und bei der Implementierung eines Zeit-Frequenz Maskierungs Algorithmus.
2
In Österreich wurde und wird zu diesem Thema geforscht, einerseits am Institut für Schallforschung der Akademie der Wissenschaften andererseits bei NuHAG am mathematischen Institut der Universität Wien. Die beiden französischen Institute, Groupe de Traitement du Signal,
LATP/ CMI, Université de Provence, Marseille unter der Leitung von Prof. Bruno Torrésani
und Modélisation, Synthèse et Contrôle des Signaux Sonores et Musicaux, LMA, CNRS Marseille unter der Leitung von Prof. Richard Kronland-Martinet, arbeiten seit Längerem eng
zusammen, um die Verbindung mathematische Theorie und Praxis zu gewährleisten. Da man
sich dort gerade mit dem Effekt der Maskierung im Bogen Theorie - Praxis und Mathematik
- Akustik beschäftigt, erscheint eine Zusammenarbeit ideal.
Neben der Erarbeitung der mathematischen Theorie, konzeptionell (“on paper“) aber auch
in Computerexperimenten, wird an diesen Instituten auch die Gelegenheit geboten, (einfache)
psychoakustische Experimente durchzuführen.
3
Literatur
[1] P. Balazs, Polynome über Gruppen, Master Thesis Univ. Wien (2001)
[2] P. C. Casazza, The Art of Frame Theory, Taiwanese J. Math., vol.4, no. 2, pp. 129-202
(2000)
[3] O. Christensen, Frame decompositions in Hilbert Spaces, PhD. thesis, Univ. Aarhus
(1993)
[4] O. Christensen An Introduction To Frames And Riesz Bases, Birkhäuser Boston (2003)
[5] J. B. Conway, A Course in Functional Analysis, Springer New York (1990)
[6] R.E.Crochiere, A Weighted Overlap-Add Method of Short-Time Fourier Analysis / Synthesis, IEEE Transactions on Acoustics, Speech and Signal Processing, Vol. ASSP-28,
No.1, Feb. 1980 (1980)
[7] M. Dörfler, Gabor Analysis for a Class of Signals called Music, Diisertation Univ. Wien
(2002)
[8] G. Eckel, Ein Modell der Mehrfachverdeckung für die Analyse musikalischer Schallsignale, Dissertation, Universität Wien (1989)
[9] Y. Eldar, H. Bök H. Bölcskei, Geometrically Uniform Frames, IEEE Trans. Inform. Theory, vol. 49, pp. 993-1006, Apr. 2003. (2003)
[10] H.Fastl, Beschreibung dynamischer Hörempfindungen anhand von MithörschwellenMustern, Habilitation TU München (1981)
[11] H. G. Feichtinger, K. Nowak, A First Survey of Gabor Multipliers, in [14]
[12] H.G. Feichtinger, W. Kozek, Operator Quantization on LCA Groups, in [13]
[13] H. G. Feichtinger, T. Strohmer, Gabor Analysis and Algorithms - theory and Applications,
Birkhäuser Bosten (1998)
[14] H. G. Feichtinger, T. Strohmer, Advances in Gabor Analysis, Birkhäuser Bosten (2003)
[15] H. G. Feichtinger, G. Zimmermann, A Banach space of test functions for Gabor analysis,
in [13]
[16] J.L. Flanagan; R. M. Golden, Phase Vocoder, Bell Syst. Tech., vol. 45, p 1493-1509 (1966);
reprinted in [29]
[17] K. Gröchenig, Foundations of Time-Frequency Analysis, Birkhäuser Boston (2001)
[18] W.M. Hartmann, Signals, Sounds, and Sensation, Springer (1998)
[19] H. Heuser, Lehrbuch der Analysis 2, Teubner Stuuttgart (1991)
[20] Y. Katznelson, An introduction to Harmonic Analysis, Dover Publications New York
(1976)
4
[21] H. Lausch, W. Nöbauer, Algebra of Polynomials, North-Holland Publishing, London
(1973)
[22] Y. Liu, Y. Wang, The uniformity of non-uniform Gabor bases, Advances in Computational Mathematics 18: 345-355 (2003)
[23] B. Moore, Perceptual Consequences of Cochlear Damage, Oxford Medical Publications
(1995)
[24] B. Moore, An Introduction to the Psychology of Hearing, Academic Press Limited London
(1989)
[25] F.R. Moore, Elements of Computer Music, Prentice-Hall, Inc. (1990)
[26] M. B. Monagan et al., MAPLE 7 Programming Guide, Waterloo Maple Inc. (2001)
[27] A. V. Oppenheimer, R.W. Schafer, Zeitdiskrete Signalverarbeitung , 3.Auflage, Oldenbourg (1999)
[28] M.R. Portnoff, Implementation of the Digital Phase Vocoder Using the Fast Fourier
Transform, IEEE Trans. Acoust., Speech, and Signal Processing, vol. ASSP-24, 243-248
(1976); reprinted in [29]
[29] R.W. Schafer, J.D. Markel (editor), Speech Analysis, IEEE Press (1979)
[30] S. D. Stearns, D.R. Hush, Digitale Verarbeitung analoger Signale , 7. Auflage, Oldenbourg
(1999)
[31] Thomas Strohmer, Numerical algorithms for discrete Gabor expansions,in [13]
[32] Dirk Werner, Funktionalanalysis, Springer Berlin (1995)
5

Regular and irregular Gabor multiplier with application to

Transcription

Similar documents

Zusammenfassung - Universität Ulm

6. MP3