Uporaba prostorskega zvoka v interakciji človek
Transcription
Uporaba prostorskega zvoka v interakciji človek
Lokalizacija zvoka in prostorski zvok Lokalizacija zvočnih izvorov Opis položaja izvora zvoka Lokalizacija zvočnih izvorov Direktni in odbiti zvočni val Lokalizacija zvočnih izvorov Prenosna funkcija na vhodu v sluhovod Lokalizacija zvočnih izvorov Prenosna funkcija odziva na bobniču HRTF (Head Related Transfer Function) Lokalizacija zvočnih izvorov Vpliv obeh ušes (binaural localization) Med-ušesna časovna razlika (< 1kHz) Med-ušesna amplitudna razlika (> 5kHz) Zaznava azimuta – horizontalne smeri Lokalizacija zvočnih izvorov Vpliv spektra signala Eno-ušesna lokalizacija Lokalizacija virtualnih in realnih zvočnih izvorov s pomočjo enega ušesa Manipulacija spektra signala Zamašitev enega ušesa Osebe gluhe na eno uho ISD – medušesna spektralna razlika Lokalizacija elevacije virtualnih in realnih zvočnih izvorov Enako natančna, če izvorni signal ne vsebuje frekvenc nad 7 kHz Lokalizacija zvočnih izvorov Vpliv spektra signala Odstranjevanje (izravnava) določenih delov frekvenčnega spektra 4 – 16 kHz 4 – 8 kHz, 5.7 – 11.3 kHz in 8 – 16 kHz 4 – 5.7 kHz, 5.7 – 8 kHz. 8 – 11.3 kHz in 11.3 – 16 kHz Ključni faktorji za lokalizacijo niso ozkofrekvenčni (širši od pol oktave) Različne specifične podrobnosti pri različnih osebah Tudi frekvence pod 3 kHz vplivajo na določanje elevacije Lokalizacija zvočnih izvorov Povzetek vpliva spektra Lokalizacija elevacije (vertikalne smeri) Lokalizacija spredaj-zadaj 6-12 kHz 8-16 kHz Lokalizacija elevacije je veliko slabša od lokalizacije azimuta Premiki glave!! Lokalizacija zvočnih izvorov Vpliv glasnosti in trajanja signala Poskus s spreminjanjem časa trajanja testnega signala Čas: 3 ms – 100 ms Zaznavanje azimuta neodvisno Zaznavanje elevacije se izboljšuje sorazmerno s trajanjem do 30 ms, naprej konstantno Glasnost: 26 dB – 63 dB Zaznavanje azimuta neodvisno (razen če je nivo glasnosti na meji slišnega področja) Zaznavanje elevacije se izboljšuje sorazmerno z glasnostjo do 60 dB, potem pa začne naglo upadati!! Lokalizacija zvočnih izvorov Haasov efekt (The Precedence Effect) Človeški slušni organ procesira zvok v oknih dolžine 35ms Analogija: video (16 slik na sekundo – 62ms) Zaznava vsega zvoka v tem oknu je locirana enako Haasov poskus (odboji!) Vpliv amplitude Občutek povečanja amplitude 50ms – 80ms: diskretni dogodki Lokalizacija zvočnih izvorov Določanje razdalje do zvočnega izvora Jakost zvočnega signala Razmerje med energijo direktnega in odbitega vala Predvsem v zaprtih prostorih Spekter signala V zraku jakost pada s kvadratom razdalje (6 dB ob podvojitvi razdalje) Zrak oslabi visoke frekvence (nekaj dB na 100 m) Ovire Medušesne razlike ITD se zelo spreminja z razdaljo Lokalizacija Smerna ločljivost Minimum Audible Angle (MAA) Azimut: ~ 2.0° (navidezni izvori: ~ 4°) Elevacija: ~ 6.0° (navidzeni izvori: ~ 23°) Generacija prostorskega zvoka Dvo-kanalni stereo (2-0) Optimalna konfiguracija: enakostranični trikotnik Generacija prostorskega zvoka Dvo-kanalni stereo Premikanje navideznega izvora s spreminjanjem amplitude L in R signala (15 – 18 dB) Frekvenčna odvisnost!! Premikanje izvora s pomočjo medsebojne zakasnitve signalov Formati signalov L in R M in S M = (L+R) – 3dB ali (L+R) – 6dB S = (L-R) – 3dB ali (L-R) – 6dB “Hot-spot”!! Generacija prostorskega zvoka Prenosna funkcija glave in uhljev Head Related Transfer Function (HRTF) Se izmeri kot impulzni odziv Head Related Impulse Responses (HRIR) 0 Left ear Right ear -5 -10 Amplitude / dB -15 -20 -25 -30 -35 -40 0.5 1 1.5 Frequency / kHz 2 Generacija prostorskega zvoka Prenosna funkcija sistema Merjenje impulznega odziva y (t ) = x(t ) ∗ h(t ) Y (ω ) = X (ω ) H (ω ) Generacija prostorskega zvoka Impulzni odzivi glave (HRIR) Generacija prostorskega zvoka Impulzni odzivi glave Individualni impulzni odzivi Splošni impulzni odzivi Generacija prostorskega zvoka Postopek merjenja Gluha soba Testni signal: 14-bitna sekvenca belega šuma Konstantni amplitudni spekter + naključna faza (IFT) Istočasno predvajanje in snemanje H SIST Izločanje šuma H odz = H vzb Večje število meritev in računanje povprečja Upoštevanje karakteristike merilne opreme Generacija prostorskega zvoka Prenosne funkcije glave Se uporabijo kot FIR filtri za generacijo pr. zv. Študija mehanizma lokalizacije Na voljo v knjižnicah na spletu 0 Left ear Right ear -5 -10 Amplitude / dB -15 -20 -25 -30 -35 -40 0.5 1 1.5 Frequency / kHz 2 Generacija prostorskega zvoka Azimut -90° Azimut -45° Azimut 0° Azimut 90° Azimut 45° Generacija prostorskega zvoka Amplitudni spektri pri različnih elevacijah Generacija prostorskega zvoka Online HRIR knjižnice Nabor FIR sit za različno število prostorskih položajev MIT Media Lab (MIT Boston) CIPIC (University of California) Itakura Različno število vzorcev Odzivi pripadajoče merilne opreme Uporaba: z ϕ φ [ n ] = ∑ z [ n − m] ⋅imp ϕ φ [ m] N −1 desni , , m =1 N −1 desni , , zlevi ,ϕ ,φ [ n ] = ∑ z [ n − m] ⋅implevi ,ϕ ,φ [ m] m =1 Generacija prostorskega zvoka MIT HRTF knjižnica Direktorijska struktura elev-40, elev-30 … elev0 … elev90 Za vsako elevacijo je na voljo 144 sit (72 za vsako uho) Primer: elevacija -20°, azimut 45° Filtra: L-20e045a.wav in R-20e045a.wav Uporaba v orodju Maltab wavread, conv,wavplay, itd. Generacija prostorskega zvoka Pogosti problemi pri uporabi HRIR odzivov Eksternalizacija Slaba informacija o razdalji virtualnih izvorov Slabo dojemanje elevacije Slabo ločevanje smeri spredaj / zadaj Procesorski čas in zmogljivost Filtriranje v realnem času Generacija prostorskega zvoka Modeliranje s filtri IIR Zmanjšanje števila koeficientov Nestabilnost takšnih sistemov Modeliranje z resonatorji 0 -10 -20 Amplituda / dB -30 -40 -50 -60 5 10 15 Frekvenca / kHz 20 Generacija prostorskega zvoka Predvajanje “prostorskih” signalov preko zvočnikov “Hot spot” Večkanalni sistemi Trikanalni (3.0) stereo L, R,C L in R sta lahko postavljena širše (> 30°) Zelo pogosto v starejših kino dvoranah Kompatibilnost z dvo-kanalnim stereo signalom? Govor? Širši kot poslušanja Štirikanalni surround (3.1) LCRS surround Poljubno velik niz zvočnikov, razporejenih okrog poslušalca Skupni mono S (surround) signal na vseh zvočnikih (dekorelacija) Večkanalni sistemi 5.1 kanalni surround (3-2 stereo) Poudarek na sprednji hemisferi (L, R, C), LS, RS Ni predvidena lokalizacija po celotnem prostoru (360°) Konfiguracija L(-30°), R(30°), LS(-100° .. -120°), RS(100° .. 120°) Dipolni zvočniki za LS in RS (usmerjeni pravokotno na poslušalca) Večkanalni sistemi 5.1 kanalni surround (3-2 stereo) .1: LFE (Low Frequency Effects) < 120 Hz Uporaba LFE kanala je opcijska (to je treba upoštevati pri snemanju) Frekvenčna kretnica (uporaba sit) V kino projekcijah je vedno prisoten (subwoofer zvočnik) +10 dB (pri reprodukciji) 80 – 160 Hz Zmanjšane dimenzije zvočnikov za visoke frekvence Se sešteje z LFE kanalom DVD-A, SACD formati Nestandardna uporaba kanalov Višinski kanal (namesto LFE) Dodatna stranska zvočnika (namesto C in LFE) Večkanalni sistemi Drugi večkanalni sistemi 6.1 (dodan RC kanal) 7.1 Dodana CL in CR kanal Dodana RL in RR kanala 8.1, 10.2, itd. Analogni večkanalni sistemi Dolby Stereo Dva zvočna kanala (35mm film) 3.1 sistem (L,C,R,S) S (dodan protifazno v L in R kanal): +90° in – 90° C (dodan sofazno v L in R) Večkanalni sistemi Digitalni večkanalni sistemi Dolby Digital (1994) V vseh kino dovoranah, HDTV, DVD, Blu-ray 5.1 sistem (7.1 od 2012 dalje) AC-3 kodni algoritem (bit rate: 32kbit/s – 640kbit/s) Dolby Digital EX Dolby Digital Live DTS (Digital Theater Systems) SDDS (Sony Dynamic Digital Sound) Matrično dodajanja 6.1 in 7.1 v osnovni 5.1 (po vzoru analogne tehnologije) 7.1 sistem MPEG (Moving Pictures Expert Group)