Der Acoustic Voice Quality Index:
Transcription
Der Acoustic Voice Quality Index:
11.01.2016 Subjektive & objektive Messverfahren zur Stimmdiagnostik Theoretische und praktische Anwendung nach wissenschaftlichen und klinischen Kriterien Ben Barsties 1,2 1 2 Faculty of Medicine and Health Sciences, University of Antwerp, Belgium. Medical School, Hochschule Fresenius University of Applied Sciences, Hamburg, Germany © Ben Barsties Inhalt Stimmdiagnostik nach ELSStandard Bildgebende Messverfahren Vorschläge zur Stimmdiagnostik Fokus Selbstevaluation des Patienten Perzeption Akustik Aerodynamik © Ben Barsties 2 Stimmdiagnostik Multizentrische Stimmuntersuchung Nach dem European Laryngological Society Komittee Videolaryngostroboskopie Perzeption (RBH) Aerodynamica (MPT, PQ) Akustik (Periodizität, Stimmfeld) Selbstevaluation http://www.alpha tron.com http://lovelyleblan c7.wordpress.com http://www.udel.edu http://biologyaweso meness.blogspot.nl/ https://www.adi nstruments.com © Ben Barsties 3 1 11.01.2016 Basisprotokoll der ELS Bestätigung des multidimensionalen Charakters der Stimme Brauchbares Instrument zum Messen von Effekten verschiedener Stimmbehandlungen © Ben Barsties 4 BILDGEBENDE MESSVERFAHREN De Bodt et al. (2008) © Ben Barsties 5 Stroboskopie: Standardisierung Friedrich & Dejonckere (2005) Parameter Normal Pathologisch Randkantenverschiebung 0: Normal: (mind. ½ der sichtbaren Stimmlippenbreite) 1: gering vermindert 2: mittelgradig vermindert 3: aufgehoben (phonatorischer Stillstand) Symmetrie 0: Normal (symm. Schwingungen nach Ort und Phase) 1: gering asym. Schwingungsmuster 2: mittelgradig asym. Schwingungsmuster 3: hochgradig asym. Schwingungsmuster Regularität 0: regulärer Schwingungsablauf 1: gering irregulärer Schwingungsablauf 2: mittelgradig irregulärer Schwingungsablauf 3: hochgradig irregulärer Schwingungsablauf Glottisschluss 0: vollständiger Glottisschluss 1: geringgradig unvollständiger Glottisschluss 2: mittelgradig unvollständiger Glottisschluss 3: hochgradig unvollständiger Glottisschluss Normal: Geringgradig: Mittelgradig: Hochgradig: Arten des unvollständigen Glottisschlusses durchgehender dorsales Spalt Dreieck ovalärer Spalt © Ben Barsties Sanduhrförmig Anteriorer Spalt Irregulär 6 2 11.01.2016 Stroboskopie: Validität Svec & Sram (2011) Patel et al. (2008) © Ben Barsties 7 Stroboskopie: Validität Nachteile Vorteile Dejonckere et al. (2001); Boominathan et al. (2012) Mendelsohn et al. (2013) Cohen et al. (2012) Minimaler Standard zur Visualisierung der Stimmlippenfunktion Niedrige Interbeurteilerzuverlässigkeit: Glottisschluss, Symmetrie & Regularität Nawka & Konerding (2012) Akzeptable Interbeurteilerzuverlässigkeit bei Polypen, Zysten, Noduli & Normale Stimme Bei irreguläre Stimmlippenbewegung kann nur unzureichend der Schwingungsablauf analysiert werden Doellinger (2009); Ziethe et al. (2011); Bonilha et al. (2012); Kendall (2012) Meist verwendete laryngologische Technik Stimmansatz/Absatz, Stimmbrüche und Gesangsmerkmale wie z.B. Registerwechsel & Vibrato sind so nicht messbar © Ben Barsties Doellinger (2009); Ziethe et al. (2011) 8 http://www.iqsol.biz/ Videokymographie • Methode zur eindimensionale Darstellung von Bewegungsabläufen • Das Prinzip: Abbildung von schmalen Bildstreifen aus zeitlich aufeinanderfolgenden Aufnahmen nebeneinander abzubilden • Videokymographie = high-speed camera Tigges et al. (2005) Svec & Sram (2011) Svec & Schutte (2012) © Ben Barsties 9 3 11.01.2016 Videokymographie Svec & Sram (2011) Pimenta et al. (2013) © Ben Barsties 10 Videokymographie: Interpretation Svec et al. (2007) © Ben Barsties 11 Videokymographie: Interpretation Svec & Schutte (2012) © Ben Barsties 12 4 11.01.2016 Videokymographie: Behauchtheit © Ben Barsties 13 Videokymographie: Rauhigkeit Onset phase rough phase change to normal phonation © Ben Barsties 14 Videokymographie: Registerwechsel © Ben Barsties 15 5 11.01.2016 Videokymographie: harter Glottisschlag © Ben Barsties 16 Videokymographie: neue Generation Wang et al. (In Press) © Ben Barsties 17 Videokymographie: Validität Vorteile Sehr genaue Aussage über das Schwingungsmuster (8000 Bilder pro Sek) Nachteile Momentan nach kein Zugang für transnasale Endoskopie Relativ junges Untersuchungsinstrument in der Laryngology (seit 1996) = wenig verbreitet/bekannt Beurteilung nur über einen bestimmten Punkt der Stimmlippe bzgl. der Stimmlippenschwingung © Ben Barsties 18 http://www.iqsol.biz/ 6 11.01.2016 PERZEPTION Beurteilung von Stimmqualität; Aber was ist das? „that attribute of auditory sensation in terms of which a listener can judge that two sounds similarly presented and having the same loudness and pitch are dissimilar (ANSI 1960, p.45) „a poorly defined term that includes all the leftover perceptions after pitch, loudness and phonetic category have been identified. (Titze 1994, p.252) „a ultidi e sio al perceptual construct, in contrast to pitch, loudness and the voiced phonemes that are monodimensional (i.e., for which there is a single correlate: fundamental frequency, intensity and formant frequency, respectively). In contrast to pitch, for example voice quality can not be quantified by a single measure or rating. (Maryn 2010, p.16) © Ben Barsties 19 Messverfahren GRBAS-Skala (Hirano 1981): • Ordinal Skala mit 5 Parametern (Grad, Rauigkeit, Behauchtheit, Asthenie, Anspannung) RBH-Skala (Nawka et al. 1994): • Aus der GRBAS-Skala entwickelt • Ordinal Skala mit nur 3 Parametern (Heiserkeit, Rauigkeit, Behauchtheit) Perzeptive Messverfahren mit hoher Akzeptanz (Carding et al. 2000; Dejonckere et al. 2001; Zraick et al. 2011) CAPE-V (Kempster et al. 2009): • „ The Consenus AuditoryPerceptual Evaluation of Voi e • Analoge Skala mit mind. 6 Parametern (Grad, Rauigkeit, Behauchtheit, Anspannung, Tonhöhe, Lautstärke) © Ben Barsties 20 Perzeptive Schulung mittels RBH-Skala Definition der Stimmparameter in RBH nach Hirano (1981) Heiserkeit: „G ad de Heise keit ode Stimmabnormalität. Allgemeine Stimmabnormalität auf Glottisebene. Rauhigkeit (spezifischer Aspekt): „Ps ho-akustischer Eindruck von Irregularität der Stimmlippenschwingung. Es entspricht der irregulären Fluktuation von F0 und/oder Amplitude der Stimmgebung auf Glottisebene. Behauchtheit (spezifischer Aspekt): „ Ps ho-akustischer Eindruck o Aus aß des Luft e lusts du h die Glottis „ ilde Luft /Tu ule z . © Ben Barsties 21 7 11.01.2016 Perzeptive Schulung mittels RBH-Skala Besonderheiten bei der Beurteilung nach RBH (Nawka & Evans, 2006) Weitere auditive Merkmale zu R und B: Rauhigkeit: Knarren, Multiplophonie, Taschenfaltenstimme (ventrikuläre Phonation), stellenweise auch gepresst Behauchtheit: Aphonie, stellenweise auch der Grad der Erschöpfung/Ermüdung H von RBH kann nie niedriger bewertet werden als einer seiner Komponenten (R oder B); kann aber höher liegen es sei denn: Knarren (Glottal Fry) im Vokalansatz ist regelmäßig zu verzeichnen (ohne weitere Auffälligkeiten) dann: H0 R1 B0 Bei Aphonie keine bewertbare Rauhigkeit, also: H3 R# B3 © Ben Barsties 22 Perzeptive Schulung mittels RBH-Skala Barsties & Maryn (2015) Ordinale Beurteilung; Score: Mittelwert von Text und [a:] Normstimme (NL): M Ankerstimmen: F Ankerstimmen: H1+R1= H1+B1= H2+R2= H2+B2= H3+R3= H3+B3= © Ben Barsties 23 Perzeptive Schulung mittels RBH-Skala Ordinale Beurteilung; Score: Mittelwert von Text und [a:] Heiserkeit: „G ad de Heise keit ode “ti a ei hu g. Allge ei e Stimmabweichung auf Glottisebene. Rauhigkeit (spezifischer Aspekt): „Ps ho-akustischer Eindruck von Irregularität der Stimmlippenschwingung. Es entspricht der irregulären Fluktuation von F0 und/oder Amplitude der Stimmgebung auf Glottisebene. Behauchtheit (spezifischer Aspekt): „ Psycho-akustischer Eindruck vom Aus aß des Luft e lusts du h die Glottis „ ilde Luft /Tu ule z . Normal (0) Geringgradig (1) Mittelgradig(2) Hochgradig (3) Heiserkeit Rauhigkeit Behauchtheit © Ben Barsties 24 8 11.01.2016 Perzeptive Schulung mittels RBH-Skala © Ben Barsties 25 Weitere Parameter zum Stimmklang Parameter zur Stimmklangbeschreibung/Stimmqualität Tonhöhenbrüche Tremor gepresst Glottal Fry Falsetstimme Diplophon Aphon Instabil © Ben Barsties 26 AKUSTISCHE MESSUNGEN Sound pressure level (dB/Hz) http://vendjs.com 60 40 20 5000 0 Frequency (Hz) © Ben Barsties 27 9 11.01.2016 Warum akustische Messungen (Teil 1) Im Vergleich zur Perzeption: Keine große Variabilität in der Zuverlässigkeit (Bele 2005) Keine Einschränkung der Genauigkeit von auditiver Gedächtnisleistung (Bigelow & Poremba 2014) Geringerer Aufwand für valide und zuverlässige Ergebnisse in der Beurteilung Objektive-apparative Quantifizierung von visuellerperzeptiver Darstellung Nicht invasiv Relativ einfach anwendbar in Bezug auf Hardware, Software & Abnahmeprozedur © Ben Barsties 28 Warum akustische Messungen (Teil 2) Niedrige Kosten der Software, jedoch weniger gebrauchsfreundlich Einfache und deutliche Standardisierung Robuste und valide Verfahren zur Quantifikation von Heiserkeit z.B. Acoustic Voice Quality Index (AVQI) (Maryn et al. 2010a) Robuste und gängige Verfahrensweisen bei der Quantifikation des Stimmstatus z.B. Dysphonia Severity Index (DSI) (Wuyts et al. 2000) Das häufigste verwendete Messverfahren um Stimmstörungen zu identifizieren (Roy et al. 2013) © Ben Barsties 29 Nachteile: akustische Messungen? Oftmals nur für wissenschaftliche Zwecke entwickelt Hohe Kosten von gebrauchsfreundlicher Software Dutzende verschiedene Systeme (keine eindeutigen Standards) Limitierte Verwendung durch verschiedene Betriebssysteme Vielzahl von akustischen Methoden (z.B. Buder 2000), aber el he si d die „ este ?( z.B. Maryn et al. 2009) © Ben Barsties 30 10 11.01.2016 Anforderungen an das Messsystem Hardware und Software Technische Anforderungen an das Mikropfon (Barsties 2012) Sofware: Samplerate (Abtastrate-Einstellung während der Aufnahame) (Barsties & De Bodt 2015) Aufnahmeverhältnisse: Umgebungsgeräusche (Barsties 2012) Phonationsweise des Patienten (Barsties & De Bodt 2015) Welche Kosten sind zu erwarten? © Ben Barsties 31 Hardware • Mikrofon 1. 2. 3. 4. 5. 6. 7. (Barsties 2012) Kondensatormikrofon Nierencharakteristik Frequenzumfang 20-20.000 Hz flacher Frequenzkurvenverlauf von 2 dB Äquivalenzschalldruckpegel unterhalb von 25 dB (A) Max. Lautstärke von min. 126 dB mit 3% Klirrfaktor Hohe Empfindlichkeit • Digitalisierungsmedium Noch keine eindeutigen Standards bekannt © Ben Barsties 32 Hardware www.wikipedia.org Quelle: AKG © Ben Barsties 33 11 11.01.2016 Software Deliyski et al. (2005) Einstellungen der Samplerate: nicht unter 26 kHz Beispiel mit 44,1 kHz (Standard) Beispiel mit 22,05 kHz Beispiel mit 8 kHz © Ben Barsties 34 Software Einstellungen der Tonhöheneinstellung (bei Stimmgesunden): 70 Hz - 250 Hz für Männer und 100 Hz – 300 Hz für Frauen Vogel & Morgan (2009) © Ben Barsties 35 Aufnahmeverhältnisse • Umgebungsgeräusche (Barsties 2012) Allgemein unterhalb von 50 dB (C) Signal-Noise-Ratio (SNR) zwischen 30-42 dB (A) BSP: Bei 75 dB gemessener Phonationslautstärke sollten die Umgebungsgeräusche nicht lauter sein als max. 45 dB(A) (besser bei 33 dB (A)) © Ben Barsties 36 12 11.01.2016 Aufnahmeverhältnisse • “N‘ Beispiel… Min.30 dB (A) = 35,01dB(A) Optimal 42 dB (A) © Ben Barsties 37 Was ist der Preis? 1. Mikrofon http://bartus.org 2. Degitalisierungsmedium http://www.xhtml-css-code.com http://www.eijndhoven.net © Ben Barsties 38 Kosten-Model-Variante 1 Bügelmikrofon (mit XLR Anschluss) ab 109€ http://bartus.org + (meistens) Adapter für mini-XLR>XLR ab 64€ + Mischpult www.akg.de ab 99 € www.behringer.com = ca. 272€ © Ben Barsties 39 13 11.01.2016 Kosten-Model-Variante 2 Bügelmikrofon (mit XLR Anschluss) ab 109€ http://bartus.org + Battery power supply ab 58€ www.akg.de + XLR Kabel nach stereo mini-jack ab 8€ www.thomann.de + externe Soundkarte ab 55 € www.soundblaster.com = ca. 230€ © Ben Barsties 40 Kosten-Model-Variante 3 (Empfehlung der Vlaamse Vereniging voor Logopedisten [VVL]) www.vvl.be AKG C544l + AKG MPA V L + Focusrite iTrack Solo = ca. 289€ (for VVL-members: 251,75€) © Ben Barsties 41 Kalibrierung Kalibrierung der Intensität Nur entscheidend für Aussagen zur habituellen Intensität oder exakter Wiedergabe für SPL-Werte Sorgt ebenfalls für die korrekte Einstellung zur Sensitivität zwischen Stimmsignal, Hardware und Software Anleitung zur Kalibrierung siehe Winholz & Titze 1997 Winholtz & Titze 1997 © Ben Barsties 42 14 11.01.2016 Multiparametrische Indizes Kombination aus verschiedenen Parametern zu einem gewichteten Model (auf statistischer Basis!) Höhere Zuverlässigkeit und Validität zu wissenschaftlich kontrollierter Perzeptionsbeurteilung als Einzelparameter (Schönweiler et al. 2000; Wuyts et al. 2000; Schönweiler et al. 2001; Awan et al. 2006; Linder et al. 2008; Awan et al. 2009; Awan et al. 2010; Godino-Llorente et al. 2010; Maryn et al. 2010a) Quantifizierung des Schweregrads einer Dysphonie Fokus auf 2 bewerte Methoden: 1. Acoustic Voice Quality Index (AVQI) seit 2010 2. Dysphonia Severity Index (DSI) seit 2000 © Ben Barsties 43 Auditiv-perzeptives Urteil • Beurteiler Experiment mit 3 Audiobeispielen (Barsties & Maryn 2012) Beurteilen Sie die fortlaufende Sprache & angehaltene Phonation zusammen und mitteln Sie Ihr Resultat, sodass Sie zu einem ordinalen Urteil gelangen. Beurteilen Sie nur das H von RBH: 0=normal, 1=leicht gestört, 2= mäßig gestört, 3= schwer gestört Hmittelwert von 5 Beurteilern= Hmittelwert von 5 Beurteilern = Hmittelwert von 5 Beurteilern = © Ben Barsties 44 Perzeptive Beurteilung: Einflussfaktoren Category Factors affecting reliability Reference Listener Panel size Internal factors (e.g. lapses in memory, attention, fatigue, and mistakes) Bele (2005) Kreiman et al. (1993), Gerratt et al. (1993), Kreiman et al. (1990), Kreiman et al. (1992), Pfützer & Barry (2004), Sofranko & Prosek (2012); Misono et al. (2012) professional background of the raters between e.g. otolaryngologists, speech- Sofranko & Prosek (2012), Pfützer & Barry (2004) language-pathologists, singing voice teacher or phonetic teacher judgment experience of the raters Stimulus listener bias in the knowledge of medical diagnosis background of a voice Eadie et al. (2011) musical background of the raters listener agreement/reliability improved after training of native listeners, undergraduate speech-language-pathologists, or graduate speech-language pathologists Eadie et al. (2010) restrict recognition memory in the auditory modality Bigelow, & Poremba, 2014 Chan & Yiu (2002), Chan & Yiu (2006), Chan et al. (2012), Iwarsson et al. (2012), Eadie, & Baylor (2006) more disagreement among slightly and moderate voice disorders than in normal Kreiman et al. (1993), Gerratt et al. (1993), Kreiman & Gerratt (2000) voices or extreme cases of voice quality Gerratt et al. (1993), Chan & Yiu (2002), uses or disuse of anchor voices (i.e., reference pattern) Awan & Lawson (2009), Eadie & Kapsner-Smith (2011) drift in ratings caused by perceptual context (e.g. after hearing a number of slightly Kreiman et al. (1992) severe pathological voices, the rating for a moderate severe pathological voice become more severe through a shift of the internal standard from the listener) Task Wuyts et al. (1999) visual analog- or ordinal-scale © Ben Barsties 45 15 11.01.2016 Der Acoustic Voice Qualtiy Index (AVQI) • verbindet als erster Index gehaltene Phonation und fortlaufende Sprache für die allgemeine Stimmqualität einer Sprechstimme = ecological validity • multiparametrisches Konstrukt auf Basis linearer Regressionsstatistik mit auditiv-perzeptiven Durchschnittswerten vom Grad der Heiserkeit als Beurteilerkriterium • Freewareprodukt • Vollständig in Praat © Ben Barsties 46 Entwicklung von AVQI © Ben Barsties 47 Entwicklung von AVQI © Ben Barsties 48 16 11.01.2016 Entwicklung von AVQI © Ben Barsties 49 Korrelation zwischen AVQI und H-RBH Studien Aufnahmesystem Anzahl: Stimmen Anzahl: Beurteiler Intrarater (IaRR) – und Interrater (IeRR) reliability Maryn et al. (2010a) Kay Pentax CSL 4500 & AKGC420 250 5 außreichende IaRR & IeRR (Kappa >0.40/0.41) rs = 0.78 Maryn et al. (2010b) Kay Pentax CSL 4500 & AKGC420 39 5 außreichend IeRR (ICC= 0.92/ICC= 0.698) rs = 0.796 Spearman Korrelation Barsties & Maryn (2012) Voice Profiler 4.2 von Alphatron 61 5 außreichende IeRR Kappa ≥ . and ICC ≥ .7 rs = 0.79 Reynolds et al. (2012) H2 Zoom Corporation & Røde electret mic 107 2 außreichende IaRR & IeRR (Kappa > 0.41) rs = 0.794 Maryn et al. (2014) Kay Pentax CSL 4500 & AKGC420 300 3 außreichende IaRR & IeRR (ICC > 0.75) rs = 0.826 Barsties & Maryn (2015) Kay Pentax CSL 4500 & AKGC420 60 5 außreichende IaRR & IeRR (Kappa > 0.41) rs = 0.905 Maryn et al. (In Press) Kay Pentax CSL 4500 & AKGC420 56 5 Tolerierbare IaRR &IeRR (ICC=0.712 & ICC=0.743) rs = 0.911 Kankare et al. (2015) Focusrite iTrack Solo, AKG MPA & AKG C544l 50 5 außreichend IeRR (Kappa > 0.41) rs = 0.809 Uloza et al. (In Submission) External sound card MAudio, AKG Perception 220 185 5 außreichende IaRR & IeRR (Kappa > 0.41) rs = 0.852 Hosokawa et al. (In Submission) DA system of a linear PCM recorder (H4n, Zoom), SE-50 Samson 336 5 außreichende IaRR (Kappa > 0.41) & tolerierbare IeRR (Kappa = 0.37) rs = 0.828 © Ben Barsties 50 Der wissenschaftliche Wert von AVQI Meta-Analyse (Rosenfeld, 2004): Eine Form vom lite atu e e ie u systematisch Studien zu filter, zu bewerten und zu kombinieren ,um Bias zu reduzieren Es ermöglicht die kombinierte statistische Erkennung und Bewertung der relevanten Studien mit einer Effektstärke einzuschätzen Meta-Analyse Programm version 5.3 (Ralf Schwarzer, Department of Psychology, Freie wie beschrieben in Maryn et al. (2009) Universität Berlin, Germany) wurde verwendet, Meta-Analyse Outcome AVQI vs. HMittelwert Anzahl d. Studien N 10 1444 Weigthed mean r (Effektstärke) 0.823 © Ben Barsties Homogenität oder Heterogenität der Effektstärke Homogen (residual SD< 0.206) 51 17 11.01.2016 Klinische Implementierung von AVQI • Ursprünglich für die NL/BEL Population entwickelt: Seit September 2013, neue Gesundheitsreform in Belgien (Vlaanderen) für Stimmpatienten • Momentan geltende klinische Richtlinien für AVQI 02.02: Threshold in Niederländisch: < 2.95/2.91 Threshold in Deutsch: < 2.70 Threshold in Englisch: < 3.27 Threshold in Finnisch (vorläufig): < 2.35 Threshold in Englisch (pädiatrisch): < 3.46 Threshold in Französisch: < 3.07 Threshold in Litauisch: < 2.97 Threshold in Japanisch: < 3.15 Test-Retest: 0.54 © Ben Barsties 52 Wie kann ich AVQI verwenden? Freeware Programm: Praat download (min. Version: 5.3.57): http://www.fon.hum.uva.nl/praat/ Download Praat Skript (kostenlos): http://www.vvl.be/documenten-en-paginas/praat-script-avqi-v0202 Implementieren des Praat-Skripts via: Praat > Open Praat s ipt > File > Add to d a i e u… > In Command box: Namensgebung, z.B. Acoustic Voice Quality Index > OK © Ben Barsties 53 © Ben Barsties 54 18 11.01.2016 Kurzzusammenfassung der AVQI-Analyse 1. Praat öffnen und Aufnahme starten (New > record mono sound), beginnend mit fortlaufender Sprache (Namensgebung: cs . Te t: Einst stritten sich Nordwind und Sonne, er on ihnen beiden ohl der Stärkere äre‘ 2. Aufnahme in Praat speichern: “a e to list 3. Namensänderung im Aufnahmefeld, z.B. aa 4. Aufnahme der angehaltenen Phonation für ca. 4-5 seconds (wenn möglich). Beachten Sie, dass Stimmansatz und Absatz nicht auf der Aufnahme sind! Ausnahme wenn die Phonation <3 Sek. 5. Aufnahme in Praat speichern: “a e to list a d lose 6. Erste Aufnahme öffnen (View & Edit) und wenn nötig Stille Momente oder Rauschen etc. am Anfang und Ende des Textes löschen (markieren und STRG+X) 7. Öffnen Sie die Zweite Aufnahme und klicken Sie relativ nah am Anfang > Select > Select > Addieren +3 und Ergebniss i e d of sele tio übernehmen> OK > File > Extract selected sound (time from 0) 8. Das neue Praat file in Praat Objects, neuer Na e: sv 9. AVQI Button klicken und fertig! © Ben Barsties 55 Dysphonia Severity Index (DSI) Maßstab für Stimmeffizienz durch sensibler Paramater für die Bewertung einer Dysphonie Messwerte zur Berechnung Setzt sich aus einer gewichteten Kombination folgender vier Messwerte zusammen: 1. 2. 3. 4. Maximaler Phonationszeit/Tonhaltedauer (MPT) Höchster Ton (F0-hoch) Niedrigste Lautstärke/Intensität (I-min) Jitter% Formel basiert auf Kay Pentax Produkten und ist nicht allgemein kompartibel für andere Softwareprodukte, da es zu größeren Abweichungen kommt (Aichinger et al. 2012) © Ben Barsties 56 Dysphonia Severity Index (DSI) Formel mit Kay Pentax (Wuyts et al. 2000): DSI = 0.13*MPT + 0.0053*F0-hoch – 0.26*I-min – 1.18*Jitter% + 12.4 Formel mit Praat: DSI2 = ((9.476 + (0.14*MPT) - (0.0329*I-min) + (0.0045*F0-hoch) (4.53*Jitter-ppq5))*1.17) - 9.96 Korrelation zwischen beiden Verfahren: r=0.86 Normwerte (Barsties 2012): © Ben Barsties 57 19 11.01.2016 Wie kann ich den DSI verwenden? Freeware Programm: Praat download: http://www.fon.hum.uva.nl/praat/ Download Praat Skript (kostenlos): http://www.vvl.be/documenten-en-paginas/praat-script-dsi-v0201 Implementieren des Praat Skripts via: Praat > Open Praat s ipt > File > Add to d a i e u… > In Command box: Give a name, e.g. Dysphonia Severity Index > OK © Ben Barsties 58 Script: Youri Maryn, PhD DYSPHONIA SEVERITY INDEX (DSI) IN PRAAT, v.02.01 Maximum phonation time: 24.00 s DSI: 4.32 Softest intensity of voiced speech: 71.69 dB -5 -4 -3 -2 -1 0 1 2 3 4 5 Maximum fundamental frequency: 591.64 Hz Jitter ppq5: 0.21 % © Ben Barsties 59 Kurzzusammenfassung der DSI-Analyse 1. Praat öffnen und neue Aufnahme (New > record mono sound) a. Angehaltenen Phonation [a:] von 4-5 Sek. ohne Stimmansatz und Stimmabsatz aufnehmen, Name z.B: AA; “a e to list b. So leise [a:] wie möglich phonieren lassen, (wichtig Kalibrierung ea hte , Na e: „il ; “a e to list c. Ma i ale Pho atio szeit [a:] auf eh e ; “a e to list d. “o ho h ie ögli h [a:], Na e: „fh ; “a e to list & close 2. AA Datei öffnen und 3 sec selektieren wie in Schritt 7 bei AVQI erklärt a. Die neue Datei in Praat O je ts u e e e i „ppq 3. MPT bestimmen: Sek. Dauer der Stimmaufnahme über Oszilogramm bestimmen 4. DSI Skript öffnen (falls nötig Kalibrierungsformel auswählen), Sek. Dauer de MPT ei füge u d „OK aus ähle u d fe tig! © Ben Barsties 60 20 11.01.2016 Habituelle Tonhöhe (Fo-hab) Synonyme: mittlere-, modale Sprechstimmlage oder fundamentale Frequenz (Fo) sowie im engl. der Beg iff „speaking fundamental frequency SFF/SFo) Definition: Der Frequenzbereich in der Sprachmelodie, der während des Sprechens am meisten vorkommt und somit die individuelle Tonhöhe auszeichnet Indifferenzlage: statistisch definierter Normbereich der mittleren Sprechstimmlage: M: zwischen F/G und c (87/98–131 Hz); F: zwischen f/g und c1 (175/196–262 Hz) Mehrere Methoden möglich: Text Lesen, Spontansprache, Vokale, Reihensprechen Berechnungsform: Modus oder Median Aufnahmedauer: ca. 60 Sek. Barsties (2013) © Ben Barsties 61 © Ben Barsties 62 Habituelle Intensität/Lautstärke (I-hab) Synonyme: mittlere-, modale Sprechlautstärke, im engl. Sound Pressure Level (SPL) Definition: Der Lautstärkenbereich in der Sprachmelodie, der während des Sprechens am meisten vorkommt und somit die individuelle Lautstärke auszeichnet Indifferenzlage: statistisch definierter Normbereich der I-hab: M/F: 65-75 dB (wobei von dB(C) ausgegangen wird) bei einen (kalibrierten) Abstand von 30 cm Mehrere Methoden möglich: Text Lesen, Spontansprache, Vokale, Reihensprechen Nawka & Wirth (2008) © Ben Barsties 63 21 11.01.2016 © Ben Barsties 64 Allgemeine Tipps und Spielregeln Nie das Gehör ausschalten, sondern immer die Repräsentativität überprüfen!!! Lautstärke und Tonhöhe: HABITUELL!!! (wenn nicht anders gefordert) Während der Aufzeichnung: frei beweglicher Pegel im grünen Be ei h oh e „Clippi g Umgebungslärm beachten (siehe z.B. Barsties, 2012) Kein Stimmansatz oder Stimmabsatz in der Aufzeichnung bei gehaltener Phonation für Stimmqualitätsanalysen (z.B. AVQI, DSI) © Ben Barsties 65 Breit- und Schmalbandspektrographie Behrman (2007) © Ben Barsties 66 22 11.01.2016 Breit- und Schmallbandspektrographie Behrman (2007) © Ben Barsties 67 Quiz: glottale Stimmklangbeschreibung Barsties et al. (In Press) © Ben Barsties 68 Quiz: glottale Stimmklangbeschreibung Barsties et al. (In Press) © Ben Barsties 69 23 11.01.2016 Quiz: glottale Stimmklangbeschreibung Barsties et al. (In Press) © Ben Barsties 70 Quiz: glottale Stimmklangbeschreibung Barsties et al. (In Press) © Ben Barsties 71 Quiz: glottale Stimmklangbeschreibung Barsties et al. (In Press) © Ben Barsties 72 24 11.01.2016 Quiz: glottale Stimmklangbeschreibung Barsties et al. (In Press) © Ben Barsties 73 Quiz: glottale Stimmklangbeschreibung Barsties et al. (In Press) © Ben Barsties 74 Quiz: glottale Stimmklangbeschreibung Barsties et al. (In Press) © Ben Barsties 75 25 11.01.2016 Quiz: glottale Stimmklangbeschreibung Barsties et al. (In Press) © Ben Barsties 76 Stimmtypenklassifizierung nach Sprecher et al. (2010) © Ben Barsties 77 Stimmtypklassifizierung nach Sprecher et al. (2010) • • • • • • Software: Praat Einstellungen: window length= 0.05s, time step=0.002s, frequency step= 5 Hz, dynamic range= 40 dB, Hamming window Type 1: Dieser Typ ist periodisch ohne größere Veränderungen oder Subharmonische. Es zeigen sich viele klar definierte Harmonische, bei der die Anzahl oder der Abstand der Harmonischen variieren kann. Die Harmonischen-Strukturen sind nahezu gerade. Eine geringe Menge von Rauschen zwischen den Harmonischen ist erlaubt, sofern ihre Deutlichkeit sich in reduzierter Form im Vergleich zu der Energie/Intensität der Harmonischen deutlich abgrenzt. Type 2: Dieser Typ beinhaltet stärkere Veränderungen, Bifurkation (wellenförmig, ungerade Bewegungsstruktur der Harmonischen mit vorübergehenden Perioden von Chaos/Turbulenz), oder Subharmonische bei dem jedoch das Signal im Großen und Ganzen periodischer Art ist. Ebenfalls weißt dieser Spektrogrammtyp viele Harmonische auf und das Inter-HarmonischeRauschen formt deutlich definierte Subharmonische mit vergleichbarer Energie/Intensität wie die Grundfrequenz. Diese Subharmonischen treten oftmals mit Unterbrechungen auf. Type 3: Dieser Typ definiert sich durch chaotische Signale mit begrenzter Dimension, bei der die “ig ale ei „Ve s h ie e de E e gie z is he de Ha o is he auf eist. Die Grundtonfrequenz und mindestens 1 bis 2 Harmonische sind aber noch deutlich zu definieren. Höhere Frequenzstrukturen sind verschleiert mit verstreuter Energie. Die Bandstruktur ist limitiert und die Energie ist konzentriert auf die niedrigen Frequenzen (meistens bis 1500 Hz). Type 4: Dieser Typ kann noch eine Grundfrequenz aufweisen, obwohl die meisten Spektrogramme dieser Art keine haben (Aphonie). Im Vergleich zu Type 3 beinhaltet Type 4 einen g öße e U fa g o „Ve s h ie u g de E e gie o F e ue ze , e glei h a ie ei weißen Rauschen im Breitband. © Ben Barsties 78 26 11.01.2016 Stimmtypenklassifizierung nach Sprecher et al. (2010) spektrographischen Stimmtypenklassifizierung H von RBH rs 2 rs unerfahrener Beurteiler 0,705 0,50 erfahrener Beurteiler 0,688 0,47 Mittelwert der 2 Beurteiler 0,746 0,56 spektrographischen R von RBH Stimmtypenklassifizierung rs 2 rs unerfahrener Beurteiler 0,375 0,14 erfahrener Beurteiler 0,296 0,09 Mittelwert der 2 Beurteiler 0,370 0,14 spektrographischen B von RBH Stimmtypenklassifizierung rs 2 rs unerfahrener Beurteiler 0,683 0,47 erfahrener Beurteiler 0,721 0,52 Mittelwert der 2 Beurteiler 0,741 0,55 Alle Korrelationswerte sind hoch signifikant (p < 0,01), bei n= 300 Barsties et al. (In Press) © Ben Barsties 79 Realtime Biofeedback für MAC – Freeware http://www.unc.edu/~rhwiley/wildspectra/ http://www.arizona-software.ch/audioxplorer/ © Ben Barsties 80 Realtime Biofeedback für Win – Freeware https://www.phon.ucl.ac.uk/resource/sfs/rtgram/ © Ben Barsties 81 27 11.01.2016 Realtime Biofeedback für MAC/Win - Shareware https://www.estillvoice.com/products/ © Ben Barsties 82 Stimmfeld/Voice Range Profile vom dynamischen Umfang der relatiert an der Funktion des Grundtons Ein Stimmfeld ist die graphische Wiedergabe Stimme, Pabon (1991) © Ben Barsties 83 Manuell vs. automatisch Manuelle Stmmfeld sind meist kleiner als die Computerunterstützenden Verfahren Schutte (1986) Computerunterstützde Stimmfelder z.B. der Voice Profiler von Alphatron oder hier an der HS Fresenius: Lingwaves von Wevosys © Ben Barsties 84 28 11.01.2016 Einflussfaktoren: interne Faktoren Persönlichkeit Übung Motvation bei der Testabnahme Laryngeale Konstitution Alter Geschlecht Medikation Stimmpathologie Proband/Patient © Ben Barsties 85 Einflussfaktoren: externe Faktoren Coleman (1993) Testmaterial Wahl der Vokale Dauer der angehaltenen Phonation Stimmqualitätsfaktoren Aufwärmen der Stimme vor Testabnahme Tageszeitpunkt Instrumentent & Umgebung Akustik des Untersuchungsraums Abstand des Mikrofons Abbrechkriterien © Ben Barsties 86 Parameter des Stimmfeldes Lautstärke/Intensität, dB Tonhöhe/Frequenz, Hz Form & Oberfläche © Ben Barsties 87 29 11.01.2016 Register im Stimmfeld Modalregister/Bruststimme Glottal Fry/Pulsationsregister Pfeifregister Falsetregister/Kopfstimme © Ben Barsties 88 Norm-Stimmfelder 1 Heylen (1997) Frauen und Männer © Ben Barsties 89 Norm-Stimmfelder 2 Mädchen und Jungen Heylen (1997) © Ben Barsties 90 30 11.01.2016 Pathologische Stimmfelder 1 Mittelgroßes Stimmfeld: Geringer melodischer Umfang Dynamischer Umfang akzeptabel Schutte (1986) Schutte (1986) Kleines Stimmfeld: Geringer melodischer Umfang Geringer dynamischer Umfang © Ben Barsties 91 Pathologische Stimmfelder 2 Schutte (1986) Dyscongruentes Stimmfeld: Schmal, aufsteigendes Stimmfeld Einschränkungen in der Lautstärke bei hohen+leisen Tönen und lauten+tiefen Tönen Großer melodischer Umfang © Ben Barsties 92 Normwerte nach ELS Friedrich & Dejonckere (2005) © Ben Barsties 93 31 11.01.2016 © Ben Barsties 94 Abnahme: Stimmfeld Bewährtes klinische Verfahren auf [a:]: 1. Habituelle Stimme [Gewöhnung an die Visualisierung; Biofeedback] 2. So tief wie möglich phonieren (gleitend, z.B. Seufzen) 3. So leise wie möglich (rundum der MSSL) 4. Unterste Kontur (so leise wie möglich Gleitton steigend in Tonhöhe bis Maximum) 5. Tiefe+laute Töne (Maximum), aber nur im Modalregister 6. Gleitton mit maximaler Leistung (laut+hoch steigend) 7. Gedachte oberste Kontur grob vervollständigen Einzelne Frequenzen vorgeben, wenn nötig um die Kontur zu vervollständigen © Ben Barsties 95 Aussagekraft: Stimmfeld Informiert über(Airainer & Klingholz 1991; Riedmüller et al. 2010): Stimmfunktion (Leistungsmerkmale) Möglichkeit für eine Bestätigung einer Stimmstörung, durch z.B. sensible Parameter wie F0-hoch und I-min Stimmstatus Objektive intra-individuelle Vergleiche zum Stimmstatus durch einer Test-Retest Situation Erweiterung auf Sprechstimmfeld (Speech-Range-Profile) und Rufstimme © Ben Barsties 96 32 11.01.2016 AERODYNAMIK Bedeutsamkeit für laryngeale Effizienz (Bless, 1991) Luftstrom Luftdruck Luftvolumen Veränderungen in diesen Parametern können die Funktion der Stimmlippenschwingung beeinflussen © Ben Barsties 97 Max. Tonhaltedauer/Phonationszeit Prozedur Auf dem Vokal [a:] so lange wie möglich phonieren Mind. 2x wiederholen Messung mit einer Stoppuhr oder via akustischer Aufnahme (z.B. Oszillogramm) die Länge in Sek. messen MPT-Wert = max. Wert oder Durchschnittswert aus der Messreihe Normwerte (nach ELS): © Ben Barsties 98 Max. Tonhaltedauer/Phonationszeit Während der Messung berücksichtigen Phonation auf MSST und MSL Mit Glottisschlag beginnen Atemtypus irrelevant Motivieren um so lang wie möglich zu phonieren (verbal oder non-verbal) © Ben Barsties 99 33 11.01.2016 Max. Tonhaltedauer/Phonationszeit © Ben Barsties 100 Phonationsquotient (PQ) Prozedur Vital Kapazität (VK) messen in ml oder L Abnahme der VK z.B. mit einem Spirometer Max. Tonhaltedauer als 2. Parameter PQ = VC(ml oder l) / MPT(Sek.) Schneider & Biegenzahn (2007) Normwert (nach ELS): © Ben Barsties 101 SELBSTEVALUATION Selbstbewertung der Stimme durch den Patienten anhand von standardisierten Fragebögen Voice Handicap Index (VHI) überprüft den Einfluss der Stimmstörung auf das alltägliche Leben und gilt als psychosoziales Evaluationsmittel (Jacobson et al. 1997): VHI-30 (sowie VHI-12,VHI-10, etc.) ist Gradmesser einer Dysphonie singingVHI [sVHI] (nach Cohen et al. 2007 und Morsomme et al. 2007) ist Gradmesser für eine Dysodie pediatricVHI [pVHI] (nach Zur et al. 2007) ist Gradmesser für eine pädiatrische Dysphonie ebenso für Transgender Stimmen und NEU für Stimmermüdung © Ben Barsties 102 34 11.01.2016 Voice Handicap Index-30 30 Fragen-/Problemstellungen, die der Patient bewertet Unterteilung in 3 Subskalen P= Ph sis h z.B. „De Kla g ei e “ti e ä de t si h i Laufe des Tages. F= Fu ktio ell z.B. „I h e utze das Telefo selte e als i h ö hte. E= E otio al z.B. „Mei “ti p o le ä ge t i h. 5 Punkte-Skala: (0=nie, 1=fast nie, 2=manchmal, 3=fast immer, 4=immer), Pro Themenkategorie können max. 40 Punkte angegeben werden Der Gesamtwert (VHI-T) beträgt max. 120 Punkte © Ben Barsties 103 VHI Normierung Gesundheitsbezogene Lebensqualität (Außenkriterium gemessen mit SF-36 Health Survey) in Abgrenzung von stimmgesunden Personen VHI-T Werte Grad 0-11 Sicher unauffällig 12-28 Eher unauffällig 29-56 Eher auffällig 57-120 Sicher auffällig Gräßel et al. (2008) Barsties (2012) © Ben Barsties 104 Digital VHI Gratis verfügbar: in 20 Sprachen, die wissenschaftlich evaluiert wurden! PLUS 2 Sprachen: Serbisch und Japanisch folgen in kürze http://homepage.univie.ac.at/christian.herbst//DigitalVHI/index.php?lang=EN &page=home © Ben Barsties 105 35 11.01.2016 Singing Voice Handicap Index Autor Publikationsjahr Sprache Stichprobe Testgruppe Population Skala Subskalen Totalwert Morsomme et al. 2007 Französisch 192 Sänger: 54 mit Stimm-störungen, 138 ohne Stimmstörungen 27 nicht-Sänger ohne Stimmstörungen Klassik Gesang 5-Punkte Likertskala 3 0-120 VHI adapted to Swedisch singers (RHI-s) Lamarche et al. 2010 Schwedisch 96 Sänger Stimmstörungen ohne 30 Sänger mit Stimmstörungen Diverse Gesangsstile 5-Punkte Likertskala 3 0-120 VHI aangepast aan de zangstem D haeselee et al. 2011 Niederländisch 85 Sänger Stimmstörungen ohne 5 Sänger mit Stimmstörungen Klassik Gesang 5-Punkte Likertskala 3 0-120 VHI angepasst an die Gesangstimme Barsties et al. 2015 Deutsch 20 Sänger Stimmstörung mit 93 Sänger ohne Stimmstörungen Diverse Gesangsstile 5-Punkte Likertskala 3 0-120 SVHI Cohen et al. 2007 Englisch 2009 Englisch Diverse Gesangsstile Diverse Gesangsstile 5-Punkte Likertskala 5-Punkte Likertskala 0-100 Cohen et al. 129 Sänger ohne Stimmstörungen 99 Sänger ohne Stimmstörungen 0 SVHI-10 112 Sänger mit Stimmstörungen 1. Gruppe: 297 Sänger mit Stimmstörungen 2. Gruppe: 91 Sänger mit Stimmstörungen 0 0-100 SVHI Garcia-López et al. 2010 Spanisch 2013 Deutsch 2014 Italienisch 5-Punkte Likertskala 5-Punkte Likertskala 5-Punkte Likertskala 0-100 Baracca et al. Klassik Gesang Diverse Gesangsstile Diverse Gesangsstile 0 SVHI 81 Sänger ohne Stimmstörungen 130 Sänger ohne Stimmstörungen 97 Sänger mit Stimmstörungen 0-100 Lorenz et al. 29 Sänger Stimmstörungen 54 Sänger Stimmstörungen 117 Sänger Stimmstörung 0 SVHI 0 0-100 VHI adapté chanteurs aux Kontrollgruppe mit mit ohne © Ben Barsties 106 Pediatric Voice Handicap Index Autor Publikationsjahr Sprache Skala Testgruppe Kontrollgruppe Subskalen Totalwert Zur et al. 2006 Englisch 33 Eltern von Kindern mit subglottaler Stenosis und zw. 4-21 Jahre waren Stichprobe 45 Eltern von Kindern ohne Dysphonie, wovon 21J & 24M und zw. 3-12 Jahre waren 5Punkte 3 0-92 Bylund & Eriksson 2010(Masterthesis) Schwedisch 13 Eltern von Kindern mit Dysphonie, die zw. 3-11 Jahre waren 29 Eltern von Kindern ohne Dysphonie, die zw. 3-11 Jahre waren 5Punkte 3 0-92 Ceuppens 2011 Niederländisch 36 Eltern von Kindern mit Dysphonie, wovon 20J & 16M, zw. 5-12 Jahre waren 83 Eltern von Kindern ohne Dysphonie, wovon 39J & 44M, die zw. 5-12 Jahre waren 5Punkte 3 0-92 Schindler et al. 2011 Italienisch 30 Eltern von Kindern mit Dysphonie, wovon 27J & 3M, zw. 3-11 Jahre waren 43 Eltern von Kindern ohne Dysphonie, wovon 30J & 13M, die zw. 3-13 Jahre waren 5Punkte 3 0-92 Shoeib et al. 2012 Arabisch 50 Eltern von Kindern mit Dysphonie, wovon 32J & 18M, zw. 5-15 Jahre waren 75 Eltern von Kindern ohne Dysphonie, wovon 33J & 42M, die zw. 4-15 Jahre waren 5Punkte 3 0-92 Park et al. 2013 0-92 Hebräisch 3 0-92 Sanz et al. 2015 Spanisch 3 0-92 Devadas et al. 2015 Malayalam 5Punkte 5Punkte 5Punkte 5Punkte 5Punkte 3 2015 60 Eltern von Kindern ohne Dysphonie, wovon 29J & 31M, die zw. 7-12 Jahre waren 111 Eltern von Kindern ohne Dysphonie, wovon 78J & 33M, die zw. 3-12 Jahre waren 83 Eltern von Kindern ohne Dysphonie, die <14 Jahre waren 44 Eltern von Kindern mit Dysphonie, wovon 26J & 18M, die zw.4-12 Jahre waren 79 Eltern von Kindern mit Dysphonie, wovon 50J & 29M, die zw. 4-12 Jahre waren 0-92 2015 41 Eltern von Kindern mit Dysphonie, wovon 30J & 11M, zw. 7-12 Jahre waren 40 Eltern von Kindern mit Dysphonie, wovon 29J & 11M, zw. 3-12 Jahre waren 58 Eltern von Kindern mit Dysphonie, die <14 Jahre waren 44 Eltern von Kindern mit Dysphonie, wovon 35J & 9M, zw. 4-12 Jahre waren 57 Eltern von Kindern mit Dysphonie, wovon 39J & 18M, zw. 4-12 Jahre waren 3 Özkan et al. Amir et al. Koreanisch Türkisch 3 0-92 © Ben Barsties 107 Voice Fatigue Handicap Questionnaire Paolillo &Pantaleo (2015) © Ben Barsties 108 36 11.01.2016 Vocal Fatigue Index Nanjundeswaran et al. (2015) © Ben Barsties 109 Vocal Fatigue Index (deutsch) Auner M. (2015), Masterstudiengang Sprachtherapie, Ludwig-Maximilian- Universität München © Ben Barsties 110 Transsexual Voice Questionnaire for male-to-female Dacakis et al. (2013) © Ben Barsties 111 37 11.01.2016 Transsexual Voice Questionnaire for male-to-female © Ben Barsties 112 Kontakt Ben Barsties: [email protected] © Ben Barsties 113 38