Statistik II

Transcription

Statistik II
Statistik II
Weitere Statistische Tests
Statistik II - 26.5.2006
1
Test auf Verteilung:
Anpassungstests
• Ist ein theoretisches Modell geeignet, beobachtete
Resultate zu erklären?
• Hierzu wird eine theoretische Verteilungsfunktion
mit der Wahrscheinlichkeitsverteilung der
Grundgesamtheit verglichen.
Die Nullhypothese lautet:
•
ist zum Beispiel die Verteilungsfunktion der
Normalverteilung, der Binomialverteilung etc…
Statistik II - 26.5.2006
2
Test auf Normalverteilung /
Jarque-Bera Test
• Der Anpassungstest im Fall der Normalverteilung beruht
auf Eigenschaften der Normalverteilung.
(Schiefe)
(Wölbung)
mit
Statistik II - 26.5.2006
3
• Es gilt für die Schätzer der höheren Momente:
• Damit gilt im Fall der Normalverteilung für die
standardisierten ZV:
•
sind unabhängig.
Statistik II - 26.5.2006
4
• Damit gilt auch:
• Und damit:
• JB ist also eine geeignete Teststatistik für unser Problem
und die Nullhypothese wird abgelehnt, falls die
Prüfgröße zu groß wird:
verwerfen.
Statistik II - 26.5.2006
5
Beispiel: Matlab Funktion jbtest
Statistik II - 26.5.2006
6
Statistik II - 26.5.2006
7
Statistik II - 26.5.2006
8
-Anpassungstest
• Allgemeinere Formulierung, da nicht nur NV
• Diskrete oder stetige ZV
• Die theoretische Verteilung kann entweder vollständig
bekannt sein oder von noch zu schätzenden Parametern
abhängen.
• Die Prüfgröße beruht auf dem Vergleich von tatsächlich
beobachteten Häufigkeiten mit den unter
zu
erwartenden Häufigkeiten.
Statistik II - 26.5.2006
9
• Zum Einstieg ein Beispiel (Quelle: Schira, S.513):
Die Gleichverteilung mit einer zweiwertigen Variablen
Statistik II - 26.5.2006
10
Es gilt:
So dass die Nullhypothese mit diesem Test bei einem
Signifikanzniveau von fünf Prozent nicht verworfen
werden kann.
• Warum ist die Prüfgröße
verteilt? s. Beweis
Statistik II - 26.5.2006
11
• Nehmen wir an, wir hätten eine m-wertige Variable und
n Beobachtungen:
• Die Prüfgröße ist jetzt asymptotisch chi-Quadrat
verteilt mit m-1 Freiheitsgraden und sieht wie folgt aus:
•Notation Skript:
Statistik II - 26.5.2006
12
Stetige Verteilungen:
• In diesem Fall muss man zur Durchführung des Test
die Merkmalsachse in
aneinandergrenzende
Intervalle
unterteilen.
Dichtefunktion der
Verteilung
Statistik II - 26.5.2006
13
• Die auf
• Die auf
entfallende Wahrscheinlichkeit:
entfallende Häufigkeit:
• Es ist besser, möglichst viele Intervalle zu bilden.
Stichwort: Fehler 2.Art
• Bilde die Intervalle in den Bereichen breiter, wo es nur
wenige Beobachtungen gibt.
• Notation Skript:
Statistik II - 26.5.2006
14
• Bekannte Verteilung mit unbekannten Parametern
z.B. Binomialverteilung, Poissonverteilung
• In diesem Fall müssen die Parameter der Verteilung
mit den Daten geschätzt werden, was die Anzahl der
Freiheitsgrade gerade um die Anzahl der geschätzten
Parameter (k) verringert.
• Mit Hilfe der geschätzten Parameter können die
Wahrscheinlichkeiten
geschätzt werden:
Statistik II - 26.5.2006
15
• Damit lässt sich auch die erwartete Häufigkeit einer
Klasse schätzen:
• Die Prüfgröße lautet dann wie folgt:
Statistik II - 26.5.2006
16