Lærebog i matematik.pdf

Transcription

Lærebog i matematik.pdf
KAPITEL 2
TESTS
2.1
Statistik kontra sandsynlighedsregning
Inden for sandsynlighedsregning opstiller vi en model, som vi kan benytte til at
beskrive de hcendelser, som vi forventer kan indtrceffe. Vi kan ikke vcere sikre pa,
at hcendelserne indtrceffer, men vi kan scette tal pa vore forventninger i form af
sandsynligheder.
Et klassisk eksempel er kast med en m0nt. Nar m0nten er "cerlig", er sandsynligheden 50 % for at fa krone og 50 % for at fa plat. Det betyder ikke, at hvert
andet m0ntkast skal give krone, sa det vil ikke komme bag pa os, hvis tre kast
med m0nten giver os 3 gange krone, men hvis 10 kast med m0nten giver 10 gange krone, vil vi for alvor begynde at betvivle m0ntens cerlighed. Kaster vi m0nten
et start antal gange, vil vi forvente, at ca. halvdelen af kastene giver krone. Ved
10 kast med m0nten er 7 gange krone ikke uscedvanligt, men ved 100 000 kast er
70 000 gange krone meget uscedvanligt.
Ved brug af sandsynlighedsregning kan vi beregne sandsynligheden for de data,
vi observerer ved udf0rte eksperimenter. Sandsynlighedsregning henregner vi til
en matematisk disciplin.
Inden for statistik er udgangspunktet i stedet observerede data, og statistik gar
ud pa at gcette/ give bud pa en sandsynlighedsmodel, som kan forklare de observerede data.
Som eksempel pa data kan vi se pa en liste med kr, kr, kr. Som statistikere kan
vi opstille en hypotese om, at data stammer fra et simpelt fors0g, hvor vi kaster
en m0nt tre gange, og hvor sandsynligheden for bade plat og krone er 50 % ved
hvert kast.
Har vii stedet et datascet, der indeholder 10 gange krone, vii vi tage den f0rste
hypotese op til revision og erstatte den med en hypotese om, at m0nten har krone
43
pa begge sider, dvs. at sandsynligheden for at sla krone er 100 %, og sandsynligheden for plat er 0 %.
Hvis datascettet skiftevis bestar af krone, plat, krone, plat, krone, plat kan vi fastholde vor f0rste hypotese. Men hvis datascettet skiftevis bestar af krone og plat
svarende til i alt 25 par, vil vi cendre vor hypotese. Data svarer da nceppe til et
kast med en m0nt, men er bedre beskrevet ved et eksperiment, hvor vi systematisk vender m0nten. Hvis resultatet af en udf0relse af fors0get er krone, vil den
nceste udf0relse af fors0get resultere i plat med 1 00 % sandsynlighed.
Forskellen mellem sandsynlighedsregning og statistik er illustreret i figur 2.1.
Sandsynlighedsregning
Statistik
Figur 2.1
Ved en statistisk test fors0ger vi at bekrcefte eller afkrcefte formodninger, sammenhcenge eller egenskaber ud fra indsamlede data.
Udgangspunktet er nogle observerede vcerdier, som vi har skaffet os ved en unders0gelse f.eks. et eksperiment, en stikpmve eller en systematiske indsamling
af data. De observerede vcerdier sammenligner vi med forventede vrerdier, som vi
beregner ud fra en hypotese, som vi opstiller.
Safremt der er god overensstemmelse mellem observerede og forventede vcerdier, kan denne sammenligning, som vi altsa kalder en test, f0re til, at vi accepterer
hypotesen. At vi accepterer hypotesen svarer ikke til, at vi har bevist, at hypotesen
er sand, men kun til at de observerede data ikke er "ekstreme" under hypotesen.
Hvis vi ved sammenligningen rna forkaste hypotesen, har vi ikke bevist, at hypotesen er forkert. Det betyder sa blot, at de observerede data er sa ekstreme, at vi
har rigtig god grund til at mene, at vor hypotese formodentlig er forkert.
De data, vi ser pa, er ofte indsamlet for at pavise en bestemt sammenhceng. Vi
opstiller sa en hypotese om mangel pa netop denne sammenhceng. Den s0gte
sammenhreng far vi sa pavist ved at forkaste hypotesen.
44
KAPITEL
TESTS
2.2
Hypotesetest
Ved en statistisk test sammenligner vi observerede data med forventede data ud
fra en hypotese, som vi har opstillet.
Den hypotese, vi tester, betegner vi med H0 og kalder den nulhypotesen. En test af
hypotesen f0rer nu til, at vi en ten accepterer hypotesen eller forkaster hypotesen.
Eftersom en hypotese enten er sand eller falsk, vii vi i testsituationen kunne bega
to typer af fejl.
Hvis vi forkaster en sand hypotese, begar vi en type-1 fejl.
Hvis vi accepterer en falsk hypotese, begar vi en type-2 fejl.
OK
Figur 2.2
At acceptere en hypotese svarer som mevnt ikke til at have vist, at hypotesen er
sand, kun at data ikke giver anledning til, at vi kan afvise den. Vi opnar saledes
kun ny viden ved at forkaste en hypotese, og derfor vii vi ofte formulere nulhypoteser, som indeholder en pastand, der er den omvendte af det, vi gerne vii
konkludere. Saiedes vii nulhypoteser ofte rumme pastande om "ingen sammenhceng" mellem st0rrelser eller 11 ingen virkning" af f.eks. en medicinsk behandling.
Nar vi har opstillet en nulhypotese, skal vi desuden opstille en alternativ hypotese
Ha, som svarer til, hvad der rna gcelde, hvis H0 ikke er opfyldt. Den simpleste
alternative hypotese Ha svarer til negationen af H 0 , som sjceldent er scerlig informativ. Den alternative hypotese er imidlertid vigtig, da den influerer pa, hvornar
vi accepterer nulhypotesen.
Ved selve testen tager vi udgangspunkt i nulhypotesen og beregner nogle sandsynligheder ved hjcelp af en teststorrelse X. Disse sandsynligheder benytter vi sa
til at afg0re, i hvor h0j grad data passer til nulhypotesen H 0 •
45
EksempellS
Ved 10 kast med en mont viser mont en krone 8 gange og plat 2 gange. Pa denne
baggrund kan vi fa mistanke om, at monten ikke er helt symmetrisk og opstiller
derfor nulhypotesen
H 0 : Sandsynligheden for at sla krone er 50 %
og den alternative hypotese
Ha: Sandsynligheden for at sla krone er storre end 50%
Som teststorrelse vrelger vi den b(10, i)-fordelte stokastiske variabel X, der angiver antallet af krone ved de 10 kast. Stolpediagrammet med teststorrelsens fordeling er vist pa figur 2.3
0, 20
- -
- - - - - -
0,15
---
0,10
----
---
-
- - - -
- - - - -
----------
-
0,05
r~0
2
4
6
8
10
12
k
Figur 2.3 M0ntkast
De 8 gange krone svarer til den observerede vrerdi
P(X
Xobs
=8 og
=Xobs) =P(X = 8) =0,04395 = 4,395%
P(X;::: Xobs) = P(X;::: 8) = 0,05469 = 5,469%
Der er altsa mere end 5 % sandsynlighed for at fa mindst 8 gange krone med en
redig mont.
Hvis vi pa forhand har vedtaget at forkaste nulhypotesen, hvis monten viser krone mindst 8 gange, vil sandsynligheden for, at vi begar en type-1 fejl, vrere storre
end 5%.
46
KAPITEL
TESTS
Vi er naturligvis interesseret i at begrrense risikoen for at forkaste en sand hypotese, dvs. bega en type-1 fejl.
Derfor knytter vi en testsandsynlighed, som vi omtaler som p-vcerdien, til testen.
p-vrerdien er sandsynligheden for den observerede vrerdi
Xobs
eller noget, der er
vrerre under nulhypotesen, dvs. noget, der er mere ekstremt i forhold til nulhypotesen. p-vrerdien viser os, hvor rimeligt deter at tro pa, at data er fremkommet
ved tilfreldigheder, nar nulhypotesen er sand, og jo mindre p-vrerdien er, jo mere
tyder det pa, at H 0 ikke er sand.
Vi rna derfor acceptere en vis sandsynlighed for at bega en type-1 fejl, ogdenne sandsynlighed fastsretter vi selv uafhrengigt af data, og vi omtaler den som
testens signifikansniveau a.
Hvis p-vrerdien er mindre end signifikansniveauet, forkaster vi nulhypotesen, og
vi siger, at resultatet er signifikant pa signifikansniveau a. Vi siger ogsa, at resultatet er signifikant pa signifikansniveau p, nar p ::5 a.
De hyppigst anvendte signifikansniveauer er a
= 5 %, a
= 1 % og a
= 0, 1 %, og
hvis p-vrerdien er under signifikansniveauet, forkaster vi nulhypotesen.
Et signifikansniveau fastlregger en kritisk mcengde K, som bestar af de ekstreme
vrerdier af testst0rrelsen, inden for hvilken vi forkaster nulhypotesen, samt en
acceptmcengde A, inden for hvilken vi accepterer nulhypotesen.
De ekstreme vrerdier kalder vi ogsa de kritiske vrerdier, og hvis de kritiske vrerdier alle er sma, eller alle er store, kalder vi testen ensidet. Hvis de kritiske vrerdier
af testst0rrelsen bade kan vrere sma eller store bestar den kritiske mrengde af to
dele, og vi kalder testen tosidet. I dette tilfrelde deler vi signifikansniveauet lige
pa de to dele.
Tode!t kritisk mrengde
Hojre kritisk
mrengde
Venstre kritisk
mrengde
Figur 2.4 Kun store kritiske
Figur 2.5
v<Erdier
vrerdier
Kun sma kritiske
Figur 2. 6 Bade store og sma
kritiske v<Erdier
47
Eksempel16
Ved 15 kast med en mont viser monten krone 13 gange og plat 2 gange. Padenne baggrund kan vi fa mistanke om, at monten ikke er helt symmetrisk, dvs. at
sandsynligheden p for at fa krone ikke er !·
Vi opstiller derfor nulhypotesen
H 0··p-1
- 2
og den alternative hypotese
Som teststorrelse vrelger vi den b(15, !)-fordelte stokastiske variabel X, der angiver antallet af krone ved de 15 kast, og de mulige vrerdier for X er I0, 1, 2, ... , 14, 15}.
Vi tester nu hypotesen med et signifikansniveau pa 5 %.
De sma vrerdier vil ogsa vrere ekstreme under den alternative hypotese, sa vi
udforer en ensidet test med en hojresidet kritisk mrengde.
Ved brug af binomialfordelingen med n
P(X
~
=15 og p = !
finder vi nu
10) = 0, 9408 = 94,08%
P(X = 11) = 0,0417 = 4,17%
P(X:?: 12) = 0,0176 = 1,76%
sa acceptmrengden A og den kritiske mrengde K bliver
A= (0, 1,2, ... , 11}
K = 112,13, 14, 15}
Idet
Xobs
= 13 ligger i den kritiske mrengde, forkaster vi H0 , og resultatet er sig-
nifikant pa 5 %-niveau. p-vrerdien finder vi til
P(X:?: 13) = 0,0037 = 0,37%
Resultatet er dermed endda signifikant pa 0,37% niveau.
Eksempel17
I 1990'erne regnede man med, at forekomsten af born med autistiske tegn var
7 %, men man formoder nu, at denne andel har rendret sig igennem de senere ar.
Ved en ny undersogelse af 384 born udviser 46 born tegn pa autisme.
Pa baggrund heraf opstiller vi nu nulhypotesen
H 0 : Forekomst af autistiske tegn blandt born er 7%
og den alternative hypotese
48
Ha: Forekomst af autistiske tegn blandt b0rn er ikke 7%
Vi udf0rer en test pa 5 %-niveau, og som testst0rrelse anvender vi den b(384, 0, 07)fordelte stokastiske varia bel X, der an giver antallet af b0rn med tegn pa autisme.
Da bade et meget lille og et meget stort antal bmn med tegn pa autisme underst0tter den alternative hypotese, benytter vi en tosidet test med tilh0rende todelt
kritisk ma:ngde. De to dele af den kritiske ma:ngde fastla:gger vi ved at kra:ve, at
sandsynligheden for hver af delene ikke rna overstige 2,5 %.
Idet
=0,0247 =2,47%
P(18::::; X::::; 37) = 0, 9546 =95,46%
P(X ::::: 38) = 0, 0207 = 2, 07%
P(X::::; 17)
bliver den kritiske ma:ngde K og acceptma:ngden A
K = {0, 1,2, ... , 17} U {38, 39, ... , 384}
A= {18,19, ... ,36,37}
Da
Xobs
=46 tilh0rer den kritiske ma:ngde, forkaster vi nulhypotesen, og resulta-
tet er signifikant pa 5 % niveau.
p-va:rdien finder vi i dette tosidede tilfa:lde som 2 gange den mindste af sandsynlighederne P(X ::::; Xobs) og P(X ::?: X0 b 5 ).
Nuer
P(X::::; 46) = 0, 9998
P(X ::::: 46)
=0, 000293
sa p-va:rdien er 0,059 %.
x2 -test for Goodness of Fit ( GOF)
2.3
Indtil videre har vi kun set pa teststorrelser, hvis fordelinger er binomialfordelinger. Vi vii nu se pa nogle tests, som vi kalder
fordelinger er de kontinuerte
2.3.1
Ved
x2 -tests, hvor teststorrelsernes
x 2 -fordelinger.
x2 -testst0rrelsen ogden kritiske vcerdi
x 2 -testen er nulhypotesen H 0 , at de observerede data svarer til en kendt for-
deling. Ved hjrelp af nulhypotesen kan vi sa beregne de tilsvarende forventede
vrerdier, som vi sammenligner med data. Aile de forventede vrerdier skal vrere
storre end 5. I forbindelse med
x2 -test omtaler vi data som de observerede vcerdier.
For at afgore om der er god eller darlig overensstemmelse mellem observerede og
forventede vrerdier, udregner vi teststorrelsen x~eregn
x2beregn--
\
L
aile V!Erdier
(observeret vrerdi- forventet vrerdi) 2
forventet vrerdi
(2.1)
Forme! (2.1) skriver vi med symboler
2
Xberegn =
\
L
aile i
hvor
o;
(o;-J;)2
Ji1
(2.2)
er en observeret vrerdi og fi er den tilsvarende forventede vrerdi.
Hvis teststorrelsen X~eregn er lille, er der god overensstemmelse mellem de forventede og de observerede vrerdier, og vi vii acceptere nulhypotesen.
Hvis teststorrelsen er star, vii vi i stedet forkaste nulhypotesen og acceptere den
alternative hypotese Ha-
x2 -fordelte. Det betyder, at vi vii vurdere X~eregn ved brug af sandsynligheder bestemt ved x2 -fordelinger. Disse forTeststorrelserne X~eregn er tilnrermelsesvis
delinger er givet ved antallet af frihedsgrader r, som svarer til det antal vrerdier,
vi kan nojes med at kende, for vi kender aile vrerdierne. Dette antal beskriver vi
ogsa som antallet af frie valg.
Til testens signifikansniveau svarer en kritisk vcerdi og en kritisk mrengde, som er
fastlagt ved, at halesandsynligheden regnet fra den kritiske vrerdi skal vrere lig
med signifikansniveauet.
50
Nar vi f.eks.
s~tter
signifikansniveauet til 5 %, er den kritiske
v~rdi
k5 % fastlagt
ved, at
0,15
0,10
0,05
Figur 2.7
ogden kritiske
m~ngde
er intervallet [ k 5 %; oo[.
Hvis teststorrelsen X~eregn ligger i den kritiske m~ngde, forkaster vi nulhypotesen.
Eksempel18
Resultatet af 60 kast med en almindelig terning er vist i tabel 2.1
v~rdi
1
2
3
4
5
6
Hyppighed
15
8
7
5
7
18
Tabel 2.1 Observerede vrerdier
Pa baggrund af tabellens tal kan vi fa en mistanke om, at terningen ikke er ~rlig,
men hvor
us~dvanlige
de observerede
v~rdier
egentlig er, er ikke umiddelbart
til at afgore.
Vi starter med at opstille nulhypotesen
H0
:
Terningen er
~rlig
Den alternative hypotese Ha er
Ha : Terningen er
u~rlig
Vi g!1r ud fra, at nulhypotesen er sand.
51
Nar terningen er rerlig, vil vi forvente, at hvert ojental forekommer fs af gangene,
som giver os tabel 2.2 med de forventede vrerdier.
Vrerdi
1
2
3
4
5
6
Hyppighed
10
10
10
10
10
10
Tabel 2.2 Forventede vrerdier
Den tilhorende teststorrelse X~eregn er
X2
_
beregn -
(15-10j2 (8-10j2 (7-10) 2 (5-10) 2 (7-10) 2 (18-10) 2
10
+
10
+
10
+
10
+
10
+
10
dvs.
x~eregn
= 13,6.
Denne teststorrelse virker forholdsvis stor, hvilket vi ogsa forventer pa baggrund
af forskellen mellem de observerede vrerdier og de forventede vrerdier, og vi vii
nu udfore en
x2 -test pa signifikansniveau 5 %.
Ved de 60 kast med terningen er det nok at vide, hvor mange gange terningen har
vist fra f.eks. 1 til 5, for sa rna terningen have vist 6 ide resterende kast. Altsa er
antallet af frihedsgrader 5, og vi skal benytte
ved
x 2 -fordelingen med 5 frihedsgrader
x2 -tests.
Ved brug af CAS finder vi (se ogsa tabel 2.15 side 67), at
P(x 2
;:::
11,07)
=o,o5
sa k 5 % = 11,07 med tilhorende kritisk mrengde [11, 07; oo[.
Da teststorrelsen X~eregn = 13,6 tilhorer dette interval, forkaster vi nulhypotesen.
Tester vi i stedet pa signifikansniveau 1 % giver CAS os (se ogsa tabel 2.15 side
67)
P(x 2
;:::
15,09) = o,o1
sa k 1 % = 15,09 med tilhorende kritisk mrengde [15,09; oo[.
Da teststorrelsen X~eregn
nulhypotesen.
52
= 13,6 ikke tilhorer dette interval, kan vi ikke forkaste
I statistiske termer formulerer vi dette som
"Data understotter, at terningen er r:erlig pa 1 % niveau."
"Data viser, at terningen er signifikant ur:erlig pa 5 % niveau."
Eksempel19
Vi kaster en almindelig m0nt 100 gange og Hir resultatet i tabel 2.3
Udfald
plat
krone
Hyppighed
40
60
Tabel 2.3 Observerede vrerdier
Vi antager, at m0nten er symmetrisk, dvs. vi opstiller hypotesen
H0
:
M0nten er symmetrisk
Nar monten er symmetrisk, forventer vi at fa plat halvdelen af gangene, sa de
forventede vrerdier af plat og krone er begge 50.
Teststorrelsen bliver dermed
x2
beregn
2
= (40-5of + (60-50) =
50
50
4
Her er teststorrelsen betydeligt mindre end i Eksempel 18.
Nar vi ved, hvor mange gange vi har faet plat ved de 100 kast, ved vi ogsa, hvor
mange gange vi har faet krone. Antallet af frihedsgrader er dermed 1, og vi skal
bruge en
x2 -fordeling med 1 frihedsgrad.
Med CAS finder vi (se ogsa tabel 2.15 side 67)
P(x 2 ~ 3,84) = 5%
P(x 2 ~ 6,63) = 1%
P(x 2 ~ 1 o, 83) =
o, 1%
sa de kritiske vrerdier er
ks"lo = 3, 84
kl%:::: 6,63
ko,I%=10,83
Vi rna derfor forkaste hypotesen om, at monten er symmetrisk med et signifikansniveau pa 5 %.
Pa signifikansniveau 1 % og 0, 1 % accepterer vi i stedet hypotesen om symmetri.
2.3.2
p-vcerdi
Til en beregnet teststorrelse X~eregn svarer som nrevnt pa side 47 en testsandsynlighed, som vi kalder p-vrerdien.
Sandsynligheden for at observere teststorrelser, der er mindst lige sa ekstreme,
som den vi har faet, er givet ved
og dermed er p-vrerdien halesandsynligheden bestemt ved x~eregn·
Nar denne halesandsynlighed er mindre end signifikansniveauet, forkaster vi
nulhypotesen.
)o
Figur 2.8 Nulhypotesen accepteres
)o
Figur 2.9 Nulhypotesen forkastes
Eksempel20
I Eksempel18 beregnede vi
x~eregn = 13, 6
ved at benytte en
x2 -fordeling med 5 frihedsgrader. Hertil svarer p-vrerdien
p = P(x 2 :::: 13,6)
Da 1 %
~
1, 84 %
~
= o,0184 = 1,84%
5 % forkaster vi hypotesen pa 5 %-niveau, men accepterer
den pa 1 %-niveau.
Eksempel21
Testsandsynligheden svarende til teststorrelsen
x~eregn =4
i Eksempel 19 finder vi tilsvarende ved at benytte en
grad til
p = P(x 2 :::: 4)
54
= o,0455 = 4,55%
KAPITEL 2. TESTS
x2 -fordeling med 1 friheds-
Eksempel22
Tabellen nedenfor viser fordelingen af unge ud fra deres foretrukne drik.
Drik
Kaffe
Te
Sodavand
Mrelk
Vand
Juice
Saft
Frekvens
14%
12%
40%
6%
16%
8%
4%
Tabel 2.4
En stikpnwe blandt 250 gymnasieelever gav folgende fordeling
Drik
Kaffe
Te
Sodavand
Mrelk
Vand
Juice
Saft
Hyppighed
28
33
112
6
49
14
8
Tabel 2.5
Vi vil undersoge, om stikproveresultatet stemmer overens med fordelingen i
tabel 2.4 pa signifikansniveau 1 %, sa nulhypotesen er
H0
:
Gymnasieeleverne foretrrekker drikke som i tabel 2.4
De forventede vrerdier udregner vi med procenterne i tabel 2.4.
Drik
Kaffe
Te
Sodavand
Mrelk
Vand
Juice
Saft
Forvent. hyp.
35
30
100
15
40
20
10
Tabel 2.6
som giver teststorrelsen
2
X beregn
=
(28-35) 2 (33-30) 2
(112-100) 2 (6-15) 2 (49-40) 2 (14-20) 2 (8-10) 2
35
+
30
+
100
+ _1_5_ +
40
+
20
+ _1_0_
=12,765
Antallet af frihedsgrader er 6, og dermed finder vi p-vrerdien ved brug af
x2 -fordelingen med 6 frihedsgrader.
p = P(x 2 2:: 12, 765)
=o,0469 = 4,69%
Da p-vrerdien er storre end 1 %, accepterer vi vor hypotese.
for
of Fit
55
Eksempel23
Et firma lover, at dets olieboreteknologi, hvor man udforer fire samtidige boringer, vil sikre, at 60 % af de udforte boringer giver aktive oliekilder. Teknologien
er blevet afprovet ved at udfore fire boringer og herefter optrelle antallet af aktive
kilder. Dette blev gentaget 500 gange.
Resultatet fremgar af tabel 2.7.
Antal aktive kilder
0
1
2
3
4
Observeret hyppighed
21
72
152
197
58
Tabel 2.7
Vi opstiller nu hypotesen
H0
:
Antallet af aktive boringer er binomialfordelt med p = 0, 6
ved brug af den nye teknologi
Vi vil teste denne hypotese pa signifikansniveau 1 %.
De tilhorende binomialfordelingssandsynligheder er
P(X = 0) = b(4, 0, 6, 0) = 0, 0256
P(X=1)=b(4, 0,6, 1)=0,1536
P(X=2)=b(4, 0,6, 2)=0,3456
P(X = 3) = b(4, 0,6, 3) = 0,3456
P(X = 4) = b(4, 0,6, 4) = 0,1296
Vi benytter sandsynlighederne som frekvenser, sa de forventede vrerdier er
Antal aktive kilder
Forventet hyppighed
0
1
2
3
4
12,8
76,8
172,8
172,8
64,8
Tabel 2.8
Teststorrelsen er
xz
-
beregn -
(21-12,8) 2 (72-76,8) 2 (152-172,8) 2 (197-172,8) 2 (58-64,8) 2
12,8
+
7 6,8
+
172,8
+
172,8
+
64,8
= 12,16
56
Vi skal benytte en
67)
x2 -fordeling med 4 frihedsgrader. I denne er (se tabel 2.15 side
ks%
= 9,488,
k1 % = 13,277 og k0, 1 % = 18,467
Dermed rna vi forkaste nulhypotesen pa 5 %-niveau og acceptere den pa 1 %niveau og 0, 1 %-niveau.
2.3
-test for Goodness of Fit
57
2.3.3
Oversigt til
x2 -test Goodness of Fit
( GOF)
Udgangspunkt er et datasret af kendt storrelse med data inddelt i kategorier
Kategori 1
Kategori 2
obso vrerdi
obso vrerdi
000
00
0
TriniGOF
Trin 1
Formuler nulhypotesenH0 o
Nulhypotesen in.deholderden fordeling, som forventeligt beskriver det observerede datamaterialeo
Forn"luler e\rt:.·denalterJ1ative.hypbt~se Hao
Trin 2
Udregn de. fot:~~tecle.ya;!rcli~J;vedJmlg .a£ forcielingeni.Eoo
Aile
deJorveiJ,t~dt7,V~J:di~r
s:I<al vrere ~terre end 5:
Trin 3
Udregn teststorrelsen
Trin 4
Udregn antallet affrjhedsgra~er
r =ariti:t.l kategorier ·:. .: 1
og beste:i:n tel)tSa11dSYJ:llig1tecie11 p ved brug af ;r 2 -fordelingen
med ·r frihedsgrader
Trin 5
Sammenlign.p-vrerdien;n1~d signifikansn~veauet.
Hvis, p• er storre ¢nd signifikCl!lsniVeauet1 accepterer vi hulhypotesen og skriver f.eks.
"[)afa
understat.ter}I0 pd ... %-niveau."
Hvis p er mindre ~nd signifikansniveauet,forkaster vi nulhypotesen og skriver f.eks.
"Data forkaster H0 pa ... %-rtiveau."
og/eller
1
58
,Data understi!Jtter Ha signifikant pd ... %-niveau."
KAPITEL 2. TESTS
Hvis vi arbejder med kritiske vrerdier, skal vi erstatte trin 4 og trin 5 med trin 4*
og trin 5* nedenfor
Trin 4*
Bestem antallet affrihedsgrader r og find den kritiske vrerdi he~­
r.ende til signifikansl1iveauet ved btug elf x2 -fordelingen med r
frihedsgrader.
Trin ·5*
San£:rienltgrrfestst'E'rrelsen'X~eregri 1lled deh kritiske vrerdi.
Hvis X~eregn ermil1dreend denkritiske vrerdi, accepterer vi nulhrnoteseJJ.>Og skriv.e!. f.eks.
"Data tmderstetter Hop~ ;.. %-'niveau."
Hvis X~ereg~ erste~rre end den kritiskevrerdi, forkaster vi nulhy.
potesen oiskriver f.eks.
nDataforkastir Ho pa :.. %-niveau.
II
og/eller
"Data understetter Ha signifjkant pd ... %-niveau."
2.3
for Goodness of Fit (GOF)
59
x2 -test for uafhcengighed
2.4
2.4.1
Test i 2 x 2-tabeller
Af tabel 2. 9 fremg;h resultatet af en stikpmveundersogelse af 500 tilfreldigt udvalgte voksne, klassificeret efter kon og motionsvaner.
Tabellen kalder vi en 2 x 2- krydstabel eller en kontingenstabel.
Regelmressig motion
Ikke regelmressig motion
Sum
Mrend
130
135
265
Kvinder
127
108
235
Sum
257
243
500
Tabel 2. 9 Observerede hyppigheder
Vi vii undersoge, om vi ud fra tabellens data kan slutte en sammenhreng mellem
de to variable: ,kon" og ,regelmressig motion".
Det kunne der umiddelbart godt se ud til at vrere, da n~ = 54 % af kvinderne
dyrker regelmressig motion, mens kun ~~~ = 49% af mrendene dyrker regelmressig motion.
Nu stammer tabellens data imidlertid fra en stikprove, sa vi kan have vreret
,uheldige" og rent tilfreldigt have faet en svag overvregt af motionerende kvinder. De to variable kan derfor sagtens vrere uafhcengige, og det tester vi ved brug
af en
x2 -test med signifikansniveau 5 %.
Uafhrengigheden formulerer vi som nulhypotesen
H 0 : Andelen af mrend og kvinder, der dyrker regelmressig motion,
er den samme
og sretter vi
PK
= andelen blandt kvinder, der dyrker regelmressig motion
PM= andelen blandt mrend, der dyrker regelmressig motion
kan vi skrive nulhypotesen
Ho: PK =PM
60
KAPITEL 2. TESTS
Teststorrelsen X~eregn skal vi igen udregne som en sum
xz
=
\
hj)2
(oij-
(2.3)
h.
L
beregn
1
aile celler
1
hvor oi er en observeret vcerdi, og .fi er den tilsvarende forventede vcerdi.
For at beregne de forventede vcerdier, tager vi udgangspunkt i tabel 2.9, hvor vi
overforer felterne med summer.
Regelm<essig motion
Ikke regelm..-essig motion
Sum
M..-end
265
Kvinder
235
257
Sum
243
500
Tabel 2.10
De motionerende personer udgor 257/500 af personerne, og da vi gar ud fra uafhcengighed, vii vi forvente, at 257/500 af savel mcendene som kvinderne dyrker
regelmcessig motion, mens 243/500 af personerne ikke dyrker motion.
Disse bmkdele benytter vi til at udfylde de tomme celler i tabellen med de forventede vcerdier.
Ikke regelm..-essig motion
Sum
= 136,21
§66 .265 = 128, 79
265
Kvinder
~6&. 235 = 120,79
§66. 235 = 114,21
235
Sum
257
243
500
Regelm<essig motion
M..-end
.
~6& 265
Tabel 2.11 Forventede hyppigheder
Tabellen kan vi ogsa nemt udfylde ved celle for celle at udregne
. h d
e
fiorventet h yppzg
2.4
· sojlesum
= rcekkesum
l
tota sum
61
Vi udregner nu teststorrelsen
(130-136,21) 2 (135-128,79) 2 (127-120,79) 2 (108-114,21) 2
xberegn=
136,21
+
128,79
+
120,79
+
114,21
2
dvs.
x~eregn
= 1, 2395
Hvis vi kender vrerdien i en af cellerne i tabel 2.1 0, kan vi bruge summerne til
at beregne vrerdierne i de ovrige celler. Vi har dermed en frihedsgrad, sa vi bestemmer testsandsynligheden ved at benytte
x2 -fordelingen med 1 frihedsgrad.
Denne giver p-vrerdien
p = P(x 2 ~ 1,2395)
=0,266 = 26,6%
Denne sandsynlighed er storre end signifikansniveauet pa 5 %, sa vi accepterer
vores nulhypotese. Dvs. at stikproven ikke viser nogen sammenhreng mellem kon
og regelmressig motion pa 5 %-niveau.
62
KAPITEL
TESTS
2.4.2
Test i n x m-tabeller
Vi kan ogsa teste for uafhc.engighed i stmre krydstabeller. En krydstabel med n
rc.ekker og m sojler kalder vi en n x m-krydstabel.
Som eksempel ser vi pa 4x2-krydstabel tabel 2.12, der viser, ved hvilken praktisk
korepmve 319 tilfc.eldigt udvalgte bilister erhvervede korekortet.
Kvinder
Mc.end
1. prove
37
56
2. prove
63
60
3. prove
47
43
4. prove
7
6
Tabel 2.12 Observerede hyppigheder
Vi vii undersoge, om antallet af aflagte korepmver er uafhc.engigt af kon, sa vi
opstiller nulhypotesen
H0 : Antallet af aflagte korepmver er uafhc.engig af kon
Som signifikansniveau benytter vi 5 %.
Hvis vi forkaster nulhypotesen, accepterer vi den alternative hypotese
Ha : Antallet af aflagte korepmver afhc.enger af kon
Cellerne i tabellen
Kvinder
Mc.end
Sum
1. prove
93
2. prove
123
3. prove
90
4. prove
13
Sum
154
165
319
Tabel2.13
udfylder vi med forventede hyppigheder, som vi pa baggrund af vor antagelse
2.4
for uafha:ngighed
63
om uafhrengighed kan udregne som
. h d rrekkesum · sojlesum
e =
tota 1sum
fiorventet hypp1g
De forventede hyppigheder er
Kvinder
Mrend
Sum
1. pmve
44,90
48,10
93
2. pmve
59,38
63,62
123
3. pmve
43,45
46,55
90
4. pmve
6,28
6,72
13
Sum
154
165
319
Tabel 2.14 Forventede hyppigheder
som giver teststorrelsen
xz
=
\
L_,
beregn
(oij- /ij)2
aile celler
Antallet af frihedsgrader er 3, og
testsandsynligheden p = 0, 28
f;1 .
=3 83
'
1
x 2 -fordelingen med 3 frihedsgrader giver
OS
=28 %.
Dermed accepterer vi nulhypotesen og konkluderer, at undersogelsen understotter, at antallet af aflagte korepmver er uafhrengigt af kon.
Generelt kan vi udregne antallet af frihedsgrader svarende til en n x m - krydstabel, hvor vi tester for uafhrengighed, som
antallet af frihedsgrader = (antallet af rrekker- 1) · (antallet af sojler- 1)
64
TESTS
2.4.3
Oversigt til
x2 -test af uafhrengighed
Udgangspunkt er en n x m-krydstabel.
Kat. 1
Kat. 2
...
Kat. m
Niv. 1
Niv. n
65
Hvis vi arbejder med kritiske vrerdier, skal vi erstatte trin 4 og trin 5 med trin 4* og trin
5* nedenfor
Trin.4*
Be.stem ant<lllet af.frihedsgrader r.og fin~ den kritiske vrerdi h0rende til
· sigrtifika:B~ni:v;eauetye~ br\lg jtf x2-fotdelin$eflirted r frihedsgrader.
66
KAPITEL 2. TESTS
2.4.4
Tabel over udvalgte kritiske vrerdier til
x2 -test
Kritiske vcerdier h0rende til signifikansniveauerne 5 %, 1 % og 0, 1 %for
x2 - fordelinger.
Tabel 2.15
Frihedsgrader
Kritiske vrerdier
10,8276
13,8155
,}!6)2662
18;;4668
34;8o5~
19
20
36,1908
31,4104
3715662
45,3147
67