Statistik

Transcription

Statistik
Sebastian Clemensen, Philip Thang og Kasper
Nordtorp
Statistik
Indholdsfortegnelse
Indhold
Statistik – hvad og hvorfor ................................................................................................................................ 3
Diskrete variabler. ............................................................................................................................................. 4
Diskrete variable ................................................................................................................................................ 5
Kvatilsæt og fraktiler ..................................................................................................................................... 6
Grupperede variabler ........................................................................................................................................ 7
Sebastian Clemensen, Philip Thang og Kasper Nordtorp
Statistik – hvad og hvorfor
Statistik betyder tilstand eller ganske enkelt stat. Det var statens tilstand, der var emnet for de første
kendte statistiske undersøgelser.
Statistik giver oplysninger om tendenser i samfund og i grupper. Statistik kan vise, men ikke forklare.
Sebastian Clemensen, Philip Thang og Kasper Nordtorp
Diskrete variabler.
En statistisk diskret variable, er en variabel hvor vi kan liste udfaldene på forhånd. Fx er en diskret variable,
en variabel der tager værdier fra reelle tal
Det data vi har valgt at arbejde, stamme fra sidste års kursisters karakterer ved GSK i Odense, i henholdsvis
skriftlig matematik A og mundtlig matematik A.
Karakteren Skriftlige Mundtlige
0
0
3
2
4
3
4
3
3
7
6
5
10
5
5
12
7
5
Sebastian Clemensen, Philip Thang og Kasper Nordtorp
Diskrete variable
Vi har valgt at opstille en tabel over observationerne fra mundtlig samt skriftlige matematik A eksamen ved
GSK 2010 Odense.
Mundtlige og
Karaktere skriftlige
0
2
4
7
10
12
Frekvens
3
7
6
11
10
12
49
I alt
Summeret
frekvens
0,06
0,14
0,12
0,22
0,20
0,24
1
Produkt
0,06
0,20
0,33
0,55
0,76
1
Produkt
0
14
24
77
100
144
359
0,00
0,29
0,49
1,57
2,04
2,94
7,33
Variansen
Spredning
Samlede karakterer for både mundtlig og skriftlig matematik A ved GSK
Pindediagram
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500
0,0000
0,75
Frekvens
0,50
0,25
0
2
4
7
10
12
Varians
52,78
51,61
51,90
50,44
50,73
50,15
307,61 SAK
6,28
2,51
Sebastian Clemensen, Philip Thang og Kasper Nordtorp
Kvatilsæt og fraktiler
De røde streger der ses i trappediagrammet er et aflæst kvartilsæt. Et kvartilsæt, står for noget så simpelt
som kvarte aflæsninger, altså aflæsninger med 0,25 (25 procents) intervaller, startende ved 0,00 til 1 (0 – til
100 procent). De forskellige kvartiller har forskellige navne startende med:



0,25-fratil = første kvartil = nedre kvartil
o Jævnfør trappediagram, første kvartil = karakteren 4 (0 til 25 procent har fået karakteren 4
eller derunder)
0,50-fratil = anden kvartil = medianen
o Jævnfør trappediagram, anden kvartil = karakteren 7 (0 til 50 procent har fået karakteren 7
eller derunder)
0,75-fratil = tredje kvartil = øvre kvartil
o Jævnfør trappediagram, tredje kvartil = karakteren 10 (0 til 75 procent har fået karakteren
10 eller derunder)
Middeltallet / gennemsnittet kan defineres ud fra formlen:
Simplificeret:
Type tal er den observation der forekommer flest gange. Jævnfør vores diagram er vores type tal noget så
flot som karakteren 12.
Variations mål, er en række forskellige redskaber til at udregner forskellen i variationerne af
observationerne


Variationsbredde
Kvartilafstanden

Variansen

Standardafvigelsen
Med andre ord er det en udregning for hvor stor en afvigelse hver enkelt observation har for
gennemsnittet. Alle formler er sådan set et udtryk fra det samme, nogle egner sig bare bedre til forskellige
situationer.
Sebastian Clemensen, Philip Thang og Kasper Nordtorp
Grupperede variabler
Grupperede variabler er data behandlet ud fra vores materiale er inddelt i grupper eller intervaller. Fx så
som ”hvor mange timer på bruger du på at se fjernsyn”, mellem 0 – 3 timer, 3 – 6 timer osv.
Summeret
intervalfrekvens
Karaktere Intervalhyppighed Intervalmidtpunkt Intervalfrekvens
Produkt
Varians
[0,2]
1
1
0,05
0,05
0,05
34,13
]2,4]
3
3
0,16
0,21
0,47
14,76
]4,7]
5
5,5
0,26
0,47
1,45
1,80
]7,10]
7
8,5
0,37
0,84
3,13
2,75
]10,12]
3
11
0,16
1,00
1,74
17,29
I alt
19
Middeltallet / gennemsnittet

Variationsbredde

Kvartilafstanden

Variansen

Standardafvigelsen
1
6,84
70,73 SAK
Variansen 3,929439828
Spredning 1,98228147
Sebastian Clemensen, Philip Thang og Kasper Nordtorp
Søjlediagram
8
7
6
5
4
Søjlediagram
3
2
1
0
[0,2]
]2,4]
]4,7]
]7,10]
]10,12]
Sumkurve
1,20
1,00
0,80
0,60
Sumkurve
0,40
0,20
0,00
[0,2]
]2,4]
]4,7]
]7,10]
]10,12]