Statistik
Transcription
Statistik
Sebastian Clemensen, Philip Thang og Kasper Nordtorp Statistik Indholdsfortegnelse Indhold Statistik – hvad og hvorfor ................................................................................................................................ 3 Diskrete variabler. ............................................................................................................................................. 4 Diskrete variable ................................................................................................................................................ 5 Kvatilsæt og fraktiler ..................................................................................................................................... 6 Grupperede variabler ........................................................................................................................................ 7 Sebastian Clemensen, Philip Thang og Kasper Nordtorp Statistik – hvad og hvorfor Statistik betyder tilstand eller ganske enkelt stat. Det var statens tilstand, der var emnet for de første kendte statistiske undersøgelser. Statistik giver oplysninger om tendenser i samfund og i grupper. Statistik kan vise, men ikke forklare. Sebastian Clemensen, Philip Thang og Kasper Nordtorp Diskrete variabler. En statistisk diskret variable, er en variabel hvor vi kan liste udfaldene på forhånd. Fx er en diskret variable, en variabel der tager værdier fra reelle tal Det data vi har valgt at arbejde, stamme fra sidste års kursisters karakterer ved GSK i Odense, i henholdsvis skriftlig matematik A og mundtlig matematik A. Karakteren Skriftlige Mundtlige 0 0 3 2 4 3 4 3 3 7 6 5 10 5 5 12 7 5 Sebastian Clemensen, Philip Thang og Kasper Nordtorp Diskrete variable Vi har valgt at opstille en tabel over observationerne fra mundtlig samt skriftlige matematik A eksamen ved GSK 2010 Odense. Mundtlige og Karaktere skriftlige 0 2 4 7 10 12 Frekvens 3 7 6 11 10 12 49 I alt Summeret frekvens 0,06 0,14 0,12 0,22 0,20 0,24 1 Produkt 0,06 0,20 0,33 0,55 0,76 1 Produkt 0 14 24 77 100 144 359 0,00 0,29 0,49 1,57 2,04 2,94 7,33 Variansen Spredning Samlede karakterer for både mundtlig og skriftlig matematik A ved GSK Pindediagram 0,3000 0,2500 0,2000 0,1500 0,1000 0,0500 0,0000 0,75 Frekvens 0,50 0,25 0 2 4 7 10 12 Varians 52,78 51,61 51,90 50,44 50,73 50,15 307,61 SAK 6,28 2,51 Sebastian Clemensen, Philip Thang og Kasper Nordtorp Kvatilsæt og fraktiler De røde streger der ses i trappediagrammet er et aflæst kvartilsæt. Et kvartilsæt, står for noget så simpelt som kvarte aflæsninger, altså aflæsninger med 0,25 (25 procents) intervaller, startende ved 0,00 til 1 (0 – til 100 procent). De forskellige kvartiller har forskellige navne startende med: 0,25-fratil = første kvartil = nedre kvartil o Jævnfør trappediagram, første kvartil = karakteren 4 (0 til 25 procent har fået karakteren 4 eller derunder) 0,50-fratil = anden kvartil = medianen o Jævnfør trappediagram, anden kvartil = karakteren 7 (0 til 50 procent har fået karakteren 7 eller derunder) 0,75-fratil = tredje kvartil = øvre kvartil o Jævnfør trappediagram, tredje kvartil = karakteren 10 (0 til 75 procent har fået karakteren 10 eller derunder) Middeltallet / gennemsnittet kan defineres ud fra formlen: Simplificeret: Type tal er den observation der forekommer flest gange. Jævnfør vores diagram er vores type tal noget så flot som karakteren 12. Variations mål, er en række forskellige redskaber til at udregner forskellen i variationerne af observationerne Variationsbredde Kvartilafstanden Variansen Standardafvigelsen Med andre ord er det en udregning for hvor stor en afvigelse hver enkelt observation har for gennemsnittet. Alle formler er sådan set et udtryk fra det samme, nogle egner sig bare bedre til forskellige situationer. Sebastian Clemensen, Philip Thang og Kasper Nordtorp Grupperede variabler Grupperede variabler er data behandlet ud fra vores materiale er inddelt i grupper eller intervaller. Fx så som ”hvor mange timer på bruger du på at se fjernsyn”, mellem 0 – 3 timer, 3 – 6 timer osv. Summeret intervalfrekvens Karaktere Intervalhyppighed Intervalmidtpunkt Intervalfrekvens Produkt Varians [0,2] 1 1 0,05 0,05 0,05 34,13 ]2,4] 3 3 0,16 0,21 0,47 14,76 ]4,7] 5 5,5 0,26 0,47 1,45 1,80 ]7,10] 7 8,5 0,37 0,84 3,13 2,75 ]10,12] 3 11 0,16 1,00 1,74 17,29 I alt 19 Middeltallet / gennemsnittet Variationsbredde Kvartilafstanden Variansen Standardafvigelsen 1 6,84 70,73 SAK Variansen 3,929439828 Spredning 1,98228147 Sebastian Clemensen, Philip Thang og Kasper Nordtorp Søjlediagram 8 7 6 5 4 Søjlediagram 3 2 1 0 [0,2] ]2,4] ]4,7] ]7,10] ]10,12] Sumkurve 1,20 1,00 0,80 0,60 Sumkurve 0,40 0,20 0,00 [0,2] ]2,4] ]4,7] ]7,10] ]10,12]