Föreläsning 1 Introduktion Tabeller och diagram

Transcription

Föreläsning 1 Introduktion Tabeller och diagram
Grunder i statistisk metodik
höstterminen 2015
Jörgen Säve-Söderbergh
[email protected]
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Kursens struktur
Modul 1 Statistikens grunder och sannolikhetslära
Modul 2 Statistisk inferens
Modul 3 Statistiska verktyg
16 föreläsningar
11 lektioner
9 datorövningar
7 matematiklektioner
Projektarbete analys av sekundärdata
Projektarbete insamling och analys av primärdata
Övningar i muntlig och skriftlig framställning
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Kurslitteratur
Statistisk dataanalys,
Svante Körner och Lars Wahlgren,
Fjärde upplagan, 9789144015736.
Praktisk statistik,
Svante Körner och Lars Wahlgren, Fjärde
upplagan, 9789144075242.
Matematik inför högskolan,
Wiklund.
Jörgen Säve-Söderbergh
16 augusti 2015
Wallin, Lithner, Jacobsson och
F1
Grunder i statistisk metodik, ht 2015
Kursens hemsida
http://www.ida.liu.se/ 732G30
Ni måste vidare för denna hemsida och gå in på LISAM, där ni
hittar detta:
några av föreläsningarna
extramaterial
information om projektarbeten
Det är alltid viktigt att hålla koll på kurshemsidan!
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Information om kursen - examination
Skriftlig salstentamen
Aktivt deltagande i löpande arbete samt muntlig och skriftlig
redovisning projektarbete analys av sekundärdata
Aktivt deltagande i löpande arbete samt muntlig och skriftlig
redovisning projektarbete insamling och analys av primärdata
Dugga matematikrepetition
Frivilliga, bonusgrundande duggor inför salstentamen
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Information om kursen - betyg
Grunder i statistisk metodik är värd 20 högskolepoäng. På kursen
kan erhållas betygen Väl godkänd, Godkänd eller Underkänd För
betyget
krävs
Godkänt betyg på skriftlig tentamen
Godkänt projektarbete analys av sekundärdata (aktivt
deltagande i arbete, rapport och presentation)
Godkänt projektarbete insamling och analys av primärdata
(aktivt deltagande i arbete, rapport och presentation)
Godkänd dugga matematikrepetition
För betyget
krävs
Väl godkänt betyg på skriftlig tentamen
Godkänt projektarbete analys av sekundärdata (aktivt
deltagande i arbete, rapport och presentation)
Godkänt projektarbete insamling och analys av primärdata
(aktivt deltagande i arbete, rapport och presentation)
Godkänd dugga matematikrepetition
Godkänd
Väl godkänd
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Föreläsning 1
Introduktion
Tabeller och diagram
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Vad är statistik ?
Siror som används i den oentliga debatten, t ex andelen
arbetslösa.
Metoder för att dra slutsatser om en population med hjälp av
stickprov.
I den första meningen från mitten av 1600-talet.
Från 1800-talet i den andra meningen.
Population och stickprov (urval) är två mängder där den senare är
en del av den andra. Matematiskt uttryckt: grundmängd och delmängd
Populationen kan vara denierad på olika sätt - se upp med vad
som menas.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Statistikens användning
Statistiken är ett sätt att kontrollera medborgarna innan Google
och Facebook uppfanns!
Befolkningsstatistik syftade till att hitta ännu er soldater ute i
byarna och skogarna.
Det nns många användningsområden för statistik. Se Körners lista
i boken.
Statistik är vetenskapens metod. Det är få forskare som inte
använder statistik.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Statistiska undersökningar
Statistiska undersökningar kan klassiceras efter
mål (syftet)
medel
beskrivande
Syftet kan vara
[frågan är HUR?] eller
[frågan är VARFÖR?].
analyserande
Hur själva datainsamlingen görs är ett annat sätt:
experimentella undersökningar
icke-experimentella undersökningar
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Experimentella undersökningar
Inom naturvetenskapen har man sedan 1600-talet använt
experiment.
Ett experiment ska kunna
upprepas.
Vi får naturligtvis inte ändra på förutsättningarna för ett visst
experiment. Om vi gör det vet vi inte vad som påverkar resultatet
av experimentet. Detta formuleras som att försöksbetingelserna kan
kontrolleras.
Inom jordbruksförsök spelar kanske jordlotten som du odlar på roll
för resultatet? Då bryter man troligen mot de kontrollerade
betingelserna.
randomisering
Fisher föreslog
som en lösning på detta. Detta
innebär att slumpen väljer vilken försöksenhet som ska ha en viss
behandling.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Om mätningar
När man ska mäta måste man vet vad man ska mäta(!).
Vissa saker är klara, t ex kroppslängd. Men vad är lycka?
Om man översätter något abstrakt till något konkret och mätbart,
så säger man att man har operationaliserat begreppet lycka. På
nätet hittar jag utlandssemestern.
Detta görs med en miljard begrepp inom samhällsvetenskapen och
kanske även naturvetenskapen (vet ej så säkert).
Mäter man det man önskar mäta genom operationaliseringen eller
inte? Är observationerna giltiga eller valida? [
]
Validitetsproblemet
Vi önskar förstås även
[
noggrannhet
Reliabilitestproblemet]
Jörgen Säve-Söderbergh
16 augusti 2015
i våra mätningar.
F1
Grunder i statistisk metodik, ht 2015
Att samla in observationers värde - datainsamling
Problem i samband med icke-experimentella undersökningar handlar
om att konstruera enkäter.
Var begriplig(klar) och kräv inte för mycket av respondenten
(minnet).
Hur ska enkäten distribueras. Post eller nätet?
Personlig intervju. Intervjuareekt. Prestigebias.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Matematikens talområden och deras beteckningar I
De enklaste talen är de
naturliga talen
[betecknas med N]
0, 1, 2, 3 . . .
Om vi tar med de negativa naturliga talen har vi
[beteckning Z]
. . . − 2, −1, 0, 1, 2, . . .
De
rationella talen har formen
p
,
q
heltalen
[beteckning Q]
där p och q är Z och q 6= 0
Exempel på rationella tal i decimalform:
14
= −14
−1
3
= 0.75
4
2
= 0, 285714285714
7
I det sista exemplet ser vi en periodisk decimalutveckling.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Matematikens talområden och deras beteckningar II
Om ett tal har en icke-periodisk decimalutveckling så är det ett
tal.
[betecknas med R]
Exempel på reella tal i decimalform:
reellt
e = 2.71828182845904
Den sista typen av tal är de
x + iy ,
och π = 3.14159265358979
komplexa talen som kan skrivas
där x och y är R.
De betecknas C.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Uppräkneliga mängder och överuppräkneliga mängder
Mängden av alla naturliga tal
0, 1, 2, 3 . . .
innehåller oändligt många tal. Den är oändlig.
Mängden av alla reella tal är också oändlig.
De naturliga talen kan räknas upp, men det kan inte de reella talen.
En oändlig mängd som kan räknas upp kallas
countable)
uppräknelig (eng :
En oändlig mängd som INTE kan räknas upp kallas
(eng : uncountable)
överuppräknelig
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Klassikation av variabler
Vilken information ger en viss variabel?
Vilka värden antar denna variabel?
Jämför variablerna kön och inkomst!
Kön antar värdena man och kvinna.
Värdena är egenskaper (som inte kan uttryckas på ett meningsfullt
sätt med siror).
Inkomst antar olika siror som värden.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Klassikation av variabler
kvalitativ variabel
Kön är en
(kategorivariabel; eng : categorical
variable) En kvalitativ variabel antar icke-numeriska värden.
kvantitativ variabel
Inkomst är en
(numerisk variabel; eng :
numerical variable) En kvantitativ variabel antar numeriska värden.
Vi kan dela upp de numeriska värdena ytterligare.
Beroende på vilken sorts tal en variabel antar får de två olika namn.
Vi sammanför de naturliga, hela och rationella talen, eftersom de
alla är uppräkneliga. En variabel som antar ett av dessa tal kallas
.
diskret
De reella talen kan ej räknas på samma sätt och en variabel som
antar reella tal kallas
.
kontinuerlig
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Skaltyper: kvotskala
Vi mäter kroppslängden för tre personer.
Person Kroppslängd (cm)
A
B
C
174
164
87
Rangordning
Ekvidistant gradering
Absolut nollpunkt
Kvotskala
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Skaltyper: intervallskala
Vi mäter temperatur i Celsiusgrader.
Tillfälle Temperatur
A
B
C
26◦
19◦
13◦
Rangordning
Ekvidistant gradering
Godtyckligt vald nollpunkt eller ingen nollpunkt
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Skaltyper: ordinalskala
Om vi säger att A är
en rangordning.
längre
än B eller att B är
kortare
än A gör vi
Rangordningar förekommer ofta: fyra personer söker en tjänst och
kandidaterna betygsätts med en poängskala.
Sökande Poäng
A
B
C
D
8
8
5
4
Rangordning
Ingen ekvidistant gradering
Godtyckligt vald nollpunkt eller ingen nollpunkt
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Skaltyper: nominalskala
Vi studerar individernas civilstånd (ogift, gift, änka/änkling
och skild). Vi kan endast klassicera dem.
Ingen rangordning
Ingen ekvidistant gradering
Godtyckligt vald nollpunkt eller ingen nollpunkt
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Vilka individer ska ingå i undersökningen?
Ibland är en statistik undersökning en
alla individer i populationen ingår.
totalundersökning, d v s
Men, ofta tar man endast ett urval av populationen och undersöker
detta. (
)
Om slumpen används för att välja ut stickprovet, så kallas urvalet
för
.
stickprovsundersökning
sannolikhetsurval
Om slumpen ej utnyttjas, så . . . icke-sannolikhetsurval.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Tabellering av kvalitativ variabel (kategorivariabel
En kvalitativ variabel varierar över ett antal
kategorier.
Antag att vi har observerat 300 personer och är intresserade av
variabeln KÖN.
Ange antalet individer som tillhör varje kategori i en
Kön
Män
Kvinnor
Totalt
Den
frekvenstabell.
Antal personer Andel personer (%)
120
180
300
40
60
100
relativa frekvensen
för män ges av
120
× 100 = 40(%).
300
I tabellen återges den
fördelningen.
Jörgen Säve-Söderbergh
absoluta
och den
16 augusti 2015
F1
relativa(procentuella)
Grunder i statistisk metodik, ht 2015
Diagram över kvalitativ variabel: cirkeldiagram
Andelarna kan illustreras som tårtbitar eller
viss medelpunktsvinkel.
cirkelsektorer
med en
Hela varvet i en cirkel utgör 360◦ . Vilken medelpunktsvinkel skall
andelen män ha?
40%
Jörgen Säve-Söderbergh
av 360◦ = 0, 40 × 360 = 144◦ .
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Diagram över kvalitativ variabel: stapeldiagram
Vi kan även rita staplar vars höjd motsvarar andelarna.
Man kan även lägga staplarna ner.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Tabellering av två kvalitativa variabler i
kombination-korstabellering
Om vi vill studera
en korstabell.
Vi tabellerar
samvariationen
observationspar
mellan de två variablerna gör vi
istället för observationer.
Ange antalet individer som tillhör varje par av kategorier.
Exempel
. Civilstånd och valdeltagande.
Individerna är antingen gifta(G) eller ej gifta(EG) och har röstat
(= 1) eller ej röstat (= 0). Det ger fyra möjligheter
(G, 0)
Jörgen Säve-Söderbergh
(G, 1)
16 augusti 2015
(EG, 0)
F1
(EG, 1)
Grunder i statistisk metodik, ht 2015
Arbetstabell
Antag att de fyra första observationerna blir
(G, 0), (EG, 1), (G, 1), (G, 1).
Valdeltagande
Civilstånd 0
1
G
EG
/
//
/
När alla observationer avprickats kan vi framställa korstabellen.
Valdeltagande
Civilstånd Ej röstat
Röstat
Gifta
Ej gifta
Jörgen Säve-Söderbergh
54
85
16 augusti 2015
1496
628
F1
Grunder i statistisk metodik, ht 2015
Korstabell eller grupperade staplar?
Valdeltagande
Civilstånd Ej röstat
Röstat
Jörgen Säve-Söderbergh
Gifta
54
1496
Ej gifta
85
628
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Korstabell eller grupperade staplar?
Valdeltagande
Civilstånd Ej röstat
Röstat
Jörgen Säve-Söderbergh
Gifta
54
1496
Ej gifta
85
628
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Korstabell-marginalfördelningar
Valdeltagande
Civilstånd Ej röstat
Röstat Summa
Gifta
Ej gifta
Summa
54
85
139
1496
628
2124
1550
713
2263
Vi har summerat radvis och kolumnvis. T ex över gifta och ogifta
som inte röstat
54 + 85 = 139.
Dessa fördelningar kallas
marginalfördelningarna.
Jörgen Säve-Söderbergh
marginalfrekvenserna
16 augusti 2015
F1
eller
Grunder i statistisk metodik, ht 2015
Marginalfördelningar
De bägge marginalfördelningarna kan framställas på vanligt vis. Den
absoluta och den relativa fördelningen för CIVILSTÅND ges som
Civilstånd Antal personer Andel personer (%)
Gifta
Ej gifta
Totalt
1550
713
2263
68,5
31,5
100
Den absoluta och den relativa fördelningen för VALDELTAGANDE
ges som
Valdeltagande Antal personer Andel personer (%)
Ej röstat
Röstat
Totalt
139
2124
2263
6,1
93,9
100
Dessa fördelningar kan avläsas ur korstabellen.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Procentuell uppdelning radvis
För att jämföra hur de gifta och de ogifta röstar, räknar vi om till
radprocent.
Vi söker den relativa civilståndsfördelningen efter valdeltagande.
Valdeltagande
Civilstånd Ej röstat
Röstat Summa
Gifta
Ej gifta
Summa
T ex
och
Jörgen Säve-Söderbergh
54
85
139
1496
628
2124
1550
713
2263
54
× 100 = 3, 5(%).
1550
1496
× 100 = 96, 5(%).
1550
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Procentuell uppdelning radvis
Gör vi samma beräkningar för de ogifta, så får vi
Valdeltagande
Civilstånd Ej röstat
Röstat Summa
Gifta
Ej gifta
Samtliga
3,5
11,9
6,1
96,5
88,1
93,9
100
100
100
Tabellen visar hur fördelningen av individer på variabeln
VALDELTAGANDE är betingad av om individerna är gifta eller
ogifta. Vi har två betingade fördelningar.
Vi har beräknat procenten i horisontell riktning, men jämför
procenttalen i de vertikala kolumnerna.
I den första kolumnen ökar andelen icke-röstande när vi går
från gifta till ogifta. I den andra tvärtom.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Avslutande anmärkningar
Vi kan beräkna kolumnprocent istället för radprocent.
Vi har tittat på två egenskaper samtidigt, man kan gå vidare
till tre eller er egenskaper samtidigt.
Antag att vi även är intresserade av skillnader mellan könen.
Då har vi åtta olika kategorier
(G, 0, Kv ), (G, 1, Kv ), (EG, 0, Kv ), (EG, 1, Kv )
(G, 0, M), (G, 1, M), (EG, 0, M), (EG, 1, M).
Gifta(G) eller ej gifta(EG) och har röstat (= 1) eller ej röstat (= 0)
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Tabellering av kvantitativ variabel
Grundprincipen vid tabellering av kvantitativa variabler är att ange
observationerna i storleksordning.
Antag att vi har n st observationer x1 , . . . , xn som antar k stycken
olika värden. Vi har er observationer än värden på variabeln, så
n > k.
Matematikbetyg Matematikbetyget för 25 elever (på den gamla
goda tiden)
5 4 1 4 4 3 2 3 3 3 4 2 3 1 3 3 5 4 2 2 2 4 3 5 3.
När data framställs på detta vis kallar vi detta ogrupperade data.
Låt
xi = värdena på observationerna, i = 1, 2, . . . , n
fi = frekvensen för det i:te variabelvärdet, i = 1, 2, . . . , k
Här är n = 25 och k = 5 (fem olika värden på variabeln
MATEMATIKBETYG).
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Tabellering av kvantitativ variabel
5 4 1 4 4 3 2 3 3 3 4 2 3 1 3 3 5 4 2 2 2 4 3 5 3.
Betyg (x ) Avprickning Frekvens (f )
i
1
2
3
4
5
Notera att
i
2
5
9
6
3
25
||
|||||
||||| ||||
||||| |
|||
k
X
fi = 25 = n.
i=1
En formel som alltid gäller. En frekvenstabell innebär att vi har
grupperat data.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Stolpdiagram
Eftersom variabeln MATEMATIKBETYG är diskret och antar
endast ett fåtal variabelvärden, så illustrerar vi fördelningen med ett
stolpdiagram.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Tabellering av kvantitativ variabel-klassindelning
Fyrtio Cloetta konfektyrer vägdes och vikterna sorterades i
storleksordning.
20,5
22,6
23,6
24,9
20,7
22,6
23,6
24,9
Jörgen Säve-Söderbergh
20,8
22,7
23,6
25,1
21,0
22,7
23,9
25,1
21,0
22,9
24,1
25,2
16 augusti 2015
21,4
22,9
24,3
25,6
F1
21,5
23,1
24,5
25,8
22,0
23,3
24,5
25,9
22,1
23,4
24,8
26,1
22,5
23,5
24,8
26,7
Grunder i statistisk metodik, ht 2015
Tabellering av kvantitativ variabel-klassindelning
VIKT är en kontinuerlig variabel, så vi måste klassindela
observationerna.
Vi väljer fem klasser som är 1.3 breda och startar i 20.4, d v s
klassindelningen
20.4-21.6, 21.7-22.9, 23.0-24.2, 24.3-25.5, 25.6-26.9
Klassbredden
för en klass.
är skillnaden mellan den övre och den undre gränsen
Den
undre gränsen
Den
övre gränsen
för klassen 20.4-21.6 är 20.35.
är 21.65.
är medelvärdet av undre och övre klassgränsen.
20.35 + 21.65
Klassmitten i klass ett =
= 21.
2
För nästa klass: 22.3.
Klassmitterna
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Tabellering av kvantitativ variabel-klassindelning
Vi tabellerar datamaterialet i en frekvenstabell
Vikt/gram Avprickning Frekvens
20.4-21.6
21.7-22.9
23.0-24.2
24.3-25.5
25.6-26.9
7
9
9
10
5
|||||||
|||||||||
|||||||||
||||||||||
|||||
Eftersom data är ordnade i storleksordning är det lätt att nna
frekvenserna.
20.5
20.7
20.8
21.0
21.0
21.4
21.5
22.0
22.1
22.5
22.6
22.6
22.7
22.7
22.9
22.9
23.1
23.3
23.4
23.5
23.6
23.6
23.6
23.9
24.1
24.3
24.5
24.5
24.8
24.8
24.9
24.9
25.1
25.1
25.2
25.6
25.8
25.9
26.1
26.7
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Tabellering av kvantitativ variabel-klassindelning
För att få svar på hur många observationer som nns under ett
visst värde beräknar vi kumulativa frekvenser.
Absolut
Kumulativ Relativ
Kumulativ
Vikt/gram frekvens (f) frekvens (F) fördelning (%) relativ fördelning (%)
20.4-21.6
7
7
17,5
17,5
21.7-22.9
9
16
22,5
40,0
23.0-24.2
9
25
22,5
62,5
24.3-25.5
10
35
25,0
87.5
25.6-26.9
5
40
12,5
100
40
Jörgen Säve-Söderbergh
100
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Grask framställning av kvantitativ, klassindelad
variabel-histogram
Histogram baserat på de absoluta frekvenserna.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Stambladdiagram
Vi ska rita ett stambladsdiagram över vikterna för de fyrtio
konfektyrerna.
20.5
22.6
23.6
24.9
20.7
22.6
23.6
24.9
20.8
22.7
23.6
25.1
21.0
22.7
23.9
25.1
21.0
22.9
24.1
25.2
21.4
22.9
24.3
25.6
21.5
23.1
24.5
25.8
22.0
23.3
24.5
25.9
22.1
23.4
24.8
26.1
22.5
23.5
24.8
26.7
Den första observationen är 20.5.
Vi uppfattar 20 som stammen och 0.5 som bladet .
I nästa observation 20.7 uppfattar vi 20 som stammen och 0.7
som bladet .
Fortsätter vi så med 20.8, får vi
20|578
Alla rader i ett stambladsdiagram ska ha samma klassbredd. Vår
första rad innehåller 20.5, 20.6, 20.7, 20.8, 20.9 och har alltså
klassbredden 0.5.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Stambladdiagram II
Vår nästa rad kommer alltså innehålla 21.0, 21.1, 21.2, 21.3, 21.4.
Med metoden ovan och 21 som stammen får vi
21|004
Den nästa raden blir
21|5
Här har vi samma stam på två rader.
Vi markerar att en klass innehåller de lägre talen genom att skriva
21|∗.
Klassen som innehåller de högre talen markeras genom 21|•.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Stambladdiagram III
Den första raden innehåller tre observationer. Den andra tre och
den tredje en.
Om vi lägger ihop dessa får vi sju. Vi har kumulerat frekvenserna i
varje rad. Detta kallas
.
djupet
Kumuleringen pågår både från toppen av stambladsdiagrammet och
botten ända tills man träar på den rad som innehåller det
mittersta värdet.
Jörgen Säve-Söderbergh
16 augusti 2015
F1
Grunder i statistisk metodik, ht 2015
Stambladdiagram IV
Fyrtio Cloetta konfektyrer vägdes.
20.5
22.6
23.6
24.9
20.7
22.6
23.6
24.9
20.8
22.7
23.6
25.1
21.0
22.7
23.9
25.1
Djup
Jörgen Säve-Söderbergh
21.0
22.9
24.1
25.2
21.4
22.9
24.3
25.6
21.5
23.1
24.5
25.8
3
20•
578
6
21*
004
7
21•
5
9
22*
01
16
22•
5667799
19
23*
134
(5)
23•
56669
16
24*
13
14
24•
558899
8
25*
112
5
25•
689
2
26*
1
1
26•
7
16 augusti 2015
F1
22.0
23.3
24.5
25.9
22.1
23.4
24.8
26.1
22.5
23.5
24.8
26.7
Grunder i statistisk metodik, ht 2015