Lösningar med kommentarer tillövningsuppgifterna

Transcription

Lösningar med kommentarer tillövningsuppgifterna
Lösningar med kommentarer till övningsuppgifterna i min
bok ”Grundläggande statistiska metoder för analys av
kvantitativa data”
Uppgift 1a
Eftersom betygsdata är approximativt normalfördelade väljer man lämpligen medelvärde och
standardavvikelse. Lämpligt är att ge frekvenstabellen.
Frequencies
Statistics
BETYG PÅ UPPSATSEN
N
Valid
Missing
Mean
Median
Std. Dev iat ion
Skewness
Std. Error of Skewness
Kurt osis
Std. Error of Kurtosis
541
0
3,00
3,00
1,022
-,052
,105
-,545
,210
BETYG PÅ UPPSATSEN
Valid
1
2
3
4
5
Total
Frequency
39
131
196
141
34
541
Percent
7,2
24,2
36,2
26,1
6,3
100,0
Valid Percent
7,2
24,2
36,2
26,1
6,3
100,0
Cumulat iv e
Percent
7,2
31,4
67,7
93,7
100,0
Uppgift 1b
Alternativ 1
Explore
Case Processing Summary
Valid
KÖN
BETYG PÅ UPPSATSEN Pojkar
Flickor
N
253
288
Percent
100,0%
100,0%
Cases
Missing
N
Percent
0
,0%
0
,0%
Total
N
253
288
Descriptives
KÖN
BETYG PÅ UPPSATSEN Pojkar
Flickor
Mean
95% Conf idence
Interv al f or Mean
5% Trimmed Mean
Median
Variance
St d. Dev iation
Minimum
Maximum
Range
Interquart ile Range
Skewness
Kurt osis
Mean
95% Conf idence
Interv al f or Mean
5% Trimmed Mean
Median
Variance
St d. Dev iation
Minimum
Maximum
Range
Interquart ile Range
Skewness
Kurt osis
Lower Bound
Upper Bound
Lower Bound
Upper Bound
St at ist ic
2,53
2,41
St d. Error
,061
2,65
2,51
3,00
,932
,966
1
5
4
1
,277
-,213
3,41
3,31
,153
,305
,052
3,51
3,41
3,00
,786
,887
1
5
4
1
-,177
-,406
,144
,286
Percent
100,0%
100,0%
457
5
BETYG PÅ UPPSATSEN
4
3
2
281
1
Pojkar
Flickor
KÖN
Uppgift 1b
Alternativ 2
Crosstabs
Case Processing Summary
Valid
N
BETYG PÅ
UPPSATSEN * KÖN
Percent
541
Cases
Missing
N
Percent
100,0%
0
,0%
BETYG PÅ UPPSATSEN * KÖN Crosstabulation
Count
BETYG PÅ
UPPSATSEN
Total
1
2
3
4
5
KÖN
Pojkar
Flickor
36
3
89
42
92
104
29
112
7
27
253
288
Total
39
131
196
141
34
541
Total
N
Percent
541
100,0%
Uppgift 2
250
Frequency
200
150
100
50
Mean = 3
Std. Dev. = 1,022
N = 541
0
1
2
3
4
5
BETYG PÅ UPPSATSEN
Uppgift 3
Frequencies
Statistics
ATTITY DER TILL SKRIVNING
N
Valid
Missing
Mean
Median
Std. Dev iat ion
Skewness
Std. Error of Skewness
Kurt osis
Std. Error of Kurtosis
536
5
3,43
3,00
,972
-,399
,106
,160
,211
ATTITYDER TILL SKRIVNING
Frequency
My cket tråkigt
25
Tråkigt
42
Varken - eller
216
Roligt
183
My cket roligt
70
Total
536
Sy stem
5
541
Valid
Missing
Total
Percent
4,6
7,8
39,9
33,8
12,9
99,1
,9
100,0
Valid Percent
4,7
7,8
40,3
34,1
13,1
100,0
Cumulat iv e
Percent
4,7
12,5
52,8
86,9
100,0
Histogram
250
Frequency
200
150
100
50
Mean = 3,43
Std. Dev. = 0,972
N = 536
0
0
1
2
3
4
5
6
ATTITYDER TILL SKRIVNING
Uppgift 4
Eftersom de båda variablerna är rangordnade så är Spearman’s rangkorrelation nog den lämpligaste. Om man betraktar variablerna som approx. normalfördelade (scale i SPSS) kan man
ange Pearson Corr. De båda beräkningarna ger mycket lika värden.
Correlations
Correlati ons
ANTAL TI MMARS
TV-TI TTANDE
SKOLDAGAR
Pearson Correlation
Sig. (2-tailed)
N
BETYG PÅ UPPSATSEN Pearson Correlation
Sig. (2-tailed)
N
ANTAL
TIMMARS
TV-TI TTANDE
SKOLDAGAR
1
BETYG PÅ
UPPSATSEN
-,224**
,000
537
537
-,224**
1
,000
537
541
**. Correlation is signif icant at the 0.01 lev el (2-tailed).
Correlations
Spearman's rho
ANTAL TIMMARS
TV-TI TTANDE
SKOLDAGAR
Correlation Coef f icient
Sig. (2-tailed)
N
BETYG PÅ UPPSATSEN Correlation Coef f icient
Sig. (2-tailed)
N
ANTAL
TIMMARS
TV-TI TTANDE
BETYG PÅ
SKOLDAGAR
UPPSATSEN
1,000
-,214**
.
,000
537
537
-,214**
1,000
,000
.
537
541
**. Correlation is signif icant at the 0.01 lev el (2-tailed).
Uppgift 5
Nonparametric Correlations
Correlati ons
Spearman's rho
BETYG PÅ UPPSATSEN Correlation Coef f icient
Sig. (2-tailed)
N
TID FÖR LÄXOR
Correlation Coef f icient
Sig. (2-tailed)
N
ANTAL TI MMAR FÖR
Correlation Coef f icient
SKRI VUPPGIFTER
Sig. (2-tailed)
N
SJÄLVSKATTNING AV
SKRI VFÖRMÅGAN
Correlation Coef f icient
Sig. (2-tailed)
N
**. Correlation is signif icant at the 0.01 lev el (2-t ailed).
*. Correlation is signif icant at the 0.05 lev el (2-t ailed).
ANTAL
SJÄLVSKAT
TIMMAR FÖR
TNING AV
BETYG PÅ
TID FÖR SKRI VUPPGIF SKRI VFÖR
UPPSATSEN
LÄXOR
TER
MÅGAN
1,000
,220**
,114*
,367**
.
,000
,011
,000
541
536
502
527
,220**
1,000
,447**
,213**
,000
.
,000
,000
536
536
500
522
,114*
,447**
1,000
,059
,011
,000
.
,195
502
500
502
491
,367**
,000
527
,213**
,000
522
,059
,195
491
1,000
.
527
Sambandet mellan de båda ”läxvariablerna” är naturligt nog ganska högt. Likaså är sambandet
mellan självskattningen av skrivförmågan måttligt, möjligen hade man förväntat sig ett något
högre samband. Tid för läxor och skrivuppgifter är ganska lågt korrelsera med betyg på uppsatsen.
Uppgift 6
Crosstabs
Case Processing Summary
Valid
N
NÖJESSKRI VNING * KÖN
502
Percent
92,8%
Cases
Missing
N
Percent
39
7,2%
NÖJESSKRIVNING * KÖN Crosstabulation
NÖJESSKRI VNING Nej
Ja
Total
Count
% wit hin
NÖJESSKRI VNING
% wit hin KÖN
Count
% wit hin
NÖJESSKRI VNING
% wit hin KÖN
Count
% wit hin
NÖJESSKRI VNING
% wit hin KÖN
KÖN
Pojkar
Flickor
74
60
55,2%
44,8%
100,0%
33,6%
146
21,3%
222
26,7%
368
39,7%
60,3%
100,0%
66,4%
220
78,7%
282
73,3%
502
43,8%
56,2%
100,0%
100,0%
100,0%
100,0%
Uppgift 7
Crosstabs
NÖJESSKRIVNING * KÖN Crosstabulation
Count
NÖJESSKRIVNING Nej
Ja
Total
Total
134
KÖN
Pojkar
Flickor
74
60
146
222
220
282
Total
134
368
502
Total
N
541
Percent
100,0%
Chi-Square Tests
Pearson Chi-Square
Continuity Correction(a)
Likelihood Ratio
1
Asymp. Sig.
(2-sided)
,002
9,027
1
,003
9,598
1
,002
Value
9,648(b)
df
Exact Sig.
(2-sided)
Fisher's Exact Test
Linear-by-Linear Association
N of Valid Cases
Exact Sig.
(1-sided)
,002
9,629
1
,001
,002
502
a Computed only for a 2x2 table
b 0 cells (,0%) have expected count less than 5. The minimum expected count is 58,73.
Symmetric Measures
Nominal by
Nominal
Phi
Cramer's V
N of Valid Cases
Value
,139
,139
502
Approx. Sig.
,002
,002
a. Not assuming the null hy pothesis.
b. Using t he asy mptotic standard error assuming the null
hy pothesis.
Visserligen är sambandet signifikant (p<0,01) men sambandet är lågt (0,14). Anledningen till
signifikansen trots att sambandet är lågt är p.g.a. det stora antalet observationer (220 + 282)
Uppgift 8
a) Oberoende: kön, antal timmar per vecka till skriftliga hemuppgifter och attityder till
skrivning. Den beroende variabeln är den som ska prediceras, dvs. betyg på uppsatsen.
b) Ja, signifikant.
c) Kön ger bäst prediktion, därefter attityder. Antal timmar per vecka till skriftliga hemuppgifter bidrar ej signifikant till prediktionen.
d) Den multipla korrelationen är ca 0,50 och således kan ca 25% av variansen i betyg
prediceras.
Regression
Variabl es Entered/ Removedb
Model
1
Variables
Entered
ATTITYDE
R TILL
SKRI VNIN
G, ANTAL
TIMMAR
FÖR
SKRI VUPP
GIFTER,
a
KÖN
Variables
Remov ed
Method
.
Enter
a. All requested v ariables entered.
b. Dependent Variable: BETYG PÅ UPPSATSEN
Model Summary
Model
1
R
,508(a)
Adjusted R
Square
,254
R Square
,259
Std. Error of
the Estimate
,871
a Predictors: (Constant), ATTITYDER TILL SKRIVNING, ANTAL TIMMAR FÖR SKRIVUPPGIFTER, KÖN
ANOVA(b)
Model
1
Sum of
Squares
Regression
Residual
df
Mean Square
130,820
3
43,607
375,148
495
,758
F
Sig.
57,538
,000(a)
Total
505,968
498
a Predictors: (Constant), ATTITYDER TILL SKRIVNING, ANTAL TIMMAR FÖR SKRIVUPPGIFTER, KÖN
b Dependent Variable: BETYG PÅ UPPSATSEN
Coefficients(a)
Unstandardized Coefficients
Model
1
B
(Constant)
KÖN
1,023
,666
ANTAL TIMMAR FÖR
,032
SKRIVUPPGIFTER
ATTITYDER
TILL SKRIV,268
NING
a Dependent Variable: BETYG PÅ UPPSATSEN
Std. Error
Standardized
Coefficients
Beta
t
,165
Sig.
6,220
,000
,089
,330
7,494
,000
,053
,024
,600
,548
,047
,255
5,759
,000
Uppgift 9
a) Det finns ingen skillnad mellan pojkar och flickor vad gäller medelvärdet för uppsatsbetyg (μp - μf = 0)
b) Kön är oberoende variabel och den är en kategorivariabel. Uppsatsbetyg betraktar jag
som en approximativt normalfördelad variabel (scale) och den är beroende.
c) T-test för två oberoende grupper och variansanalys. Om man anser betyg vara en ordinalskalerad variabel kan t.ex. Mann-Whitney användas (som ger en z-transformation
eftersom grupperna är stora).
d) Nollhypotesen måste förkastas. Det finns en högst signifikant skillnad mellan medelvärdena (p<0,00). Skillnaden är dessutom stor (eta-kvadrat = 18%).
e) Som framgår av beräkningarna är t2 = F.
T-Test
Group Statistics
BETYG PÅ
UPPSATSEN
KÖN
Pojkar
253
Mean
2,53
Std. Deviation
,966
Std. Error
Mean
,061
288
3,41
,887
,052
N
Flickor
Independent Samples Test
Lev ene's
Test f or
Equality of
Variances
BETYG PÅ UPPSATSEN Equal
v ariances
assumed
Equal
v ariances
not
assumed
t-test f or Equality of Means
Sig.
(2-tailed)
Mean
Dif f er
ence
Std.
Error
Dif f er
ence
95%
Conf idence
Interv al of the
Dif f erence
Lower
Upper
F
Sig.
t
1,680
,196
-10,999
539
,000
-,876
,080
-1,033
-,720
-10,938
515,333
,000
-,876
,080
-1,033
-,719
df
Means
Case Processing Summary
Cases
Included
N
Excluded
Percent
BETYG PÅ UPPSATSEN * KÖN
541
N
100,0%
Total
Percent
0
N
,0%
Percent
541
100,0%
Report
BETYG PÅ UPPSATSEN
KÖN
Pojkar
Mean
2,53
Flickor
Total
N
253
Std. Deviation
,966
3,41
288
,887
3,00
541
1,022
ANOVA Table
BETYG PÅ
UPPSATSEN * KÖN
Between Groups
Within Groups
(Combined)
Total
Sum of
Squares
103,383
1
Mean
Square
103,383
460,617
539
,855
564,000
540
df
F
120,975
Measures of Association
Eta
BETYG PÅ UPPSATSEN * KÖN
,428
Eta Squared
,183
Uppgift 10
a) Ja, sambandet mellan kön och dagboksskrivande är högst signifikant (p<0,001).
b) Nollhypotes: Det finns inget samband mellan kön och dagboksskrivande. Mothypotes: Det finns ett samband mellan kön och dagboksskrivande.
c) Båda variablerna är kategorivariabler (nominalskala).
d) Se nedan!
e) Cramérs index. (sambandet mellan variablerna är 0,55)
Sig.
,000
Crosstabs
Case Processing Summary
Cases
Valid
N
KÖN * DAGBOK
Missing
Percent
92,8%
502
N
39
Total
Percent
7,2%
N
541
Percent
100,0%
KÖN * DAGBOK Crosstabulati on
KÖN
Pojkar
Flickor
Total
Count
% wit hin KÖN
% wit hin DAGBOK
Count
% wit hin KÖN
% wit hin DAGBOK
Count
% wit hin KÖN
% wit hin DAGBOK
DAGBOK
Nej
Ja
199
21
90,5%
9,5%
66,3%
10,4%
101
181
35,8%
64,2%
33,7%
89,6%
300
202
59,8%
40,2%
100,0%
100,0%
Total
220
100,0%
43,8%
282
100,0%
56,2%
502
100,0%
100,0%
Chi-Square Tests
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
Linear-by -Linear
Association
N of Valid Cases
Value
153,429b
151,165
170,149
df
1
1
1
153,123
1
Asy mp. Sig.
(2-sided)
,000
,000
,000
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
,000
,000
,000
502
a. Computed only f or a 2x2 table
b. 0 cells (,0%) hav e expected count less than 5. The minimum expected count is
88,53.
Symmetric Measures
Nominal by
Nominal
Phi
Cramer's V
N of Valid Cases
Value
,553
,553
502
Approx. Sig.
,000
,000
a. Not assuming the null hy pothesis.
b. Using t he asy mptotic standard error assuming the null
hy pothesis.
Uppgift 11
a) Det finns ingen skillnad i medelvärdena mellan de fyra grupperna (kategorierna) i
uppsatsbetyg.
b) Grupperna är oberoende och kategorivariabler och den beroende variabeln (om vi accepterar tidigare resonemang) en ”scale-variabel”.
c) Enligt b ovan använder man lämpligen One-way-Anova. Man kan också parvisa jämförelse enligt någon av föreslagna metoder.
d) Eta-kvadrat är väl ett bra mått.
Oneway
ANOVA
BETYG PÅ UPPSATSEN
Between Groups
Within Groups
Total
Sum of
Squares
72,823
476,175
548,998
df
3
523
526
Mean Square
24,274
,910
F
26,661
Sig.
,000
Eta-kvadrat = 72,823/548,998 = 0,13
Post Hoc Tests
Multi ple Comparisons
Dependent Variable: BETY G PÅ UPPSATSEN
Schef f e
(J)
SJÄLVSKATTNI NG
(I) SJÄLVSKATTNING AV
AV SKRIVFÖRMÅGAN SKRI VFÖRMÅGAN
Inte alls bra
Ganska dålig
Ganska bra
Bra
Ganska dålig
Inte alls bra
Ganska bra
Bra
Ganska bra
Inte alls bra
Ganska dålig
Bra
Bra
Inte alls bra
Ganska dålig
Ganska bra
Mean
Dif f erence
(I-J)
-,399
-,956*
-1,342*
,399
-,557*
-,942*
,956*
,557*
-,385
1,342*
,942*
,385
*. The mean dif f erence is signif icant at the .05 lev el.
Std. Error
,166
,156
,195
,166
,097
,152
,156
,097
,142
,195
,152
,142
Sig.
,123
,000
,000
,123
,000
,000
,000
,000
,061
,000
,000
,061
95% Conf idence
Interv al
Lower
Upper
Bound
Bound
-,86
,07
-1,39
-,52
-1,89
-,79
-,07
,86
-,83
-,28
-1,37
-,52
,52
1,39
,28
,83
-,78
,01
,79
1,89
,52
1,37
-,01
,78
BETYG PÅ UPPSATSEN
a,b
Schef f e
SJÄLVSKATTNING AV
SKRI VFÖRMÅGAN
Inte alls bra
Ganska dålig
Ganska bra
Bra
Sig.
N
43
144
286
54
Subset f or alpha = .05
1
2
2,23
2,63
3,19
3,57
,083
,102
Means f or groups in homogeneous subsets are display ed.
a. Uses Harmonic Mean Sample Size = 76, 606.
b. The group sizes are unequal. The harmonic mean of
the group sizes is used. Ty pe I error lev els are not
guaranteed.
Skillnaden mellan ”Inte alls bra” och ”Ganska dålig” är ej signifikant, ej heller skillnaden
mellan ”Ganska bra” och ”Bra”. Dock finns det en signifikant skillnad mellan grupperna (Inte
alls bra och Ganska dålig) i jämförelse med grupperna (Ganska bra och Bra).
Uppgift 12
Sambandsvärdet blir mycket lika. Eta-kvadrat är också ett korrelationsmått, om än mellan en
kategorivariabel och en ”scale-variabel”. En rangkorrelation, som väl är mer korrekt, ger
sambandet 0,367.
Uppgift 13
Om man betraktar attityder till skrivning som en ”scale-variabel” så blir resultatet följande:
Means
Case Processing Summary
Included
Percent
N
ATTITYDER TILL
SKRI VNING * KÖN
536
99,1%
Report
ATTITYDER TILL SKRIVNING
KÖN
Pojkar
Flickor
Total
Mean
2,97
3,84
3,43
N
251
285
536
St d. Dev iation
,883
,862
,972
Cases
Excluded
N
Percent
5
,9%
Total
N
Percent
541
100,0%
ANOVA Table
ATTITYDER TILL
SKRI VNING * KÖN
Between Groups
Within Groups
(Combined)
Total
Sum of
Squares
99,392
1
Mean
Square
99,392
406,054
534
,760
505,446
535
df
F
130,71
Sig.
,000
Measures of Association
Eta
ATTITYDER TILL
SKRIVNING * KÖN
Eta Squared
,443
,197
Om man anser att attityder är en ordinalskalerad variabel så blir resultatet följande:
NPar Tests
Mann-Whitney Test
Ranks
ATTITYD TILL
PROVUPPSATSEN
KÖN
Pojkar
Flickor
Total
N
132
155
287
Mean Rank
119,08
165,22
Sum of Ranks
15718,50
25609,50
Test Statisticsa
Mann-Whitney U
Wilcoxon W
Z
Asy mp. Sig. (2-tailed)
ATTITYD TILL
PROVUPPSA
TSEN
6940,500
15718,500
-4,846
,000
a. Grouping Variable: KÖN
Slutsatsen blir densamma, dvs. att det finns en högst signifikant skillnad mellan pojkar och
flickor. ANOVA ger eta-kvadrat = 20%, dvs. stor skillnad.
Uppgift 14
Det finns 5 grupper (v11) och grupp är den oberoende variabeln. De jämförs på den beroende
variabeln. Här betraktas betyg som scale-variabel.
Oneway
ANOVA
BETYG PÅ UPPSATSEN
Between Groups
Within Groups
Total
Sum of
Squares
32,212
527,781
559,993
df
Mean Square
8,053
,994
4
531
535
F
8,102
Sig.
,000
Post Hoc Tests
Multi ple Comparisons
Dependent Variable: BETY G PÅ UPPSATSEN
Schef f e
(I) TID FÖR LÄXOR (J) TI D FÖR LÄXOR
Ingen tid alls
Ca 1/2 tim
Ca 1 tim
Ca 1 1/2 tim
Ca 2 tim eller mer
Ca 1/2 tim
Ingen tid alls
Ca 1 tim
Ca 1 1/2 tim
Ca 2 tim eller mer
Ca 1 tim
Ingen tid alls
Ca 1/2 tim
Ca 1 1/2 tim
Ca 2 tim eller mer
Ca 1 1/2 tim
Ingen tid alls
Ca 1/2 tim
Ca 1 tim
Ca 2 tim eller mer
Ca 2 tim eller mer
Ingen tid alls
Ca 1/2 tim
Ca 1 tim
Ca 1 1/2 tim
Mean
Dif f erence
(I-J)
Std. Error
-,285
,180
-,630*
,176
-,833*
,190
-,696*
,199
,285
,180
-,345*
,110
-,548*
,131
-,411
,145
,630*
,176
,345*
,110
-,203
,126
-,066
,140
,833*
,190
,548*
,131
,203
,126
,138
,157
,696*
,199
,411
,145
,066
,140
-,138
,157
*. The mean dif f erence is signif icant at the .05 lev el.
Sig.
,642
,013
,001
,017
,642
,046
,002
,092
,013
,046
,624
,994
,001
,002
,624
,943
,017
,092
,994
,943
95% Conf idence Interv al
Lower Bound
Upper Bound
-,84
,27
-1,17
-,09
-1,42
-,25
-1,31
-,08
-,27
,84
-,69
,00
-,95
-,14
-,86
,04
,09
1,17
,00
,69
-,59
,19
-,50
,37
,25
1,42
,14
,95
-,19
,59
-,35
,62
,08
1,31
-,04
,86
-,37
,50
-,62
,35
Homogeneous Subsets
BETYG PÅ UPPSATSEN
Scheffe
Subset for alpha = .05
TID FÖR LÄXOR
Ingen tid alls
N
1
2
3
39
2,46
Ca 1/2 tim
146
2,75
Ca 1 tim
186
3,09
3,09
Ca 2 tim eller mer
70
3,16
3,16
Ca 1 1/2 tim
95
2,75
3,29
Sig.
,516
,151
,798
Means for groups in homogeneous subsets are displayed.
a Uses Harmonic Mean Sample Size = 79,772.
b The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed.
Det finns en signifikant skillnad mellan de fem grupperna (p<0,001). Av kontrastanalyserna
framgår skillnaderna mellan de olika grupperna. De som lägger ner mer tid på läxläsning är
bättre. Högst medelvärde har gruppen ”ca 1,5 timmar”.
Om man i ställer betraktar betyg som en ordinalskala ska Kruskal-Wallis användas:
NPar Tests
Kruskal-Wallis Test
Ranks
BETYG PÅ UPPSATSEN
TID FÖR LÄXOR
Ingen tid alls
39
Mean Rank
189,95
Ca 1/2 tim
146
232,71
Ca 1 tim
186
282,05
95
311,12
70
293,05
Ca 1 1/2 tim
Ca 2 tim eller mer
Total
N
536
Test Statistics(a,b)
BETYG PÅ
UPPSATSEN
Chi-Square
df
Asymp. Sig.
30,663
4
,000
a Kruskal Wallis Test
b Grouping Variable: TID FÖR LÄXOR
Här framkommer självfallet också en signifikant skillnad mellan grupperna.
Uppgift 15
Här ska två oberoende variabler prövas i en och samma analys, dvs. skillnaden mellan kön
och skillnaden mellan de fem läxläsningsgrupperna. I och med vi har två oberoende variabler,
en s.k. 2x5 faktoriell design kan vi också studera en ev. samspelseffekt.
Univariate Analysis of Variance
Between-Subjects Factors
KÖN
TID
FÖR
LÄXOR
1
2
1
2
3
4
5
Value Label
Pojkar
Flickor
Ingen tid
alls
Ca 1/2 tim
Ca 1 tim
N
251
285
39
146
186
Ca 1 1/2 tim
95
Ca 2 tim
eller mer
70
Descriptive Statistics
Dependent Variable: BETYG PÅ UPPSATSEN
KÖN
Pojkar
Flickor
Total
TID FÖR LÄXOR
Ingen tid alls
Ca 1/2 tim
Ca 1 tim
Ca 1 1/2 tim
Ca 2 tim eller mer
Total
Ingen tid alls
Ca 1/2 tim
Ca 1 tim
Ca 1 1/2 tim
Ca 2 tim eller mer
Total
Ingen tid alls
Ca 1/2 tim
Ca 1 tim
Ca 1 1/2 tim
Ca 2 tim eller mer
Total
Mean
2,31
2,33
2,72
2,63
2,84
2,53
3,14
3,31
3,38
3,68
3,27
3,40
2,46
2,75
3,09
3,29
3,16
3,00
St d. Dev iation
,859
,923
,978
1,060
,958
,968
1,069
,759
,892
,911
,940
,889
,942
,981
,985
1,090
,958
1,023
N
32
84
81
35
19
251
7
62
105
60
51
285
39
146
186
95
70
536
Tests of Between-Subjects Effects
Dependent Variable: BETYG PÅ UPPSATSEN
Source
Corrected Model
Intercept
v1
v 11
v 1 * v 11
Error
Total
Corrected Total
Ty pe II I Sum
of Squares
117,347a
2569,296
45,818
9,027
5,210
442,645
5372,000
559,993
df
Mean Square
13,039
2569,296
45,818
2,257
1,302
,842
9
1
1
4
4
526
536
535
F
15,494
3053,122
54,446
2,682
1,548
Sig.
,000
,000
,000
,031
,187
Part ial Eta
Squared
,210
,853
,094
,020
,012
a. R Squared = , 210 (Adjusted R Squared = ,196)
Det finns en högst signifikant skillnad mellan kön (p<0,001) och en signifikant skillnad mellan läxläsningsgrupper (p<0,05). Däremot finns ingen signifikant samspelseffekt (p>0,05).
Skillnaden mellan kön är påtaglig, däremot är den liten mellan läxläsningsgrupper.
Uppgift 16
Om vi betraktar betyg som scale-variabel kan man använda envägs variansanalys med kontrastanalys.
Oneway
ANOVA
BETYG PÅ UPPSATSEN
Between Groups
Within Groups
Total
Sum of
Squares
44,945
511,048
555,993
df
2
532
534
Mean Square
22,472
,961
F
23,394
Sig.
,000
Post Hoc Tests
Multi ple Comparisons
Dependent Variable: BETYG PÅ UPPSATSEN
Schef f e
(I) TVSUM
1,00
2,00
3,00
(J) TVSUM
2,00
3,00
1,00
3,00
1,00
2,00
Mean
Dif f erence
(I-J)
,497*
,864*
-,497*
,367
-,864*
-,367
St d. Error
,102
,156
,102
,172
,156
,172
Sig.
,000
,000
,000
,103
,000
,103
95% Conf idence Interv al
Lower Bound
Upper Bound
,25
,75
,48
1,25
-,75
-,25
-,05
,79
-1,25
-,48
-,79
,05
*. The mean dif f erence is signif icant at t he .05 lev el.
Homogeneous Subsets
BETYG PÅ UPPSATSEN
a,b
Schef f e
TVSUM
3,00
2,00
1,00
Sig.
N
44
124
367
Subset f or alpha = .05
1
2
3
2,32
2,69
3,18
1,000
1,000
1,000
Means f or groups in homogeneous subsets are display ed.
a. Uses Harmonic Mean Sample Size = 89, 508.
b. The group sizes are unequal. The harmonic mean
of the group sizes is used. Ty pe I error lev els are not
guaranteed.
Skillnaden mellan de tre ”TV-grupperna” är signifikant (p<0,001) och ganska stor (etakvadrat 8%). Det finns parvis signifikanta skillnader mellan de tre grupperna.
Uppgift 17
Nedan presenteras endast den roterade matrisen enligt principalkomponentmetoden med
varimaxrotering.
Rotated Component Matrixa
1
BETYG PÅ
UPPSATSEN
BETYG, STIL OCH
SPRÅK
BETYG, I NNEHÅLL
BETYG,
DISPOSITION
ATTITY D TILL
PROVUPPSATSEN
ANTAL ÅR FORTSATT
UTBILDNING
PLANERAR
TILLSAMMANS
FAMI LJEANGELÄGEN
HETER
DISKUTERAR TVOCH
RADIOPROGRAM
ARBETE OCH SKOLA
DISKUTERAR
ALLMäNNA TING
DISKUTERAR
LITTERATUR
ANTAL TI MMARS
TV-TI TTANDE
FRIDAGAR
ANTAL TI MMARS
TV-TI TTANDE
SKOLDAGAR
FADERNS
UTBILDNING
MODERNS
UTBILDNING
DAGBOK
BREVVÄN
ATTITY DER TILL
SKRI VNING
TID FÖR LÄXOR
ANTAL TI MMAR FÖR
SKRI VUPPGIFTER
NÖJESSKRI VNING
SJÄLVSKATTNING AV
SKRI VFÖRMÅGAN
ANTAL TI MMAR FÖR
LÄSUPPGIFTER
2
3
Component
4
5
6
7
,923
,914
,891
,889
,561
,302
,481
,339
,393
,827
,788
,753
,635
,349
-,317
,634
,533
,479
-,761
-,754
,736
,709
,853
,698
,309
,520
,510
,840
,665
,312
,833
,324
Extraction Method: Principal Component Analy sis.
Rotation Met hod: Varimax with Kaiser Normalization.
a. Rotation conv erged in 8 iterations.
,651
,778
a) Ja, de sex frågorna om hur ofta barn och vuxna gör saker tillsammans (v4-v9) verkar
hänga samman och kan benämnas ”hemkultur”.
b) Det verkar inte finnas några bra attitydfrågor som hänger samman.
c) Nej, de olika aspekterna av uppsatsskrivning verkar hänga mycket nära samman.
Uppgift 18
Här får man undersöka mätsäkerheten i de tre skalorna, dvs. reliabiliteten och då lämpligen
med Cronbach’s alpha, eftersom uppgifterna i skalan ska vara homogena.
Reliability
Case Processing Summary
N
Cases
Valid
Excludeda
Total
%
90,0
10,0
100,0
487
54
541
a. Listwise deletion based on all
v ariables in the procedure.
Reliabi lity Statisti cs
Cronbach's
Alpha
,794
N of Items
6
Item-Total Statistics
ARBETE OCH SKOLA
FAMI LJEANGELÄGENH
ETER
PLANERAR
TILLSAMMANS
DISKUTERAR
ALLMäNNA TING
DISKUTERAR
LITTERATUR
DISKUTERAR TV- OCH
RADIOPROGRAM
Scale Mean if
Item Deleted
12,98
Scale
Variance if
Item Deleted
20,318
Corrected
Item-Tot al
Correlation
,573
Cronbach's
Alpha if Item
Delet ed
,756
13,47
19,270
,642
,739
14,06
21,023
,551
,762
14,59
19,988
,553
,762
15,14
22,806
,492
,776
14,24
21,014
,482
,779
Reliabiliteten är hög med tanke på vad man försöker mäta och det lönar sig inte ur reliabilitetssynpunkt att ta bort någon fråga.
De två TV-frågorna kan också bilda en summavariabel med ganska hög reliabilitet (0,72). De
tre frågorna 11-13 har visserligen något gemensamt men bildar ingen mätsäker skala.
Uppgift 19
Till uppgift 13 finns en alternativ lösning med icke-parametrisk metod.
Om betyg betraktas som ordinalskalerad måste Kruskal-Wallis användas.
NPar Tests
Kruskal-Wallis Test
Ranks
TVSUM
BETYG PÅ UPPSATSEN 1,00
2,00
3,00
Total
N
367
124
44
535
Mean Rank
295,20
222,72
168,72
Test Statisticsa,b
Chi-Square
df
Asy mp. Sig.
BETYG PÅ
UPPSATSEN
43,670
2
,000
a. Kruskal Wallis Test
b. Grouping Variable: TVSUM
Självfallet får man även med denna icke-parametrisk metod en signifikant skillnad mellan
grupperna.
Uppgift 20
Här måste man bygga upp två olika filer för uppgift a respektive b.
I uppgift a består datafilen av två kolumner med resultatet i grupp 1 i den ena och grupp 2 i
den andra (i rätt ordning eftersom de är matchade, dvs. beroende observationer).
I uppgift b finns också två kolumner men nu finns grupp i den ena (dvs. 15 ”ettor” och 15
”tvåor”) och i den andra finns resultatet för de 30 observationerna.
a)
T-Test
Paired Samples Statisti cs
Pair
1
grupp1
grupp2
Mean
6,2000
6,8000
N
St d. Error
Mean
,61101
,72506
St d. Dev iation
2,36643
2,80815
15
15
Paired Samples Correlations
N
Pair 1
grupp1 & grupp2
15
Correlation
,985
Sig.
,000
Paired Samples Test
Mean
Pair
1
grupp1
grupp2
Paired Dif f erences
95% Conf idence
Interv al of the
Std.
Dif f erence
Std.
Error
Dev iation
Mean
Lower
Upper
-,60000
,63246
,16330
-,95024
-,24976
t
-3,674
Det finns en signifikant skillnad mellan de två (matchade) grupperna (p<0,01)
b)
T-Test
Group Statisti cs
resultat
grupp
1
2
N
15
15
Mean
6,20
6,80
St d. Dev iation
2,366
2,808
St d. Error
Mean
,611
,725
df
14
Sig.
(2-tailed)
,003
Independent Samples Test
Lev ene's
Test f or
Equality of
Variances
F
resultat
Equal
v ariances
assumed
Equal
v ariances
not
assumed
,289
t-t est f or Equality of Means
Sig.
(2-tailed)
Mean
Dif f er
ence
St d.
Error
Dif f er
ence
95% Conf idence
Interv al of the
Dif f erence
Lower
Upper
Sig.
t
,595
-,633
28
,532
-,600
,948
-2,542
1,342
-,633
27,2
,532
-,600
,948
-2,545
1,345
df
Om grupperna är oberoende framkommer ingen signifikant skillnad (p>0,05). I grupperna
finns alltför få observationer för att det ska bli någon signifikant skillnad.
Om man betraktar den beroende variabeln som ordinalskalerad så kan Wilcoxon sign rank test
användas i uppgift a och Mann-Whitney-testet användas i uppgift b. Utfallet blir som tidigare;
en signifikant skillnad om grupperna är matchade (högre precision genom matchning då en
större del av variansen kan kontrolleras) och ingen signifikant skillnad om de är oberoende.
Uppgift 21
Man ska skriva in data i en ny fil son innehåller de två variablerna grupp och resultat. En analys med Oneway ANOVA (alternativt med Means med Options: Anova table and eta) ger ett
p-värde = 0,465, dvs. nollhypotesen kan inte förkastas. Dock blir eta-kvadrat hela 0,40, viket
indikerar en mycket stor skillnad mellan grupperna. Skälet till detta motsägande resultat är att
grupperna är alltför små för att kunna ge någon signifikant skillnad.
Oneway
Descriptives
Resultat
95% Confidence Interval for
Mean
N
Std. Deviation
1,414
Std.
Error
1,000
Lower Bound
-10,71
Upper Bound
14,71
Minimum
1
Maximum
3
1
2
Mean
2,00
2
2
3,00
1,414
1,000
-9,71
15,71
2
4
3
2
4,00
1,414
1,000
-8,71
16,71
3
5
Total
6
3,00
1,414
,577
1,52
4,48
1
5
ANOVA
Resultat
Sum of
Squares
4,000
Between Groups
Within Groups
Total
df
2
Mean Square
2,000
6,000
3
2,000
10,000
5
F
1,000
Sig.
,465
Post Hoc Tests
Multiple Comparisons
Dependent Variable: Resultat
Scheffe
95% Confidence Interval
Mean Difference (I-J)
-1,000
-2,000
Std. Error
1,414
1,414
Sig.
,794
,465
Lower Bound
-7,18
-8,18
Upper Bound
5,18
4,18
1
1,000
1,414
,794
-5,18
7,18
3
-1,000
2,000
1,000
1,414
1,414
1,414
,794
,465
,794
-7,18
-4,18
-5,18
5,18
8,18
7,18
(I) Grupp
1
(J) Grupp
2
3
2
3
1
2
Homogeneous Subsets
Resultat
Scheffe
Subset for
alpha =
.05
Grupp
1
N
1
2
2,00
2
2
3,00
3
2
4,00
Sig.
,465
Means for groups in homogeneous subsets are displayed.
a Uses Harmonic Mean Sample Size = 2,000.