Vodnik po SPSS-u Delovna verzija (2) AnjaZnidaršic

Comments

Transcription

Vodnik po SPSS-u Delovna verzija (2) AnjaZnidaršic
Vodnik po SPSS-u
Delovna verzija (2)
ˇ
Anja Znidarˇ
siˇc
Kazalo
Namesto uvoda
1
1 Naˇ
crtovanje raziskave in vpraˇ
salnika
1.1 Koraki v procesu raziskovanja . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Na zaˇcetku so raziskovalna vprasanja oziroma zgodba o Podjetju X . . . .
1.3 Nekaj malega o vpraˇsalniku . . . . . . . . . . . . . . . . . . . . . . . . . .
3
3
4
5
2 Priprava podatkov v SPSS-u
2.1 Zaˇcetek dela z SPSS-om . . . . . . . .
2.2 Priprava baze v SPSS-u . . . . . . . .
2.2.1 Vpisovanje spremenljivk . . . .
2.2.2 Vpisovanje podatkov . . . . . .
2.3 Delo s pomoˇcjo ukazov - Syntax . . . .
2.3.1 Priprava ukazov za vpis besedila
2.3.2 Priprava ukazov za vpis besedila
2.3.3 Okno Syntax in izvedba ukazov
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
vpraˇsanj .
odgovorov .
. . . . . . .
3 Opisne statistike
3.1 Fekvence - ukaz Frequences . . . . . . . . . . .
3.2 Opisne statistike - ukaz Descriptives . . . . . . .
3.3 Prilagodljive tabele - ukaz Custom Tables . . .
3.4 Veˇc moˇznih odgovorov - ukaz Multiple response
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9
9
12
13
19
20
21
22
23
.
.
.
.
24
24
34
39
42
4 Intervali zaupanja
45
4.1 Interval zaupanja za povpreˇcje . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2 Interval zaupanja za deleˇz . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5 Grafiˇ
cni prikazi
50
5.1 Okvirji z roˇcaji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.2 Razsevni grafikoni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
ˇ
5.3 Crtni
grafikoni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6 Preurejanje spremenljivk in izbira dela podatkov
60
6.1 Raˇcunanje s spremenljivkami . . . . . . . . . . . . . . . . . . . . . . . . . . 60
6.2 Preoblikovanje zvezne spremenljivke v kategorijalno . . . . . . . . . . . . . 62
6.3 Prekodiranje spremenljivk . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
7 Testiranje hipotez
7.1 t-testi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1.1 Razlike v povpreˇcjih med dvema skupinama . . . . . .
7.1.2 Testiranje populacijskega povpreˇcja . . . . . . . . . . .
7.1.3 Primerjanje povpreˇcij dveh spremenljivk (parni t-test)
7.2 ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2.1 Homogene variance, statistiˇcno neznaˇcilne razlike . . .
7.2.2 Homogene variance, statistiˇcno znaˇcilne razlike . . . . .
7.2.3 Nehomogene variance, statistiˇcno znaˇcilne razlike . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
69
69
69
77
79
81
81
86
90
7.3
7.4
Povezanost spremenljivk
7.3.1 χ2 test . . . . . .
7.3.2 Korelacija . . . .
Linearna regresija . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
94
94
98
100
8 Neparametriˇ
cni testi
105
8.1 Test deleˇzev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
8.2 Kolmogorov-Smirnov test za en vzorec . . . . . . . . . . . . . . . . . . . . 113
Literatura
118
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
1
Namesto uvoda
Priroˇcnik, ki je pred vami, je namenjen prvemu spoznavanju z SPSS-om. Morda ga boste
potrebovali ˇze pri izdelavi seminarskih nalog, zagotovo pa ga boste potrebovali pri analiziranju podatkov za potrebe diplomske ali magisterske naloge.
Prvo poglavje ni pregleden povzetek obstojeˇce literature na temo raziskovanja, paˇc pa
je namenjen le osvetlitvi glavnih pojmom v raziskovanju, natanˇcneje v zasnovi raziskave
in vpraˇsalnika. V drugem poglavju je prikazana priprava baze za vnaˇsanje spremenljivk
in podatkov v SPSS ter delo s pomoˇcjo ukazov. V tretjem poglavju je prikazan izraˇcun
frekvenc in opisnih statistik ter analiza vpraˇsanj z veˇc moˇznimi odgovori, v ˇcetrtem poglavju pa je prikazan izraˇcun intervala zaupanja za povpreˇcje in deleˇz. V petem poglavju
so predstavljeni najpogostejˇsi grafiˇcni prikazi rezultatov; okvir z roˇcaji, razsevni in ˇcrtni
ˇ
grafikon. Sesto
poglavje je namenjeno preurejanju spremenljivk ter raˇcunanju s spremenljivkami. V sedmem poglavju testiramo hipoteze in sicer v poglavju 7.1 prikaˇzemo
razliˇcne t-teste, v poglavju 7.2 analizo variance, povezanost spremenljivk preuˇcujemo v
poglavju 7.3 s pomoˇcjo χ2 -testa ter Pearsonovega koeficienta korelacije, poglavje 7.4 pa
je namenjeno linearni regresiji. Osmo poglavje je namenjeno neparametriˇcnim testom, in
sicer je v poglavju 8.1 predstavljen test deleˇzev, v poglavju 8.2 pa Kolmogorov-Smirnov
test za preverjanje normalnosti porazdelitve.
Del besedila v priroˇcniku je zapisan v barvnih okvirˇckih:
Poskusi sam...
Ponovi,
ponovi,
ponovi,...
Ponovi,
V oranˇznih okvirˇckih ’Poskusi sam’ so
zapisane dodatne naloge, ki jih boste poskusili reˇsiti sami.
V svetlo zelenih okvirˇckih so podani
osnovni pojmi, ki jih moramo poznati,
da bi lahko interpretirali dobljene rezultate.
Dodatna razlaga posameznih pojmov je podana v zelenih okvirˇckih.
Uporabni napotki tako pri pri pripravi raziskave kot pri posameznih
testih so zapisani v vijoliˇcnih okvirˇckih.
2
Syntax
+
+
+
+
+
....za programerske frike :)
V modrih okvirčkih so zapisani ukazi, ki jih lahko izvedemo
v Syntax oknu. Ob vsakem prikazanem ukazu izvedenem s pomočjo
menijev bo izpisan še ukaz v obliki besedila.
Osnovno predstavitev dela z ukazi oziroka sintakso najdete
v poglavju 2.3 Delo s pomočjo ukazov - Syntax.
Bazo podatkov v SPSS-u (podatki PodjetjeX.sav) s katerimi delamo v tem priroˇcniku
najdete na spletni strani
http://www2.fov.uni-mb.si/matstat/upload/PrirocnikSPSS/podatki_PodjetjeX.rar
v zazipani datoteki.
Priroˇcnik je ˇse v nastajanju. Prosim, da vse
• pripombe,
• predloge,
• tiskarske ˇskrate in
• druge popravke
poˇsljite na [email protected]
ˇ
Zelim
vam uspeˇsno uporabo SPSS-a,
Anja
Ljubljana, februar 2013
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
1
3
Naˇ
crtovanje raziskave in vpraˇ
salnika
Raziskavo zaˇcnemo naˇcrtovati ˇze z izbiro teme, ki pa se ob pregledu obstojeˇce literature
lahko tudi nekoliko spremeni. V nadaljevanju so predstavljeni osnovni koraki v raziskovalnem procesu.
1.1
Koraki v procesu raziskovanja
Vsak raziskovalni proces ima veˇc korakov, ki se delno med seboj tudi prepletajo (Babbie,
2007; Neuman, 2007):
1. Opredelitev problema prouˇcevanja. Natanˇcno analiziramo obstojeˇca zna- nja (iskanje in ˇstudij literature, razgovor s strokovnjaki) ter doloˇcimo cilje raziskovanja.
2. Postavitev raziskovalnih vpraˇsanj, ki izhajajo iz problema in ustreznih statistiˇcnih
hipotez, ki jih je s pomoˇcjo statistiˇcnih testov moˇzno sprejeti oz. zavrniti.
3. Izdelava naˇcrta raziskave: izbira enot (doloˇcitev populacije) in vzorˇcni naˇcrt (doloˇcitev
vzorca), doloˇcitev spremenljivk, izbira in sestava inˇstrumenta merjenja (npr. vpraˇsalnik),...
4. Zbiranje podatkov (opazovanje, eksperiment, anketiranje, intervju, ...).
5. Priprava in analiza podatkov.
6. Interpretacija (pojasnitev, razlaga) rezultatov.
7. Poroˇcanje o rezultatih (poroˇcila, znanstveni ˇclanki, uporabnost rezultatov).
V priroˇcniku se bomo seveda osredotoˇcili na peti korak, ki se nanaˇsa na analizo podatkov ter njihovo ustrezno predhodno pripravo. Ker pa je v resnici bolj kot same ˇstevilke
pomembna njihova interpretacija, torej obˇsirno razloˇzen njihov po- men, bomo poskuˇsali
dobljene rezultate tudi pojasniti ter hkrati dodati kakˇsen namig za prikaz rezultatov. Interpretacija rezultatov seveda zahteva predhodno poznavanje problema ter raziskovalnih
vpraˇsanj, zato bomo vse izraˇcune in ana- lize naredili na primeru ankete o zadovoljstvu
zaposlenih z delovnim okoljem v Podjetju X.
V poglavju 2.2 je tako na kratko opisan problem prouˇcevanja skupaj z razi- skovalnimi
vpraˇsanji na katere bomo odgovorili s pomoˇcjo analize podatkov v poglavju 6). V poglavju
2.3 je podan vpraˇsalnik na podlagi katerega bomo pri- kazali urejanje baze v SPSS-u in
vnos podatkov.
V nadaljevanju je prikazan le en poseben primer, ki nam bo v pomoˇc pri pred- stavitvi rezultatov. Natanˇcnejˇse smernice kako opredeliti problem, postaviti raziskovalna vpraˇsanja,
oblikovati anketni vpraˇsalnik ter izbrati vzorec boste morali poiskati v ustrezni literaturi.
4
1.2
1 Naˇcrtovanje raziskave in vpraˇsalnika
Na zaˇ
cetku so raziskovalna vprasanja oziroma zgodba o Podjetju X
Predstavljajte si, da ste zaposleni na vodilnem poloˇzaju v Podjetju X, kjer posebno pozornost namenjate zadovoljstvu zaposlenih. Trenutno vas zanima, kako so zaposleni zadovoljni s svojim delovnim okoljem, pisarnami, pisarniˇskim materialom ter pomoˇcjo IT
strokovnjakov ob morebitnih teˇzavah. Natanˇcneje vas zanima:
RVl: Se zadovoljstvo zaposlenih z delovnim okoljem in opremo razlikuje glede na spol?
RV2: Moˇski so bolj zadovoljni s fotokopirnimi stroji, ki jih imamo v podjetju, kot ˇzenske.
RV3: Se zadovoljstvo zaposlenih s pisarniˇskim materialom razlikuje glede na spol?
RV4: Ali so ˇzenske res bolj zadovoljne s telefoni kot moˇski?
ˇ
RV5: Zenske
so bolj zadovoljne s tehniˇcno podporo kot moˇski.
RV6: Ali so starejˇsi res manj zadovoljni s programsko opremo?
RV7: Ali so zaposleni z daljˇso delovno dobo bolj zadovoljni z delovnim okoljem in opremo?
RV8: Ali se zadovoljstvo zaposlenih s tiskalnikom razlikuje od zadovoljstva zaposlenih s
telefonom?
RV9: Zaposleni so bolj zadovoljni fotokopirnim strojem kot s tiskalnikom.
RV10: Se zadovoljstvo zaposlenih z opremo razlikuje glede na oddelek v podjetju?
RV11: Se zadovoljstvo zaposlenih z velikostjo pisarne razlikuje glede na oddelek v podjetju?
RV12: Se zadovoljstvo zaposlenih s tiskalnikom razlikuje glede na oddelek v podjetju?
RV13: Se zadovoljstvo zaposlenih z delovnim okoljem in opremo razlikuje glede na izobrazbo?
RV14: Ali je povpreˇcna starost zaposlenih v podjetju niˇzja od 40 let?
RV15: Je zadovoljstvo zaposlenih z delovnim okoljem in opremo morda povezano s starostjo?
RV16: V kakˇsni povezavi sta delovna doba in starost v naˇsem podjetju? oziroma
RV17: Kako natanˇcno lahko iz starosti zaposlenega napovemo njegovo delovno dobo?
RV18: Zadovoljstvo zaposlenih z delovnim okoljem in opremo je pozitivno povezano z zadovoljstvom s tehniˇcno podporo.
RV19: Ali obstajajo razlike v izobrazbeni strukturi zaposlenih glede na spol?
RV20: Ali si veˇc kot tri ˇcetrtine zaposlenih ˇzeli odprto okrepˇcevalnico do 17. ure?
RV21: Ali je odstotek zaposlenih, ki si ˇzelijo naroˇcanja kosil tudi za domov niˇzji od 40%?
Postavili smo si torej 21 raziskovalnih vpraˇsanj oziroma raziskovalnih hipotez na podlagi
katerih je potrebno sestaviti ustrezen vpraˇsalnik.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
1.3
5
Nekaj malega o vpraˇ
salniku
Na podlagi zgoraj naˇstetih raziskovalnih vpraˇsanj. raziskovalnih hipotez oz je potrebno
oblikovati anketna vpraˇsanja. Vsako raziskovalno vpraˇsanje navadno povezuje dve ali veˇc
anketnih vpraˇsanj. V nadaljevanju je predstavljenih 10 korakov oblikovanja vpraˇsalnika
(Salant and Dillman, 1994).
1. Pregled spiska iskanih informacij in postavljenih hipotez,
2. izbor tipa vpraˇsalnika in metode zbiranja podatkov,
3. doloˇcitev vsebine posameznih vpraˇsanj,
4. doloˇcitev oblike odgovorov za vsako vpraˇsanje,
5. formuliranje vpraˇsanj in odgovorov,
6. organizacija vpraˇsanj in doloˇcitev zaporedja vpraˇsanj,
7. doloˇcitev oblike vpraˇsalnika,
8. pregled vseh korakov in ustrezne spremembe ter
9. preizkus vpraˇsalnika in ustrezne spremembe,
10. vrnitev na prvi korak.
Najprej je potreben razmislek, katere informacije sploh potrebujemo in zakaj. V vpraˇsalniku
torej postavimo samo tista vpraˇsanja, ki jih potrebujemo pri odgovorih na raziskovalna
vpraˇsanja. Vpraˇsalnik poskuˇsamo namreˇc sestaviti ˇcim krajˇsi, da ne obremenjujemo anketirancev po nepotrebnem.
Najprej lahko pogledamo, katere tako imenovane socio-demografske podatke o anketirancih potrebujemo. V raziskovalnih vpraˇsanjih RV6 ter RV13-RV16 omenjamo starost, v
vpraˇsanjih RVl do RV5 ter RV18 omenjamo spol, izobrazba je omejena v vpraˇsanjih RV12
in RV18, delovna doba je omenjena v vpraˇsanjih RV7, RV15 in RV16 ter oddelek zaposlenih v podjetju v raziskovalnih vpraˇsanjih RV10 in RV11.
Na zaˇcetku vpraˇsalnika postavimo zanimiva (sploˇsna) vpraˇsanja, medtem ko bolj specifiˇcna vpraˇsanja postavimo na koncu vpraˇsalnika. Socio-demografska vpraˇsanja (starost,
spol, dohodek,...) naj bi zastavili na koncu vpraˇsalnika (glej sliko 1.1). Za vpraˇsanja Spol,
Izobrazba ter Delovno mesto smo izbrali zaprt tip vpraˇsanja s ponujenimi moˇznimi odgovori, pri vpraˇsanjih Starost in Delovna doba pa smo anketirance prosili, da sami vpiˇsejo
ˇstevilo let. Pri vpraˇsanjih Starost in Delovna doba bi prav tako lahko ponudili zaprt
tip odgovorov z ustreznimi razredi, pri ˇcemer je potrebno paziti, da se meje razredov ne
prekrivajo oz. so jasno doloˇcene.
6
1 Naˇcrtovanje raziskave in vpraˇsalnika
Slika 1.1: Primer vpraˇsalnika
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
7
Na kaj moramo paziti pri sestavljanju anketnih
vpraˇ
sanj?
• vpraˇsanja naj bodo zapisana na preprost naˇcin,
• vpraˇsanja naj bodo kratka in konkretna,
• izogibajte se vpraˇsanj, ki vsebujejo veˇc razseˇznosti, postavite raje veˇc vpraˇsanj,
• natanˇcno doloˇcite ˇcas in kraj v vpraˇsanju, ˇce vpraˇsanje to vkljuˇcuje,
• prva vpraˇsanja naj bodo preprosta in zanimiva, naj anketiranca pritegnejo k
sodelovanju,
• teˇzka, neprijetna in obˇcutljiva vpraˇsanja postavite na koncu,
• vpraˇsanja naj bodo razvrˇsˇcena po podobnosti in vsebini v skupine, vsaka skupina naj bo ustrezno poimenovana,
• skupine vpraˇsanj naj bodo urejene v logiˇcno zaporedje,
• pri zaprtem tipu vpraˇsanj oz. odgovorov je potrebno paziti, da anketirancem
ponudimo paleto vseh moˇznih odgovorov oz. jim dopustimo, da sami dopiˇsejo
manjkajoˇce moˇznosti (pol-zaprt tip vpraˇsanja),
• vˇcasih je potrebno anketirancem ponuditi tudi moˇznost, da na vpraˇsanje ne
odgovorijo (npr. ’ne morem odgovoriti’, ’ne vem’,...),
• ˇce je na doloˇceno vpraˇsanje moˇznih veˇc odgovorov, naj bo to jasno oznaˇceno,
• vpraˇsalniku je potrebno dodati spremno pismo ali nagovor (glej okvirˇcek na
strani 2.3).
Veˇc navodil s konkretnimi primeri najdete npr. v Fowler (1995); Fink (2003).
Poleg podatkov o anketirancu nas glede na raziskovalna vpraˇsanja zanima ˇse zadovoljstvo
zaposlenih z delovnim okoljem in opremo. Omenjeni koncept zadovoljstva z delovnim
okoljem in opremo smo razdelili na deset podvpraˇsanj ter zaposlene povpraˇsali, kako so
zadovoljni s posameznim elementom v svojem delovnem okolju. Kot moˇzne odgovore smo
anketirancem ponudili 5-stopenjsko letvico, kjer 1 pomeni ‘zelo nezadovoljen’ do 5 ‘zelo zadovoljen’, odgovor 3 pa je na nek naˇcin nevtralen (’delno nezadovoljen, delno zadovoljen’).
Zadovoljstvo z delovnim okoljem smo tako razdelili na zadovoljstvo z velikostjo pisarne
(vkljuˇceno v raziskovalno vpraˇsanje RV10), opremo, osvetljenostjo pisarne ter zvoˇcno
izolacijo pisarne. Podobno smo zadovoljstvo z opremo razdelili na ˇsest podvpraˇsanj in
sicer: zadovoljstvo s pisarniˇskim materialom (vkljuˇceno v raziskovalno vpraˇsanje RV3),
raˇcunalnikom, programsko opremo (vkljuˇceno v raziskovalno vpraˇsanje RV6), tiskalnikom
(vkljuˇceno v raziskovalni vpraˇsanji RV8 in RV9), fotokopirnim strojem (vkljuˇceno v raziskovalni vpraˇsanji RV2 in RV9) in telefonom (vkljuˇceno v raziskovalni vpraˇsanji RV4 in
RV8).
8
1 Naˇcrtovanje raziskave in vpraˇsalnika
Poleg zadovoljstva z delovnim okoljem smo zaposlene povpraˇsali ˇse po zadovoljstvu s
tehniˇcno podporo (vkljuˇceno v raziskovalni vpraˇsanji RV5 in RV15) in sicer so nas zanimali trije vidiki: hitrost odziva sodelavcev tehniˇcne pomoˇci, hitrost odpravljanja teˇzav
ter strokovna usposobljenost sodelavcev. V vpraˇsalniku je za vsak omenjeni vidik zadovoljstva s tehniˇcno pomoˇcjo postavljena trditev na katero so anketiranci odgovarjalis
5-stopenjsko lestvico strinjanja (1-sploh se ne strinjam, 2-se ne strinjam, 3-delno se strinjam, delno ne, 4-se strinjam, 5- popolnoma se strinjam).
V vpraˇsalnik smo vkljuˇcili tudi osem trditev o ˇzeljenih spremembah v okrepˇcevalnici, ki
so vklju´cene tudi v RV20 in RV21.
Kako iz posameznih anketnih vpraˇsanj dobimo ˇstiri koncepte zadovoljstvoz delovnim okoljem, zadovoljstvo z opremo, zadovoljstvo z delovnim okoljem in opremo ter zadovoljstvo s
tehniˇcno podporo, ki jih uporabljamo v raziskovalnih vpraˇsanjih na strani 4, je natanˇcneje
opisano v poglavju 6.1 na strani 60.
Vpraˇsalniku (slika 1.1) smo na zaˇcetku dodali kratek nagovor, kjer smo navedli naslov
ankete, namen ankete, povedali, kje in kdaj bodo dostopni rezulati, poudarili, da je anketa
anonimna ter se zahvalili za sodelovanje. Podrobnejˇse so elementi nagovora oz. spremnega
pisma podani v spodnjem okvirˇcku.
Kaj naj vkljuˇ
cuje spremno pismo oz. nagovor?
Vpraˇsalniku je potrebno dodati spremno pismo ali nagovor, kjer:
• pojasnimo cilje raziskave, omenimo nosilca raziskave (ime in/ali organizacija),
• prosimo za sodelovanje in poudarimo, da je sodelovanje anketiranca pomembno
za uspeh raziskave,
• poudarimo koristnost raziskave (tako sploˇsno kot za anketiranca osebno),
• poudarimo, da bodo odgovori anonimni in zaupni,
• nakaˇzemo trajanje anketiranja,
• na kratko lahko opiˇsemo postopek izdelave vzorca, predvsem kako je bil anketiranec izbran za sodelovanje,
• ponudimo ime in telefonsko ˇstevilko in/ali e-mail za morebitna dodatna pojasnila,
• ponudimo skrajˇsano poroˇcilo raziskave (npr. po poˇsti, e-mailu,...(dodatno zagotovite anonimnost in poudarite objavo rezultatov v sumarni obliki)) oz. navedemo spletno stran, kjer bodo rezultati dostopni (in kdaj)),
• zahvalimo se za sodelovanje.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
2
2.1
9
Priprava podatkov v SPSS-u
Zaˇ
cetek dela z SPSS-om
Skozi celoten priroˇcnik se bomo torej ‘igrali’ s podatki, ki so jih v Podjetju X zbrali s
pomoˇcjo anketnega vpraˇsalnika, ki je prikazan na sliki 1.1. Najprej si bomo pogledali
kako pripravimo bazo podatkov v SPSS-u.
V tem priroˇcniku bomo uporabljali SPSS 20, natanˇcneje
IBM SPSS Statistics 20, vendar se posamezne verzije
bistveno ne razlikujejo med seboj. Ko zaˇzenemo program
(ikona iz menija Start je prikazana na sliki 2.1) se odpre
okno prikazano na sliki 2.2. V primeru, da ˇzelimo od- Slika 2.1: Ikona programa
preti ˇze obstojeˇco SPSS datoteko s konˇcnico .sav , pustimo SPSS
oznaˇceno privzeto moˇznost Open an existing data source
in poiˇsˇcemo ˇzeljeno datoteko na seznamu ali kliknemo More Files... ter poiˇsˇcemo mesto
shranjene datoteke.
ˇ ˇzelimo pripraviti
Ce
novo bazo oznaˇcimo
moˇznost Type in
data ter izbiro potrdimo s klikom nagumb OK. Odpre
se osnovno okno SPSSa prikazano na sliki
2.2. Opazimo, da
ima SPSS dve glavni
okni (glej zavihka
levo spodaj): okno
s podatki (Data View)
in trenutno izbrano
okno s spremenljivSlika 2.2: Zaˇcetno okno SPSS-a
kami (Variable View).
Moˇznosti orodne vrstice za urejanje podatkov oz. posamezne ikone so natanˇcneje predstavljene na sliki 4.
Na sliki 2.3 so prikazane posamezne ikone orodne vrstice za urejanje podatkov. Vkljuˇcimo
oziroma izkljuˇcite jo lahko v View → Toolbars → Data Edior.
10
2 Priprava podatkov v SPSS-u
Ikono na sliki 2.3a uporabimo za odpiranje dokumentov (Open data
document).
(a)
Podatke shranimo s klikom na ikono na sliki 2.3b (Save this document).
(b)
(c)
Vsebino zaslona lahko stiskamo s klikom na ikono na sliki
2.3c. V oknu Data View se natisnejo podatki, v oknu Vairable View se natisnejo informacije o spremenljivkah.
Pri
tem se ˇcrte tabele natisnejo, ˇce so prikazana na zaslonu.
Vkljuˇcite oz.
izkljuˇcite jih lahko v View → Grid Lines.
S pomoˇcjo klika na ikono na sliki 2.3d prikaˇzemo zadnjih nekaj ukazov, ki smo jih izvedli (Recall recently used dialogs).
(d)
S pomoˇcjo ikone na sliki 2.3e lahko razveljavimo zadnje dejanje ter
povrnemo prejˇsnje stanje (Undo a user action).
(e)
S klikom na ikono na sliki 2.3f ponovno izvedemo zadnje dejanje (Redo
a user action).
(f)
(g)
S pomoˇcjo ikone na sliki 2.3g si lahko ogledamo podatke
doloˇcenega anketiranca ali doloˇcene spremenljivke (Go to case).
S klikom na ikono se odpre okno z naslovom Go To, kjer
lahko v zavihku Case izberemo zaporedno ˇstevilko anketiranca,
v zavihku Variable pa iz seznama izberemo ˇzeljeno spremenljivko.
ˇ v oknu Variable View kliknemo na ikono na sliki 2.3h se vrstica
Ce
z izbrano spremenljivko obarva, tako da si lahko ogledamo lastnosti
izbrane spremenljivke.
(h)
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
(i)
11
S klikom na ikono na sliki 2.3i (Variables) si lahko ogle- damo podrobnosti izbrane spremenljivke, kjer se izpiˇse oznaka spremenljivke,
njeno opisno poimenovanje (Label), manjkajoˇce vrednosti (Missing
Values), nivo merjenja (Measurement Level) ter lestvica merjenja
z oznakami (Value Labels).
V oknu Data View lahko s klikom na ikono na sliki 2.3j (Find)
poiˇsˇcemo doloˇceno vrednost ter jo tudi zamenjamo z izbrano vrednostjo.
(j)
S klikom na ikono na sliki 2.3k (Insert Cases) lahko na po- ljubnem
mestu dodamo prazno vrstico, kamor nato vpiˇsemo odgovore novega
anketiranca.
(k)
S pomoˇcjo ikone na sliki 2.3l (Insert Variable) lahko na poljubnem
mestu dodamo novo spremenljivko.
(l)
(m)
S klikom na ikono na sliki 2.3m (Split File) se odpre
okno, kjer lahko doloˇcimo spremenljivko na podlagi katere
ˇ
loˇcimo podatke.
Ce
npr.
izberemo Organize output
by groups bomo v nadaljnih analizah dobili izpisane rezultate posebej za vsako skupino, ki jo doloˇca izbrana spremenljivka.
S klikom na ikono na sliki 2.3n (Weight Cases) bi lahko posameznim
anketirancem oz. podatkom doloˇcili ustrezne uteˇzi (ki so shranjene v
neki spremenljivki).
(n)
(o)
S pomoˇcjo ikone na sliki 2.3o (Select Cases) lahko izberemo podmnoˇzico anketiranev z izbranimi lastnostmi. Privzeto so izbrani
vsi podatki (All cases). Izberemo lahko podmnoˇzico podatkov,
ki zadoˇsˇcajo izbranemu pogoju (If condition is satisfied) ali
pa izberemo sluˇcajni vzorec podatkov (Random sample of cases).
S klikom na ikono na sliki 2.3p (Value Labels) lahko preklapljamo
med ˇstevilskim in opisnim prikazom vrednosti v oknu Data View.
(p)
Slika 2.3: Orodna vrstica urejanje podatkov
12
2.2
2 Priprava podatkov v SPSS-u
Priprava baze v SPSS-u
Pred pripravo datoteke v SPSS-u za vnaˇsanje podatkov iz anket si na vpraˇsalniku oznaˇcimo
oznake vpraˇsanj ter oznake odgovorov (slika 2.4). Prvo vpraˇsanje je sestavljeno iz desetih podvpraˇsanj, zato le-ta oznaˇcimo z V1 a, V1 b,...,V1 j. Podobno oznaˇcimo tri
podvpraˇsanja vpraˇsanja 2: V2 a, V2 b, V2 c. Kadar vpraˇsanje ponuja veˇc moˇznih
odgovorov, v naˇsem primeru je to vpraˇsanje 3, oznaˇcimo vsak odgovor posebej: V3 a,
V3 b,...,V3 h Naslednje vpraˇsanje Spol tako krajˇse oznaˇcimo z V4 in si pri ˇzenskem
spolu oznaˇcimo 1, pri moˇskem spolu pa 2. Vpraˇsanje Starost oznaˇcimo z V5, Delovno
dobo z V6,... Na vrhu vpraˇsalnika smo oznaˇcili ˇse ID, kar predstavlja identifikacijˇsko
ˇstevilko ankete. V primeru napake pri vnaˇsanju podatkov lahko tako znova poiˇsˇcemo
anketo in preverimo vneˇsene vrednosti.
ID
V1_a
V1_b
V1_c
V1_d
V1_e
V1_f
V1_g
V1_h
V1_i
V1_j
V2_a
V2_b
V2_c
V3_a
V3_b
V3_c
V3_d
V3_e
V3_f
V3_g
V3_h
V4
1
2
V5
V6
V7
1
2
3
4
V8
1
2
3
4
5
Slika 2.4: Primer vpraˇsalnika z oznakami vpraˇsanj in odgovorov
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
2.2.1
13
Vpisovanje spremenljivk
Nato zaˇcnemo pripravljati bazo podatkov. V
spodnjem levem kotu
SPSS-a kliknemo gumb
Variable View (Slika
2.5). Odpre se nam prazna tabela, kamor bomo
vpisali vse spremenljivke
iz naˇsega vpraˇsalnika.
Vsaka vrstica predSlika 2.5: Vpisovanje spremenljivk - okno Variable View
stavlja eno spremenljivo, v stolpce pa vpiˇsemo
lastnosti posamezne spremenljivke oziroma jih izberemo izmed ponujenih moˇznosti (odebeljeno so zapisane lastnosti spremenljivk, ki jih vedno ustrezno prilagodimo):
• Name: Vpiˇsemo ime spremenljivke. Vpisujmo kratka imena, prvi znak imena
mora biti ˇcrka, ime spremenljivke ne sme imeti presledkov (uporabimo lahko npr.
podˇcrtaj).
• Type: Doloˇcimo tip spremenljivke, privzeta vrednost je ˇstevilska spremenljivka
(Numeric). V primeru datumskih spremenljivk izberemo Date, ˇce je spremenljivka znesek lahko izberemo Dollar ali Custom currency. ˇce spremenljivke niso
ˇstevilske z njimi ne moremo raˇcunati (npr. odgovor v obliki vpisanega besedila),
zato jih oznaˇcimo kot String.
• Label: Vpiˇsemo opisno poimenovanje spremenljivke, zapiˇsemo lahko kar besedilo
anketnega vpraˇsanja (do 256 znakov, lahko vsebuje presledke).
• Width: ˇstevilo ˇstevk ali znakov (za ˇstevilsko spremenljivko je privzeto 8 ˇstevk).
• Decimals: ˇstevilo decimalnih mest vpisanih podatkov.
• Values: Vpiˇsemo opis vrednosti spremenljivk.
• Missing: Definiramo doloˇcene vrednosti kot manjkajoˇce.
• Columns: Doloˇcimo lahko ˇsirino stolpca ( v pogledu Data View).
• Align: Prikaz podatkov v oknu Data View, za ˇstevilske podatke je privzeta desna
poravnava, za znakovne vpise pa leva poravnava.
• Measure: Nivo merjene spremenljivke lahko doloˇcimo kot Nominal v primeru imenske lestvice, Ordinal v primeru urejenostne lestvice ali Scale v primeru, da imamo
podatke na intervalni ali razmernostni lestvici (veˇc o lestvicah lahko preberete v
zelenem okvirˇcku na strani 14).
14
2 Priprava podatkov v SPSS-u
Nekaj veˇ
c o lestvicah:
• Imenska (ali nominalna) lestvica.
Predstavljajo neko poimenovanje, med enotami je moˇzno le primerjanje (je
enako/ni enako). Primer: spol, barva oˇci, kraj bivanja,...
• Urejenostna (ali ordinalna) lestvica.
ˇ
Stevila
prirejena enotam predstavljajo urejenost, tako ima vrstni red nek pomen, razlike med vrednostmi pa niso smiselne. Med enotami je poleg primerjanja (je enako/ni enako) moˇzna ˇse primerjava veˇcje-manjˇse. Primer: stopnja
ˇ SS,...),
ˇ
izobrazbe (OS,
ocene, vrstni red na tekmovanju, lestvice strinjanja (1sploh se ne strinjam,..., 5-popolnoma se strinjam), saj ˇsirine intervalov niso
enako ˇsiroke,...
• Intervalna lestvica.
Poleg urejenosti imajo pomen tudi razlike med vrednostmi, pri tem je niˇcelna
vrednost doloˇcena poljubno, intervali med vrednostmi pa so enako ˇsiroki. Primer: datum, temperatura (F), IQ toˇcke,...
• Razmernostna lestvica.
Vrednost niˇc je enoliˇcno doloˇcena, zato lahko raˇcunamo tudi razmerje (kvocient)
med vrednostma dveh enot. Primer: starost, viˇsina osebnega dohodka, meseˇcna
poraba, dolˇzina, masa, temperatura (K),...
V okno Variable View zaˇcnemo torej vpisovati spremenljivke.
• V prvo vrstico tako najprej vpiˇsemo pod Name oznako ID, pod Label vpiˇsemo
Identifikacijska ˇstevilka ankete. S to spremenljivko sicer ne bomo raˇcunali, ker je
namenjena le kontroli vneˇsenih podatkov, kljub temu smo Measure nastavili na
Nominal (glej sliko 2.6).
• Nato vpiˇsemo prvo spremenljivko iz naˇsega anketnega vpraˇsalnika, torej Velikost
pisarne (glej vpraˇsalnik na sliki 2.4). Pod Name vpiˇsemo V1 a, pod Label vpiˇsemo
Velikost pisarne ter nivo merjenja nastavimo na urejenostni (v stolpcu Measure
izberemo Scale1 ).
Nadaljujemo z vpisovanjem posameznih oznak za vrednosti, kot smo jih oznaˇcili na
vpraˇsalniku na sliki 2.4. Torej anketirance smo o velikosti pisarne spraˇsevali na 5stopenjski lestvici. Na vpraˇsalniku smo oznaˇcili, da bomo odgovor ’zelo nezadovoljen’
vpisali s ˇstevilko 1, ’nezadovoljen’ z 2,...
1
Vse 5-stopenjske lestvice strinjanja so v bistvu urejenostne, tako da bi morali v stolpcu Measure
izbrati Ordinal. Ker pa se v druˇzboslovnih raziskavah take lestvice uporabljajo kot intervalne oz. razmernostne in z njimi raˇcunamo povpreˇcja, standardne odklone,..., smo nivo merjenja nastavili na Scale.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
15
Slika 2.6: Vpisovanje spremenljivk
Opis vseh vrednosti dodamo tako, da kliknemo na celico s trenutno oznako None
v stolpcu Values pri spremenljivki V1 a
Odpre senovo okno z naslovom Value Labels (Slika 2.7a), kjer vpiˇsemo:
• v okno Value vpiˇsemo 1,
• v okno Label vpiˇsemo ’zelo nezadovoljen’,
• kliknemo gumb Add,
(a) Opis vrednosti 1 za ’zelo nezadovoljen’
• v okno Value vpiˇsemo 2,
• v okno Label vpiˇsemo ’nezadovoljen’,
• kliknemo gumb Add,
• postopek ponovimo ˇse za vrednosti 3,
4 in 5,
• kliknemo gumb OK (slika 2.7b ). V
primeru, da smo se zmotili, si lahko
(b) Opis vseh vrednosti
pomagamo z gumboma Change
(lahko spremenimo vpisano vrednost Slika 2.7: Dodajanje oznak posameznim vrevrednostim ali njeno oznako) ali Re- dnostim
move (izbriˇsemo vpis izbrane vrednosti).
16
2 Priprava podatkov v SPSS-u
Nadaljujemo z vpisom vseh ostalih spremenljivk ter vrednosti.
Kadar imamo enako lestvico pri
veˇc spremenljivkah (kot pri spremenljivkah V1 a do V1 j) lahko
lestvico vpiˇsemo le enkrat, ter si
pomagamo s kopiranjem:
• kliknemo z desnim gumbom
miˇske na ˇze vpisano lestvico
pri spremenljivki V1 a,
Slika 2.8: Kopiranje vpisane lestvice
• izberemo Copy (glej sliko 2.8 ),
• kliknemo na spremenljivko, kjer ˇzelimo dodati isto lestvico, le-ta se obarva oranˇzno
(ˇce ˇzelimo izbrati veˇc spremenljivk hkrati se le pomaknemo z miˇsko navzdol),
• kliknemo z desnim gumbom miˇske ter izberemo Paste.
Slika 2.9: Vpis manjkajoˇcih vrednosti
V SPSS-u imamo moˇznost definirati tudi
ˇ npr.
manjkajoˇce vrednosti.
Ce
anketiranec na vpraˇsanje ne odgovori, bi
lahko pustili polje prazno, lahko pa
vpiˇsemo neko ˇstevilko in to oznaˇcimo v
stolpcu Missing pri posamezni spremenljivki. V vpraˇsalniku na sliki 1.1 smo
pred vpraˇsanjem 2 za pisali, da zaposlenim
v IT oddelku nanj ni potrebno odgovarjati. Manjkajoˇce vrednosti v SPSS-u navadno oznaˇcimo s kakˇsno veliko vrednostjo,
ki ni moˇzna pri odgovorih na posamezno
vpraˇsanje. Recimo, da smo izbrali 99 kot
oznako za manjkajoˇce vrednosti pri spre-
menljivkah V2 a, V2 b in V2 c.
• kliknemo na celico v stolpcu Missing pri spremenljivki V2 a, odpre se okno na
sliki 2.9 ,
• V prvo polje Discrete missing values vpiˇsemo 99,
• potrdimo s klikom na gumb OK.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
17
Pri tretjem vpraˇsanju smo anketirancem ponudili veˇc moˇznih odgovorov. V takem primeru
je potrebno vsak odgovor vnesti kot novo spremenljivko, kot smo to oznaˇcili na sliki
2.13. Poglejmo si, kako pripravimo spremenljivko za prvi ponujeni moˇzni odgovor tretjega
vpraˇsanja. V oknu Variable View vpiˇsemo (slika 2.10):
• v stolpec Name vpiˇsemo V3 a,
• v stolpec Label vpiˇsemo besedilo odgovora, torej ’podaljˇsanje delovnega ˇcasa do 17.
ure’,
• v stolpcu Measure nastavimo imensko lestvico (Nominal).
Podobno vpiˇsemo ˇse ostale spremenljivke tretjega vpraˇsanja V3 b in V3 h.
Slika 2.10: Vpisovanje spremenljivk v primeru veˇc moˇznih odgovorov
Ko konˇcamo z vpisom vseh spremenljivk, oznak posameznih vrednosti ter doloˇcimo manjkajoˇce vrednosti naˇse okno Variable View zgleda tako kot je prikazano na sliki 2.11.
18
2 Priprava podatkov v SPSS-u
Slika 2.11: Priprava baze podatkov - vpisane vse spremenljivke in vrednosti
Pripravljeno bazo shranimo z ukazom v SPSS-u: File → Save as.
Odpre se okno na sliki 2.12 .
• V oknu Look in poiˇsˇcemo
mapo, kamor bomo shranili
podatke,
• v okno File name vpiˇsemo
ime datoteke, npr.
podatki podjetjeX,
• SPSS datoke imajo konˇcnico
.sav, kar je oznaˇceno v oknu
Save as type,
• kliknemo gumb Save.
Slika 2.12: Shranjevanje baze v SPSS-u
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
2.2.2
19
Vpisovanje podatkov
Ko konˇcamo s pripravo baze z vsemi spremenljivkami, zaˇcnemo z vpisovanjem podatkov.
Primer reˇsenega vpraˇsalnika je predstavljen na sliki 2.13. Pred vpisovanjem podatkov
vsak vpraˇsalnik oznaˇcimo z identifikacijsko ˇstevilko ID, da lahko po potrebi, torej ˇce se
zmotimo pri vnaˇsanju, poiˇsˇcemo doloˇcen vpraˇsalnik in podatke ustrezno popravimo.
1
x
x
x
48
21
x
x
Slika 2.13: Primer reˇsenega vpraˇsalnika
Podatke vnaˇsamo v okno Data View. Na sliki 2.14a je prikazan vnos podatkov iz
vpraˇsalnika na sliki 2.13. Kjer imamo lestvico vnesemo ˇstevilko, ki jo je na vpraˇsalniku
20
2 Priprava podatkov v SPSS-u
oznaˇcil anketiranec (npr. pri prvem in drugem vpraˇsanju). Pri tretjem vpraˇsanju smo pripravili osem spremenljivk (V3 a, V3 b,...,V3 h) in pri posamezni spremenljivki v SPSSu vpiˇsemo 0, ˇce moˇzni odgovor ni bil izbran ter 1, ˇce je anketiranec izbral doloˇceni odgovor.
Pri vpraˇsanjih V5 in V6 v oknu Data View vpiˇsemo ˇsteviloske vrednosti, ki jih je anketiranec dopisal na vpraˇsalnik. Na sliki 2.14b je prikazano okno, ko vnesemo vse podatke.
Bazo podatkov v SPSS-u (podatki PodjetjeX.sav), s katerimi delamo v tem priroˇcniku,
najdete na strani http://www2.fov.uni-mb.si/matstat/upload/PrirocnikSPSS/podatki PodjetjeX.rar
v zazipani datoteki.
(a) Vnos podatkov iz vpraˇsalnika ˇst. 1
(b) Vneˇseni podatki
Slika 2.14: Priprava baze - vnos podatkov
2.3
Delo s pomoˇ
cjo ukazov - Syntax
V tem poglavju bomo prikazali ˇse en naˇcin, kako lahko pripravimo bazo za vnaˇsanje
podatkov, in sicer s pomoˇcjo ukazov. Ustrezne ukaze bomo najprej (zaradi enostavnosti)
pripravili v Excelu oziroma Wordu in jih nato prenesli v okno za izvrˇsevanje ukazov
Syntax.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
2.3.1
21
Priprava ukazov za vpis besedila vpraˇ
sanj
Najprej bomo v Ecelu
pripravili ukaze za vpis
besedila vpraˇsanj.
V
stolpec A tako vpiˇsemo
VAR LAB (okrajˇsava
za Variable label ), v stolpec C vpiˇsemo narekovaj
(”) ter v stolpec E narekovaj ter piko (”.). Pika
v SPSS-u pomeni, da gre
Slika 2.15: Excel - priprava ukazov VAR LAB
za konec nekega ukaza.
Stolpca B in D pustimo
zaenkrat prazna, vpis v prvi vrsti pa skopiramo ˇse v 25 vrstic, saj imamo toliko vpraˇsanj
oz. podvpraˇsanj (slika 2.15).
V naslednjem koraku v stolpec B vpiˇsemo oznake spremenljivk (glej sliko 2.4), v stolpec
D pa besedilo vpraˇsanj. Ko vpiˇsemo vse spremenljivke Excel-ov delovni list izgleda kot
je prikazano na sliki 2.16.
Slika 2.16: Excel - priprava ukazov VAR LAB in vpis spremenljivk ter vpraˇsanj
22
2.3.2
2 Priprava podatkov v SPSS-u
Priprava ukazov za vpis besedila odgovorov
Nato v Word-u pripravimo ukaze za vpis besedila odgovorov. Ukaz za
poimenovanje razliˇcnih kategorij oz. odgovorov se
zaˇcne z VAL LAB, kar
je okrajˇsava za Value label. Vseh deset spremenljivk prvega vpraˇsanja
ima isto lestvico, tako da
bomo lahko ukaz za besedilo odgovorov vpisali
hkrati.
Najprej tako zapiˇsemo
ukaz VAL LAB, nato je
vmes presledek ter ime
prve spremenljivke V 1 a,
spet sledi presledek, nato
ime druge spremenljivke
V 1 b in tako naprej do
desete spremenljivke prvega vpraˇsanja V 1 j. V
naslednjo vrstico nato
zapiˇsemo 1, presledek,
narekovaj (’), poimenovanje prve vrednosti na
lestvici, torej zelo nezadovoljen.
Podobno
zapiˇsemo ˇse ostale ˇstevilske vrednosti na lestvici
Slika 2.17: Word - priprava ukazov VAL LAB
in ustrezna besedila. Na
koncu vrstice, kjer opiˇsemo zadnjo kategorijo je spet obvezno pika (.), ker le-ta nakaˇze, da
smo zakljuˇcili z navajanjem lestvice posamezne spremenljivke oz. skupine spremenljivk.
Na podoben naˇcin vpiˇsemo ˇse odgovore pri drugem, ˇcetrtem, sedmem in osmem vpraˇsanju
(slika 2.17).
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
2.3.3
23
Okno Syntax in izvedba ukazov
V primeru priprave baze s pomoˇcjo ukazov nam ne bi bilo potrebno niˇcesar vpisovati v
okno Variable View, kot smo to storili v poglavju 2.2.1. Po odprtju programa SPSS in
nove baze (glej sliko 2.2), bi lahko nadaljevali s spodnjim postopkom.
Ukaze, ki smo jih pripravili v prejˇsnjih
dveh poglavjih moramo sedaj tudi izvesti, zato potrebujemo ukazno oz. Syntax okno.
Le-tega dobimo tako, da
kliknemo na File → New → Syntax (slika 2.18). Odpre se nam prazno
okno Syntax, kamor bomo skopirali vse Slika 2.18: Odpiranje novega ukaznega okna
- Syntax
ukaze.
Nato vse ukaze za vnos besedila vpraˇsanj in besedila odgovorov, ki smo jih pripravili v
poglavjih 2.3.1 in 2.3.2 skopiramo v desno polje Syntax okna. Na sliki 2.19 je skopiran
samo del ukazov VAR LAB za prvo anketno vpraˇsanje. Nato vse ukaze oznaˇcimo (lahko
ˇ se postavimo z
s klikom na Ctrl+A) ter kliknemo na ikono z zelenim trikotnikom. Ce
miˇsko na zelen trikotnik, se izpiˇse Run Selection. S tem se izvedejo vsi oznaˇceni ukazi.
V primeru s slike 2.19 bi se zdaj v oknu Variable View izpisala besedila vseh desetih
spremenljivk prvega anketnega vpraˇsanja.
Slika 2.19: Okno Syntax in izvedba ukazov
S klikom na ikono z zelenim trikotnikom bi sevedal lahko izvedli tudi vse ukaze, ki so skozi
celoten priroˇcnim zapisani v modrih Syntax okvirˇckih.
24
3
3.1
3 Opisne statistike
Opisne statistike
Fekvence - ukaz Frequences
Najprej si bomo ogledali, kako poiskati frekvence ter relativne frekvence oziroma odstotke.
Prvo vpraˇsanje, ki se nanaˇsa na socio-demografske spremenljivke v vpraˇsalniku Spol (spremenljivka V3). Kot smo zapisali v poglavju ..., je to imenska spremenljivka, torej je zanjo
smiselno raˇcunanje frekvenc. Tako nas najprej zanima koliko ˇzensk in koliko moˇskih je
odgovarjalo na naˇsa vpraˇsanja.
V SPSS-u izberemo Analyze v menijski vrstici, nato Descriptive Statistics ter na vrhu
novega menija ˇse Frequencies (glej sliko 3.1). Ukaze bomo v prihodnje krajˇse zapisali
kot: SPSS: Analyze → Descriptive Statistics → Frequencies.
Slika 3.1: Frekvence - ukaz
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
25
Odpre se nam okno Frequences 3.2a,
kjer imamo na levi seznam vseh spremenljivk, na desni strani pa prazno
okno, kamor dodamo spremenljivke, katerih frekvence ˇzelimo izraˇcunati.
V
desno podokno Variable(s) spremenljivke prenesemo tako, da jih najprej
oznaˇcimo ter jih nato prenesemo z
miˇsko ali s kilkom na puˇsˇcico med
obema oknoma. Na sliki 3.2b je prikazano, da smo izbrali spremenljivko
Spol.
Pod oknom je ˇze oznaˇcena
moˇznost Display frequency tables, ki
prikaˇze frekvenˇcno tabelo. V primeru,
da ima spre- menljivka veliko moˇznih
vrednosti ter vas frekvenˇcna tabela ne
zanima, lahko to moˇznost tudi odznaˇcite.
(a) Izbira spremenljivke
Okno Frequences na desni ponuja ˇse ˇstiri
moˇznosti: Statistics, Charts, Format in
Bootstrap. V oknu Format lahko na(b) Izbrana spremenljivka Spol
stavimo prikaz vrednosti v tabelah, kjer
je privzet naraˇsˇcajoˇc prikaz vrednosti spre- Slika 3.2: Frekvence - izbira spremenljivk
menljivk, v oknu Statistics doloˇcimo katere mere srednje vrednosti in razprˇsenosti
ˇzelimo. Ker je spremenljivka Spol imenska te statistike niso primerne (glej okvirˇcek o
lestvicah na strani 14). Poglejmo, kakˇsne moˇznosti nam ponuja okno Charts.
Okno Frequencies: Charts nam ponuja tri
razliˇcne tipe grafiˇcnih prikazov. Avtomatiˇcno je privzeto, da ne ˇzelimo izrisanega grafa (None). Izbiramo lahko med paliˇcnim grafom (Bar charts),
tortnim diagramom (Pie charts) ali histogramom (Histograms) z dorisano normalno krivuljo (oznaˇcena moˇznost Show normal curve on
histogram) ali brez. V naˇsem primeru spremenljivke Spol smo izbrali tortni diagram (slika
3.3).
Izberemo lahko tudi ali ˇzelimo na grafu oznaˇcene
frekvence ali odstotke. V spodnjem delu okno
(pod Chart Value) smo pustili privzete freSlika 3.3: Frekvence - izbira grafov kvence (Frequencies), lahko bi izbrali tudi odstotke (Percentages).
Svojo izbiro potrdimo s klikom na gumb Continue.
26
3 Opisne statistike
SPSS rezultate prikazuje v posebnem oknu, ki je poimenovan Output. Na desni strani
okna je prikazano kazalo vseh dosedanjih analiz, na levi strani pa se ob vsaki izvedeni
analizi najprej izpiˇsejo ukazi, pod njimi pa rezultati posamezne analize (Slika 3.4).
zapis
izvedenih
ukazov
rezultati
analiz
kazalo
analiz
Slika 3.4: Output - izpis rezultatov
Izpis rezultatov (Output) lahko seveda shranimo ter kasneje dostopamo samo do izraˇcunanih
tabel in grafov. V oknu z rezultati zberemo File → Save As ter izberemo ime datoteke,
ki bo imela knoˇcnico .spv.
Syntax
+
+
+
+
+
....za programerske frike :)
FREQUENCIES VARIABLES=V4
/NTILES=4
/STATISTICS=STDDEV VARIANCE MINIMUM MAXIMUM MEAN MEDIAN MODE
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.
1
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
Kot je razvidno ˇze iz
slike 3.4 je prvi del rezultatov podan v tabelah, kjer iz prve tabele
izvemo, da imamo 74
odgvovorov anketirancev
ter nobenega manjkajoˇcega odgovora (Missing)
pri spremenljivki Spol
(Slika 3.5a).
Spodnja
tabela podaja frekvence
(Frequency), odstotke
(Percent), veljavne odstotke (Valid Percent)2
ter kumulativne odstotke
(Cumulative Percent).
27
(a) Tabeli
V naˇsi anketi je tako sodelovalo 31 ˇzensk (42%)
ter 43 (58%) moˇskih.
Na sliki (Slika 3.5b) je
prikazan tortni diagram.
Navadno ˇzelimo, da so
na grafu prikazani tudi
frekvence ali odstotki. ˇce
ˇzelimo spreminjati izgled
grafa, najprej dvakrat
kliknemo na graf. Odpre
se nam okno Chart Editor (glej sliko 20a).
(b) Tortni diagram
Slika 3.5: Rezultati za spremenljivko Spol
ˇ ˇzelimo dodati vrednosti na
Ce
tortni diagram izberemo Chart
Editor: Elements→Show Data
Labels (Slika 3.6). Odpre se
nam okno z lastnostmi grafa
(Properties), kjer lahko urejamo
razliˇcne parametre (glej sliko 3.7).
Slika 3.6: Urejanje grafov
2
V primeru manjkajoˇcih vrednosti se odstotki ter veljavni odstotki razlikujejo, saj je pod odstotki
izraˇcunan ˇse ostotek manjkajoˇcih vrednosti. V takem primeru navadno navedemo veljavne odstotke,
ki predstavljajo odstotke pri posamezni kategoriji glede na ˇstevilo vseh odgovorov (in ne na ˇstevilo
anketirancev).
28
3 Opisne statistike
V oknu z lastnostmi grafa lahko torej urejamo:
• velikost grafa (Chart Size),
• obliko naslova (Text Layot); vodoravna, navpiˇcna oz. poˇsevna usmerjenost naslova,
• oblikovanje besedila (Text Style);
vrsta pisave, velikost ter barva,
• oblikovanje polj z oznakami (Fill &
Border); polnilo in obroba okvirja z
vrednostmi,
• oblikovanje vrednosti (Number format); ˇstevilo decimalnih mest, prikaz znaka %.
S slike 3.6 je razvidno, da smo ˇstevilo
decimalk nastavili na 0.
Poleg tega
smo v zavihku Fill & Border izbrali
prosojno ozadje (Transparent) ter velikost pisave za iz-pisane vrednosti nastavili na 20 v zavihku Text Style.
Vsakiˇc ko spremenimo kakˇsno izmed nastavitev to potrdimo s klikom na gumb
Apply.
Slika 3.7: Urejanje oznak grafa
Spreminajmo lahko tudi velikost pisave legende
ter naslova in sicer tako, da dvokliknemo na
napis.
Nastavitve spet spreminjamo v zavihku Text Style in potrdimo s klikom na
gumb Apply.
Na sliki 21 je prikazan urejen tortni diagram kot je opisano zgoraj.
V
zavihku Fill & Border lahko npr.
izberemo barvo ozadja in obrobo oznak na grafu.
V naˇsem primeru (Slika 3.8) smo izbrali prosojno ozadje in obrobo (na barvni paleti izberemo bel preˇctan pravokotnik oz.
Transparent).
Slika 3.8: Urejanje oznak grafa
V oknu Chart Editor lahko doloˇcimo tudi, da so
pri tortnem diagramu rezine med sabo loˇcene. To moˇznost izberemo z ukazom Chart
Editor: Elements→Explode Slice.
ˇ ˇzelimo zamenjati barve rezin dvokliknemo ali na posamezno rezino ali na oznako v
Ce
legendi. Odpre se nam okno z lastnostmi, kjer lahko v zavihku Fill & Border zamenjamo
barvo.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
29
Naslednje vpraˇsanje je bilo Starost, oznaˇceno z V5 (glej vpraˇsalnk
na sliki 1.1). Starost je merjena na razmernostni letvici (glej
okvirˇcek na strani 14, zato lahko
zanjo izraˇcunamo tako mere centralne tendence oz.
srednje
vrednosti (mediano, modus ,
aritmetiˇcno sredino) kot mere
razprˇsenosti (varianca, standardni odklon). Podobno kot prej
v SPSS-u izberemo SPSS: AnaSlika 3.9: Frekvence - izbira spremenljivke Starost lyze → Descriptive Statistics
→ Frequencies. V desno okno
Variable(s) prenesemo spremenljivko Starost (ˇse prej odstranimo iz desnega okna spremenljivko Spol iz prve analize in sicer tako da spremenljivko oznaˇcimo ter kliknemo
puˇsˇcico levo).
Na desni strani izberemo gumb
Statistics. Odpre se nam okno
prikazano na sliki 3.10.
Izmed ponujenih moˇznosti izberemo
levo zgoraj pod Percentile values kvartile (Quartiles), med
merami centralne tendence Central Tendency pa izberemo povpreˇcje oz. aritmetiˇcno sredino
(Mean), mediano (Median) in
modus (Mode). Med merami
razprˇsenosti (Dispersion) izberemo standardni odklon (Std.
deviation), varianco (Variance),
poleg tega izberemo ˇse minimum (Minimum) in maksimum
Maximum. Izbiro potrdimo s
klikom na gumb Continue. Pomen posameznih statistik najdete
v okvirˇcku Ponovi na strani 31
Slika 3.10: Frekvence - izbira statistik
V oknu Frequencies: Statistics bi lahko pod Percentile values izbrali ˇse decile, v
primeru, da pod Cut points for vtipkamo 10. V tem primeru SPSS izraˇcuna toˇcke,
ˇ vtipkamo 100, dobimo
ka ranˇzirno vrsto podatkov razdelijo na deset enakih delov. Ce
seveda centile (za podrobnejˇseinformacije poglej okvirˇcek Ponovi na strani 31 oz. ustreˇ odkljukamo Percentile(s) in v okence vpiˇsemo npr. 30, dobimo
zno literaturo). Ce
30. centil oziroma vrednost, ki naˇso ranˇzirno vrsto razdeli v razmerju 30:70. Pod merami
razprˇsenosti (Dispersion) bi lahko izbrali razpon vrednosti Rangeter standardno napako
povpreˇcja S.E. mean. Desno spodaj pod Distribution lahko izberemo ˇse koeficienta
30
3 Opisne statistike
asimetriˇcnosti (Skewness) in sploˇsˇcenosti (Kurtosis) normalne porazdelitve.
V oknu Frequencies (slika 3.9) lahko
izberemo ˇse ustrezen graf s klikomna gumb Charts. Odpre se nam
okno Frequencies: Charts, kjer je
privzeto nastavljena moˇznost None,
kar pomeni, da se graf ne bo izrisal. V naˇsem primeru bomo tokrat
pod Chart type izberali histogram
z dorisano normalno krivuljo, kar pomeni, da oznaˇcimo Histograms: in
v spodnji vrstici odkljukamo ˇse Show
normal curve on histogram. Pod
izbiro tipa grafikona imamo moˇznost
izbire tipa vrednosti, ki bodo prikazane na grafu (Chart Values). Avtomatiˇcno je potrjena izbira Frequencies, kar pomeni, da bodo pri histogramu (na y osi) prikazane frekvence.
ˇ ˇzelimo prikazati odstotke, izbeCe
remo Percentages. Izbiro potrdimo
s klikom na gumb Continue.
Slika 3.11: Frekvence - izbira grafov
Razmisli, zakaj je v primeru spremenljivke Starost bolj smiselna izbira histograma kot pa tortnega diagrama ali
ˇ ne nejdeˇs odgovora,
paliˇcnega grafa. Ce
poskusi narisati tortni diagram ali paliˇcni graf ter primerjaj dobljene grafikone.
Poskusi sam...
Syntax
+
+
+
+
+
....za programerske frike :)
FREQUENCIES VARIABLES=V4
/NTILES=4
/STATISTICS=STDDEV VARIANCE MINIMUM MAXIMUM MEAN MEDIAN MODE
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.
2
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
Ponovi,
ponovi,
ponovi,...
Ponovi,
31
katere
opisne
statistike
poznanmo,
kaj
pomenijo
ter
kako
jih
izraˇcunamo.
Podrobnejˇsi opis najdeˇs npr.
v
ˇ
Sparl (2010) ali Jesenko (2001).
Mere centralne tendence oz. srednje vrednosti:
• modus (Mo) je najpogostejˇsa vrednost
• mediana (Me) je srednja vrednost po poloˇzaju,
• aritmetiˇ
cna sredina ali povpreˇ
cje (¯
x) (najbolj pogosto uporabljena mer
srednje vrednosti) je seˇstevek vseh vrednosti, deljen s ˇstevilom vseh vrednosti.
Kvantili: Naj bo 0 ≤ p ≤ 1. p-kvantil xp je tista vrednost za katero velja, da je p
odstotkov vrednosti manjˇsih ali enakih xp , (1 − p) odstotkov pa veˇcjih.
Posebni kvantili:
• Kvartili so kvantili, ki podatke razdelijo na 4 enake dele:
Q1 = x0.25 , Q2 = x0,50 = M e, Q3 = x0.75 .
• Decili so kvantili, ki podatke razdelijo na 10 enakih delov:
d1 = x0.1 , d2 = x0.2 , . . . , d9 = x0.9 .
• Centili so kvantili, ki podatke razdelijo na 100 enakih delov:
c1 = x0.01 , c2 = x0.02 , . . . , c3 = x0.99 .
Mere variabilnosti ali razprˇ
senosti:
• varianca - s2 je definirana kot povpreˇcje kvadratov odklonov od aritmetiˇcne
sredine.
√
• Standardni odklon - s se izraˇcuna kot kvadratni koren iz variance (s = s2 ).
Standardni odklon pove, koliko se v povpreˇcju odklanjajo vrednosti od aritmetiˇcne sredine.
32
Ker smo v oknu
Frequencies pustili oznaˇceno Display frequency
tables (slika 3.9)
je najprej pri
rezultatih, torej v oknu Output, podana
frekvenˇcna tabela. Na sliki
3.12 je prikazan le del tabele, ker je tabela precej dolga
in nas v tem
primeru ne zanima koliko zaposlenih dosega
posamezno starost.
3 Opisne statistike
...
...
Slika 3.12: Frekvenˇcna tabela za spremenljivko Starost
Slika 3.13 prikazuje tabelo z opisnimi statistikami za spremenljivko Starost. Najmlajˇsi zaposleni je star 20 let, najstarejˇsi
zaposleni pa 59 let. Povpreˇcna starost anketirancev je 38 let, standardni odklon pa
7.6 let.
Polovica anketirancev je mlajˇsa od 39,5
let, polovica pa je starejˇsih (mediana Me
= 39, 5). Prvi kvartil Q1 je enak 32,75
(oznaka v tabeli Percentile 25), kar pomeni, da je ˇcetrtina (oziroma 25%) anketiˇ
rancev mlajˇsih od 32,75 let. Cetrtina
anketirancev je starejˇsih od 43,0 let (Q3 = 43,
0).
Slika 3.13: Opisne statistike za spremenljivko
Starost
Najveˇc anketirancev je starih 43 let (modus
Mo = 43). Iz frekvenˇcne tabele (slika 3.12)
lahko razberemo, da je 8 anketirancev starih 43 let (glej drugi stolpec Frequency)
oziroma 10.8% anketirancev je starih 43 let
(glej ˇcetrti stolpec Valid Percent).
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
33
Histogram za spremenljivko Starost je prikazan
na sliki 3.14. Na levi
so ˇse enkrat podani podatki o ˇstevilu anketirancev (N = 74), povpreˇcni
starosti (Mean=38.26) in
standardnem odklonu
(Std. Dev.=7.646).
Slika 3.14: Histogram za spremenljivko Starost
Porazdelitev je bimodalna, saj imamo dva vrhova (pri 36 in 42 let)
in vendar se normalna
krivulja kar dobro prilega histogramu. Kako
bi preverili, ali je porazdelitev spremenljivke
Starost res normalno porazdeljena?
Dve statistiki, ki nam pomagata pri ugotavljanju ali je porazdelitev normalna sta asimetriˇcnost porazdelitve in sploˇsˇcenost porazdelitve.
Omenjena koeficienta izraˇcunamo tako, da v oknu Frequencies: Statistics (glej sliko
3.10) pod Dispersion izberemo ˇse asimetriˇcnost Skewness in Kurtosis.
...
...
Na sliki 3.15 sta prikazana koeficienta
asimetrije in sploˇsˇcenosti.
V primeru
normalne porazdelitve, sta oba omenjena
koeficienta enaka 0.
V primeru spremenljivke Starost je koeficient asimetrije (Skewness) enak 0.062, kar pomeni, da je porazdelitev spremenljivke Starost nekoliko bolj razpotegnjena v desno.
Koeficient sploˇsˇcenosti, ki meri
koniˇcastost porazdelitve, (Kurtosis) je
enak 0.552, kar nakuzuje nekoliko bolj
ˇspiˇcast vrh porazdelitve spremenljivke Starost.
Odloˇcitev o normalnosti porazdelitve na
podlagi sploˇsenosti in asimetriˇcnosti je
Slika 3.15: Del tabele z opisnimi statistikami lahko seveda precej zahtevna, saj ne obstaza spremenljivko Starost s koeficientoma asi- jajo jasno doloˇcene meje obeh koeficientov,
metrije in sploˇsˇcenosti
za katere bi lahko rekli, da je porazdelitev
spremenljivke zagotovo normalna. Kadar
34
3 Opisne statistike
potrebujemo objektivnejˇsi odgovor ali je porazdelitev normalna (npr. zaradi kasnejˇsih
testov, izvedemo Kolmogorov-Smirnov test (K-S) ali Shapiro-Wilk-ov (S-W) test (glej
poglavje 8.2 na strani 113).
Poiˇsˇci frekvenˇcne porazdelitve za spremenljive Delovna doba, Izobrazba ter Delovno mesto. Za vsako izmed spremenljivk izraˇcunaj ustrezne statistike ter izberi ustrezen grafiˇcni prikaz. Interpretiraj dobljene rezultate.
Poskusi sam...
3.2
Opisne statistike - ukaz Descriptives
Slika 3.16: Opisne statistike - ukaz
Opisne statistike lahko izraˇcunamo tudi s pomoˇcjo ukaza Analyze → Descriptive Statistics → Descriptives (glej sliko 3.16). Odpre se pogovorno okno prikazano na sliki
3.17.
S pomoˇcjo moˇznosti Descriptives bomo izraˇcunali opisne
statistike za vsa podvpraˇsanja
vpraˇsanja 1 hkrati (glej vpraˇsalnik
prikazan na sliki 1.1).
V levem oknu oznaˇcimo spremenljivke
V1 a do V1 j tako da drˇzimo
tipko Ctrl in kliknemo na vsako
izmed desetih spremeljivk posebej
ali pa drˇzimo tipko Shift ter kliknemo najprej prvo spremenljivko
V1 a in nato ˇse V1 j. Izbrane
spremenljivke (obarvane rumeno)
prenesemo na desno v okno Variable(s) z miˇsko ali s klikom na
puˇsˇcico med obema oknoma.
Slika 3.17: Opisne statistike - izbira spremenljivk
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
35
S klikom na gumb Options se odpre pogovorno okno (slika 3.18), kjer izberemo opisne statistike, ki jih ˇzelimo prikazati za izbrane spremenljivke. Izbrali smo povpreˇcje,
standardni odklon, minimum ter maksimum.
Izbiro potrdimo s klikom na gumb Continue.
Moˇznost Sum izraˇcuna seˇstevek vseh vrednosti. Pod Dispersion bi lahko izbrali ˇse varianco (Variance), variacijski razmik (Range),
ki je izraˇcunan kot razlika med najveˇcjo in
najmanjˇso vrednostjo, ter standardno napako
povpreˇcja (S.E. mean), ki meri natanˇcnost
vzorˇcne ocene povpreˇcja. Pod Distribution
bi lahko izbrali ˇse sploˇsˇcenost (Kurtosis) porazdelitve ter asimetrijo (Skewness). Kadar
izberemo veˇc spremenljivk hrati tako kot v
naˇsem primeru, lahko pod Display Order
doloˇcimo, v kakˇsnem vrstnem redu naj bodo
spremenljivke prikazane. Izbiramo lahko med
Variable list, kar pomeni v enakem vrstnem
redu kot smo jih vnesli v seznam, po abecedi
(Alphabetic) ter po naraˇsˇcajoˇcih (Asceding
Slika 3.18: Opisne statistike - moˇznosti means) ali padajoˇcih povpreˇcjih (Desceding
means).
Okno Descriptives (slika 3.18) nam ponuja tudi moˇznost shranitve standardiziranih
spremenljivk, ˇce oznaˇcimo moˇznost Save standardized values as variables na dnu
okna. V naˇsem primeru standardiziranih spremenljivk ne potrebujemo, zato te moˇznosti
nismo oznaˇcili.
Izpis rezultatov za vse
spremenljivke zadovoljstva zaposlenih z delovnim okoljem in opremo
podaja tabela na sliki
3.19. Najprej opazimo,
da so na vpraˇsanje o
zadovoljstvu s telefonom
vsi anketiranci oznaˇcili 3
ali veˇc na pet-stopenjski
lestvici. Zaposleni so v
povpreˇcju najbolj zadox =
Slika 3.19: Opisne statistike - zadovoljstvo z delovnim okoljem voljni s telefonom (¯
4.0),
sledijo
fotokopirni
in opremo
stroj (¯
x = 3.7) ter
36
3 Opisne statistike
raˇcunalnik (¯
x = 3.6). Najmanj pa so zaposleni zadovoljni z opremo pisarne (¯
x = 2.8)
ter velikostjo pisarne (¯
x = 3.1). Podatki so najmanj razprˇseni pri vpraˇsanju o zado- voljstvu s telefonom (s = 0.702) ter najbolj razprˇseni pri vpraˇsanju o zvoˇcni izolaciji pisarne
(s = 1.254). Kadar nam posamezno spremenljivko oz. koncept sestavlja veˇc vpraˇsanj,
jih navadno ˇzelimo prikazati tudi na istem grafu. To najlaˇzje storimo tako, da tabelo
rezultatov (slika 30) skopiramo v Excel.
V oknu Output v
SPSS-u kliknemo na
tabelo z opisnimi
statistikami ter nato
pritisnemo tipki Ctrl
+ C ali pa kliknemo
z desnim gumbom
miˇske ter izberemo
moˇznost Copy. Odpremo Excelov delovni zvezek ter prilepimo skopirane podatke (tipki Ctrl
+ V ali desni klik
z miˇsko ter Paste).
Podatki v
Excelu so prikazani
na sliki 3.20. Najprej oznaˇcimo stolpca
z imeni spremenljivk ter s povpreˇcji
(Mean). Oba stolpca Slika 3.20: Priprava podatkov v Excelu za vpraˇsanje o zadovoljstvu
hkrati oznaˇcimo tako, zaposlenih z delovnim okoljem
da drˇzimo tipko Ctrl.
Tip grafa v Excelu 2010 izberemo tako, da
v menijski vrstici kliknemo na Vstavljanje, izberemo zavihek Grafikoni ter izberemo Paliˇ
cni graf 3 (slika 3.21). Med
paliˇcnimi grafi izberemo 2D-vrstiˇcni graf
prikazan prvi z leve. Paliˇcni grafikoni so
primerni posebej v primerih, kadar je besedilo vpraˇsanj, ki ga ˇzelimo prikazati precej
dolgo.
Slika 3.21: Izbira tipa grafa v Ecelu za
vpraˇsanje o zadovoljstvu zaposlenih z delovnim okoljem
3
V primeru angleˇske razliˇcice Excela izberete Insert → Charts → Bar.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
37
Graf zadovoljstva zaposlenih
z delovnim okoljem in opremo
je prikazan na sliki 3.22a.
Graf je potrebno nekoliko
urediti.
Najprej lahko odstranimo oznako Niz 1 na desni, saj ne
podaja nobene koristne informacije. To storimo tako,
da kliknemo na oznako Niz
1 in pritisnemo tipko Delete.
(a) Osnovni graf
V naslednjem koraku uredimo oznake vodoravne osi.
Ker smo podatke merili na 5stopenjski lestvici (1-zelo nezadovoljen,..., 5-zelo zadovoljen) naj bodo na taki lestvici
prikazani tudi podatki. To
storimo tako, da z desnim
gumbom miˇske kliknemo na
oznake vodoravne osi ter iz(b) Urejanje vodoravne osi grafa
beremo zadnjo moˇznost v meniju, to je Oblikuj os (slika Slika 3.22: Graf v Excelu za vpraˇsanje o zadovoljstvuza3.22b). Odpre se nam okno poslenih z delovnim okoljem
prikazano na sliki 3.23.
V oknu Oblikovanje osi (slika 3.23)
izberemo na levi Moˇ
znosti osi ter
nato na desni oznaˇcimo v prvi vrstici Najmanjˇ
se moˇznost Nespremenljivo ter v okvirˇcek vpiˇsemo 1.
V drugi vrstici pri zapisu Najveˇ
cje
spet oznaˇcimo Nespremenljivo ter v
okvirˇcek vpiˇsemo 5. Izbiro potrdimo
s klikom na gumb Zapri desno spodaj.
Slika 3.23: Urejanje osi grafa v Excelu
V polju Veˇ
cja enota bi lahko nastavili ˇse, kakˇsen naj bo razmik med navpiˇcnimi ˇcrtami
v grafu oz. kako pogosto naj bodo na grafu prikazane enote. V naˇsem primeru je izbrana
vrednost 1.
38
3 Opisne statistike
Grafu dodamo ˇse oznake podatkov. To storimo
tako, da se postavimo nad stolpce grafa ter kliknemo z desnim gumbom miˇske. Odpre se nam
okno, kjer oznaˇcimo Dodaj oznake podatko (slika
3.25).
Avtomatiˇcno se grafu dodajo vrednosti zapisane na
dve decimalki, tako kot dobimo izpisane v SPSS-u
(slika 3.19) in smo jih nato prenesli v Excel (slika
3.20). Vrednosti lahko zaokroˇzimo na eno decimalko tako, da oznaˇcimo stolpec povpreˇcij (Means) Slika 3.24: Dodajanje oznak podatv Excelovi tabeli (slika 3.19), kliknemo z desnim kov v Excelu
gumbom miˇske ter izberemo Oblikuj celice.
Odpre se okno Oblikovanje celic, kjer
pod Zvrstjo na levi izberemo ˇstevilo, nato
pa na desni strani zmanjˇsamo ˇstevilo decimalnih mest na 1 (slika 3.25).
Izbiro potrdimo s klikom na gumb V
redu.
Slika 3.25: Oblikovanje celic v Excelu
Slika 3.26 prikazuje urejen graf povpreˇcij
na vpraˇsanja o zadovoljstvu zaposlenih z
delovnim okoljem in opremo. Poleg zgoraj opisanih sprememb smo nastavili ˇse velikost pisave vpraˇsanj ter oznak podatkov
nastavili na 12 ter izbrali odebeljen tip pi-
save.
Slika 3.26: Urejen graf povpreˇcij v Excelu za vpraˇsanja o zadovoljstvu zaposlenih z delovnim okoljem in opremo
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
Syntax
+
+
+
+
+
39
....za programerske frike :)
DESCRIPTIVES VARIABLES=V1_a V1_b V1_c V1_d V1_e V1_f V1_g V1_h V1_i V1_j
/STATISTICS=MEAN STDDEV MIN MAX.
Poskusi sam...
3
Poiˇsˇci povpreˇcja, standardni odklon ter
minimalen in maksimalen odgovor za tri
vpraˇsanja o Zadovoljstvu zaposlenih s
tehniˇcno podporo. Nariˇsi grafe pov-
preˇcij. Interpretiraj dobljene rezultate.
3.3
Prilagodljive tabele - ukaz Custom Tables
Frekvenˇcno porazdelitev spremenljivk lahko dobimo tudi s pomoˇcjo ukaza Analyze →
Tables → Custom Tables (slika 3.27 ), kadar imamo imenske in urejenostne spremenljivke. Navadno pa ukaz Custom Tables uporabimo, kadar ˇzelimo prikazati veˇc
spremenljivk v isti tabeli (npr. vse socio-demografske spremenljivke).
Slika 3.27: Ukaz - Custom Tables
Slika 3.28: Custom Tables - opozorilo
Najprej se odpre opozorilo (slika
3.28), da morajo biti oznake spremenljivk urejene za vse kategorialne spremenljivke, prav tako morajo imeti spremenljivke urejen
nivo merjenja. Ker smo oznake in
nivo merjenja naˇsih spremenljivk
uredili ˇze na zaˇcetku, kliknemo
Ok (oznaˇcimo lahko tudi, da se to
pogovorno okno ne prikazuje veˇc
(Don’t show this dialog again)).
V primeru, da bi ˇzeleli urediti nivo merjenih spremenljivk, kliknemo Defne Variable
Properties.
40
3 Opisne statistike
Odpre se pogovorno
okno Custom Tables.
Oznaˇcimo
spremenljivki Spol in
Izobrazba (drˇzimo tipko Ctrl) v levem
oknu Variables. Spremenljivki prenesemo
v desno okno tako,
da oznaˇceni spremenljivki prenesemo
nad polje z napisom Rows, tako da
se le-to obarva rdeˇce
(slika 3.29), nato
spremenljivki spustimo.
V desnem polju se
nam nakaˇze obris tabele, ki jo bomo dobili v izpisu rezultaSlika 3.29: Custom Tables - izbira spremenljivk
tov (slika 3.30). Avtomatiˇcno se izraˇcunajo frekvence, kar je oznaˇceno v stolpcu Count.
Navadno ˇzelimo izpisane
tudi odstotke. V spodnjem levem kotu pod
napisom Define kliknemo
na gumb Summary Statistics. Odpre se nam
pogovorno okno Summary Statistics (glej
sliko 3.31).
V prvi
vrstici nas okno opomni, da smo izbrali veˇc
spremenljivk (Multiple
Variables), saj smo v
prejˇsnjem koraku izbrali
spremenljivki Spol in Izobrazba.
Slika 3.30: Custom Tables - izbira spremenljivk Spol in Izobrazba
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
41
V spodnjem oknu
Statistics izberemo
odstotke, torej izberemo Column N
%. Izbiro s pomoˇcjo
puˇsˇcice (ali miˇske)
prenesemo v desno
okno.
Izbiro potrdimo z
gumbom Apply to
Selection. V primeru, da bi v prejˇsnjem koraku oznaˇcili
Slika 3.31: Custom Tables - izbira statistic
le eno spremenljivko
v desnem obrisu tabele, bi izbira Apply to Selection pomenila, da se bodo odstotki izraˇcunali le za
ˇ bi v takem primeru kljub temu ˇzeleli izraˇcunati odstotke
oznaˇceno spremenljivko. Ce
za celo tabelo, kliknemo na gumb Apply to All.
Po zaprtju okna Summary Statistics se v oknu Custom Tables ˇze izriˇse tabela s frekvencami (stolpec Count) in odstotki (stolpec Column N %). Izbiro spremenljivk ter
izbranih statistik ˇse enkrat potrdimo s klikom na gumb OK (slika 3.31).
Izpis rezultatov v
oknu Output je prikazan v tabeli na
sliki 3.32.
Rezultate za spremenljivko Spol smo prikazali ˇze na sliki 3.4
na strani 26.
Rezultati za spremenljivko Izobrazba Slika 3.32: Custom Tables - izpis rezultatov za spremenljivki Spol
kaˇzejo, da ima 57% in Izobrazba
anketirancev srednjeˇsolsko izobrazbo, 20%
anketirancev ima viˇsjeˇsolsko ali visokoˇsolsko izobrazbo, prav toliko anketirancev (20%)
ima univerzitetno izobrazbo, magisterij oz. doktorat pa ima le 3% anketirancev.
Podatke lahko prikaˇzemo tudi grafiˇcno. Pomagamo si lahko s kopiranjem tabele rezultatov v Excel ali pa z ukazom Graphs v SPSS-u (glej poglavje 5).
42
3 Opisne statistike
+
+ Syntax
+++
....za programerske frike :)
* Custom Tables.
CTABLES
/VLABELS VARIABLES=V3 V6 DISPLAY=LABEL
/TABLE V3 [COUNT F40.0, COLPCT.COUNT PCT40.1] + V6 [COUNT F40.0, COLPCT.COUNT PCT40.1]
/CATEGORIES VARIABLES=V3 V6 ORDER=A KEY=VALUE EMPTY=INCLUDE.
4
V primeru, da izberemo v oknu Custom
Tables razmernostne spremenljivke
(nivo merjenja oznaˇcen kot Scale), se
nam avtomatiˇcno namesto odstotkov
prikaˇzejo povpreˇcja (Mean). V oknu Summary Statistic lahko nato izberamo ˇse
med ˇstevilom anketirancev (Count), najveˇcjo vrednostjo (Maximum), mediano
(Median), najmanjˇso vrednostjo (Minimum), ˇstevilom manjkajoˇcih podatkov
(Missing), modusom (Mode), kvantili (Percentile 05, 25, 75, 95 in 99),
variacijskim razmikom (Range), standardno napako povpreˇcja (Standard Error
of Mean), standardnim odklonom (Standard Deviation), varianco (Variance)
in nekaterimi drugimi.
Poskusi sam...
Poskusi za razmernostne spremenljivke iz vpraˇsalnika (spremenljivke o zadovoljstvu
ali spremenljivki Starost in Delovna doba) sestaviti tabelo z ustreznimi opisnimi statistikami. Rezultate ustrezno interpretiraj.
3.4
Veˇ
c moˇ
znih odgovorov - ukaz Multiple response
V primeru, ko imamo v vpraˇsalniku vpraˇsanje z veˇc kot enim moˇznim odgovorom, moramo
SPSS-u najprej povedati katere spremenljivke spadajo skupaj. Pomagamo si z ukazom
Multiple Response, ki ga najdemo pod Analyze → Multiple Response → Define
Variable Set (slika 3.33).
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
43
Slika 3.33: Ukaz - Multiple Response
Odpre se nam okno Define
Multiple Response Sets
prikazano na sliki 3.34. V
levem oknu polja Set Definition oznaˇcimo vse spremenljivke tretjega vpraˇsanja
V3 a, V3 b,...,V3 h in sicer tako, da jih oznaˇcimo
in prenesemo z miˇsko v
okno Variables in Set
ali pa kliknemo na puˇsˇcico
med obema oknoma.
V
spodnjem polju Variables
Are Coded As pustimo
oznaˇceno Dichotomies in
v okence Counted value
vpiˇsemo 1. V polje Name
Slika 3.34: Izbira spremenljivk v primeru veˇc moˇznih od- vpiˇsemo ’Okrepˇcevalnica’ ter
pod Label kratko oznako
govorov
V3 skupaj.
44
3 Opisne statistike
Nato kliknemo na gumb Add. V desnem polju Multiple Response Sets se pojavi oznaka $Okrepˇ
cevalnica
(slika 3.35). Na koncu v oknu Define Multiple
Response Sets (slika 3.34) kliknemo ˇse na gumb
Slika 3.35: Nova spremenljivka
Close.
v primeru veˇc odgovorov
Nato ˇzelimo seveda izraˇcunati ˇse frekvence
in odstotke za novo spremenljivko z oznako
Ukaz najdemo pod AnaV3 skupaj.
lyze → Multiple Response → Frequencies.
Odpre se nam okno Multiple Response Frequencies prikazano na sliki 3.36. Spremenljivko $Okrepˇ
cevalnica prenesemo v desno
polje Table(s) for ter izbiro potrdimo s klikom na gumb OK.
V oknu Output dobimo izpisane rezultate priSlika 3.36: Frekvence v primeru veˇc kazane na sliki 3.37. V stolpcu z oznako N dobimo izpisane frekvence pri vsakem moˇznem odmoˇznih odgovorov
govoru, v stolpcu Percent of Cases pa ustrezne odstotke (glede na ˇstevilo vseh anketirancev). Stolpca z oznako Percent v tem
primeru ne interpretiramo, saj so to odstotki izraˇcunani glede na skupno ˇstevilo vseh izbranih odgovorov v podatkih.
Najveˇc anketirancev si ˇzeli
podaljˇsanje delovnega ˇcasa
okrepˇcevalnice do 17h (76%),
sledi poveˇcana ponudba sadja
in sveˇzih sokov (53%) ter
moˇznost, da bi okrapˇcevalnico
lahko obiskovali tudi druˇzinski
ˇclani (53%).
Uvedbi ponudbe zajtrka je naklonjenih
51% anketirancem, uvedbi
razliˇcnih menijev pa polovica anketirancev.
Skoraj
polovica anketirancev si ˇzeli
tudi ponudbo vsaj dveh vegetarianskih obrokov (49%)
in odprtje okrepˇcevalnice ob
7. uri (47%). Najmanj glasov je dobila moˇznost uvedbe
naroˇcanja kosil za domov Slika 3.37: Nova spremenljivka v primeru veˇc odgovorov
(28%).
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
4
45
Intervali zaupanja
Ponovi,
ponovi,
ponovi,...
Ponovi,
Zakaj potrebujemo intervale
zaupanja?
Intervale zaupanja potrebujemo, ker so
toˇckovne ocene (npr. povpreˇcje, razlika
povpreˇcij, deleˇz,...) nezanesljive. Za
posamezno oceno ne vemo ali je toˇcna
oziroma za koliko se razlikuje od prave vrednosti.
Naj bo q neznani parameter, ki ga ocenjujemo in α vnaprej znana verjetnost. Interval
[L, D] imenujemo interval zaupanja s stopnjo zaupanja 1 − α, ˇce z zaupanjem 1 − α
priˇcakujemo, da parameter q leˇzi v tem intervalu.
Zapisano krajˇse: P (L ≤ q ≤ D) = 1 − α.
Meji intervala zaupanja sta sluˇcajni spremenljivki, kar pomeni, da pri vsakem vzorcu
zavzameta druge vrednosti. V populaciji vseh vzorcev velikosti n lahko priˇcakujemo,
da je deleˇz intervalov zaupanja, ki vsebujejo parameter q enak 1 − α, deleˇz napaˇcnih
intervalov zaupanja, kjer q ne leˇzi znotraj intervala, pa je enak α.
Poimenovanji:
• verjetnost 1 − α - stopnja zaupanja (npr. 95 % stopnja zaupanja),
• verjetnost α - stopnja tveganja (npr. 5 % stopnja tveganja),
4.1
Interval zaupanja za povpreˇ
cje
Interval zaupanja za povpreˇcje lahko izraˇcunamo v SPSS-u s pomoˇcjo ukaza Explore
(slika 4.38): SPSS: Analyze → Descriptive Statistics → Explore.
Slika 4.38: Raziˇsˇci podatke - ukaz Explore
46
4 Intervali zaupanja
Odpre se okno Explore,
kjer v desno polje Dependent List prenesemo spremenljivko za
katero raˇcunamo interval
zaupanja, npr. spremenljivko V 1 a Velikost pisarne (slika 4.39). V
spodnjem delu okna v
polju Display lahko izberemo ali ˇzelimo prikazati le izraˇcunane statistike (Statistics), le
grafiˇcne prikaze (Plots)
ali obeje (Both).
V
naˇsem primeru smo izbrali le statistike, saj nas
trenutno zanimajo intervali zaupanja.
Slika 4.39: Okno Explore
ˇ kliknemo na gumb StatiCe
stics lahko doloˇcimo, kakˇsen
interval zaupanja nas zanima
(slika 4.40). Privzeto je nastavljen 95 % interval zaupanja (Comfidence Interval
for Mean: 95 %). Izbrali
bi lahko ˇse izraˇcun razliˇcnih
kvantilov (Percentiles) ali
raziskali osamelce, torej izstopajoˇce podatke (Outliers).
Slika 4.40: Okno Explore: Statistics - izbira statistik
Syntax
+
+
+
+
+
EXAMINE VARIABLES=V1_a
/PLOT NONE
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
Izbiro potrdimo s klikom na
gumb Continue. Nato kliknemo ˇse na gumb OK v
oknu Explore (slika 4.39).
....za programerske frike :)
5
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
47
V izpisu rezultatov se
najprej izpiˇse tabela s
povzetkom vkljuˇcenih spremenljivk in ˇstevilom podatkov (Case ProcesSlika 4.41: Rezultati z ukazom Explore - vkljuˇcene spremen- sing Summary), ki je v
poroˇcilu navadno ne naljivke in ˇstevilo podatkov
vajamo (slika 4.41).
V tabeli z opisnimi statistikami (Descriptives)
v oknu Output dobimo izpisan tudi interval zaupanja (slika
4.42) oziroma njegovo
spodnjo (Lower Bound) in zgornjo mejo
(Upper Bound). Povpreˇcno zadovoljstvo zaposlenih z velikostjo pisarne je 3.08, 95% interval zaupanja pa je enak
[2.81, 3.38]. Torej, povpreˇcno zadovoljstvo z velikostjo pisarne vseh za- Slika 4.42: 95% interval zaupanja za spremenljivko Velikost
poslenih v podjetju se s pisarne
95-odstotno verjetnostjo
nahaja na intervalu [2.81, 3.38].
Interval zaupanja za povpreˇcje dobimo izraˇcunan tudi poleg rezultatov t-testa, ki ga izvedemo s pomoˇcjo ukaza Analyze → Compare Means → One Sample T Test (glej
poglavje 7.1.2). Interval zaupanja za razliko povpreˇcij pa dobimo izpisan v rezultatih
t-testa za razliko povpreˇcij (glej poglavje 7.1.1).
Interval zaupanja za povpreˇcje dobimo izraˇcunan tudi poleg rezultatov t-testa, ki ga
izvedemo s pomoˇcjo ukaza Analyze → Compare Means → One Sample T Test
(glej poglavje 7.1.2). Interval zaupanja za razliko povpreˇcij pa dobimo izpisan v rezultatih
t-testa za razliko povpreˇcij (glej poglavje 7.1.1).
4.2
Interval zaupanja za deleˇ
z
Interval zaupanja za deleˇz v SPSS-u lahko dobimo na enak naˇcin kot za povpreˇcje, ˇce
imamo dihotomno spremenljivko. To pomeni, da morajo biti podatki zapisani z vrednostmi 1 in 0, kot npr. vse spremenljivke naˇsega tretjega vpraˇsanja (glej vneˇsene podatke
na sliki 2.14). V primeru, da imenska spremenljivka z dvema vrednostma ni dihotomna
(kot npr. v naˇsih podatkih spremenljivka Spol, kjer vrednost 1 oznaˇcuje ˇzenske, 2 pa
48
4 Intervali zaupanja
moˇske), lahko spremenljivko pred izraˇcunom intervala zaupanja prekodiramo. Kako to
storimo je opisano v poglavju 6.3.
Recimo, da nas zanima 95% interval zaupanja za spremenljivko V 3 a - podaljˇsanje delovnega ˇcasa do 17. ure. Tako kot prej v SPSS-u izberemo Analyze → Descriptive
Statistics → Explore.
V oknu Explore sedaj
v desno polje Dependent List prenesemo
spremenljivko V 3 a (slika
4.43). V spodnjem delu
okna v polju Display
spet oznaˇcimo le (Statistics).
Ker ˇzelimo
izraˇcunati 95% interval
zaupanja ne rabimo v
oknu Explore: Statistics, ki bi ga dobili
s klikom na gumb Statistics, niˇcesar spreminjati, saj je privzeto nastavljen ravno 95% interval zaupanja (glej sliko
4.40).
Izbiro potr- Slika 4.43: Okno Explore - spremenljivka ’podaljˇsanje delovdimo s klikom na gumb nega ˇcasa do 17. ure’
OK.
V oknu z rezultati dobimo tabelo z opisnimi
statistikami prikazano na
sliki 4.44.
Deleˇz anketirancev, ki si ˇzelijo,
da bi bila okrepˇcevalnica
odprta do 17. ure je
enak 0.76. 95% interval zaupanja za deleˇz zaposlenih, ki si ˇzelijo odprtje okrepˇcevalnice do
17.
ure pa je enak
[0.66, 0.86]. Torej, deleˇz
Slika 4.44: 95% interval zaupanja za spremenljivko podaljˇsanje vseh zaposlenih v podjetju, ki si ˇzelijo odprdelovnega ˇcasa do 17. ure
tje okrepˇcevalnice do 17.
ure, se s 95-odstotno verjetnostjo nahaja na intervalu [0.66, 0.86].
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
Syntax
+
+
+
+
+
EXAMINE VARIABLES=V3_a
/PLOT NONE
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
49
....za programerske frike :)
6
50
5
5 Grafiˇcni prikazi
Grafiˇ
cni prikazi
Nekaj grafiˇcnih prikazov podatkov smo si pogledali ˇze v poglavju 4. V SPSS-u si lahko
ustrezen grafiˇcni prikaz izberemo v meniju Graphs → Chart Builder (slika 5.1).
Slika 5.1: Grafi (Graphs) - ukaz
Najprej se pokaˇze opozorilo (slika 5.2), da morajo
biti pred izrisi grafov nivoji merjenja spremenkljivk pra vilno nastavljeni. Ker smo mi le-te
nastavili ˇze na zaˇcetku,
kliknemo OK, v nasprotnem primeru bi uredili nivoje merjenja s
klikom na gumb Define Variable Properties.
Slika 5.2: Okno Graphs - opozorilo
Odpre se nam okno Chart Builder na sliki 5.3. Na levi strani zgoraj je prikazan seznam
naˇsih spremenljivk, desno zgoraj je okno, kjer se bo prikazal predogled izbranega grafa, v
spodnjem delu okna pa so prikazani moˇzni grafi.
V galeriji grafov v spodnjem delu okna Chart Builder (slika 47) lahko izbiramo med
devetimi osnovnimi vrstami grafov.
Prvi na seznamu so stolpiˇcni grafi - Bar (slika 5.4a). Izbiramo lahko (od leve proti desni in od zgoraj navzdol) med preprostim stolpiˇcnim grafom (Simple Bar), stolpiˇcnim
grafom s prikazom skupin (Clustered Bar) in naloˇzenim stolpiˇcnim grafom (Stacked
Bar), sledijo 3D prikazi omenjenih grafov ter grafikona s prikazom standardnih napak
(Simple Error Bar in Clustered Error Bar).
Sledijo ˇcrtni grafikoni in sicer preprosti ˇcrtni grafikon (Simple Line) ter ˇcrtni grafikon s
prikazom veˇcih skupin (Multiple Line) (slika 5.4c).
Med ploˇsˇcinskimi grafi na sliki 5.4c lahko izbiramo med preprostim ploˇsˇcinskim grafom
(Simple Area) ter naloˇzenim ploˇsˇcinskim grafom (Stacked Area) s prikazom skupin.
Tortni grafikon (Pie Chart) je prikazan na sliki sliki 5.4d.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
51
Slika 5.3: Okno Chart Builder
Razsevni diagrami so prikazani na sliki sliki 5.4e. Od leve proti desni izbiramo med
preprostim razsevnim diagramom (Simple Scatter), razsevnim grafikonom s prikazom
skupin (Grouped Scatter), sledita 3D razliˇcici omenjenih grafikonov, toˇckovni grafikon (Summary Point plot), na katerem lahko prikaˇzemo raliˇcne opisne statistike, kot
so povpreˇcje, minimum, mediano,... glede na izbrane skupine. Sledijo preprost toˇckovni
diagram (Simple Dot Plot), ki prikaˇze porazdelitev podatkov glede na izbrano spremenljivko, matrika razsevnih diagramov (Scatterplot Matrix) prikaˇze razsevne diagrame za
vse pare izbranih spremenljivk ter Drop-Line grafikon.
52
5 Grafiˇcni prikazi
Razliˇcni histogrami so predstavljeni na sliki sliki 5.4f. Od
leve proti desni so prikazani preprosti histogram (Simple
Histogram), naloˇzeni histogram (Stacked Histogram),
poligon (Frequency Poligon) ter populacijska piramida
(Population Pyramid).
(a) Stolpiˇcni grafi
Razliˇcni histogrami so predstavljeni na sliki sliki 5.4f. Od
leve proti desni so prikazani preprosti histogram (Simple
Histogram), naloˇzeni histogram (Stacked Histogram),
poligon (Frequency Poligon) ter populacijska piramida
(Population Pyramid).
Skupina grafikonov na sliki 5.4g prikazuje razlike med
naviˇsjimi in najniˇzjimi vrednostmi izbranih spremenljivk
(High-Low-Close), kjer lahko za najniˇzjo, najviˇsjo vrednost ter povpreˇcje izberemo isto spremenljivko ali pa
za vsako prikazano vrednost izberemo drugo spremenljivko. Podoben prikaz v obliki stolpcev dobimo s preprostim stolpiˇcnim grafikonom razpona (Simple Range
Bar), lahko pa prikaz razdelimo ˇse glede na skupine
(Clustered Range Bar). Razliko povrˇsin glede na povpreˇcja dveh spremenljivk in izbrane skupine prikazuje Differenced Area.
Okvirji z roˇcaji (Boxplot) so prikazani na sliki 5.4h.
Preprosti okvirji z roˇcaji (Simple boxplots) prikazujejo pet opisnih statistik, in sicer minimum, prvi kvartil, mediano, tretji kvartil in maksimum.
V primeru, da so v podatkih prisotni osamelci (angl. outliers), roˇcaji oz. ˇcrte predstavljajo 1.5 kvartilnega razmika (razlika med tretjim in prvim kvartilom). Okvirji
z roˇcaji so lahko prikazani tudi posamiˇcno za izbrane skupine (Clustered Boxplot).
1-D Boxplot
prikaˇze okvir z roˇcaji le za eno posamezno spremenljivko.
ˇ
(b) Crtni
grafi
(c) Ploˇsˇcinski grafi
(d) Tortni grafi
(e) Razsevni grafi
(f) Histogrami
(g) Najviˇsji-najniˇzji
(h) Okvirji z roˇcaji
S pomoˇcjo grafov z dvojno osjo (Dual Axes) prikazanih na sliki 5.4i lahko izberemo dve spremenljivki, ki bosta prikazani na y osi. V primeru kategorialne spremenljivke na x osi izberemo Dual Y Axes with Categorical X Axes, ˇce pa je spremenljivka na osi x razmerno(i) Dvojna os
stna oz. ˇstevilska izberemo Dual Y Axes with Scale X
Slika 5.4: Izbira tipa grafa
Axes.
v okolju Chart Builder
V nadaljevanju je po korakih prikazanih nekaj najpogosteje
uporabljenih grafikonov.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
5.1
53
Okvirji z roˇ
caji
Najprej bomo prikazali okvir z roˇcaji za spremenljivko Starost.
Kot smo ˇze zapisali,
okvirje z roˇcaji najdemo
v meniju Graphs →
Chart Builder. Levo
spodaj v oknu Chart
Builder (slika 46) izberemo preproste okvirje
z roˇcaji (prva ikona na
sliki 47h).
Nato kliknemo na izbrano ikono
ter jo povleˇcemo v okno
desno zgoraj, kjer se
prikaˇze predogled grafikona prikazan na sliki
5.5. Nato v okno na levi
strani grafikona prenesemo spremenljivko StaSlika 5.5: Izbira grafa - boxplot za spremenljivko Starost
rost in sicer tako, da
spremenljivko oznaˇcimo ter prenesemo nad polje Y-Axis?, da se te-to obarva rdeˇce.
Izbiro potrdimo s s klikom na gumb OK.
V izpisu rezultatov (okno
Output) se izriˇse okvir
z roˇcaji prikazan na sliki
ˇ v poglavju opi5.6. Ze
snih statistik na strani
32 smo izraˇcunali statistike, ki so sedaj prikazane ˇse na okvirju z
roˇcaji. Mediana spremenljivke Starost je 39.5
let, kar pomeni, da
je polovica anketirancev starejˇsih, polovica
pa mlajˇsih od 39.5 let.
ˇ
Cetrtina
najmlajˇsih anketirancev je stara 32.75
let ali manj, medtem
ko je ˇcetrtina najstarejˇsih zaposlenih stara
Slika 5.6: Boxplot za spremenljivko Starost
vsaj 43.0 let. Okvir z
roˇcaji kaˇze, da imamo v podatkih en osamelec (oznaˇcen z identifikacijsko ˇstevilko 20)
in sicer gre za zaposlenega, ki je star 59 let.
54
V primeru, da kateri izmed roˇcajev ni v
celoti viden oz. ˇzelimo spremeniti razpon
vrednosti na y-osi, to storimo tako, da dvokliknemo y os. Najprej se nam odpere
okno Chart Editor, kjer ˇse enkrat dvokliknemo vrednosti na y-osi. Odpre se nam
okno Properties (slika 5.7), kjer lahko
v zavihku Scale doloˇcimo razpon vrednosti na y-osi. Na boxplotu, ki je prikazan
na sliki 5.6 smo najniˇzjo vrednost Minimum postavili na 19. Vrednosti v zadnjem
stolpcu pod Data prikazujeta najniˇzjo in
najviˇsjo vrednost v podatkih (20 let in 59
let), tako da si lahko z njima pomagamo,
ko doloˇcamo razpon prikazanih vrednosti
na y-osi.
5 Grafiˇcni prikazi
Slika 5.7: Boxplot - urejanje vrednosti
Nariˇsemo lahko tudi veˇc
okvirjev z roˇcaji in sicer za vsako kategorijo
izbrane imenske ali ordinalne spremenljivke. V
naˇsem primeru nas na
primer zanimajo okvirji
z roˇcaji za spremenljivko
Starost glede na Delovno
mesto anketirancev. Izberemo Clustered Boxplots oziroma drugo
ikono na sliki 5.4h ter je
prenesemo v okno desno
zgoraj. Na y os prenesemo tako kot prej spremenljivko Starost, na x
Slika 5.8: Izbira grafa - boxploti za spremenljivko Starost glede
os pa spremenljivko Dena spremenljivko Delovno mesto
lovno mesto.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
55
Izpis rezultatov iz okna
Output je prikazan na
sliki 5.9. Najprej opazimo, da je sedaj anketiranec z najviˇsjo starostjo (59 let) zaposlen
v administraciji.
Mediana je najniˇzja v oddelku prodaje (35 let)
in najviˇsja v IT oddelku
(43let). To pomeni, da je
v oddelku prodaje polovica anketirancev mlajˇsa
od 35 let, v odelku prodaje pa je polovica anketirancev starejˇsa od 43
let. Najveˇcji kvartilni
razmik je v oddelku proSlika 5.9: Boxploti za spremenljivko Starost glede na spremendaje in sicer znaˇsa le ta
ljivko Delovno mesto
14let, najmanjˇsi pa v oddelku prodaje (8 let). Starosti, ki jih za posamezne statistike navajamo zgoraj niso izpisane
ob posameznem okvirju z roˇcaji. Namig, kako jih izraˇcunati, najdeˇs v okvirˇcku Poskusi
sam’ na strani 5.1.
Poskusi sam...
S pomoˇcjo Custom Tables lahko
izraˇcunamo izbrane statistike posebej za
vsako skupino anketirancev, ki jo doloˇca
imenska ali urejenostna spremenljivka
oziroma kombinacija veˇcih spremenljivk.
a) Poskusi za spremenljivki Starost in Delovno mesto sestaviti tabelo z opisnimi
statistikami, ki so prikazane na okvirjih z roˇcaji na sliki 5.9.
b) Spremenljivkama Starost in Delovno mesto, dodajte ˇse spremenljivko Spol, tako
da boste dobili opisne statistike prikazane na okvirjih z roˇcaji na sliki 5.11.
56
5 Grafiˇcni prikazi
Okvirjem z roˇcaji prikazanim na sliki 5.9 lahko
dodamo ˇse eno dimenzijo, ˇce izberemo Clustered Boxplot oziroma tretjo ikono na sliki
5.4h. Podobno kot prej
na x os dodamo spreenljivko Delovno mesto
ter na y os spremenljivko
Starost. V okvirˇcek desno zgoraj Cluster on
X: set color prenesemo
spremenljivko Spol. Iz- Slika 5.10: Izbira grafa-boxploti za spremenljivko Starost glede
biro potrdimo s klikom na spremenljivki Delovno mesto in Spol
na gumb OK. Dobimo
okvirje z roˇcaji prikazane na sliki 5.11.
Slika 5.11: Okvirji z roˇcaji za spremenljivko Starost glede na spremenljivki Delovno mesto
in Spol
Poskusi sam...
strani 55).
Interpretirajte dobljene okvirje z roˇcaji,
ki so prikazani na sliki 5.11. Pomagajte
si z izraˇcunom ustreznih opisnih statistik
(glej okvirˇcek ’Poskusi sam’, toˇcka b), na
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
5.2
57
Razsevni grafikoni
V nadaljevanju
si bomo ogledali
razsevna grafikona za spremenljivki Starost
in Delovna doba.
Razsevni grafikon izberemo s
klikom na prvo
ikono na sliki
5.4e. V okvirˇcek
pod osjo x (slika
5.12) prenesemo
spremenljivko
Starost, v okvirˇcek levo od osi
y pa spremenljivko Delovna
Slika 5.12: Izbira grafa - razsevni grafikon za spremenljivko Starost glede
doba. Izbiro pona spremenljivko Delovno mesto
trdimo s klikom
na gumb OK.
Dobljeni razsevni grafikon je prikazan na
sliki 5.13. Opazimo,
da priˇcakovano viˇsja
starost pomeni tudi
viˇsjo delovno dobo.
Ker sta obe spremenljivki razmernostni, lahko v tem
primeru izraˇcunamo
torej Pearsonov koeficient korelacije (glej
poglavje 6.2.2).
Slika 5.13: Razsevni grafikon za spremenljivko Starost glede na
spremenljivko Delovno mesto
58
5.3
5 Grafiˇcni prikazi
ˇ
Crtni
grafikoni
Povpreˇcja posameznih spremenljivk (glede na
eno ali dve imenski oz. urejenostni spremenljivki) lahko prikaˇzemo tudi s
pomoˇcjo ˇcrtega
grafikona in sicer tako, da izberemo drugo
ikono na sliki
5.4b oziroma
Multiple Line.
V okvirˇcek pod Slika 5.14: Izbira ˇcrtnega graf za spremenljivko Delovna doba glede na
osjo x prene- spremenljivko Delovno mesto
semo spremenljivko Delovno mesto (slika 5.14), levo od y osi spremenljivko Delovna doba in desno
zgoraj v okvirˇcek Set Color spremenljivko Spol.
V oknu Element properties (ki se navadno odpre desno od osnovnega okna
Chart Builder) lahko izberemo statistike, ki naj se prikaˇzejo na ˇcrtnem
grafu.
V naˇsem primeru smo izbrali
povpreˇcje, torej Mean (slika 5.15). Izbiramo lahko ˇse med statistikami navedenimi v oknu Statistics; npr.
odstotek, mediana, modus, minimum,...
Izbiro potrdimo s klikom na gumb
Apply.
V oknu Chart Builder izbiro potrdimo s klikom na gumb OK ter dobimo ˇcrtni grafikon prikazan na sliki
Slika 5.15: Izbira prikaza statistik za ˇcrtni 5.16.
graf
Rezultati prikazani na ˇcrtnem grafikonu na
sliki 5.16 kaˇzejo, da je najviˇsja povpreˇcna delovna doba med moˇskimi v kadrovski sluˇzbi
in v IT oddelku (19.0 let ter 18.2 let), najniˇzja pa v oddelku prodaje (10.0 let). V
povpreˇcju imajo najdaljˇso delovno dobo v podjetju ˇzenske zaposlene v IT oddelku (19.0
let), najniˇzjo povpreˇcno delovno dobo pa imajo ˇzenske zaposlene pravni sluˇzbi (12.1 leto).
Opisne statistike navedene zgoraj izraˇcunaj s pomoˇcjo namiga iz okvirˇcka ’poskusi sam’
na strani 5.3.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
59
Slika 5.16: Izbira prikaza statistik za ˇcrtni graf
Poskusi sam...
S pomoˇcjo ukaza Custom Tables poiˇsˇci
povpreˇcje spremenljivke Delovna doba
glede na spremenljivki Delovno mesto in
Spol.
60
6 Preurejanje spremenljivk in izbira dela podatkov
6
Preurejanje spremenljivk in izbira dela podatkov
6.1
Raˇ
cunanje s spremenljivkami
V postavljenih raziskovalnih vpraˇsanjih na strani 1.2 uporabljamo pojme ’Zadovoljstvo
zaposlenih z delovnim okoljem’, ’Zadovoljstvo zaposlenih z delovnim okoljem in opremo’
ter ’Zadovoljstvo s tehniˇcno podporo’. Na podlagi teh raziskovalnih vpraˇsanj smo sestavili
vpraˇsalnik (slika prasalnik1.1), v katerem smo posamezen pojem razdelili na veˇc vpraˇsanj.
V analizi podatkov, bi radi ta vpraˇsanja na nek naˇcin zdruˇzili v novo spremenljivko.
Najpogostejˇsi sta dve moˇznosti:
• posamezne spremenljivke seˇstejemo (Na primer, ˇce imamo spremenljivke, ki podajajo meseˇcni stroˇsek za hrano, za oblaˇcila, za prevoz, za zabavo,... bi radi te
spremenljivke samo seˇsteli, ter tako dobili skupne meseˇcne stroˇske.),
• izraˇcunamo povpreˇcje spremenljivk (ter tako ohranimo podatke v istem razponu
(npr. 1-5) kot so bile merjene spremenljivke).
Slika 6.1: Ukaz Compute
V naˇsem primeru bomo ’zadovoljstvo zaposlenih z delovnim okoljem in opremo’
izraˇcunali kot povpreˇcje desetih spremenljivk prvega vpraˇsanja. Novo spremenljivko lahko izraˇcunamo s pomoˇcjo ukaza
Compute Variables, ki ga najdemo v
meniju Transform (slika 6.1). SPSS:
Transform → Compute Variables.
Odpre se okno
Variable View
(slika 6.2), kjer
najprej zapiˇsemo
ime nove spremenljivke v oknu
Target Variable. V nasem
primeru smo zapisali
V 1 povprecje.
Pod oknom Target Variable
kliknemo na gumb
Type & Label, kjer zapiˇsemo
pisno poimenovanje nove spremenljivke.
Slika 6.2: Ukaz Compute - okno Compute Variable
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
61
Odpre se nam pogovorno okno Compute
Variable: Type and
Label (slika 6.3), kjer
vpiˇsemo Zadovoljstvo zaposlenih z delovnim okoljem in opremo.
Tip
spremenljivke je ˇze avtomatiˇcno doloˇcen kot
ˇstevilski (Numeric). Vpisano oznako potrdimo s
klikom na gumb Continue.
Slika 6.3: Ukaz Compute - dodajanje oznake nove spremenV okno Numeric Expresljivke
sion zapiˇsemo formulo
za izraˇcun nove spremenljivke.
Oznaˇcimo prvo spremenljivko Velikost pisarne (V 1 a) ter jo s pomoˇcjo puˇsˇcice ali
miˇske prenesemo v zgornje okno Numeric
Expression (slika 62a). Napiˇsemo znak
+ spomoˇcjo spodnjih gumbov ali tipkovnice.
V okno Numeric Expression prenesemo
ˇse ostale spremenljivke vpraˇsanja 1, torej spremenljivke V 1 b do V 1 j, ter vmes
zapiˇsemo pluse (slika 6.4b).
(a) Dodajanje spremenljivke
(b) Vsota spremenljivk
Zapisali smo, da bomo spremenljivko Za(c) Povpreˇcje spremenljivk
dovoljstvo zaposlenih z delovnim okoljem
in opremo izraˇcunali kot povpreˇcje dese- Slika 6.4: Ukaz Compute - raˇcunanje povtih spremenljivk prvega vpraˇsanja. Zato preˇcja spremenljivk
damo spremenljivke V 1 a do V 1 j v oklepaj (slika 6.4c) ter delimo z 10 (zapiˇsemo /10). Zapisano formulo potrdimo s klikom na
gumb OK v oknu Compute Variable (slika 6.2).
V oknu Variable View dobimo novo spremenljivko V 1 povprecje z zapisanim opisnim
poimenovanjem Zadovoljstvo zaposlenih z delovnim okoljem in opremo v stolpcu Label
(slika 6.5).
Slika 6.5: Nova spremenljivka prikazana v oknu Variable Viewe
62
6 Preurejanje spremenljivk in izbira dela podatkov
+
+ Syntax
+++
....za programerske frike :)
COMPUTE V1_povprecje=(V1_a+V1_b+V1_c+V1_d+V1_e+V1_f+V1_g+V1_h+V1_i+V1_j)/10.
VARIABLE LABELS V1_povprecje 'Zadovoljstvo zaposlenih z delovnim okoljem
in opremo'.
EXECUTE.
7
Povpreˇcje
spremenljivk
lahko
izraˇcunamo tudi tako, da v polju
Function group: okna Compute
Variable (glej sliko 6.2) izberemo Statistical ter nato v spodnjem oknu Functions and Special Variables: izberemo
povpreˇcje oz. Mean, Dvokliknemo na napis Mean, ki se prenese v zgornje polje
Numeric Expression. Podobno kot prej moramo vnesti vse spremenljivke s
pomoˇcjo katerih ˇzelimo izraˇcunati povpreˇcje nove spremenljivke, le da jih tokrat
loˇcimo z vejicami:
MEAN(V1 a, V1 b, V1 c, V1 d, V1 e, V1 f, V1 g, V1 h, V1 i, V1 j).
Poskusi sam...
Poskusi na podoben naˇcin izraˇcunati ˇse vsoto desetih spremenljivk prvega vpraˇsanja.
Pomagaj si z ukazom Sum.
6.2
Preoblikovanje zvezne spremenljivke v kategorijalno
Kadar ˇzelimo zvezne oziroma razmernostne spremenljivke preoblikovati v kategorialne spremenljivke, torej v doloˇceno ˇstevilo razredov, si lahko pomagamo z ukazom Visual Binning (slika 6.6);
SPSS: Transform → Visual
Binning.
Preoblikujemo lahko tudi urejenostne spremenljivke z zdruˇzevanjem kategorij, npr. 10-stopenjsko
lestvico ocenjevanja zdruˇzimo v
Slika 6.6: Preoblikovanje zveznih spremenljivk - ukaz
tri nove kategorije.
Visual Binning
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
63
Odpre se okno prikazano
na sliki 6.7.
V desno okno Variables to
Bin prenesemo spremenljivko Starost ter izbiro
potrdimo s klikom na
gumb Continue.
V
primeru velike koliˇcine
podatkov lahko omejimo
ˇstevilo pregledanih podatkov (Limit number
of casses scanned), kar
sicer prihrani ˇcas, vendar hkrati tudi vpliva
na porazdelitev podatkov in poslediˇcno na izbiro mej novih razredov
(IBM, 2011).
Po kliku na gumb Continue se odpre okno priSlika 6.7: Preoblikovanje zveznih spremenljivk - izbira spre- kazano na sliki 6.8. Na
menljivk
levi strani okno Current Variable kaˇze seznam izbranih spremenljivk, Casses Scanned oznaˇcuje ˇstevilo prikazanih podatkov,
Missing Values pa ˇstevilo enot z manjkajoˇcimi podatki. Glede na prikazani histogram
se npr. odloˇcimo, da bomo spremenljivko Starost razdelili v dva razreda (histogram spremenljivke starost z oˇzjimi razredi je prikazan na sliki 3.14) in sicer na zaposlene stare 38
let in manj ter starejˇse. Izbrano mejo doloˇcimo tako, da vnesemo vrednost 38 v tabelo pod
histogramom. S tem smo doloˇcili prvo mejo razreda, v katerem bodo vsi anketiranci stari
ˇ ˇzelimo odprto zgornjo mejo intervala (< 38), lahko na desni
38 let ali manj (≤ 38). Ce
strani v okvirˇcku Upper Endpoints oznaˇcimo moˇznost Excluded (<). Meja razreda
je sedaj z rdeˇco navpiˇcno ˇcrto oznaˇcena tudi na histogramu (ˇce kliknemo nanjo, jo lahko
poljubno premikamo, ˇce jo prenesemo izven obmoˇcja diagrama, jo odstranimo). V tabeli
je v stolpcu Value zapisan tekst High, kar pomeni, da najveˇcja vrednost spremenljivke
ˇ bi ˇzeleli veˇc razredov samo dodamo ˇse preodoloˇca zgornjo mejo zadnjega intervala. Ce
stale meje razredov.
Oznake razredov zapiˇsemo v stolpec Label, kjer v vrstici z vrednostjo 38 zapiˇsemo oznako
38 let ali manj, v vrstici z oznako HIGH pa veˇc kot 38 let.
Na vrhu v okno Binnded Variable ter stolpec Name zapiˇsemo ime nove spremenljivke.
Mi smo zapisali V 5 2sk 38, kar oznaˇcuje, da je spremenljivka preoblikovana iz spremenljivke V 4 (Starost), 2sk oznaˇcuje, da nova spremenljivka doloˇca dve skupini, vrednost 38
na koncu pa navaja mejo razdelitve. V stolpec Label lahko zapiˇsemo kar Starost, saj je
to ime spremenljivke, ki se bo izpisovalo v vseh tabelah rezultatov.
64
6 Preurejanje spremenljivk in izbira dela podatkov
Slika 6.8: Preoblikovanje zveznih spremenljivk - okno Visual Binning
Meje razredov lahko doloˇcimo
tudi s klikom na gumb Make
Cutpoints, odpre se okno prikazano na sliki 6.9.
Z izbiro Equal Width Intevals
lahko doloˇcimo intervale enakih ˇsirin.
Pri tem je potrbno nastaviti dve izmed treh
moˇznosti: prvo mejo razredov
(First Cutpoint Location),
ˇstevilo delilnih toˇck (Number
of Cutpoints), ˇsirino razredov
(Width).
Druga moˇznost za doloˇcitev mej
razredov je enako ˇstevilo enot
v vsakem razredu (Equal Percentiles Based on Scanned
Cases). Pri tem je potrebno
doloˇciti eno izmed naslednjih treh
moˇznosti: ˇstevilo delilnih toˇck
ˇ bi Slika 6.9: Preoblikovanje zveznih spremenljivk (Number of Cutpoints). Ce
na primer doloˇcili tri delilne toˇcke, moˇznosti za doloˇcanje mej razredov
bi dobili 4 (= 3 + 1) razrede, kjer
ˇ
bi vsak od njih vseboval 25% enot). Sirina
intervala v odstotkih (Width (%)) oznaˇcuje
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
65
odstotek enot v vsakem razredu, torej v naˇsem primeru 25% enot.
ˇ izberemo moˇznost Cutpoints at Mean and Selected Standard Deviations BaCe
sed on Scanned Cases, se delilne toˇcke razredov izraˇcunajo na podlagi povpreˇcja ter
ˇ ne izberemo nobenega standardnega odklona, dobimo dva rastandardnega odklona. Ce
zreda in sicer so v enem enote z vrednostmi manjˇsimi ali enakimi povpreˇcju, v drugem
ˇ pa izberemo
pa enote, ki imajo na izbrani spremenljivki veˇcje vrednosti od povpreˇcja. Ce
npr. +\− 1 Std. Deviation, dobimo ˇstiri razrede, katerih delilne toˇcke so povpreˇcje,
ter povpreˇcje ± standardni odklon oziroma zapisano drugaˇce (¯
x − s, x¯, x¯ + s).
Ko v oknu Visual Binning (slika 6.10) nastavitve potrdimo s klikom
na gumb OK nam SPSS
pokaˇze opozorilo v katerem nas opomni koliko
spremenljivk bo bilo preSlika 6.10: Visual Binning - opozorilo o ˇstevilu novih spremen- urejenih v razrede (slika
ljivk
6.10).
V oknu Variable View dobimo torej novo preoblikovano spremenljivko Starost, torej
spremenljivko z oznako V 5 2sk 38 (slika 6.11).
Slika 6.11: Preoblikovanje spremenljivke Starost in dobljena nova spremenljivka v oknu
Variable View
Syntax
+
+
+
+
+
....za programerske frike :)
* Visual Binning.
*V4.
RECODE V4 (MISSING=COPY) (LO THRU 38.0=1) (LO THRU HI=2) (ELSE=SYSMIS)
INTO V4_2sk_38.
VARIABLE LABELS V4_2sk_38 'Starost'.
FORMATS V4_2sk_38 (F5.0).
VALUE LABELS V4_2sk_38 1 '38 let ali manj' 2 'več kot 38 let'.
VARIABLE LEVEL V4_2sk_38 (ORDINAL).
EXECUTE.
8
66
6 Preurejanje spremenljivk in izbira dela podatkov
6.3
Prekodiranje spremenljivk
Kategorije urejenostnih
spremenljivk bi veˇckrat
radi ustrezno zdruˇzili.
To vˇcasih zahtevajo same
analize ali pa bi radi podatke prikazali v lepˇsi
obliki, ˇse posebej, ˇce
kakˇsna kategorija nima
nobene enote oz. zelo
majhno ˇstevilo enot. Ukaz
za prekodiranje spremenljivk najdemo v meniju
Slika 6.12: Prekodiranje spremenljivk - ukaz Recode
Transform, natanˇcneje
SPSS: Transform → Recode into Different Variables (slika 6.12).
V oknu Recode into Different
Variables izberemo najprej spremenljivko, ki jo ˇzelimo prekodirati (slika 6.13). V naˇsem primeru smo izbrali spremenljivko
Izobrazba, kjer bomo zdruˇzili zadnji dve izobrazbeni skupini, ker
imamo v vzorcu le dva anketiranca z magisterijem oz. doktoratom (glej rezultate na sliki 3.32).
V okno na sredini (Numeric
Variable → Output variable)
Slika 6.13: Prekodiranje spremenljivk - izbira spretako prenesemo spremenljivko Izmenljivk
obrazba. Na desni strani v okvirˇcu
Output Variable za ime spremenljivke (Name) zapiˇsemo V7 3sk, kar oznaˇcuje, da bomo preoblikovali spremenljivko
V 7 (Izobrazba) v tri skupine. V okvirˇcek Label zapiˇsemo opisni pomen spremenljivke,
torej Izobrazba. Izbiro poimenovanja nove spremenljivke potrdimo s klikom na gumb
Change.
S klikom na gumb Old and New Values se nam odpre okno prikazano na sliki 6.14a
. Prekodiramo lahko posamezne vrednosti, obseg vrednosti ter tudi manjkajoˇce vrednosti. Za stare vrednosti spremenljivke lahko na levi strani izberemo eno izmed naslednjih
moˇznosti:
• Value - posamezna vrednost,
• System-missing - vrednosti, ki jih sistem oznaˇci kot manjkajoˇce in oznaˇci s piko
(.),
• System- or user-missing - manjkajoˇce vrednosti, ki smo jih definirali v stolpcu
Missing ali vrednosti, ki jih sistem doloˇci kot manjkajoˇce ter oznaˇci s piko (.),
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
67
• Range - obseg vrednosti, kjer doloˇcimo najmanjˇso in najveˇcjo vrednost v obsegu,
• Range, LOWEST through value - obseg vrednosti od najmanjˇse vrednosti v
podatkih do izbrane vrednosti,
• Range, value through HIGHEST - obseg vrednosti od izbrane vrednosti do
najveˇcje vrednosti v podatkih,
• All other values - vse ostale vrednosti, ki jih nismo doloˇcili v seznamu Old →
New.
Podobno lahko na desni strani nove vrednosti definiramo s ˇstevilko (Value), doloˇcimo
manjkajoˇce vrednosti (System-missing) ali pa stare vrednosti le prekopiramo (Copy
old values).
Vrednosti spremenljivke V 7 prekodiramo na naslednji naˇcin:
• Vrednost 1 spremenljivke
V 7 oznaˇcuje srednjeˇsolsko
izobrazbo, ˇcesar v novi spremenljivki V 7 3sk ne ˇzelimo
spreminjati. Zato v polje
Value zapiˇsemo v okvirˇcek
na desni strani, kjer doloˇcamo
vrednosti nove spremenljivke
(uporabili bi lahko tudi
moˇznost Copy old values,
ker se vrednost ne spremeni). Izbiro potrdimo s
klikom na gumb Add (slika
6.14a).
(a) Posamezna vrednost
• Podobno ne spreminjamo
druge kategorije, ki oznaˇcuje
viˇsjeˇsolsko ali visokoˇsolsko
izobrazbo, zato v okno Value na levi in na desni
zapiˇsemo 2.
(b) Obseg vrednosti
• Na koncu bi radi univerzitetno izobrazbo (v podatkih Slika 6.14: Prekodiranje spremenljivk - izbira starih
kodirano s 3) ter magiste- in novih vrednosti
rij oz. doktorat (v podatkih
kodirano s 4) zdruˇzili. Na
desni strani izberemo Range ter v prvi okvirˇcek zapiˇsemo 3, v spodnji okvirˇcek pa
4. Na levi strani zapiˇsemo v okvirˇcek New value vrednost 3 ter izbor prekodiranih
vrednosti potrdimo s klikom na gumb Add (slika 6.14b).
68
6 Preurejanje spremenljivk in izbira dela podatkov
Ko za vse vrednosti spremenljivke V 7 povemo, v kaj se prekodirajo, izbiro potrdimo s
ˇ enkrat se pokaˇze okno s slike 6.13, kjer pritisnemo OK.
klikom na gumb Continue. Se
V oknu Variable View dobimo novo spremenljivko (slika 6.15). Novi spremenljivki dodamo oznake kategorij, tako da kliknemo trenutno oznako None v stolpcu Values. Odpre
se nam okno prikazano na sliki 6.16.
Slika 6.15: Prekodirana spremenljivka Izobrazba in dobljena nova spremenljivka v oknu
Variable View
V okno Valu Labels vpiˇsemo:
• V polje Value zapiˇsemo 1, v
polje Label ’srednjeˇsolska’,
kliknemo gumb Add.
• V polje Value zapiˇsemo
2, v poljeLabel ’viˇsjeˇsolska
ali visokoˇsolska’, kliknemo
gumb Add.
• V polje Value zapiˇsemo 3,
v polje Label ’univerzitetna ali veˇc’, kliknemo gumb
Add.
Slika 6.16: Prekodiranje spremenljivk - poimenovanje
Dodane vrednosti spremenljivk kategorij
potrdimo s klikom na gumb OK.
Syntax
+
+
+
+
+
....za programerske frike :)
RECODE V6 (1=1) (2=2) (3 thru 4=3) INTO V6_3sk.
VARIABLE LABELS V6_3sk 'Izobrazba'.
EXECUTE.
* Dodajanje oznak kategorij novi spremenljivki.
VAL LAB V6_3sk
1 'srednješolska'
2 'višješolska ali visokošolska'
3 'univerzitetna ali več'.
Poskusi sam...
storili s pomoˇcjo ukaza Visual Binning.)
9
S pomoˇcjo ukaza Recode into different variables preoblikuj spremenljivko
Starost v dve skupini: 38 let ali manj ter
veˇc kot 38 let. (V poglavju 6.2 smo to ˇze
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
7
69
Testiranje hipotez
7.1
t-testi
t-testi se uporabljajo za preverjanje domnev o povpreˇcjih spremenljivk. V SPSS-u jih
najdemo pod SPSS: Analyze → Compare Means. Ponujene imamo tri t-teste:
• za en vzorec ( One-Sample T Test), kjer preverjamo ali je povpreˇcna vrednost
ene spremenljivke enaka doloˇceni hipotetiˇcni vrednosti,
• za dva neodvisna vzorca (Independent-Samples T Test), kjer preverjamo ali se
povpreˇcna vrednost spremenljivke razlikuje med dvema skupinama enot.
• za odvisna vzorca (Paired-Samples T Test), kjer preverjamo ali je povpreˇcna
vrednost ene spremenljivke enaka povpreˇcni vrednosti druge spremenljivke na isti
mnoˇzici enot oziroma anketirancev.
ˇ ˇzelimo preveriti ali je povpreˇcje spremenljivke enako med veˇc kot dvema skupinama
Ce
enot uporabimo analizo variance ali ANOVO (One-Way ANOVA). Primer uporabe
najdete v poglavju 7.2.
ˇ ˇzelimo le pogledati povpreˇcja neke spremenljivke (brez testiranja ustrezne domneve)
Ce
med veˇc skupinami lahko izberemo tudi ukaz SPSS: Analyze → Compare Means.
7.1.1
Razlike v povpreˇ
cjih med dvema skupinama
Zadovolstvo z delovnim okoljem in opremo glede na Spol (RV1)
V prvem raziskovalnem vpraˇsanju na strani 4 smo zapisali
RVl: Se zadovoljstvo zaposlenih z delovnim okoljem in opremo razlikuje glede
na spol?
Na podlagi raziskovalnega vpraˇsanja najprej postavimo statistiˇcni hipotezi:
H0 : Povpreˇcno zadovoljstvo zaposlenih z delovnim okoljem in opremo je enako pri moˇskih
in pri ˇzenskah (µM = µz ).
H1 : Povpreˇcno zadovoljstvo zaposlenih z delovnim okoljem in opremo se pri moˇskih in
ˇzenskah razlikuje (µM 6= µz ).
Opomba: Alternativna hipoteza H1 je v tem primeru zapisana dvostransko, saj smo zapisali, da povpreˇcji pri moˇskih in ˇzenskah nista enaki.
Hipotezi bomo testirali s t-testom neodvisnih vzorcev: SPSS: Analyze → Compare
Means → Independent-Samples T Test (slika 7.1).
70
7 Testiranje hipotez
Slika 7.1: t-test neodvisnih vzorcev - ukaz
Odpre se nam pogovorno okno Independent-Samples T Test prikazano na sliki 7.2. V
zgornje okno Test Variable(s) prenesemo spremenljivko Zadovoljstvo z delovnim okoljem
in opremo 4 z oznako V 1 povprecje. V spodnje okno Grouping Variable prenesemo spremenljivko Spol. V oknu Grouping Variable se nam izpiˇse oznaka V4(? ?), kar oznaˇcuje,
da moramo ˇse definirati oznake skupin.
Slika 7.2: Izbira spremenljivk v t-testu neodvisnih vzorcev
Syntax
+
+
+
+
+
T-TEST GROUPS=V4(1 2)
/MISSING=ANALYSIS
/VARIABLES=V1_povprecje
/CRITERIA=CI(.95).
4
....za programerske frike :)
10
Spremenljivka Zadovoljstvo z delovnim okoljem in opremo je dobljena kot povpreˇcje 10 spremenljivk
prvega vpraˇsanja, glej pogalvje 6.1
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
71
Ko kliknemo na gumb Define Groups se odpre
okno prikazano na sliki 7.3. Na vpraˇsalniku (slika
2.4) smo ˇzenske oznaˇcili z 1 in moˇske z 2, zato v
okno Define Groups zapiˇsemo 1 v polje Group
1 in 2 v polje Group 2. Izbiro potrdimo s klikom na gumb Continue ter s klikom na gumb
OK v oknu Independent-Samples T Test (slika
7.2).
S klikom na gumb Options lahko nastavimo, kakˇsen in- Slika 7.3: Doloˇcitev skupin pri
terval zaupanja za razliko povpre´cij ˇzelimo (slika 7.4). t-testu neodvisnih vzorcev
Privzeto je nastavljen 95% interval zaupanja, izberemo
lahko seveda tudi kakˇsno drugo vrednost.
V okvirˇcku Missing Values lahko nastavimo, na kakˇsen naˇcin naj bodo
vkljuˇcene enote z manjkajoˇcimi vrednostmi.
Excluded cases analysis
by analysis pomeni, da bo enota izkljuˇcena iz analize, ˇce bo imela manjkajoˇco vrednost na obravnavani spremenljivki. Izbira Excluded cases listwise
pomeni, da bo enota izkluˇcena iz analize, ˇce ima manjkajoˇco vrednost pri vsaj
eni izmed spremenljivk, katerih povpreˇcja
ˇzelimo primerjati (kadar v oknu Target
Variable(s) izberemo veˇc spremenljivk Slika 7.4: t-test neodvisnih vzorcev - izbira
intervala zaupanja
hkrati).
Rezultati t-testa neodvisnih vzorcev se v oknu Output izpiˇsejo v dveh tabelah. V prvi
tabeli so predstavljene opisne statistike (slika 7.5), v drugi pa rezultati t-testa (slika 7.6).
Iz tabele z opisnimi statistikami razberemo, da
je povpreˇcno zadovoljstvo ˇzensk z delovnim
okoljem in opremo enako
3,38 (s = 0.265), moˇskih
Slika 7.5: Opisne statistike pri t-testu za spremenljivki Zado- pa 3,41 (s = 0.354). Da
voljstvo zaposlenih z delovnim okoljem in opremo glede na Spol bi lahko iz teh rezultatov
na vzorcu odgovorili ali
je zadovoljstvo zaposlenih z delovnim okoljem in opremo enako v celotem podjetju (oz.
sploˇsno v populaciji), potrebujemo rezultate t-testa.
Pri t-testu neodvisnih vzorcev se testna statistika t izraˇcuna drugaˇce, ˇce so variance med
skupinama enake oziroma ˇce so le-te razliˇcne. V SPSS-u dobimo izpisani obe moˇznosti
in moramo sami izbrati pravo. Prvi del tabele na sliki 7.6 predstavlja rezultate Levene-
72
7 Testiranje hipotez
ovega testa enakosti varianc (Levene’s Test for Equality of Variances). Glede na
to, ali sprejmemo ali zavrnemo niˇcelno domnevo o enakosti varianc, izberemo ustrezno vrstico v tabeli pri rezultatih t-testa neodvisnih vzorcev (t-test for Equality of Means).
Kako formalno zapiˇsemo statistiˇcni hipotezi pri Levene-ovem testu si oglej v okvirˇcku na
7.1.1.
Kako postavimo hipotezi pri Levene-ovem testu?
H0 : Varianci spremenljivke Zadovoljstvo zaposlenih z delovnim okoljem in opremo
2
sta enaki v obeh skupinah (σM
= σZ2 ).
H1 : Varianci spremenljivke Zadovoljstvo zaposlenih z delovnim okoljem in opremo
2
sta v skupinah razliˇcni (σM
6= σZ2 )
ˇ je p-vrednost (angl. significance, oznaka Sig.) Levene-ovega testa enakosti varianc:
Ce
• veˇcja od 0.05, niˇcelno domnevo o enakosti varianc sprejmemo pri 5% stopnji znaˇcilnosti5 (α = 0.05)6 . V tem primeru gledamo pri rezultatih t-testa prvo vrstico (Equal
variances assumed, sl. predpostavljene enake variance).
• manjˇsa od 0.05, niˇcelno domnevo o enakosti varianc zavrnemo pri 5% tveganju
(α = 0.05). V tem primeru gledamo pri rezultatih t-testa drugo vrstico (Equal
variances not assumed, sl. predpostavljene razliˇcne variance).
V naˇsem primeru lahko torej zapiˇsemo naslednji sklep (slika 7.6): Na podlagi Levene-ovega
testa ne moremo zavrniti niˇcelne domnevo o enakosti varianc pri 5% stopnji znaˇcilnosti,
saj je p-vrednost enaka 0.283 > 0.05 (F = 1.168). p-vrednost7 t-testa enakosti povpreˇcij
je enaka 0.645 > 0.05 (tsp=72 = −0.422), torej niˇcelne domneve o enakosti povpreˇcij ne
moremo zavrniti pri 5% stopnji znaˇcilnosti, kar pomeni, da ni statistiˇcno znaˇcilnih razlik
v povpreˇcni oceni zadovoljstva zaposlenih z delovnim okoljem in opremo med moˇskimi in
ˇzenskami. To hkrati pomeni, da je odgovor na prvo raziskovalno vpraˇsanje (Se zadovoljstvo zaposlenih z delovnim okoljem in opremo razlikuje glede na spol?) negativen.
5
Vˇcasih uporabimo tudi izraz 5% tveganje namesto stopnja znaˇcilnosti.
Poleg stopnje znaˇcilnosti α = 0.05 se v druˇzboslovnih raziskavah vˇcasih uporabi tudi α = 0.01 ali
α = 0.10, kar je odvisno od tega, kakˇsno tveganje privzamemo, da zavrnemo pravilno niˇcelno domnevo.
Stopnjo tveganja nastavimo v oknu moˇznosti (Options), glej sliko 7.4
7
V tabeli, ki jo izpiˇse SPSS, je zapisana oznaka Sig. (2-tailed), kar pomeni, da je kritiˇcno obmoˇcje
zavrnitve niˇcelne domneve sestavljene iz dveh delov. V tem primeru je to v redu, saj smo v alternativni
domnevi zapisali, da povpreˇcji nista enaki (6=), kar pomeni, da moramo izbrati dvostranski test.
6
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
Levene-ov test
enakosti varianc
73
t-test enakosti povprečij
Slika 7.6: Rezultati t-testa za spremenljivki Zadovoljstvo zaposlenih z delovnim okoljem
in opremo in Spol
Vˇcasih moramo vse izraze v tabeli prevesti v slovenˇsˇcino. Veˇcino izrazov smo zapisali ˇze
zgoraj, preostali so navedeni v nadaljevanju:
• df (angl. degrees of freedom); slovenski prevod je stopinje prostosti in okrajˇsava sp,
• Mean Diference; slovenski prevod je povpreˇcna razlika,
• Std. Error Difference; slovenski prevod je standardna napaka razlike,
• 95% Confidence Interval of the Difference; slovenski prevod je 95% interval
zaupanja za razliko,
• Lower; slovenski prevod je spodnja meja,
• Upper; slovenski prevod je zgornja meja.
Zadovoljstvo s fotokopirnim strojem glede na spol (RV2)
Poglejmo si ˇse primer, kjer uporabimo enostranski test za neodvisne vzorce. V drugem
raziskovalnem vpraˇsanju (RV2) so v podjetju zapisali (stran 4):
Moˇski so bolj zadovoljni s fotokopirnimi stroji, ki jih imamo v podjetju, kot
ˇzenske.
V tem primeru niˇcelno domnevo zapiˇsemo podobno kot prej, alternativno domnevo pa
zapiˇsemo pa s pomoˇcjo neenaˇcaja:
H0 : Moˇski in ˇzenske so v povpreˇcju enako zadovoljni s fotokopirnimi stroji (µM = µz ).
H1 : Moˇski so v povpreˇcju bolj zadovoljni s fotokopirnimi stroji kot ˇzenske (µM > µz ).
74
7 Testiranje hipotez
Podobno kot prej izberemo test z ukazom SPSS:
Analyze → Compare Means → IndependentSamples T Test. Za testno spremenljivko (Test
Variable(s)) v tem primeru izberemo spremenljivko
V 1 i, medtem ko je spremenljivka, ki doloˇca skupini (Grouping Variable) enaka kot v prejˇsnjem
primeru, torej Spol.
Pri doloˇcitvi skupin moramo v tem primeru nekoliko paziti, saj moramo za prvo skupino izbrati moˇske, za drugo
Slika 7.7: Doloˇcitev skupin v pa ˇzenske, ker smo alternativno hipotezo zapit-testu neodvisnih vzorcev pri sali kot µM > µZ .
V okno Define Groups
RV2
vpiˇsemo torej najprej 2 in v spodnje okno 1 (slika
7.7).
Syntax
+
+
+
+
+
T-TEST GROUPS=V4(2 1)
/MISSING=ANALYSIS
/VARIABLES=V1_i
/CRITERIA=CI(.95).
....za programerske frike :)
11
V izpisu rezultatov (okno
Output) dobimo najprej tabelo opisnih statistik (slika 7.8), iz katere razberemo naslednje: Moˇski so v povSlika 7.8: Opisne statistike za spremenljivko Zadovoljstvo s preˇcju ocenili zadovoljfotokopirnim strojem glede na Spol
stvo s fotokopirnim strojem s povpreˇcno oceno
3.93 (s = 1.26), ˇzenske pa niˇzje in sicer s povpreˇcno oceno 3.45 (s = 0.72).
V naˇsem primeru lahko torej na podlagi rezultatov (slika 7.9) zapiˇsemo naslednji sklep:
Na podlagi Levenovega-testa zavrnemo niˇcelno domnevo enakosti varianc pri 5% stopnji
znaˇcilnosti, saj je p-vrednost enaka 0.005 < 0.05 (F = 8.263).
Glede na zgornji sklep bomo torej pri t-testu enakosti povpreˇcij gledali drugo vrstico
tabele (Equal variances not assmed). Ker smo pri alternativni hipotezi uporabili neenaˇcaj, moramo uporabiti enostranski test. V tabeli piˇse Sig. (2-tailed), kar pomeni,
da moramo dobljeno p-vrednost iz tabele deliti z 2: p = 0.043
= 0.022. Sklep o enakosti
2
povpreˇcij je zapisan v nadaljevanju.
Na podlagi rezultatov t-testa (slika 7.9) niˇcelno domnevo o enakosti povpreˇcij zavrnemo
pri 5% stopnji znaˇcilnosti (p = 0.022 < 0.05, tsp=72 = 2.063), kar pomeni, da so moˇski
povpreˇcju statistiˇcno znaˇcilno bolj zadovoljni s fotokopirnim strojem (¯
x = 3.9) kot ˇzenske
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
75
:2, ker imamo enostranski test
Levene-ov test
enakosti varianc
t-test enakosti povprečij
Slika 7.9: Rezultati t-testa za spremenljivko Zadovoljstvo s fotokopirnim strojem in dve
skupini glede na Spol
(¯
x = 3.5), kar pomeni da lahko raziskovalno vpraˇsanje RV2 (Moˇski so bolj zadovoljni s
fotokopirnimi stroji, ki jih imamo v podjetju, kot ˇzenske.) potrdimo.
Zadovoljstvo zaposlenih s programsko opremo glede na starostni skupini (RV6)
V obeh do sedaj predstavljenih t-testih smo kot spremenljivko, ki doloˇca dve skupini vzeli
ˇ pogledamo vpraˇsalnik na strani 6, na prvi pogled izgleda, da je
spremenljivko Spol. Ce
to tudi edina spremenljivka, ki nam anketirance deli na dve skupini. Vendar pa lahko
izmerjene spremenljivke tudi preuredimo kot smo videli v poglavju 60.
Tako npr. preurejeno spremenljivko Starost potrebujemo v ˇsestem raziskovalnem vpraˇsanju
(glej stran 4), kjer nas zanima ali so starejˇsi res manj zadovoljni s programsko opremo.
Kako bomo doloˇcili mlajˇse in starejˇse zaposlene seveda ni natanˇcno doloˇceno. Smiselno
je, da v takˇsnem in podobnih primerih uporabimo vnaprej znane definicije oz. kriterije
ali pa vsaj smiselno delitev glede na trenutne podatke. V naˇsem primeru bomo uporabili
spremenljivko Starost preoblikovano v dve skupini, kot zapisano na strani 6.2.
Glede na raziskovalno vpraˇsanje
RV6: Ali so starejˇsi res manj zadovoljni s programsko opremo? postavimo
statistiˇcni hipotezi:
postavimo statistiˇcni hipotezi:
H0 : Mlajˇsi zaposleni (do vkljuˇcno 38 let) in starejˇsi zaposleni (39 let ali starejˇsi) so v
povpreˇcju enako zadovoljni s programsko opremo (µdo38 = µnad39 ).
H1 : Mlajˇsi zaposleni (do vkljuˇcno 38 let) so bolj zadovoljni s programsko opremo kot
starejˇsi zaposleni (39 let ali starejˇsi) (µdo38 > µnad39 ).
Ker predvidevamo, da so mlajˇsi zaposleni bolj zadovoljni s programsko opremo v podjetju, smo alternativno hipotezo postavili enostransko.
Z ukazom SPSS: Analyze → Compare Means → Independent-Samples T Test
izberemo ustrezen test neodvisnih vzorcev. Za testno spremenljivko (Test Variable(s))
76
7 Testiranje hipotez
v tem primeru izberemo spremenljivko V1 g (Programska oprema), medtem ko za spremenljivko, ki doloˇca skupini (Grouping Variable) izberemo spremenljivko V5 2sk 38.
Pri doloˇcitvi skupin (Define Groups) za oznako prve skupine vtipkamo 1, za doloˇcitev
druge pa 2.
Syntax
+
+
+
+
+
....za programerske frike :)
T-TEST GROUPS=V5_2sk_38(1 2)
/MISSING=ANALYSIS
/VARIABLES=V1_g
/CRITERIA=CI(.95).
12
V izpisu rezultatov Output dobimo najprej tabelo opisnih statistik (slika
7.10). iz katere razberemo, da so mlajˇsi zapoSlika 7.10: Opisne statistike za spremenljivko Zadovoljstvo s sleni ocenili zadovoljstvo
s programsko opremo s
programsko opremo glede na dve starostni skupini
povpreˇcjem 4.4 (s =
0.59), medtem ko so starejˇsi zaposleni (39 let in veˇc) ocenili zadovoljstvo s programsko opremo s povpreˇcjem 2.7 (s = 0.84).
Sklep: Na podlagi Levenovega-testa (slika 7.11) sprejmemo niˇcelno domnevo o enakosti varianc pri 5% stopnji znaˇcilnosti, saj je p-vrednost enaka 0.052 > 0.05 (F = 3.914).
Glede na zgornji sklep bomo torej pri t-testu enakosti povpreˇcij gledali prvo vrstico tabele
(Equal variances assumed). Ker smo pri alternativni hipotezi uporabili neenaˇcaj, moramo uporabiti enostranski test. V tabeli piˇse Sig. (2-tailed), kar pomeni, da moramo
dobljeno p-vrednost iz tabele deliti z 2: p = 0.000
= 0.000. Sklep o enakosti povpreˇcjih je
2
zapisan v nadaljevanju.
:2, ker imamo enostranski test
Levene-ov test
enakosti varianc
t-test enakosti povprečij
Slika 7.11: Rezultati t-testa za spremenljivko Zadovoljstvo s programsko opremo in dve
skupini glede na Starost
Na podlagi rezultatov t-testa (slika 83) niˇcelno domnevo o enakosti povpreˇcij zavrnemo
pri 5% stopnji znaˇcilnosti (p = 0.000 < 0.05, tsp=72 = 9.858), kar pomeni, da so mlajˇsi
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
77
zaposleni (do vkljuˇcno 38 let) v povpreˇcju bolj zadovoljni s programsko opremo (¯
x = 4.4)
kot starejˇsi zaposleni (¯
x = 2.7), kar pomeni, da lahko na ˇsesto raziskovalno vpraˇsanje (Ali
so starejˇsi res manj zadovoljni s programsko opremo?) odgovorimo pritrdilno.
7.1.2
Testiranje populacijskega povpreˇ
cja
Poglejmo, kako bi odgovorili na ˇstirinajsto raziskovalno vpraˇsanje
RV13: Ali je povpreˇcna starost zaposlenih v podjetju niˇzja od 40 let?
Na podlagi raziskovalnega vpraˇsanja najprej postavimo statistiˇcni hipotezi:
H0 : Povpreˇcna starost zaposlenih v podjetju je 40 let. (µ = 40).
H1 : Povpreˇcna starost zaposlenih v podjetju je niˇzja od 40 let (µ < 40).
Alternativna hipoteza H1 je tudi v tem primeru zapisana enostransko, saj smo zapisali,
ˇ bi alternativno hipotezo zapisali kot µ 6= 40,
da je povpreˇcna starost niˇzja od 40 let. Ce
potem bi morali uporabiti dvostranski test.
Hipoteze bomo testirali s t-testom za testiranje populacijskih povpreˇcij oziroma s t-testom
za en vzorec. V SPSS-u najdemo test pod Analyze → Compare Means → One
Sample T Test (slika 7.12).
Slika 7.12: t-test za en vzorec - ukaz
Odpre se okno prikazano
na sliki 7.13. V zgornje okno Test Variable (s) prenesemo spremenljivko Starost. Testna vrednost (Test Value) je privzeto nastavljena na 0, kar glede na
postavljeni hipotezi spremenimo v 40. s klikom
na gumb Options lahko
nastavimo interval zaupanja podobno kot pri
Slika 7.13: t-test za populacijsko povpreˇcje za spremenljivko testu neodvisnih vzorcev
(slika 7.4).
Starost
78
7 Testiranje hipotez
V prikazu rezultatov (okno Output) dobimo najprej tabelo opisnih statistik (slika 7.15), iz katere
razberemo, da je povpreˇcna starost 74 anketi- Slika 7.14: t-test za populacijsko povpreˇcje za spremenljivko
rancev 38.3 leta s stan- Starost - opisne statistike
dardnim odklonom 7.6
let.
:2, ker imamo enostranski test
Slika 7.15: Rezultati t-testa za populacijsko povpreˇcje spremenljivke Starost
Rezultati t-testa so prikazani v tabeli na sliki 7.15. Ker smo alternativno domnevo zapisali
enostransko, moramo p-vrednost iz tabele (Sig. (2-tailed)) deliti z 2; p = 0.054
= 0.027.
2
Zapiˇsemo lahko naslednji sklep: p-vrednost enostranskega t-testa je enaka 0.027 < 0.05
(tsp=73 = −1.961), torej niˇcelno domnevo zavrnemo pri 5% stopnji znaˇcilnosti. To pomeni,
da je povpreˇcna starost zaposlenih v podjetju niˇzja od 40 let, kar pomeni, da lahko na
naˇse trinajsto raziskovalno vpraˇsanje odgovorimo pritrdilno.
Syntax
+
+
+
+
+
....za programerske frike :)
T-TEST
/TESTVAL=40
/MISSING=ANALYSIS
/VARIABLES=V4
/CRITERIA=CI(.95).
Poskusi sam...
pretirajte dobljene rezultate.)
13
S pomoˇcjo ustreznih t-testov odgovorite
na raziskovalna vpraˇsanja RV3, RV4,
RV5 in RV7. Postavite ustrezni statistiˇcni hipotezi, izvedite analizo ter inter-
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
7.1.3
79
Primerjanje povpreˇ
cij dveh spremenljivk (parni t-test)
Kadar ˇzelimo primerjati povpreˇcji dveh spremenljivk, kot v primeru osmega raziskovalnega
vpraˇsanja, to storimo s parnim t-testom.
RV8: Ali se zadovoljstvo zaposlenih s tiskalnikom razlikuje od zadovoljstva
zaposlenih s telefonom?
Na podlagi raziskovalnega vpraˇsanja postavimo naslednji statistiˇcni hipotezi:
H0 : Povpreˇcno zadovoljstvo zaposlenih s tiskalnikom je enako povpreˇcnemu zadovoljstvu
zaposlenih s telefonom (µtisk = µtel ).
H1 : Povpreˇcno zadovoljstvo zaposlenih s tiskalnikom ni enako povpreˇcnemu zadovoljstvu
zaposlenih s telefonom (µtisk 6= µtel ).
Parni t-test najdemo v SPPS-u pod Analyze → Compare Means → Paired-Samples
T Test (slika 7.16).
Slika 7.16: Parni t-test - ukaz
Odpre se okno Paires-Samples T Test (slika 7.17), kjer v desno polje Paired Variables v prvo vrstico, ki doloˇca en par spremenljivk, prenesemo najprej spremenljivko
Tiskalnik (V1 h) v stolpec Variable 1. V zadnji stolpec Variable 2 pa prenesemo
spremenljivko Telefon (V1 j). S klikom na gumb Options bi lahko nastavili ˇse interval
zaupanja, privzeto je nastavljen 95% interval zaupanja. Izbiro potrdimo s klikom na gumb
OK. Besedilni apis ukaza je predstavljen v spodnjem okvirˇcku.
Syntax
+
+
+
+
+
....za programerske frike :)
T-TEST PAIRS=V1_h WITH V1_j (PAIRED)
/CRITERIA=CI(.9500)
/MISSING=ANALYSIS.
14
80
7 Testiranje hipotez
Slika 7.17: Parni t-test - izbira spremenljivk
V izpisu rezultatov (okno
Output) dobimo izpisane najprej opisne statistike za obe spremenljivki.
Povpreˇcno zadovoljstvo 74 anketirancev s tiskalnikom je 3.6
s standardnim odklonom Slika 7.18: Opisne statistike za spremenljivki Tiskalnik in Te0.908, povpreˇcno zado- lefon
voljstvo s telefonom pa je
nekoliko viˇsje, in sicer je enako 4.0 s standardnim odklonom 0.702 (slika 7.18).
V naslednji tabeli dobimo izpisan koeficient korelacije8 med
obema spremenljivkama. Le-ta je
enak -0.083, vendar ni statistiˇcno
znaˇcilen pri 5% tveganju, saj je pSlika 7.19: Opisne statistike za spremenljivki Tiskal- vrednost enaka 0.481>0.05. (slika
nik in Telefon
7.19).
Rezultati parnega t-testa so predstavljeni v tabeli Paired Samples Test na sliki 7.20.
Zapiˇsemo lahko naslednji sklep: p-vrednost parnega t-testa je enaka 0.005<0.05 (t =
−2.924, sp = 73), torej niˇcelno domnevo o enakosti povpreˇcij obeh spremenljivk zavrnemo
pri 5% tveganju. Med povpreˇcnim zadovoljstvom zaposlenih s tiskalnikom in povpreˇcnim
zadovoljstvom s telefonom obstajajo torej statistiˇcno znaˇcilne razlike. Odgovor na osmo
raziskovalno vpraˇsanje (Ali se zadovoljstvo zaposlenih s tiskalnikom razlikuje od zadovoljstva zaposlenih s telefonom?) je torej pritrdilen.
8
Izraˇcun koeficienta korelacije in njegova interpretacija sta predstavljena v poglavju 7.3.2 .
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
81
Slika 7.20: Rezultati parnega t-testa za spremenljivki Tiskalnik in Telefon
7.2
ANOVA
Kadar ˇzelimo primerjati povpreˇcja med veˇc kot dvema skupinama ne moremo uporabiti
t-testa, paˇc pa uporabimo analizo variance ali krajˇse ANOVO.
7.2.1
Homogene variance med skupinami in statistiˇ
cno neznaˇ
cilne razlike v
povpreˇ
cju spremenljivke med skupinami
Pri naˇctovanju raziskave na strani 4 smo si zastavili naslednje raziskovalno vpraˇsanje
(RV10):
Se zadovoljstvo zaposlenih z opremo razlikuje glede na oddelek v podjetju?
Na podlagi raziskovalnega vpraˇsanja postavimo najprej statistiˇcni hipotezi:
H0 : Povpreˇcno zadovoljstvo zaposlenih z opremo je enako v vseh petih oddelkih v podjetju (µA = µOP = µKS = µP S = µIT ).
H1 : Povpreˇcno zadovoljstvo zaposlenih z opremo se v vsaj enem oddelku razlikuje od
ostalih (µi 6= µj , za i, j ∈ {A, OP, KS, P S, IT }9 ).
Analizo variance najdemo v SPPS-u pod Analyze → Compare Means → One-Way
ANOVA (slika 7.21).
Slika 7.21: Analiza variance (ANOVA) - ukaz
9
V vpraˇsalniku na strani 6 imamo navedenih pet oddelkov: A - administracija, OP - oddelek prodaje,
KS- kadrovska sluˇzba, P S - pravna sluˇzba, IT - IT oddelek
82
7 Testiranje hipotez
Odpre se nam okno OneWay ANOVA prikazano na sliki 7.22. V
desno zgornje polje Dependent list prenesemo
spremenljivko katere povpreˇcja nas zanimajo, v
naˇsem primeru torej spremenljivko z oznako V1 b
- Oprema pisarne. V
spodnje polje Factor
prenesemo spremenljivko,
ki doloˇca skupine, torej Delovno mesto (V 8).
Nato kliknemo na gumb
Options, kjer bomo izberali razliˇcne moˇznosti izpisa.
Slika 7.22: ANOVA - izbira spremenljivk
Odpre se nam okno One-Way ANOVA:
Options, kjer pod oznako Statistics izberemo opisne statistike (Descriptive), test
homogenosti varianc po skupinah (Test of
Homogeneity of variance test) in, ˇce
ˇzelimo, tudi graf povpreˇcij (Means plot)
(slika 7.23). Izbiro potrdimo s klikom na
gumb Apply.
V izpisu rezultatov (okno Output) se najprej izpiˇseju ukazi (glej okvirˇcek Syntax
7.15), v nadaljevanju pa so izpisane opisne statistike za spremenljivko Oprema
pisarne glede na oddelek podjetja (slika
7.24).
Slika 7.23: Izbira moˇznosti pri ANOVI
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
Syntax
+
+
+
+
+
83
....za programerske frike :)
ONEWAY V1_b BY V7
/STATISTICS DESCRIPTIVES HOMOGENEITY
/PLOT MEANS
/MISSING ANALYSIS.
15
Iz tabele z opisnimi statistikami najprej razberemo, da je na anketo odgovorilo 19 zaposlenih iz administracije, 12 iz oddelka prodaje, po 14 zaposlenih iz kadrovske sluˇzbe in
pravne sluˇzbe ter 15 zaposlenih iz IT oddelka. Z opremo pisarne so najbolj zadovoljni v
oddelku prodaje (¯
x = 3.08), sledi pravna sluˇzba (¯
x = 3.07) in kadrovska sluˇzba (¯
x = 2.86),
ˇ pogledamo stolpec s
najmanj zadovoljni pa so zaposleni v administraciji (¯
x = 2.47). Ce
standardnim odklonom (Std. Deviation) ugotovimo, da so odgovori glede zadovoljstva z
opremo pisarne najmanj razprˇseni v kadrovski sluˇzbi (s = 1.027), najbolj pa v IT oddelku
(s = 1.457). Zanimiva je ˇse ugotovitev, da nihˇce med anketiranci iz administracije in kadrovske sluˇzbe ni ocenil opreme pisarne z ocene 5 - zelo zadovoljen (stolpec Maximum).
Slika 7.24: Opisne statistike za spremenljivko Oprema pisarne glede na oddelek v podjetju
Naslednji izpis je test homogenosti varianc med skupinami Test of Homogeneity of Variances (slika 7.25). V okvirˇcku
si lahko ogledate, kako bi formalno zapisali statistiˇcni hipotezi za test homogenosti varianc med skupani. Na podlagi izpisa
na sliki 7.25 pa lahko zapiˇsemo naslednji
sklep: p-vrednost testa homogenosti vari- Slika 7.25: Test homogenosti varianc za spreanc je 0.474 > 0.05, torej niˇcelne domneve menljivko Oprema pisarne in skupine glede
o enakosti varianc ne moremo zavrniti pri na oddelek podjetja
5% tveganju. To pomeni, da lahko nadaljujemo z interpretacijo tabele ANOVA (slika 7.26).
84
7 Testiranje hipotez
Kako postavimo hipotezi pri Levene-ovem testu v
primeru ANOVE?
H0 : Variance spremenljivke Oprema pisarne so enake v vseh petih skupinah glede
2
2
2
na oddelek v podjetju (σA2 = σOP
= σKS
= σP2 S = σIT
).
H1 : Vsaj dve varianci spremenljivke Oprema pisarne se razlikujeta od ostalih (σi2 6=
σj2 , za i, j ∈ {A, OP, KS, P S, IT }.
Rezultati ANOVE so prikazani na sliki 7.26), in
sicer lahko zapiˇsemo naslednji sklep: p-vrednost
analize variance je enaka
0.608¿0.05, torej niˇcelne
domneve o enakosti povpreˇcnega zadovoljstva z
Slika 7.26: Rezultati ANOVE za spremenljivki Oprema pisarne opremo pisarne glede na
in in skupine glede na oddelek podjetja
oddelek v podjetju ne
moremo zavrniti pri 5%
tveganju. Odgovor na naˇse deseto raziskovalno (Se zadovoljstvo zaposlenih z opremo razlikuje glede na oddelek v podjetju?) je torej negativen; med oddelki v podjetju namreˇc
ni statistiˇcno znaˇcilnih razlik v zadovoljstvu zaposlenih z opremo pisarne.
V primeru, da smo v oknu
One-Way ANOVA: Options na sliki 7.23 izbrali izris povpreˇcij (Means Plot)
dobimo v oknu z rezultati
(Output) ˇse graf prikazan
na sliki 7.27. Na podlagi
tega grafa bi na prvi pogled
najbrˇz rekli, da so velike razlike v povpreˇcnem zadovoljstvu zaposlenih z opremo pisarne predvsem med administracijo in oddelkom prodaje.
Vendar pa je ta slika nekoliko popaˇcena, saj je lestvica
na y-osi med 2.4 in 3.1 in
ne med 1 in 5, tako kot v
ˇ ˇzelimo povpraˇsalniku. Ce
praviti razpon vrednosti dvo- Slika 7.27: Prikaz povpreˇcij za spremenljivko Oprema pikliknemo na vrednosti na y- sarne glede na oddelek podjetja
osi. Odpre se okno Chart
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
85
Editor, kjer ˇse enkrat dvokliknemo na y-os.
Odpre se nam okno Properties, kjer
v zavihku Scale doloˇcimo najniˇzjo vrednost na y-osi z 1 (vrednost vpiˇsemo v
polje Custom v vrstici Minimum) in
najviˇsjo s 5 Custom v vrstici Maximum).
Izbiro potrdimo s klikom na
gumb Apply, nato pa ˇse zapremo okno
Chart Editor (s klikom na x desno zgoraj).
Na grafu lahko popravimo tudi besedilona obeh oseh in sicer tako, da kliknemo na samo besedilo v oknuChart
Editor ter vnesemo ustrezne spremembe.
Na sliki 7.29 je prikazan graf s popra- Slika 7.28: Rezultati ANOVE za spremenvljeno lestvico in slovenskim napisom na ljivki Oprema pisarne in in skupine glede na
oddelek podjetja
y-osi.
Slika 7.29: Prikaz povpreˇcij za spremenljivko Oprema pisarne glede na oddelek podjetja
- popravljen graf
86
7.2.2
7 Testiranje hipotez
Homogene variance med skupinami in statistiˇ
cno znaˇ
cilne razlike v
povpreˇ
cju spremenljivke med skupinami
Med raziskovalnimi vpraˇsanji na strani 4 smo si zastavili tudi naslednje raziskovalno
vpraˇsanje (RV11):
Se zadovoljstvo zaposlenih z velikostjo pisarne razlikuje glede na oddelek v
podjetju?
Na podlagi raziskovalnega vpraˇsanja postavimo statistiˇcni hipotezi:
H0 : Povpreˇcno zadovoljstvo zaposlenih z velikostjo pisarne je enako v vseh petih oddelkih
v podjetju (µA = µOP = µKS = µP S = µIT ).
H1 : Povpreˇcno zadovoljstvo zaposlenih z velikostjo pisarne se v vsaj enem oddelku razlikuje od ostalih (µi 6= µj , za i, j ∈ {A, OP, KS, P S, IT }).
Tako kot v prejˇsnjem
primeru test izberemo
Analyze → Compare
Means → One-Way
ANOVA (slika 7.21).
Odpre se okno OneWay ANOVA, kjer V
zgornje polje Dependent List prenesemo
spremenljivko Velikost pisarne (V1 a), v spodnje
pole Factor pa tako kot
prej spremenljivko Delovno mesto (slika 7.30).
S klikom na gumb OptiSlika 7.30: ANOVA - izbira spremenljivk
ons izberemo opisne statistike, test homogenosti varianc in, ˇce ˇzelimo, ˇse graf povpreˇcij (glej sliko 7.23).
V izpisu rezultatov (okno Output) so najprej prikazane opisne statistike (slika 7.31).
Tako kot prej iz tabele z opisnimi statistikami najprej razberemo, da je na anketo odgovorilo 19 zaposlenih iz administracije, 12 iz oddelka prodaje, po 14 zaposlenih iz kadrovske
sluˇzbe in pravne sluˇzbe ter 15 zaposlenih iz IT oddelka. Z velikostjo pisarne so najbolj
zadovoljni v administraciji (¯
x = 4.0), sledi kadrovska sluˇzba (¯
x = 3.9) in pravna sluˇzba
(¯
x = 3.07), najmanj zadovoljni pa so zaposleni v oddelku prodaje (¯
x = 1.9) in IT oddelku
ˇ
(¯
x = 2.1). Ce pogledamo stolpec s standardnim odklonom (Std. Deviation) ugotovimo,
da so odgovori glede zadovoljstva z velikostjo pisarne najmanj razprˇseni v oddelku prodaje
(s = 0.669), najbolj pa v pravnem oddelku (s = 0.915). Zanimiva je ˇse ugotovitev, da je
bila najviˇsja ocena velikosti pisarne enaka 3 (stolpec Maximum).
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
87
Slika 7.31: Opisne statistike za spremenljivko Velikost pisarne glede na oddelek v podjetju
Rezultati testa homogenosti varianc med
skupinami Test of Homogeneity of
Variances so prikazani na sliki 7.32).
Zapiˇsemo naslednji sklep: p-vrednost testa homogenosti varianc je 0.586 > 0.05,
torej niˇcelne domneve o enakosti varianc ne moremo zavrniti pri 5% tvega- Slika 7.32: Test homogenosti varianc za sprenju.
To pomeni, da lahko nadalju- menljivko Velikost pisarne in skupine glede
jemo z interpretacijo tabele ANOVA (slika na oddelek podjetja
7.33).
Na podlagi rezultatov
ANOVE (slika 7.33) zapiˇsemo naslednji sklep: pvrednost analize variance je enaka 0.000¡0.05,
torej niˇcelno domnevo o
enakosti povpreˇcnega zadovoljstva zaposlenih z
Slika 7.33: Rezultati ANOVE za spremenljivki Velikost pisarne velikostjo pisarne glede
in skupine glede na oddelek podjetja
na oddelek v podjetju zavrnemo pri 5% tveganju.
Odgovor na naˇse enajsto raziskovalno (Se zadovoljstvo zaposlenih z velikostjo pisarne razlikuje glede na oddelek v podjetju?) je torej pozitiven; med oddelki v podjetju namreˇc
obstajajo statistiˇcno znaˇcilne razlike v zadovoljstvu zaposlenih z velikostjo pisarne.
Ker smo ugotovili, da obstajajo statistiˇcno znaˇcilne razlike v zadovoljstvu zaposlenih z
velikostjo pisarne, nas v nadaljevanju zanima ˇse, med katerimi oddelki prihaja do razlik. V
ta namen izvedemo tako imenovane multiple (ali veˇckratne) primerjave. Smernice, kateri
test izbrati, najdete v okvirˇcku na strani 7.2.2. Glede na navedene smernice izberemo
ˇ
ustrezni test na podlagi velikosti skupin in predpostavke o homogenosti varianc. Ce
pogledamo tabelo z opisnimi statistikami (slika 7.31 ugotovimo, da se velikosti skupin
(oz. anketirancev po oddelkih) nekoliko razlikujejo, hkari pa je izpolnjena predpostavka
o enakosti varianc med skupinami (slika 7.32). Na podlagi smernic iz okvirˇcka na strani
88 bomo torej v naˇsem primeru izvedli Gabriel-ov postopek.
88
7 Testiranje hipotez
Kateri test izbrati v primeru, ko pri ANOVI ugotovimo, da med skupinami obstajajo statistiˇ
cno
znaˇ
cilne razlike v povpreˇ
cju neke spremenljivke?
Smernice za izbiro testa (Field, 2009, str. 388):
ˇ so skupine enako velike in je izpolnjen pogoj o homogenosti varianc med
• Ce
skupinami uporabimo REGWQ ali Tukey-jev HSD.
ˇ se velikosti skupin nekoliko razlikujejo, uporabimo Gabriel-ov postopek.
• Ce
ˇ so velikosti skupin zelo razliˇcne in je izpolnjen pogoj o homogenosti varianc,
• Ce
uporabimo Hochberg’s GT2.
ˇ predpostavka o enakosti varianc ni izpolnjena, uporabimo Games–Howell• Ce
ov postopek.
V SPSS-u izberemo ustrezni test za multiple primerjave s klikom na gumb Post Hoc v
oknu One-Way ANOVA (slika 7.30). Odpre se na okno One-Way ANOVA: Post
Hoc Multiple Comparisons (slika 7.34), kjer v zgornjem polju Equal Variances Assumed izberemo Gabriel-ov postopek. izbiro potrdimo s klikom na gumb Continue.
Slika 7.34: Izbira testa za multiple primerjave pri ANOVI
V oknu Output dobimo izpisane rezultate multiplih primerjav, ki so prikazane na sliki
7.35. Razlike med posameznimi skupinami oziroma v naˇsem primeru med oddelki so
oznaˇcene z ∗ v stolpcu povpreˇcna razlika (Mean Difference (I-J)). Sklep o znaˇcilnih
razlikah med povpreˇcjema dveh skupin lahko sprejmemo tudi na podlagi p-vrednosti v
stolpcu Sig., seveda ˇce so p-vrednosti manjˇse od 0.05 (v primeru 5% tveganja).
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
89
V naˇsem primeru obstajajo statistiˇcno znaˇcilne razlike v povpreˇcnem zadovoljstvu zaposlenih z velikostjo pisarne med (slika 7.35):
• administracijo in kadrovsko sluˇzbo (p=0.000),
• administracijoin pravno sluˇzbo (p=0.039),
• administracijo in IT oddelkom (p=0.000),
• oddelkom prodaje in kadrovsko sluˇzbo (p=0.000),
• oddelkom prodaje in pravno sluˇzbo (p=0.015),
• kadrovsko sluˇzboin IT oddelkom (p=0.000).
Slika 7.35: Rezultati multiplih primerjav v ANOVI za spremenljivko Velikost pisarne in
skupine glede na oddelek podjetja
90
7 Testiranje hipotez
Syntax
+
+
+
+
+
....za programerske frike :)
ONEWAY V1_b BY V7
/STATISTICS DESCRIPTIVES HOMOGENEITY
/PLOT MEANS
/MISSING ANALYSIS
/POSTHOC=GABRIEL ALPHA(0.05).
7.2.3
16
Nehomogene variance med skupinami in statistiˇ
cno znaˇ
cilne razlike v
povpreˇ
cju spremenljivke med skupinami
Poskuˇsajmo odgovoriti ˇse na dvanajsto raziskovalno vpraˇsanje predstavljeno na strani 4:
Se zadovoljstvo zaposlenih s tiskalnikome razlikuje glede na oddelek v podjetju?
Na podlagi raziskovalnega vpraˇsanja postavimo statistiˇcni hipotezi:
H0 : Povpreˇcno zadovoljstvo zaposlenih s tiskalnikom je enako v vseh petih oddelkih v
podjetju (µA = µOP = µKS = µP S = µIT ).
H1 : Povpreˇcno zadovoljstvo zaposlenih s tiskalnikom se v vsaj enem oddelku razlikuje
od ostalih (µi 6= µj , za i, j ∈ {A, OP, KS, P S, IT }).
Tako kot v prejˇsnjih dveh primerih izberemo Analyze → Compare Means → OneWay ANOVA (slika 7.21). Odpre se okno One-Way ANOVA, kjer V zgornje polje
Dependent List prenesemo spremenljivko Tiskalnik (V1 h), v spodnje pole Factor pa
tako kot prej spremenljivko Delovno mesto (slika 7.30). S klikom na gumb Options izberemo opisne statistike, test homogenosti varianc in, ˇce ˇzelimo, ˇse graf povpreˇcij (glej sliko
7.23).
V izpisu rezultatov (okno Output) so najprej prikazane opisne statistike (slika 7.36). V
stolpcu z oznako N najprej razberemo ˇstevilo zaposlenih poposameznih odddelkih. Na
anketo odgovorilo 19 zaposlenih iz administracije, 12 iz oddelka prodaje, po 14 zaposlenih
iz kadrovske sluˇzbe in pravne sluˇzbe ter 15 zaposlenih iz IT oddelka. S tiskalniki so najbolj zadovoljni v IT oddelku (¯
x = 4.0), sledi oddelek prodaje (¯
x = 3.8) in pravna sluˇzba
ˇ pogledamo
(¯
x = 3.6), najmanj zadovoljni pa so zaposleni v kadrovski sluˇzbi (¯
x = 3.0). Ce
stolpec s standardnim odklonom (Std. Deviation) ugotovimo, da so odgovori glede zadovoljstva z velikostjo pisarne najmanj razprˇseni v kadrovski sluˇzbi (s = 0.555), najbolj
pa v oddelku prodaje (s = 1.030). Zanimiva je ˇse ugotovitev, da je bila najviˇsja ocena
tiskalnikov v kadrovski sluˇzbi 4 (stolpec Maximum), v IT oddelku pa je bila najniˇzja
ocena 3 (stolpec Minimum).
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
91
Slika 7.36: Opisne statistike za spremenljivko Tiskalnik glede na oddelek v podjetju
Rezultati testa homogenosti varianc med
skupinami Test of Homogeneity of
Variances so prikazani na sliki 7.32).
Zapiˇsemo naslednji sklep: p-vrednost testa homogenosti varianc je 0.016 < 0.05,
torej niˇcelno domnevo o enakosti varianc zavrnemo pri 5% tveganju. To pomeni, da tabele ANOVA, ki je izpisana Slika 7.37: Test homogenosti varianc za sprev nadaljevanju rezultatov ne moremo in- menljivko Tiskalnik in skupine glede na odterpretirati, paˇc pa moramo izbrati drug delek podjetja
test.
Ustrezen test v primeru neenakih varianc in veˇc kot dveh skupin najdemo spet
pod Analyze → Compare Means →
One-Way ANOVA, nato kliknemo na
gumb Options, vendar sedaj, poleg opisnih statistik, testa homogenosti varianc
in grafa povpreˇcij, odkljukamo ˇse BrownForsythe in Welch (slika 7.38).
Izbiro potrdimo s klikom na gumb Continue.
Slika 7.38:
Izbira postopka BrownForsythe v primeru neenakih varianc med
skupinami pri ANOVI
92
7 Testiranje hipotez
V izpisu rezultatov dobimo sedaj ˇse enkrat izpisane opisne statistike
in test enakosti varianc, nova pa je tabela z
napisom Robust Tests
of Equality of Means
(slika 7.39). Priporoˇcilo
Slika 7.39: Rezultati robustnega testa enakosti povpreˇcij za pravi, da ˇce je vsaj en izspremenljivki Tiskalnik in skupine glede na oddelek podjetja med izpisanih testov statitiˇcno znaˇcilen, nadaljujemo naˇso analizo s testi multiplih primerjav. Na podlagi robustnih testov enakosti povpreˇcij v naˇsem primeru zapiˇsemo naslednji sklep: p-vrednosti tako Brown-Forsytheovega testa (F(4, 32.78)=4.11, p=0.008¡0.05) kot Welch-ovega testa (F(4, 57.56)=2.75,
p=0.008¡0.05) sta manjˇsi od 0.05, torej niˇcelno domnevo o enakosti povpreˇcnega zadovoljstva zaposlenih s tiskalnikom glede na oddelek v podjetju zavrnemo pri 5% tveganju.
Odgovor na dvanajsto raziskovalno (Se zadovoljstvo zaposlenih s tiskalnikom razlikuje
glede na oddelek v podjetju?) je torej pozitiven; med oddelki v podjetju namreˇc obstajajo statistiˇcno znaˇcilne razlike v zadovoljstvu zaposlenih s tiskalnikom. V nadaljevanju
nas seveda zanima med katerimi oddelki prihaja do statistiˇcno znaˇcilnh razlik.
Glede na okvirˇcek s smernicami za izbiro testa za multiple primerjave na strani 88 je torej
v naˇsem primeru zaradi neenakih varianc med skupinami primeren Games-Howell-ov
postopek. Izberemo ga tako, da v oknu One-Way ANOVA kliknemo na gumb Post
Hoc. Odpre se nam okno One-Way ANOVA: Post Hoc Multiple Comparisons
(glej sliko 7.34), kjer v spodnjem polju pod napisom Equal Variances Not Assumed
odkljukamo Games-Howell. Izbiro potrdimo s klikom na gumb Continue.
V oknu Output dobimo izpisane rezultate multiplih primerjav, ki so prikazane na
sliki 7.41. V naˇsem primeru
obstajajo statistiˇcno znaˇcilne
razlike v povpreˇcnem zadovoljstvu zaposlenih s tiskalnikom le med IT oddelkom in kadrovsko sluˇzbo
(p=0.007). Kot smo videli
ˇze v tabeli z opisnimi statistikami (slika 7.36) je povpreˇcno zadovoljstvo zaposlenih s tiskalnikom v kadrovski sluˇzbi enako 3.0, v IT
oddelku pa 4.0, povpreˇcja
so prikazana tudi na sliki
7.40.
Slika 7.40: Prikaz povpreˇcij za spremenljivko za spremenljivko Tiskalnik in skupine glede na oddelek podjetja
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
93
Slika 7.41: Rezultati multiplih primerjav v ANOVI za spremenljivko Tiskalnik in skupine
glede na oddelek podjetja
Syntax
+
+
+
+
+
....za programerske frike :)
ONEWAY V1_h BY V7
/STATISTICS DESCRIPTIVES HOMOGENEITY BROWNFORSYTHE WELCH
/PLOT MEANS
/MISSING ANALYSIS
/POSTHOC=GH ALPHA(0.05).
17
94
7.3
7.3.1
7 Testiranje hipotez
Povezanost spremenljivk
χ2 test
χ2 test (hi-kvadrat test) uporabljamo za testiranje hipotez o povezanosti dveh imenskih
ali urejenostnih spremenljivk. Tako lahko z omenjenim testom analiziramo devetnajsto
raziskovalno vpraˇsanje (predstavljeno na strani 4), ki spraˇsuje ali obstajajo razlike v
izobrazbeni strukturi zaposlenih glede na spol. Postavimo ustrezni statistiˇcni hipotezi:
H0 : Spremenljivki Spol in Izobrazba nista povezani.
H1 : Spremenljivki Spol in Izobrazba sta povezani.
χ2 test najdemo v meniju s kontingenˇcnimi tabelami (Crosstabs), natanˇcneje SPSS:
Analyze → Descreptive Statistics → Crosstabs (slika 7.1).
Slika 7.1: χ2 test - ukaz
Odpre se nam pogovorno okno Crosstabs
(slika 7.2 ), kjer izberemo ustrezne spremenljivke. V polje Row(s)
vnesemo npr. spremenljivko Spol, v polje Column(s) pa spremenljivko Izobrazba. To pomeni, da bomo imeli v
kontingenˇcni tabeli v vrsticah zapisane kategorije spremenljivke Spol,
torej ˇzenski in moˇski,
v stolpcih pa izobrazbene skupine. Spremenljivke, dodane v vrstice
in stolpce tabele, lahko
seveda poljubno zamenjamo.
Slika 7.2: χ2 test - izbira spremenljivk
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
95
s klikom na gumb Statistics v oknu Crosstabs na sliki 7.2 izberemo statistike, ki jih
ˇzelimo izraˇcunati. V naˇsem primeru potrebujemo le χ2 (Chi-square) (slika 7.3a). Izbiro
potrdimo s klikom na gumb Continue.
(a) Izbira ststistik
(b) Prikaz podatkov v celicah tabele
Slika 7.3: χ2 test - izbira moˇznosti v oknu Statistics in Options
S klikom na gumb Cells v oknu Crosstabs se odpre okno prikazano na sliki 7.3b, kjer
lahko doloˇcimo, kako naj se izpiˇsejo podatki v kontingenˇcni tabeli. Privzeto je v okvirˇcu
Counts oznaˇceno Obsereved, kar pomeni, da bo v vsaki celici prikazano ˇstevilo opazovanih enot. Oznaˇcili smo ˇse moˇznost Expected, kar pomeni, da se bodo izpisale ˇse
teoretiˇcne frekvence. V okvirˇcu Percentages smo oznaˇcili ˇse moˇznost Rows, kar pomeni,
da se bodo izraˇcunali ˇse odstotki glede na vsako vrstico tabele.
V izpisu rezultatov dobimo najprej kontingenˇcno
tabelo (slika 7.4). Opazimo, da imata v naˇsem
vzorcu le ena ˇzenska in
en moˇski magisterij oz.
doktorat. Teoretiˇcna frekvenca pri moˇskih z magisterijem oz. doktoratom je enaka 1.2, χ2 test
pa zahteva, da so teo- Slika 7.4: Izpis χ2 testa - kontingenˇcna tabela za spremenljivki
retiˇcne frekvence v vsaki Spol in Izobrazba
celici tabele veˇcje ali
ˇ to ni mogoˇce,
enake 5. V takih primerih lahko poskusimo kategorije ustrezno zdruˇziti. Ce
2
2
χ testa ne moremo izvesti oziroma interpretacija p-vrednosti χ testa ni smiselna (durga
dobljena tabela v oknu Output z naslovom Chi-Square Tests).
96
7 Testiranje hipotez
Spomnimo se, da smo
v poglavju 6.3 o preurejanju spemenljivk na
strani 66 spremenljivko
Izobrazba ˇze ustrezno preoblikovali v 3 skupine.
Ponovno izvedemo χ2
test. V zgornjem polju Rows je ˇze zapisana spremenljivka Spol,
iz polja Column(s) pa
najprej odstranimo spremenljivko V 7 ter nato
vanj prenesemo spremenljivko V7 3sk (slika 7.2).
Izbiro potrdimo s sklikom na gumb OK.
Slika 7.5: χ2 test - izbira preurejene spremenljivke Izobrazba
Syntax
+
+
+
+
+
CROSSTABS
/TABLES=V4 BY V7_3sk
/FORMAT=AVALUE TABLES
/STATISTICS=CHISQ
/CELLS=COUNT EXPECTED ROW
/COUNT ROUND CELL.
....za programerske frike :)
18
Na sliki 7.6 je prikazana kontingenˇcna tabela.
Sedaj so teoretiˇcne frekvence v vsaki
celica veˇcje ali enake 5.
Ker smo v oknu Cells
izbrali izraˇcunane odstotke po vrsticah opazimo, da se izraˇcunani
odstotki v vsaki vrstici
seˇstejejo v 100 %.
Slika 7.6: Izpis rezultatov pri χ2 testu - kontingenˇcna tabela
Med ˇzenskami jih ima 17 za spremenljivko Spol in preurejeno spremenljivko Izobrazba
oz. 55% srednjeˇsolsko izobrazbo, 23% ima viˇsjeˇsolsko oz. visokoˇsolsko izobrazbo ter 23% univerzitetno izobrazbo
ali veˇc. Med moˇskimi ima 58% zaposlenih srednjeˇsolsko izobrazbo, univerzitetno oz. viˇsjo
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
97
izobrazbo pa ima 23%.
V primeru, da bi oknu
Cells (slika 7.3b) izbrali
izraˇcunane odstotke po
stolpcih (Column), bi
dobili tabelo prikazano
na sliki 7.7. Iz nje razberemo, da je med zaposlenimi s srednjeˇsolsko izobrazbo 40.5% ˇzensk ter
59.5 odstotkov moˇskih.
Med zaposlenimi z viˇsjeˇsolsko oz. visokoˇsolsko izo- Slika 7.7: Izpis rezultatov pri χ2 testu - kontingenˇcna tabela
brazbo je 47% ˇzensk ter za spremenljivko Spol in preurejeno spremenljivko Izobrazba
53 % moˇskih, medtem ko (odstotki izraˇcunani po stolpcih)
je med zaposlenimi z univerzitetno oz. viˇsjo izobrazbo 42% ˇzensk ter 58 % moˇskih.
Katere odstotke izberemo, po vrsticah ali po stolpcih, je seveda odvisno od tega, na kakˇsen
ˇ oznaˇcimo hkrati moˇznosti Rows in Columns bomo
naˇcin bi radi prestavili rezultate. Ce
ˇ v oknu Cells izberemo
dobili odstotke po vrsticah in stolpcih zapisane v isti tabeli. Ce
Total, dobimo izraˇcunane odstotke glede na skupno ˇstevilo enot v tabeli. Tako bi v naˇsem
primeru npr. dobili, da je med vsemi zaposlenimi 23 % ˇzensk s srednjeˇsolsko izobrazbo.
Za odgovor na vpraˇsanje
ali sta spremenljivki Spol
in Izobrazba povezani,
pogledamo rezultate v
tabeli na sliki 7.8. Ali je
povezava med spremenljivkama znaˇcilna, nam
pove p-vrednost v prvi
vrstici (pri Pearson Chisquare).
2
p-vrednost χ2 testa je Slika 7.8: Rezultati χ testa za spremenljivko Spol in preureenaka 0.915 < 0.05 jeno spremenljivko Izobrazba
(χ2 = 0.179), kar pomeni, da niˇcelno domnevo, da spremenljivki Spol in Izobrazba nista povezani pri 5% stopnji
znaˇcilnosti , torej niˇcelne domneve ne moremo zavrniti. To pomeni, da na devetnajsto
raziskovalno vpraˇsanje (Ali obstajajo razlike v izobrazbeni strukturi zaposlenih glede na
spol?) odgovorimo negativno.
98
7 Testiranje hipotez
Kdaj izraˇ
cunamo koeficient kontingence in kaj
le-ta pomeni?
V primeru, da bi ugotovili, da sta naˇsi dve imenski spremenljivki povezani, bi
izraˇcunali ˇse koeficient kontingence, ki meri intenzivnost oziroma stopnjo povezanosti dveh spremenljivk. Koeficient kontingence C zavzame vrednosti med 0 in 1, in
sicer veˇcji kot je koeficient, moˇcneje sta povezani obe spremenljivki.
Koeficient kontigence izraˇcunamo tako, da v oknu Crosstabs (SPSS: Analyze →
Descreptive Statistics → Crosstabs) kliknemo gumb Statistics ter izberemo v
polju Nominal moˇznost Contigency coefficient (glej sliko 7.3a).
V vpraˇsalniku na strani 6 imamo zapisane tri imenske spremenljivke. Zapiˇsi
ˇse dve raziskovalni vpraˇsanji, ki povezujeta po dve imenski spremenljivki. Postavi ustrezni statistiˇcni hipotezi, izvedi analizo s pomoˇcjo χ2 testa ter interpretiraj
dobljene rezultate.
Poskusi sam...
7.3.2
Korelacija
V primeru dveh razmernostnih spremenljivk (ali vsaj urejenostnih) ugotavljamo povezanost spremenljivk s Pearsonovim koeficientom korelacije. V SPSS-u ga najdemo pod
Analyze → Correlate → Bivariate (slika 7.9 ).
Slika 7.9: Korelacija - ukaz
S pomoˇcjo korelacije bi torej radi odgovorili na ˇsestnajsto raziskovalno vpraˇsanje:
V kakˇsni povezavi sta delovna doba in starost v naˇsem podjetju?
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
99
Postavimo, ustrezni statistiˇcni hipotezi:
H0 : Spremenljivki Starost in Delovna doba nista povezani (ρ = 0).
H1 : Spremenljivki Starost in Delovna doba sta povezani (ρ 6= 0).
Odpre se okno Bivariate correlations, kjer v desno okno Variables prenesemo obe
spremenljivki Starost in Delovna Doba (slika 7.10). V oknu Options bi lahko oznaˇcili ˇse
izraˇcun povpreˇcij ter standardnih odklonov.
Slika 7.10: Korelacija - izbira spremenljivk Starost in Delovna doba
Syntax
+
+
+
+
+
CORRELATIONS
/VARIABLES=V5 V5
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.
....za programerske frike :)
19
100
7 Testiranje hipotez
V prikazu rezultatov (okno
Output) dobimo tabelo
izraˇcunanimi korelacijskimi
koeficienti (slika 7.11).
p-vrednost je 0.000 <
0.01, kar kaˇze, da sta
spremenljivki Starost in
Delovna doba povezani
pri 1 % tveganju (torej
niˇcelne domneve ne moremo potrditi). Pearso- Slika 7.11: Izpis rezultatov za korelacijo med spremenljivkama
nov koeficient korelacije Starost in Delovna doba
je enak 0.923, kar nakazuje visoko pozitivno linearno povezanost med spremenljivkama Starost in Delovna doba.
Torej, starejˇsi kot je anketiranec, daljˇsa je njegova delovna doba.
S pomoˇcjo izraˇcuna Pearsonovega
koeficienta korelacije odgovori na
raziskovalni vpraˇsanji RV12 in
RV15 na stani 4. Postavi ustrezni statistiˇcni hipotezi, izvedi analizo ter interpretiraj dobljene rezultate.
7.4
Linearna regresija
Kadar nas ne zanima samo ali sta dve spremenljivki povezani, paˇc pa tudi ali lahko s
pomoˇcjo prve spremenljivke pojasnimo drugo spremenljivko oziroma, povedano drugaˇce,
kakˇsen vpliv ima prva spremenljivka na drugo spremenljivko, lahko uporabimo linearno
regresijo. Pri regresiji tako loˇcimo neodvisno spremenljivko, navadno oznaˇcena z X, ter
odvisno spremenljivko, ki jo navadno oznaˇcimo z Y . V tem poglavju se bomo omejili
na linearno regresijo, kjer poskuˇsamo odvisnost med dvema spremenljivkama opisati z
linearno funkcijo.
V sedemnajstem raziskovalnem vpraˇsanju na strani 4 smo se vpraˇsali
RVl7: Kako natanˇcno lahko iz starosti zaposlenega napovemo njegovo delovno
dobo?
Vpraˇsanje je napisano zelo sploˇsno, tako da moramo najprej sploh ugotoviti, za kakˇsno
odvisnost gre med preuˇcevanjima spremenljivkama. Izvedba linearne regresije je namreˇc
smiselna, kadar ˇze v samih podatkih zaznamo linearno odvisnost, zato najprej nariˇsemo
razsevni grafikon. Razsevni grafikon spremenljivk Starost in Delovna doba smo narisali
ˇze na sliki 5.13 na strani 57, kjer se jasno kaˇze linearna odvisnost med obema spremenljivkama.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
101
Linearna funkcija, ki jo iˇsˇcemo ima enaˇcbo
Y = a + b · X + ε na populaciji in
y = a
ˆ + ˆb · x + εˆ na vzorcu,
kjer oznaki ε in εˆ predstavljata sluˇcajni vpliv oz. napako regresijskega modela.
Z linearno regresijo ˇzelimo tako dobiti parametre premice a
ˆ in ˆb, ter hkrati oceno, kako
dobro se model, torej dobljena linearna funkcija, prilega naˇsim podatkom.
V naˇsem primeru nas torej zanima, kako dobro lahko iz starosti posameznika napovemo
njegovo delovno dobo. Regresijsko enaˇcbo bi tako lahko zapisali tudi kot:
delovna doba = a
ˆ + ˆb · starost .
Linearno regresijo v SPSS-u najdemo pod SPSS: Analyze → Regression → Linear...
(slika 7.12).
Slika 7.12: Linearna regresija - ukaz
Odpre se nam okno Linear Regression (slika
7.13), kjer v zgornje
polje pod Dependent:
prenesemo odvisno spremenljivko, torej v naˇsem
primeru Delovno dobo, v
spodnje okno pod Independent(s): pa prenesemo neodvisno spremenljivko, torej Starost.
S klikom na gumb Statistics lahko izberemo
dodatne statistike, ki
jih ˇzelimo izraˇcunati oz.
preverimo kaj se bo izpisalo pri rezultatih.
Slika 7.13: Izbira spremenljivk pri linearni regresiji
102
7 Testiranje hipotez
Odpre se nam okno Linear Regression:
Statistics (slika 7.14), kjer v zgornjem
levem polju Regression Coefficientsˇze
oznaˇceno Estimates, torej oceni obeh parametrov premice, oznaˇcimo pa lahko ˇse
interval zaupanja Confidence Intervals.
Desno zgoraj je ˇze oznaˇceno Model fit,
torej ocena kako dobro se linearni model prilega podatkom, ˇce ˇzelimo pa lahko
oznaˇcimo ˇse prikaz opisnih statistik Descriptives. Ostalih statistik pri enostavni
regresiji ne potrebujemo, uporabili bi jih v
primeru multiple regresije, ˇce bi imeli torej
veˇc neodvisnih spremenljivk, kar pa presega okvire tega priroˇcnika. Izbiro potr- Slika 7.14: Linearna regresija - izbira statidimo s klikom na gumb Continue. Nato stik
pa v oknu Linear Regression kliknemo
ˇse OK.
+
+ Syntax
+++
....za programerske frike :)
REGRESSION
/DESCRIPTIVES MEAN STDDEV CORR SIG N
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT V6
/METHOD=ENTER V5.
20
V izpisu rezultatov (okno Output) se najprej izpiˇse tabela opisnih statistik (slika 7.15), seveda
ˇce smo jo oznaˇcili v oknu Linear
Regression: Statistics (slika
7.14). Povpreˇcna delovna doba
Slika 7.15:
Opisne statistike za spremenljivke je tako enaka 15.2 leti (s standardnim odklonom s = 8.3), medtem
vkljuˇcene v regresijo
ko je povpreˇcna starost zaposlenih
38.3 let (s standardnim odklonom 7.6 let).
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
103
Nato se v izpisu rezultatov (v
oknu Output) izpiˇse tabela prikazana na sliki 7.16 iz katere razberemo, da smo dobili en model v katerem je Starost neodvisna spremenljivka, odvisnma
spremenljivka pa Delovna doba.
Te tabele pri linearni regresiji Slika 7.16: Spremenljivke vkljuˇcene v linearno regrenavadno ne vkljuˇcujemo v naˇsa sijo
poroˇcila.
Naslednja tabela v izpisou rezultatov nam prikazuje povzetek oz. lastnosti modela (slika 7.16).
Vrednost R2 nam pove,
da lahko spremenljivka
Starost pojasni 85.2 %
Slika 7.17: Linearna regresija - povzetek modela
variance spremenljivke Delovna doba. V primeru
enostavne linearne regresije nam R predstavlja (Pearsonov) korelacijski koeficient med
spremenljivkama Starost in Delovna doba (R = 0.923), ki smo ga izraˇcunali ˇze na strani
100.
Tabela na sliki 7.18 z
naslovom ANOVA nam
pove ali je naˇs model dobro opisuje podatke ali
ne. Ker je p-vrednost
0.000 < 0.05 lahko pri
5 % tveganju trdimo,
da je naˇs model doSlika 7.18: Linearna regresija - tabela ANOVA
ber oz. da statistiˇcno
znaˇcilno bolje napove delovno dobo kot ˇce bi vzeli le povpreˇcje delovne dobe.
Slika 7.19: Linearna regresija - koeficienti modela
V tabeli z naslovom Coefficients (slika 7.19) so
prikazani koeficienti regresijskega modela. V
naˇso regresijsko enaˇcbo
prepiˇsemo nestandardizirane regresijske modele iz drugega stolpca
(Unstandardized Co-
104
7 Testiranje hipotez
efficients: B), tako da dobimo
delovna doba = −23.205 + 1.04 · starost .
p-vrednosti v zadnjem stolpcu nam povedo, da sta oba kooeficienta (ˆ
a in ˆb) statistiˇcno
znaˇcilno razliˇcna od 0.
Kako interpretiramo koeficiente regresijske premice?
Koeficient ˆb nam pove za koliko se spremeni odvisna spremenljivka, ˇce se neodvisna spremnljivka poveˇca za 1 enoto. V naˇsem primeru lahko torej reˇcemo, da ˇce se starost zaposlenega poveˇca za eno leto, se njegova delovna doba poveˇca za 1.004 let.
Pri interpretacija a
ˆ moramo biti nekoliko previdini ali le-ta smiselna. a
ˆ namreˇc pove,
kakˇsna je vrednost odvisne spremenljivke, ˇce je vrednost neodvisne spremenljivke enaka
0. V naˇsem primeru torej to ni smiselno, saj delavci ne morejo biti stari 0 let.
S pomoˇcjo regresijske enaˇcbe lahko tudi napovemo vrednost odvisne spremenljivke za
neko neodvisno spremenljivko. Pri tem moramo paziti, da vzamemo vrednost neodvisne
spremenljivke samo na intervalu, na katerem imamo podatke. V naˇsem primeru je najmlajˇsi zaposleni star 20 let, najstarejˇsi pa 59 let. Recimo, da nas zanima, kakˇsna je v
povpreˇcju delovna doba zaposlenega, ki je star 45 let. Izbrano starost vstavimo v enaˇcbo
in dobimo
delovna doba = −23.205 + 1.04 · 45 = 23.6 .
Torej, toˇckasta ocena za delovno dobo za zaposlenega starega 45 let je enaka 23.6 let.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
8
105
Neparametriˇ
cni testi
Paleta neparametriˇcnih testov je zelo ˇsiroka, saj praktiˇcno za vsak parametriˇcen test
obstaja njegova neparametriˇcna razliˇcica. V poglavju bomo prikazali test deleˇza za en
vzorec ter Kolmogorov-Smirnov test za en vzorec.
In v ˇ
cem je sploh razlika med parametriˇ
cnimi in
neparametriˇ
cnimi testi?
Parametriˇcni testi predpostavljajo doloˇceno porazdelitev, in sicer v veˇcini primerov
normalno porazdelitev. Poleg tega zahtevajo, da imamo ˇstevilske spremenljivke,
navadno merjene z razmernostno oz. intervalno lestvico.
Neparametriˇcni testi ne zahtevajo predpostavke o normalni porazdelitvi in homogenosti varianc in so primerni tudi za urejenostne in imenske spremenljivke.
Vsak parametriˇcen test ima vsaj eno neparametriˇcno razliˇcico, vendar, ˇce je moˇzno,
raje uporabljamo parametriˇcne teste, saj imajo veˇcjo moˇc. Pri istem ˇstevilu
podatkov, parametriˇcni testi z veˇcjo verjetnostjo zavrnejo napaˇcno postavljeno
niˇcelno domnevo.
V primeru velikih vzorcev nam centralni limitni izrek zagotavlja, da bomo s parametriˇcnimi testi dobili dobre rezultate tudi ˇce podatki niso normalno porazdeljeni.
8.1
Test deleˇ
zev
V dvajsetem raziskovalnem vpraˇsanju na strani 4 smo se vpraˇsali
Ali si veˇc kot tri ˇcetrtine zaposlenih ˇzeli odprto okrepˇcevalnico do 17. ure?
Na podlagi raziskovalnega vpraˇsanja najprej postavimo statistiˇcni hipotezi:
H0 : Deleˇz zaposlenih, ki si ˇzelijo, da bi bila okrepˇcevalnica odprta do 17. ure je enak
0.75 (p = 0.75).
H1 : Deleˇz zaposlenih, ki si ˇzelijo, da bi bila okrepˇcevalnica odprta do 17. ure je veˇcji
kot 0.75 (p > 0.75).
Opomba: V primeru, ˇce vzorˇcni deleˇz primerjamo z 0.5 bo v SPSS-u avtomatiˇcno izveden
dvostranski test, v nasprotnem primeru se bo izvedel ustrezen enostranski test.
Hipotezi bomo testirali s testom deleˇzev (slika 8.1):
SPSS: Analyze → Nonparametric Tests → One Sample.
106
8 Neparametriˇcni testi
Slika 8.1: Test deleˇzev - izbira ukaza (1. moˇznost)
Odpre se nam okno One-Sample Nonparametric Tests s tremi zavihki: Objective,
Fields in Settings. V zavihku Objective izberemo Customize analysis (slika 8.2) .
Nato kliknemo na zavihek Fields, kjer najprej na vrhu izberemo
Use custom field assignments (slika 8.3).
Avtomatiˇcno so v desnem oknu Test Fields
zbrane vse naˇse spremenljivke. Ker ˇzelimo izvesti le test deleˇzev za spremenljivko ’podaljˇsanje delovnega ˇcasa okrepˇcevalnice do 17. ure’ (V 3 a),
najprej vse spremenljivke
prenesemo na levo in sicer tako, da vse spremenljivke oznaˇcimo in prenesemo v levo polje Fields ali pa kliknemo na
puˇsˇcico med obema poSlika 8.3: Okno One-Sample Nonparametric Tests - zaviljema.
hek Fields
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
107
Slika 8.2: Okno One-Sample Nonparametric Tests - zavihek Objective
Nato v desno polje Test
Fields prenesemo spremenljivko Starost (slika
8.4). Seveda bi lahko
spremenljivko V 3 a ˇze
na zaˇcetku pustili v desnem oknu in na levo
prenesli le vse ostale
spremenljivke.
V naslednjem koraku se
pomaknemo na zavihek
Settings, kjer v levem polju Select an
item pustimo izbrano
prvo moˇznost Choose
Tests. Na desni nato izberemo Customize tests, odkljukamo prvo polje Compare observed Slika 8.4: Okno One-Sample Nonparametric Tests - izbira
probability to hypo- spremenljivke V 3 a v zavihku Objective
thesized (Binomial test)
ter kliknemo na gumb Options (slika 8.5).
108
8 Neparametriˇcni testi
Slika 8.5: Okno One-Sample Nonparametric Tests - zavihek Settings
Odpre se nam okno Binomial Options prikazano na sliki 8.6, kjer v
zgornje polje Hypothesized proportion vpiˇsemo deleˇz iz hipoteze,
torej v naˇsem primeru
ˇ ˇzelimo izraˇcunati
0.75. Ce
ˇse interval zaupanja bi
lahko izbrali ClopperPearson (exact). V
spodnjem polju Define
Success for Categorial Fields lahko doloˇcimo, katero kategorijo
Slika 8.6: Okno Binomial Test Options
ˇzelimo izbrati. Izberemo
seveda tisto, ki je navedena v postavljeni hipotezi. V naˇsem primeru spremenljivke V 3 a vrednost 1 pomeni, da
se anketiranec strinja s trditvijo, da bi bilo potrebno delovni ˇcas okrepˇcevalnice podaljaˇsti
do 17. ure, medtem ko 0 a pomeni, da se anketiranec z navedeno trditvijo ne strinja. V
hipotezi omenjamo deleˇz anketirancev, ki se s trditvijo strinjajo, kar pomeni, da ˇzelimo
ˇ bi oznaˇcili
ta deleˇz primerjati z 0.75. Pri izbiri kategorije imamo tako dve moˇznosti. Ce
prvo moˇznost Use first category found in data, bi SPSS kot kategorijo, katere deleˇz
ˇ pogledamo bazo pobi testiral, vzel tisto kategorijo, ki je prva navedena v podatkih. Ce
datkov, vidimo, da imamo v prvi vrstici pri spremenljivki V 3 a vpisano vrednost 1 (glej
sliko 2.14b na strani 20). V naˇsem primeru, ko ˇzelimo preˇsteti deleˇz anketirancev, ki se
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
109
strinjajo s trditvijo, torej 1 v podatkih, bi bila tudi izbira te moˇznosti v redu. V naˇsem
primeru smo izbrali drugo moˇznost Specify success values, kjer lahko sami doloˇcimo,
deleˇz katere kategorije bomo testirali, torej v polje Success Values vpiˇsemo v naˇsem
primeru vrednost 1. Izbiro potrdimo s klikom na gumb OK. V oknu zavihku Settings
One-Sample Nonparametric Tests nato kliknem ˇse gumb Run.
V oknu z rezultati Output dobimo izpisano
tabelo z rezultati prikazano na sliki 8.7. V tabeli je najprej zapisana
niˇcelna hipoteza, ki bi jo
lahko prevedli in (na nekoliko lepˇsi naˇcin) zapiSlika 8.7: Rezultati testa deleˇzev za spremenljivko ’podaljˇsanje sali kot: Deleˇz anketirancev, ki se strinjajo ozidelovnega ˇcasa okrepˇcevalnice do 17. ure’
roma se ne strinjajo s trditvijo ’podaljˇsanje delovnega ˇcasa okrepˇcevalnice do 17. ure’ je enak 0.75 oziroma 0.25. V
stolpcu Test je zapisan uporabljen test, torej test deleˇzev za en vzorec. p-vrednost testa
deleˇzev je 0.500>0.05 (glej tretji stolpec Sig.), torej niˇcelne domneve ne moremo zavrniti
pri 5% tveganju. Sklep je zapisan tudi v zadnjem stolpcu Decision, kjer piˇse, da niˇcelno
domnevo obdrˇzimo. Odgovor na dvajsteto raziskovalno vpraˇsanje je torej negativen, saj
ne moremo trditi, da si veˇc kot tri ˇcetrtine zaposlenih ˇzeli odprto okrepˇcevalnico do 17.
ure?
ˇ dvokliknemo na tabelo na sliki 8.7 se odpre Model Viewer (slika 8.8), kjer dobimo
Ce
ˇ se z miˇsko pomaknemo
prikazane dejanske in teoretiˇcne deleˇze na grafu desno zgoraj. Ce
na stolpec na grafu se deleˇzi ˇse izpiˇsejo. V naˇsem primeru se torej 76% anketirancev
strinja s trditvijo o ’podaljˇsanju delovnega ˇcasa okrepˇcevalnice do 17. ure’, 24% odstotkov
pa se ne strinja. Hipotetiˇcni deleˇz pa smo nastavili na 0.75 oz 75%. V spodnjem delu je
ˇse enkrat zapisana p-vrednost enostranskega t-testa (1-sided test)10 .
Syntax
+
+
+
+
+
....za programerske frike :)
*Nonparametric Tests: One Sample.
NPTESTS
/ONESAMPLE TEST (V3_a) BINOMIAL(TESTVALUE=0.75
SUCCESSCATEGORICAL=LIST(1) SUCCESSCONTINUOUS=CUTPOINT(MIDPOINT))
/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.
10
21
Kot smo ˇze zapisali, se v primeru, ko je deleˇz iz hipoteze razliˇcen od 0.5 v SPSS-u avtomatiˇcno
izveden ustrezen enostranski test.
110
8 Neparametriˇcni testi
Slika 8.8: Test deleˇzev - pregled modela
Druga moˇznost za izvedbo testa deleˇzev je: SPSS: Analyze → Nonparametric Tests
→ Legacy Dialog → Binomial.
Slika 8.9: Test deleˇzev - izbira ukaza (2. moˇznost)
Odpre se nam pogovorno okno Binomial Test, ki je prikazano na
sliki 8.9.
Najprej v desno polje Test Variable List prenesemo
spremenljivko ’podaljˇsanju delovnega
ˇcasa okrepˇcevalnice do 17.
ure’,
nato pa v sponje okence Test Proportion vpiˇsemo 0.75.
S klikom na gumb Options bi lahko
izbrali ˇse izraˇcun opisnih statistik
in kvartile.
V oknu Exact Tests, ki bi ga dobili s klikom na
gumb Exact, ni potrebno spreminjati
niˇcesar. Nato izbiro spremenljivk in
Slika 8.10: Test deleˇzev - izbira spremenljivk in testnega deleˇza potrdimo s klikom na
doloˇcitev testnega deleˇza
gumb OK.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
111
Rezultati so prikazani na sliki
8.11. SPSS za prvo kategorijo vedno izbere tisto vrednost, ki je
prva vpisana pri podatkih, torej
vrednost, ki je v prvi vrstici pri Slika 8.11: Rezultati testa deleˇzev za spremenljivko
spremenljivki V a, kar je v naˇsem ’podaljˇsanje delovnega ˇcasa okrepˇcevalnice do 17. ure’
primeru 1 (glej sliko 2.14a). Iz (2. moˇznost)
stolpca N razberemo, da se 56 oziroma 0.76 anketirancev strinja s trditvijo ’podaljˇsanje delovnega ˇcasa okrepˇcevalnice do
17. ure’, 18 pa ne, kar znaˇsa 0.24; Testni deleˇz je bil seveda tako kot prej enak 0.76
(stolpec Test Prop.). p-vrednost t-testa je 0.509>0.05, kar pomeni, da niˇcelne domneve
ne moremo zavrniti pri 5% tveganju.
Syntax
+
+
+
+
+
....za programerske frike :)
NPAR TESTS
/BINOMIAL (0.75)=V3_a
/MISSING ANALYSIS.
22
Poglejmo si ˇse, kako bi s pomoˇcjo testa deleˇzev odgovorili na enaindvajseto raziskovalno
vpraˇsane postavljeno na strani 4:
Ali je odstotek zaposlenih, ki si ˇzelijo naroˇcanje kosil tudi za domov niˇzji od
40%?
Na podlagi raziskovalnega vpraˇsanja najprej postavimo statistiˇcni hipotezi:
H0 : Deleˇz zaposlenih, ki si ˇzelijo, da bi bilo moˇzno naroˇcati kosila tudi za domov je enak
0.4 (p = 0.4).
H1 : Deleˇz zaposlenih, ki si ˇzelijo, da bi bilo moˇzno naroˇcati kosila tudi za domov je majˇsi
kot 0.4 (p < 0.75).
ˇ pogledamo podatke (slika 2.14a ) imamo v prvi vrstici pri spremenljivki V 3 g (’uvedba
Ce
moˇznosti naroˇcanja kosil tudi za domov ’) zapisano vrednost 0. Zato bo bolje, da test
deleˇzev izvedemo s pomoˇcjo ukaza SPSS: Analyze → Nonparametric Tests → One
Sample, kjer bomo lahko sami doloˇcili kategorijo, ki nas zanima.
112
8 Neparametriˇcni testi
Odpre se nam okno OneSample Nonparametric Tests, kjer v zavihku Objective izberemo Customize
analysis, nato pa v zavihku Fields prenesemo v
desno polje Test Fields spremenljivko ’uvedba moˇznosti Slika 8.12: Okno One-Sample Nonparametric Tests naroˇcanja kosil tudi za do- izbira spremenljivke
mov ’ (slika 8.12).
V zavihku Settings najprej izberemo moˇznost Customized Tests in nato Compare observed probability to hypothesized (Binomial test). Kliknemo na gumb Options. Odpre se nam okno Binomial Options, kjer v zgornje polje Hypothesized proportion vpiˇsemo
0.4. V podnjem polju Define
Success for Categorical Fields
izberemo Specify success values ter v spodnje polje vpiˇsemo 1
(slika 8.13). Celoten ukaz v obliki Slika 8.13: Okno One-Sample Nonparametric Tesintakse je prikazan v spodnjem sts - izbira spremenljivke
okvirˇcku.
+
+ Syntax
+++
....za programerske frike :)
*Nonparametric Tests: One Sample.
NPTESTS
/ONESAMPLE TEST (V3_ "OM"TESTVA0.4 SUCCESSCATEGORICAL=LIST(1)
SUCCESSCONTINUOUS=CUTPOINT(MIDPOINT))
/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.
23
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
113
Rezultati testa deleˇzev
so predstavljeni na sliki
8.14. Niˇcelno hipotezo,
da je deleˇz zaposlenih, ki
si ˇzelijo ’uvedbo moˇznosti
naroˇcanja kosil tudi za
domov ’enak 0.4, zavrnemo pri 5% tveganju, Slika 8.14: Rezultati testa deleˇzev za spremenljivko ’uvedba
saj je p-vrednost testa moˇznosti naroˇcanja kosil tudi za domov ’
deleˇzev enaka 0.027. Odgovor na 21. raziskovalno vpraˇsanj je torej pritrdilen: manj kot 40% zaposlenih si ˇzeli
uvedbo moˇznosti naroˇcanja kosil tudi za domov.
ˇ dvokliknemo na priCe
kazano tabelo se nam odpre novo okno Model
Viewer (slika 8.15). Na
desni strani sta grafiˇcno
prikazana dejanska in teoretiˇcna deleˇza. V tem
primeru se stolpca precej
razlikujeta, in sicer lahko
razberemo, da si 28%
anketirancev ˇzeli uvedbo
moˇznosti naroˇcanja kosil za domov, medtem
ko je bil teoretiˇcni deleˇz
postavljen na 0.4.
V
spodnjem delu desnega
okna lahko preverimo,
kakˇsna je bila alternativna domneva: ”deleˇz v
uspeˇsni skupini je manjˇsi
od hipotetiˇcne verjetnoSlika 8.15: Test deleˇzev za spremenljivko ’uvedba moˇznosti sti uspeˇsnih”, kar je v
naroˇcanja kosil tudi za domov ’ - pregled modela
skladu z naˇso alternativno hipotezo.
8.2
Kolmogorov-Smirnov test za en vzorec
Kolmogorov-Smirnov test za en vzorec uporabimo, kadar ˇzelimo vzorec primerjati z referenˇcno porazdelitvijo. V naˇsem primeru torej zanima, ali je spremenljivka Starost porazdeljena normalno (glej histogram spremenljivke Starost na strani 33, slika 3.14). Postavimo naslednji statistiˇcni hipotezi:
114
8 Neparametriˇcni testi
H0 : Porazdelitev spremenljivke Starost je normalno porazdeljena s povpreˇcjem x¯ = 38.26
in standardnim odklonom s = 7.65.
H1 : Porazdelitev spremenljivke Starost ni normalno porazdeljena s povpreˇcjem x¯ =
38.26 in standardnim odklonom s = 7.65.
Test najdemo v SPSS-u pod: SPSS: Analyze → Nonparametric Tests → One Sample....
Odpre se nam okno One-Sample Nonparametric Tests s tremi zavihki: Objective,
Fields in Settings. V zavihku Objective izberemo Customize analysis (slika 8.16).
Slika 8.16: Okno One-Sample Nonparametric Tests - zavihek Objective
Nato kliknemo na zavihek Fields, kjer najprej na vrhu izberemo Use custom field assignments (slika 8.17a). Avtomatiˇcno so v desnem oknu Test Fields zbrane vse naˇse
spremenljivke. Ker ˇzelimo izvesti le Kolmogorov-Smirnov test za spremenljivko Starost,
najprej vse spremenljivke prenesemo na levo in sicer tako, da vse spremenljivke oznaˇcimo
in prenesemo na levo ali pa kliknemo na puˇsˇcico med obema poljema (slika 8.17a).
Nato v desno polje prenesemo spremenljivko Starost (slika 8.17b). Seveda bi lahko spremenljivko Starost ˇze na zaˇcetku pustili v desnem oknu in na levo prenesli le vse ostale
spremenljivke.
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
115
(a) Zavihek Fields
(b) Izbira spremenljivke Starost
Slika 8.17: Okno One-Sample Nonparametric Tests - zavihek Fields
V naslednjem koraku se pomaknemo na zavihek Settings, kjer v levem oknu pustimo
izbrano prvo moˇznost Choose Tests. Na desni nato izberemo Custom tests, odkljukamo tretje polje Test observed distribution against hypothesized (KolmogorovSmirnov test (slika 8.18) ter kliknemo na gumb Options.
116
8 Neparametriˇcni testi
Slika 8.18: Okno Kolmogorov-Smirnov Test Options
Odpre se nam okno Kolmogorov-Smirnov
Test Options prikazano na sliki 8.19,
kjer izberemo tip porazdelitve s katero ˇzelimo primerjati naˇs vzorec. Ker
ˇzelimo preveriti, ali je spremenljivka Starost porazdeljena normalno, oznaˇcimo
prvo moˇznost Normal.
V polju Distribution parameters lahko izberemo
ali naj se za testna parameta vzameta
povpreˇcje in standardni odklon vzorˇcnih
podatkov (Use sample data) ali pa
sami doloˇcimo povpreˇcje (Mean) in standardi odklon (Std.Dev.).
V naˇsem
primeru izberemo Use sample data
ter izbiro potrdimo s klikom na gumb
OK.
V sredinskem delu okna KolmogorovSmirnov Test Options bi lahko izbrali
enakomerno porazdelitev (Uniform), v
spodnjem delu pa eksponentno porazdelitev (Exponential) ali Poissonovo poraz- Slika 8.19: Opisne statistike za spremenljivko
delitev (Poisson). Podrobnejˇsi opis poraz- Starost
ˇ
delitev lahko poiˇsˇceˇs npr. v Sparl
(2010) ali
Jesenko (2001).
ˇ
A. Znidarˇ
siˇc: Vodnik po SPSS-u
117
Na sliki 8.20 je prikazan rezultat Kolmogorov-Smirnov testa za en vzorec za spremenljivko
Starost. Na levi je zapisana niˇcelna domneva (Null Hypothesis), kot smo jo zapisali
na strani 114. Na desni v stolpcu Sig. je zapisana p-vrednost, ki je enaka 0.584>0.05,
torej niˇcelne domneve ne moremo zavrniti pri 5% tveganju. Spremenljivka Starost je torej
normalno porazdeljena s povpreˇcjem x¯ = 38.26 in standardnim odklonom s = 7.65.
SPSS nam tudi sam ˇze zapiˇse sklep v zadnjem stolpcu tabele, kjer pod Decision piˇse
Retain the null hypothesis.
Slika 8.20: Rezultati Kolmogorov-Smirnov testa za spremenljivko Starost
Syntax
+
+
+
+
+
....za programerske frike :)
*Nonparametric Tests: One Sample.
NPTESTS
/ONESAMPLE TEST (V5) KOLMOGOROV_SMIRNOV(NORMAL=SAMPLE )
/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.
24
118
Literatura
Literatura
Babbie, Earl R. 2007. The practice of social research. 11th ed. Wadsworth Pub. Co.
Field, A. 2009. Discovering statistics using spss. Introducing Statistical Methods, SAGE
Publications.
Fink, Arlene. 2003. How to ask survey questions. Thousand Oaks, ZDA: Sage Publications.
Fowler, Floyd J. Jr. 1995. Improving survey questions. design and evaluation. 2nd ed.
Thousand Oaks, ZDA: Sage Publications.
IBM. 2011. Ibm spss statistics 20 core system user’s guide.
Jesenko, Joˇze. 2001. Statistika v organizaciji in managementu. Kranj: Moderna organizacija.
Neuman, William Lawrence. 2007. Basics of social research: qualitative and quantitative
approaches. 2nd ed. Pearson Education, Inc.
Salant, Priscilla, and Don. A. Dillman. 1994. How to conduct your own survey. New York,
ZDA: John Wiley & Sons.
ˇ
Sparl,
Petra. 2010. Statistika UN: zapiski predavanj. Kranj: Fakulteta za organizacijske
vede.