Vodnik po SPSS-u Delovna verzija (2) AnjaZnidaršic
Transcription
Vodnik po SPSS-u Delovna verzija (2) AnjaZnidaršic
Vodnik po SPSS-u Delovna verzija (2) ˇ Anja Znidarˇ siˇc Kazalo Namesto uvoda 1 1 Naˇ crtovanje raziskave in vpraˇ salnika 1.1 Koraki v procesu raziskovanja . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Na zaˇcetku so raziskovalna vprasanja oziroma zgodba o Podjetju X . . . . 1.3 Nekaj malega o vpraˇsalniku . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 4 5 2 Priprava podatkov v SPSS-u 2.1 Zaˇcetek dela z SPSS-om . . . . . . . . 2.2 Priprava baze v SPSS-u . . . . . . . . 2.2.1 Vpisovanje spremenljivk . . . . 2.2.2 Vpisovanje podatkov . . . . . . 2.3 Delo s pomoˇcjo ukazov - Syntax . . . . 2.3.1 Priprava ukazov za vpis besedila 2.3.2 Priprava ukazov za vpis besedila 2.3.3 Okno Syntax in izvedba ukazov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vpraˇsanj . odgovorov . . . . . . . . 3 Opisne statistike 3.1 Fekvence - ukaz Frequences . . . . . . . . . . . 3.2 Opisne statistike - ukaz Descriptives . . . . . . . 3.3 Prilagodljive tabele - ukaz Custom Tables . . . 3.4 Veˇc moˇznih odgovorov - ukaz Multiple response . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 9 12 13 19 20 21 22 23 . . . . 24 24 34 39 42 4 Intervali zaupanja 45 4.1 Interval zaupanja za povpreˇcje . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.2 Interval zaupanja za deleˇz . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 5 Grafiˇ cni prikazi 50 5.1 Okvirji z roˇcaji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5.2 Razsevni grafikoni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 ˇ 5.3 Crtni grafikoni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 6 Preurejanje spremenljivk in izbira dela podatkov 60 6.1 Raˇcunanje s spremenljivkami . . . . . . . . . . . . . . . . . . . . . . . . . . 60 6.2 Preoblikovanje zvezne spremenljivke v kategorijalno . . . . . . . . . . . . . 62 6.3 Prekodiranje spremenljivk . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 7 Testiranje hipotez 7.1 t-testi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1.1 Razlike v povpreˇcjih med dvema skupinama . . . . . . 7.1.2 Testiranje populacijskega povpreˇcja . . . . . . . . . . . 7.1.3 Primerjanje povpreˇcij dveh spremenljivk (parni t-test) 7.2 ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 Homogene variance, statistiˇcno neznaˇcilne razlike . . . 7.2.2 Homogene variance, statistiˇcno znaˇcilne razlike . . . . . 7.2.3 Nehomogene variance, statistiˇcno znaˇcilne razlike . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 69 69 77 79 81 81 86 90 7.3 7.4 Povezanost spremenljivk 7.3.1 χ2 test . . . . . . 7.3.2 Korelacija . . . . Linearna regresija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 94 98 100 8 Neparametriˇ cni testi 105 8.1 Test deleˇzev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.2 Kolmogorov-Smirnov test za en vzorec . . . . . . . . . . . . . . . . . . . . 113 Literatura 118 ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 1 Namesto uvoda Priroˇcnik, ki je pred vami, je namenjen prvemu spoznavanju z SPSS-om. Morda ga boste potrebovali ˇze pri izdelavi seminarskih nalog, zagotovo pa ga boste potrebovali pri analiziranju podatkov za potrebe diplomske ali magisterske naloge. Prvo poglavje ni pregleden povzetek obstojeˇce literature na temo raziskovanja, paˇc pa je namenjen le osvetlitvi glavnih pojmom v raziskovanju, natanˇcneje v zasnovi raziskave in vpraˇsalnika. V drugem poglavju je prikazana priprava baze za vnaˇsanje spremenljivk in podatkov v SPSS ter delo s pomoˇcjo ukazov. V tretjem poglavju je prikazan izraˇcun frekvenc in opisnih statistik ter analiza vpraˇsanj z veˇc moˇznimi odgovori, v ˇcetrtem poglavju pa je prikazan izraˇcun intervala zaupanja za povpreˇcje in deleˇz. V petem poglavju so predstavljeni najpogostejˇsi grafiˇcni prikazi rezultatov; okvir z roˇcaji, razsevni in ˇcrtni ˇ grafikon. Sesto poglavje je namenjeno preurejanju spremenljivk ter raˇcunanju s spremenljivkami. V sedmem poglavju testiramo hipoteze in sicer v poglavju 7.1 prikaˇzemo razliˇcne t-teste, v poglavju 7.2 analizo variance, povezanost spremenljivk preuˇcujemo v poglavju 7.3 s pomoˇcjo χ2 -testa ter Pearsonovega koeficienta korelacije, poglavje 7.4 pa je namenjeno linearni regresiji. Osmo poglavje je namenjeno neparametriˇcnim testom, in sicer je v poglavju 8.1 predstavljen test deleˇzev, v poglavju 8.2 pa Kolmogorov-Smirnov test za preverjanje normalnosti porazdelitve. Del besedila v priroˇcniku je zapisan v barvnih okvirˇckih: Poskusi sam... Ponovi, ponovi, ponovi,... Ponovi, V oranˇznih okvirˇckih ’Poskusi sam’ so zapisane dodatne naloge, ki jih boste poskusili reˇsiti sami. V svetlo zelenih okvirˇckih so podani osnovni pojmi, ki jih moramo poznati, da bi lahko interpretirali dobljene rezultate. Dodatna razlaga posameznih pojmov je podana v zelenih okvirˇckih. Uporabni napotki tako pri pri pripravi raziskave kot pri posameznih testih so zapisani v vijoliˇcnih okvirˇckih. 2 Syntax + + + + + ....za programerske frike :) V modrih okvirčkih so zapisani ukazi, ki jih lahko izvedemo v Syntax oknu. Ob vsakem prikazanem ukazu izvedenem s pomočjo menijev bo izpisan še ukaz v obliki besedila. Osnovno predstavitev dela z ukazi oziroka sintakso najdete v poglavju 2.3 Delo s pomočjo ukazov - Syntax. Bazo podatkov v SPSS-u (podatki PodjetjeX.sav) s katerimi delamo v tem priroˇcniku najdete na spletni strani http://www2.fov.uni-mb.si/matstat/upload/PrirocnikSPSS/podatki_PodjetjeX.rar v zazipani datoteki. Priroˇcnik je ˇse v nastajanju. Prosim, da vse • pripombe, • predloge, • tiskarske ˇskrate in • druge popravke poˇsljite na [email protected]. ˇ Zelim vam uspeˇsno uporabo SPSS-a, Anja Ljubljana, februar 2013 ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 1 3 Naˇ crtovanje raziskave in vpraˇ salnika Raziskavo zaˇcnemo naˇcrtovati ˇze z izbiro teme, ki pa se ob pregledu obstojeˇce literature lahko tudi nekoliko spremeni. V nadaljevanju so predstavljeni osnovni koraki v raziskovalnem procesu. 1.1 Koraki v procesu raziskovanja Vsak raziskovalni proces ima veˇc korakov, ki se delno med seboj tudi prepletajo (Babbie, 2007; Neuman, 2007): 1. Opredelitev problema prouˇcevanja. Natanˇcno analiziramo obstojeˇca zna- nja (iskanje in ˇstudij literature, razgovor s strokovnjaki) ter doloˇcimo cilje raziskovanja. 2. Postavitev raziskovalnih vpraˇsanj, ki izhajajo iz problema in ustreznih statistiˇcnih hipotez, ki jih je s pomoˇcjo statistiˇcnih testov moˇzno sprejeti oz. zavrniti. 3. Izdelava naˇcrta raziskave: izbira enot (doloˇcitev populacije) in vzorˇcni naˇcrt (doloˇcitev vzorca), doloˇcitev spremenljivk, izbira in sestava inˇstrumenta merjenja (npr. vpraˇsalnik),... 4. Zbiranje podatkov (opazovanje, eksperiment, anketiranje, intervju, ...). 5. Priprava in analiza podatkov. 6. Interpretacija (pojasnitev, razlaga) rezultatov. 7. Poroˇcanje o rezultatih (poroˇcila, znanstveni ˇclanki, uporabnost rezultatov). V priroˇcniku se bomo seveda osredotoˇcili na peti korak, ki se nanaˇsa na analizo podatkov ter njihovo ustrezno predhodno pripravo. Ker pa je v resnici bolj kot same ˇstevilke pomembna njihova interpretacija, torej obˇsirno razloˇzen njihov po- men, bomo poskuˇsali dobljene rezultate tudi pojasniti ter hkrati dodati kakˇsen namig za prikaz rezultatov. Interpretacija rezultatov seveda zahteva predhodno poznavanje problema ter raziskovalnih vpraˇsanj, zato bomo vse izraˇcune in ana- lize naredili na primeru ankete o zadovoljstvu zaposlenih z delovnim okoljem v Podjetju X. V poglavju 2.2 je tako na kratko opisan problem prouˇcevanja skupaj z razi- skovalnimi vpraˇsanji na katere bomo odgovorili s pomoˇcjo analize podatkov v poglavju 6). V poglavju 2.3 je podan vpraˇsalnik na podlagi katerega bomo pri- kazali urejanje baze v SPSS-u in vnos podatkov. V nadaljevanju je prikazan le en poseben primer, ki nam bo v pomoˇc pri pred- stavitvi rezultatov. Natanˇcnejˇse smernice kako opredeliti problem, postaviti raziskovalna vpraˇsanja, oblikovati anketni vpraˇsalnik ter izbrati vzorec boste morali poiskati v ustrezni literaturi. 4 1.2 1 Naˇcrtovanje raziskave in vpraˇsalnika Na zaˇ cetku so raziskovalna vprasanja oziroma zgodba o Podjetju X Predstavljajte si, da ste zaposleni na vodilnem poloˇzaju v Podjetju X, kjer posebno pozornost namenjate zadovoljstvu zaposlenih. Trenutno vas zanima, kako so zaposleni zadovoljni s svojim delovnim okoljem, pisarnami, pisarniˇskim materialom ter pomoˇcjo IT strokovnjakov ob morebitnih teˇzavah. Natanˇcneje vas zanima: RVl: Se zadovoljstvo zaposlenih z delovnim okoljem in opremo razlikuje glede na spol? RV2: Moˇski so bolj zadovoljni s fotokopirnimi stroji, ki jih imamo v podjetju, kot ˇzenske. RV3: Se zadovoljstvo zaposlenih s pisarniˇskim materialom razlikuje glede na spol? RV4: Ali so ˇzenske res bolj zadovoljne s telefoni kot moˇski? ˇ RV5: Zenske so bolj zadovoljne s tehniˇcno podporo kot moˇski. RV6: Ali so starejˇsi res manj zadovoljni s programsko opremo? RV7: Ali so zaposleni z daljˇso delovno dobo bolj zadovoljni z delovnim okoljem in opremo? RV8: Ali se zadovoljstvo zaposlenih s tiskalnikom razlikuje od zadovoljstva zaposlenih s telefonom? RV9: Zaposleni so bolj zadovoljni fotokopirnim strojem kot s tiskalnikom. RV10: Se zadovoljstvo zaposlenih z opremo razlikuje glede na oddelek v podjetju? RV11: Se zadovoljstvo zaposlenih z velikostjo pisarne razlikuje glede na oddelek v podjetju? RV12: Se zadovoljstvo zaposlenih s tiskalnikom razlikuje glede na oddelek v podjetju? RV13: Se zadovoljstvo zaposlenih z delovnim okoljem in opremo razlikuje glede na izobrazbo? RV14: Ali je povpreˇcna starost zaposlenih v podjetju niˇzja od 40 let? RV15: Je zadovoljstvo zaposlenih z delovnim okoljem in opremo morda povezano s starostjo? RV16: V kakˇsni povezavi sta delovna doba in starost v naˇsem podjetju? oziroma RV17: Kako natanˇcno lahko iz starosti zaposlenega napovemo njegovo delovno dobo? RV18: Zadovoljstvo zaposlenih z delovnim okoljem in opremo je pozitivno povezano z zadovoljstvom s tehniˇcno podporo. RV19: Ali obstajajo razlike v izobrazbeni strukturi zaposlenih glede na spol? RV20: Ali si veˇc kot tri ˇcetrtine zaposlenih ˇzeli odprto okrepˇcevalnico do 17. ure? RV21: Ali je odstotek zaposlenih, ki si ˇzelijo naroˇcanja kosil tudi za domov niˇzji od 40%? Postavili smo si torej 21 raziskovalnih vpraˇsanj oziroma raziskovalnih hipotez na podlagi katerih je potrebno sestaviti ustrezen vpraˇsalnik. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 1.3 5 Nekaj malega o vpraˇ salniku Na podlagi zgoraj naˇstetih raziskovalnih vpraˇsanj. raziskovalnih hipotez oz je potrebno oblikovati anketna vpraˇsanja. Vsako raziskovalno vpraˇsanje navadno povezuje dve ali veˇc anketnih vpraˇsanj. V nadaljevanju je predstavljenih 10 korakov oblikovanja vpraˇsalnika (Salant and Dillman, 1994). 1. Pregled spiska iskanih informacij in postavljenih hipotez, 2. izbor tipa vpraˇsalnika in metode zbiranja podatkov, 3. doloˇcitev vsebine posameznih vpraˇsanj, 4. doloˇcitev oblike odgovorov za vsako vpraˇsanje, 5. formuliranje vpraˇsanj in odgovorov, 6. organizacija vpraˇsanj in doloˇcitev zaporedja vpraˇsanj, 7. doloˇcitev oblike vpraˇsalnika, 8. pregled vseh korakov in ustrezne spremembe ter 9. preizkus vpraˇsalnika in ustrezne spremembe, 10. vrnitev na prvi korak. Najprej je potreben razmislek, katere informacije sploh potrebujemo in zakaj. V vpraˇsalniku torej postavimo samo tista vpraˇsanja, ki jih potrebujemo pri odgovorih na raziskovalna vpraˇsanja. Vpraˇsalnik poskuˇsamo namreˇc sestaviti ˇcim krajˇsi, da ne obremenjujemo anketirancev po nepotrebnem. Najprej lahko pogledamo, katere tako imenovane socio-demografske podatke o anketirancih potrebujemo. V raziskovalnih vpraˇsanjih RV6 ter RV13-RV16 omenjamo starost, v vpraˇsanjih RVl do RV5 ter RV18 omenjamo spol, izobrazba je omejena v vpraˇsanjih RV12 in RV18, delovna doba je omenjena v vpraˇsanjih RV7, RV15 in RV16 ter oddelek zaposlenih v podjetju v raziskovalnih vpraˇsanjih RV10 in RV11. Na zaˇcetku vpraˇsalnika postavimo zanimiva (sploˇsna) vpraˇsanja, medtem ko bolj specifiˇcna vpraˇsanja postavimo na koncu vpraˇsalnika. Socio-demografska vpraˇsanja (starost, spol, dohodek,...) naj bi zastavili na koncu vpraˇsalnika (glej sliko 1.1). Za vpraˇsanja Spol, Izobrazba ter Delovno mesto smo izbrali zaprt tip vpraˇsanja s ponujenimi moˇznimi odgovori, pri vpraˇsanjih Starost in Delovna doba pa smo anketirance prosili, da sami vpiˇsejo ˇstevilo let. Pri vpraˇsanjih Starost in Delovna doba bi prav tako lahko ponudili zaprt tip odgovorov z ustreznimi razredi, pri ˇcemer je potrebno paziti, da se meje razredov ne prekrivajo oz. so jasno doloˇcene. 6 1 Naˇcrtovanje raziskave in vpraˇsalnika Slika 1.1: Primer vpraˇsalnika ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 7 Na kaj moramo paziti pri sestavljanju anketnih vpraˇ sanj? • vpraˇsanja naj bodo zapisana na preprost naˇcin, • vpraˇsanja naj bodo kratka in konkretna, • izogibajte se vpraˇsanj, ki vsebujejo veˇc razseˇznosti, postavite raje veˇc vpraˇsanj, • natanˇcno doloˇcite ˇcas in kraj v vpraˇsanju, ˇce vpraˇsanje to vkljuˇcuje, • prva vpraˇsanja naj bodo preprosta in zanimiva, naj anketiranca pritegnejo k sodelovanju, • teˇzka, neprijetna in obˇcutljiva vpraˇsanja postavite na koncu, • vpraˇsanja naj bodo razvrˇsˇcena po podobnosti in vsebini v skupine, vsaka skupina naj bo ustrezno poimenovana, • skupine vpraˇsanj naj bodo urejene v logiˇcno zaporedje, • pri zaprtem tipu vpraˇsanj oz. odgovorov je potrebno paziti, da anketirancem ponudimo paleto vseh moˇznih odgovorov oz. jim dopustimo, da sami dopiˇsejo manjkajoˇce moˇznosti (pol-zaprt tip vpraˇsanja), • vˇcasih je potrebno anketirancem ponuditi tudi moˇznost, da na vpraˇsanje ne odgovorijo (npr. ’ne morem odgovoriti’, ’ne vem’,...), • ˇce je na doloˇceno vpraˇsanje moˇznih veˇc odgovorov, naj bo to jasno oznaˇceno, • vpraˇsalniku je potrebno dodati spremno pismo ali nagovor (glej okvirˇcek na strani 2.3). Veˇc navodil s konkretnimi primeri najdete npr. v Fowler (1995); Fink (2003). Poleg podatkov o anketirancu nas glede na raziskovalna vpraˇsanja zanima ˇse zadovoljstvo zaposlenih z delovnim okoljem in opremo. Omenjeni koncept zadovoljstva z delovnim okoljem in opremo smo razdelili na deset podvpraˇsanj ter zaposlene povpraˇsali, kako so zadovoljni s posameznim elementom v svojem delovnem okolju. Kot moˇzne odgovore smo anketirancem ponudili 5-stopenjsko letvico, kjer 1 pomeni ‘zelo nezadovoljen’ do 5 ‘zelo zadovoljen’, odgovor 3 pa je na nek naˇcin nevtralen (’delno nezadovoljen, delno zadovoljen’). Zadovoljstvo z delovnim okoljem smo tako razdelili na zadovoljstvo z velikostjo pisarne (vkljuˇceno v raziskovalno vpraˇsanje RV10), opremo, osvetljenostjo pisarne ter zvoˇcno izolacijo pisarne. Podobno smo zadovoljstvo z opremo razdelili na ˇsest podvpraˇsanj in sicer: zadovoljstvo s pisarniˇskim materialom (vkljuˇceno v raziskovalno vpraˇsanje RV3), raˇcunalnikom, programsko opremo (vkljuˇceno v raziskovalno vpraˇsanje RV6), tiskalnikom (vkljuˇceno v raziskovalni vpraˇsanji RV8 in RV9), fotokopirnim strojem (vkljuˇceno v raziskovalni vpraˇsanji RV2 in RV9) in telefonom (vkljuˇceno v raziskovalni vpraˇsanji RV4 in RV8). 8 1 Naˇcrtovanje raziskave in vpraˇsalnika Poleg zadovoljstva z delovnim okoljem smo zaposlene povpraˇsali ˇse po zadovoljstvu s tehniˇcno podporo (vkljuˇceno v raziskovalni vpraˇsanji RV5 in RV15) in sicer so nas zanimali trije vidiki: hitrost odziva sodelavcev tehniˇcne pomoˇci, hitrost odpravljanja teˇzav ter strokovna usposobljenost sodelavcev. V vpraˇsalniku je za vsak omenjeni vidik zadovoljstva s tehniˇcno pomoˇcjo postavljena trditev na katero so anketiranci odgovarjalis 5-stopenjsko lestvico strinjanja (1-sploh se ne strinjam, 2-se ne strinjam, 3-delno se strinjam, delno ne, 4-se strinjam, 5- popolnoma se strinjam). V vpraˇsalnik smo vkljuˇcili tudi osem trditev o ˇzeljenih spremembah v okrepˇcevalnici, ki so vklju´cene tudi v RV20 in RV21. Kako iz posameznih anketnih vpraˇsanj dobimo ˇstiri koncepte zadovoljstvoz delovnim okoljem, zadovoljstvo z opremo, zadovoljstvo z delovnim okoljem in opremo ter zadovoljstvo s tehniˇcno podporo, ki jih uporabljamo v raziskovalnih vpraˇsanjih na strani 4, je natanˇcneje opisano v poglavju 6.1 na strani 60. Vpraˇsalniku (slika 1.1) smo na zaˇcetku dodali kratek nagovor, kjer smo navedli naslov ankete, namen ankete, povedali, kje in kdaj bodo dostopni rezulati, poudarili, da je anketa anonimna ter se zahvalili za sodelovanje. Podrobnejˇse so elementi nagovora oz. spremnega pisma podani v spodnjem okvirˇcku. Kaj naj vkljuˇ cuje spremno pismo oz. nagovor? Vpraˇsalniku je potrebno dodati spremno pismo ali nagovor, kjer: • pojasnimo cilje raziskave, omenimo nosilca raziskave (ime in/ali organizacija), • prosimo za sodelovanje in poudarimo, da je sodelovanje anketiranca pomembno za uspeh raziskave, • poudarimo koristnost raziskave (tako sploˇsno kot za anketiranca osebno), • poudarimo, da bodo odgovori anonimni in zaupni, • nakaˇzemo trajanje anketiranja, • na kratko lahko opiˇsemo postopek izdelave vzorca, predvsem kako je bil anketiranec izbran za sodelovanje, • ponudimo ime in telefonsko ˇstevilko in/ali e-mail za morebitna dodatna pojasnila, • ponudimo skrajˇsano poroˇcilo raziskave (npr. po poˇsti, e-mailu,...(dodatno zagotovite anonimnost in poudarite objavo rezultatov v sumarni obliki)) oz. navedemo spletno stran, kjer bodo rezultati dostopni (in kdaj)), • zahvalimo se za sodelovanje. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 2 2.1 9 Priprava podatkov v SPSS-u Zaˇ cetek dela z SPSS-om Skozi celoten priroˇcnik se bomo torej ‘igrali’ s podatki, ki so jih v Podjetju X zbrali s pomoˇcjo anketnega vpraˇsalnika, ki je prikazan na sliki 1.1. Najprej si bomo pogledali kako pripravimo bazo podatkov v SPSS-u. V tem priroˇcniku bomo uporabljali SPSS 20, natanˇcneje IBM SPSS Statistics 20, vendar se posamezne verzije bistveno ne razlikujejo med seboj. Ko zaˇzenemo program (ikona iz menija Start je prikazana na sliki 2.1) se odpre okno prikazano na sliki 2.2. V primeru, da ˇzelimo od- Slika 2.1: Ikona programa preti ˇze obstojeˇco SPSS datoteko s konˇcnico .sav , pustimo SPSS oznaˇceno privzeto moˇznost Open an existing data source in poiˇsˇcemo ˇzeljeno datoteko na seznamu ali kliknemo More Files... ter poiˇsˇcemo mesto shranjene datoteke. ˇ ˇzelimo pripraviti Ce novo bazo oznaˇcimo moˇznost Type in data ter izbiro potrdimo s klikom nagumb OK. Odpre se osnovno okno SPSSa prikazano na sliki 2.2. Opazimo, da ima SPSS dve glavni okni (glej zavihka levo spodaj): okno s podatki (Data View) in trenutno izbrano okno s spremenljivSlika 2.2: Zaˇcetno okno SPSS-a kami (Variable View). Moˇznosti orodne vrstice za urejanje podatkov oz. posamezne ikone so natanˇcneje predstavljene na sliki 4. Na sliki 2.3 so prikazane posamezne ikone orodne vrstice za urejanje podatkov. Vkljuˇcimo oziroma izkljuˇcite jo lahko v View → Toolbars → Data Edior. 10 2 Priprava podatkov v SPSS-u Ikono na sliki 2.3a uporabimo za odpiranje dokumentov (Open data document). (a) Podatke shranimo s klikom na ikono na sliki 2.3b (Save this document). (b) (c) Vsebino zaslona lahko stiskamo s klikom na ikono na sliki 2.3c. V oknu Data View se natisnejo podatki, v oknu Vairable View se natisnejo informacije o spremenljivkah. Pri tem se ˇcrte tabele natisnejo, ˇce so prikazana na zaslonu. Vkljuˇcite oz. izkljuˇcite jih lahko v View → Grid Lines. S pomoˇcjo klika na ikono na sliki 2.3d prikaˇzemo zadnjih nekaj ukazov, ki smo jih izvedli (Recall recently used dialogs). (d) S pomoˇcjo ikone na sliki 2.3e lahko razveljavimo zadnje dejanje ter povrnemo prejˇsnje stanje (Undo a user action). (e) S klikom na ikono na sliki 2.3f ponovno izvedemo zadnje dejanje (Redo a user action). (f) (g) S pomoˇcjo ikone na sliki 2.3g si lahko ogledamo podatke doloˇcenega anketiranca ali doloˇcene spremenljivke (Go to case). S klikom na ikono se odpre okno z naslovom Go To, kjer lahko v zavihku Case izberemo zaporedno ˇstevilko anketiranca, v zavihku Variable pa iz seznama izberemo ˇzeljeno spremenljivko. ˇ v oknu Variable View kliknemo na ikono na sliki 2.3h se vrstica Ce z izbrano spremenljivko obarva, tako da si lahko ogledamo lastnosti izbrane spremenljivke. (h) ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u (i) 11 S klikom na ikono na sliki 2.3i (Variables) si lahko ogle- damo podrobnosti izbrane spremenljivke, kjer se izpiˇse oznaka spremenljivke, njeno opisno poimenovanje (Label), manjkajoˇce vrednosti (Missing Values), nivo merjenja (Measurement Level) ter lestvica merjenja z oznakami (Value Labels). V oknu Data View lahko s klikom na ikono na sliki 2.3j (Find) poiˇsˇcemo doloˇceno vrednost ter jo tudi zamenjamo z izbrano vrednostjo. (j) S klikom na ikono na sliki 2.3k (Insert Cases) lahko na po- ljubnem mestu dodamo prazno vrstico, kamor nato vpiˇsemo odgovore novega anketiranca. (k) S pomoˇcjo ikone na sliki 2.3l (Insert Variable) lahko na poljubnem mestu dodamo novo spremenljivko. (l) (m) S klikom na ikono na sliki 2.3m (Split File) se odpre okno, kjer lahko doloˇcimo spremenljivko na podlagi katere ˇ loˇcimo podatke. Ce npr. izberemo Organize output by groups bomo v nadaljnih analizah dobili izpisane rezultate posebej za vsako skupino, ki jo doloˇca izbrana spremenljivka. S klikom na ikono na sliki 2.3n (Weight Cases) bi lahko posameznim anketirancem oz. podatkom doloˇcili ustrezne uteˇzi (ki so shranjene v neki spremenljivki). (n) (o) S pomoˇcjo ikone na sliki 2.3o (Select Cases) lahko izberemo podmnoˇzico anketiranev z izbranimi lastnostmi. Privzeto so izbrani vsi podatki (All cases). Izberemo lahko podmnoˇzico podatkov, ki zadoˇsˇcajo izbranemu pogoju (If condition is satisfied) ali pa izberemo sluˇcajni vzorec podatkov (Random sample of cases). S klikom na ikono na sliki 2.3p (Value Labels) lahko preklapljamo med ˇstevilskim in opisnim prikazom vrednosti v oknu Data View. (p) Slika 2.3: Orodna vrstica urejanje podatkov 12 2.2 2 Priprava podatkov v SPSS-u Priprava baze v SPSS-u Pred pripravo datoteke v SPSS-u za vnaˇsanje podatkov iz anket si na vpraˇsalniku oznaˇcimo oznake vpraˇsanj ter oznake odgovorov (slika 2.4). Prvo vpraˇsanje je sestavljeno iz desetih podvpraˇsanj, zato le-ta oznaˇcimo z V1 a, V1 b,...,V1 j. Podobno oznaˇcimo tri podvpraˇsanja vpraˇsanja 2: V2 a, V2 b, V2 c. Kadar vpraˇsanje ponuja veˇc moˇznih odgovorov, v naˇsem primeru je to vpraˇsanje 3, oznaˇcimo vsak odgovor posebej: V3 a, V3 b,...,V3 h Naslednje vpraˇsanje Spol tako krajˇse oznaˇcimo z V4 in si pri ˇzenskem spolu oznaˇcimo 1, pri moˇskem spolu pa 2. Vpraˇsanje Starost oznaˇcimo z V5, Delovno dobo z V6,... Na vrhu vpraˇsalnika smo oznaˇcili ˇse ID, kar predstavlja identifikacijˇsko ˇstevilko ankete. V primeru napake pri vnaˇsanju podatkov lahko tako znova poiˇsˇcemo anketo in preverimo vneˇsene vrednosti. ID V1_a V1_b V1_c V1_d V1_e V1_f V1_g V1_h V1_i V1_j V2_a V2_b V2_c V3_a V3_b V3_c V3_d V3_e V3_f V3_g V3_h V4 1 2 V5 V6 V7 1 2 3 4 V8 1 2 3 4 5 Slika 2.4: Primer vpraˇsalnika z oznakami vpraˇsanj in odgovorov ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 2.2.1 13 Vpisovanje spremenljivk Nato zaˇcnemo pripravljati bazo podatkov. V spodnjem levem kotu SPSS-a kliknemo gumb Variable View (Slika 2.5). Odpre se nam prazna tabela, kamor bomo vpisali vse spremenljivke iz naˇsega vpraˇsalnika. Vsaka vrstica predSlika 2.5: Vpisovanje spremenljivk - okno Variable View stavlja eno spremenljivo, v stolpce pa vpiˇsemo lastnosti posamezne spremenljivke oziroma jih izberemo izmed ponujenih moˇznosti (odebeljeno so zapisane lastnosti spremenljivk, ki jih vedno ustrezno prilagodimo): • Name: Vpiˇsemo ime spremenljivke. Vpisujmo kratka imena, prvi znak imena mora biti ˇcrka, ime spremenljivke ne sme imeti presledkov (uporabimo lahko npr. podˇcrtaj). • Type: Doloˇcimo tip spremenljivke, privzeta vrednost je ˇstevilska spremenljivka (Numeric). V primeru datumskih spremenljivk izberemo Date, ˇce je spremenljivka znesek lahko izberemo Dollar ali Custom currency. ˇce spremenljivke niso ˇstevilske z njimi ne moremo raˇcunati (npr. odgovor v obliki vpisanega besedila), zato jih oznaˇcimo kot String. • Label: Vpiˇsemo opisno poimenovanje spremenljivke, zapiˇsemo lahko kar besedilo anketnega vpraˇsanja (do 256 znakov, lahko vsebuje presledke). • Width: ˇstevilo ˇstevk ali znakov (za ˇstevilsko spremenljivko je privzeto 8 ˇstevk). • Decimals: ˇstevilo decimalnih mest vpisanih podatkov. • Values: Vpiˇsemo opis vrednosti spremenljivk. • Missing: Definiramo doloˇcene vrednosti kot manjkajoˇce. • Columns: Doloˇcimo lahko ˇsirino stolpca ( v pogledu Data View). • Align: Prikaz podatkov v oknu Data View, za ˇstevilske podatke je privzeta desna poravnava, za znakovne vpise pa leva poravnava. • Measure: Nivo merjene spremenljivke lahko doloˇcimo kot Nominal v primeru imenske lestvice, Ordinal v primeru urejenostne lestvice ali Scale v primeru, da imamo podatke na intervalni ali razmernostni lestvici (veˇc o lestvicah lahko preberete v zelenem okvirˇcku na strani 14). 14 2 Priprava podatkov v SPSS-u Nekaj veˇ c o lestvicah: • Imenska (ali nominalna) lestvica. Predstavljajo neko poimenovanje, med enotami je moˇzno le primerjanje (je enako/ni enako). Primer: spol, barva oˇci, kraj bivanja,... • Urejenostna (ali ordinalna) lestvica. ˇ Stevila prirejena enotam predstavljajo urejenost, tako ima vrstni red nek pomen, razlike med vrednostmi pa niso smiselne. Med enotami je poleg primerjanja (je enako/ni enako) moˇzna ˇse primerjava veˇcje-manjˇse. Primer: stopnja ˇ SS,...), ˇ izobrazbe (OS, ocene, vrstni red na tekmovanju, lestvice strinjanja (1sploh se ne strinjam,..., 5-popolnoma se strinjam), saj ˇsirine intervalov niso enako ˇsiroke,... • Intervalna lestvica. Poleg urejenosti imajo pomen tudi razlike med vrednostmi, pri tem je niˇcelna vrednost doloˇcena poljubno, intervali med vrednostmi pa so enako ˇsiroki. Primer: datum, temperatura (F), IQ toˇcke,... • Razmernostna lestvica. Vrednost niˇc je enoliˇcno doloˇcena, zato lahko raˇcunamo tudi razmerje (kvocient) med vrednostma dveh enot. Primer: starost, viˇsina osebnega dohodka, meseˇcna poraba, dolˇzina, masa, temperatura (K),... V okno Variable View zaˇcnemo torej vpisovati spremenljivke. • V prvo vrstico tako najprej vpiˇsemo pod Name oznako ID, pod Label vpiˇsemo Identifikacijska ˇstevilka ankete. S to spremenljivko sicer ne bomo raˇcunali, ker je namenjena le kontroli vneˇsenih podatkov, kljub temu smo Measure nastavili na Nominal (glej sliko 2.6). • Nato vpiˇsemo prvo spremenljivko iz naˇsega anketnega vpraˇsalnika, torej Velikost pisarne (glej vpraˇsalnik na sliki 2.4). Pod Name vpiˇsemo V1 a, pod Label vpiˇsemo Velikost pisarne ter nivo merjenja nastavimo na urejenostni (v stolpcu Measure izberemo Scale1 ). Nadaljujemo z vpisovanjem posameznih oznak za vrednosti, kot smo jih oznaˇcili na vpraˇsalniku na sliki 2.4. Torej anketirance smo o velikosti pisarne spraˇsevali na 5stopenjski lestvici. Na vpraˇsalniku smo oznaˇcili, da bomo odgovor ’zelo nezadovoljen’ vpisali s ˇstevilko 1, ’nezadovoljen’ z 2,... 1 Vse 5-stopenjske lestvice strinjanja so v bistvu urejenostne, tako da bi morali v stolpcu Measure izbrati Ordinal. Ker pa se v druˇzboslovnih raziskavah take lestvice uporabljajo kot intervalne oz. razmernostne in z njimi raˇcunamo povpreˇcja, standardne odklone,..., smo nivo merjenja nastavili na Scale. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 15 Slika 2.6: Vpisovanje spremenljivk Opis vseh vrednosti dodamo tako, da kliknemo na celico s trenutno oznako None v stolpcu Values pri spremenljivki V1 a Odpre senovo okno z naslovom Value Labels (Slika 2.7a), kjer vpiˇsemo: • v okno Value vpiˇsemo 1, • v okno Label vpiˇsemo ’zelo nezadovoljen’, • kliknemo gumb Add, (a) Opis vrednosti 1 za ’zelo nezadovoljen’ • v okno Value vpiˇsemo 2, • v okno Label vpiˇsemo ’nezadovoljen’, • kliknemo gumb Add, • postopek ponovimo ˇse za vrednosti 3, 4 in 5, • kliknemo gumb OK (slika 2.7b ). V primeru, da smo se zmotili, si lahko (b) Opis vseh vrednosti pomagamo z gumboma Change (lahko spremenimo vpisano vrednost Slika 2.7: Dodajanje oznak posameznim vrevrednostim ali njeno oznako) ali Re- dnostim move (izbriˇsemo vpis izbrane vrednosti). 16 2 Priprava podatkov v SPSS-u Nadaljujemo z vpisom vseh ostalih spremenljivk ter vrednosti. Kadar imamo enako lestvico pri veˇc spremenljivkah (kot pri spremenljivkah V1 a do V1 j) lahko lestvico vpiˇsemo le enkrat, ter si pomagamo s kopiranjem: • kliknemo z desnim gumbom miˇske na ˇze vpisano lestvico pri spremenljivki V1 a, Slika 2.8: Kopiranje vpisane lestvice • izberemo Copy (glej sliko 2.8 ), • kliknemo na spremenljivko, kjer ˇzelimo dodati isto lestvico, le-ta se obarva oranˇzno (ˇce ˇzelimo izbrati veˇc spremenljivk hkrati se le pomaknemo z miˇsko navzdol), • kliknemo z desnim gumbom miˇske ter izberemo Paste. Slika 2.9: Vpis manjkajoˇcih vrednosti V SPSS-u imamo moˇznost definirati tudi ˇ npr. manjkajoˇce vrednosti. Ce anketiranec na vpraˇsanje ne odgovori, bi lahko pustili polje prazno, lahko pa vpiˇsemo neko ˇstevilko in to oznaˇcimo v stolpcu Missing pri posamezni spremenljivki. V vpraˇsalniku na sliki 1.1 smo pred vpraˇsanjem 2 za pisali, da zaposlenim v IT oddelku nanj ni potrebno odgovarjati. Manjkajoˇce vrednosti v SPSS-u navadno oznaˇcimo s kakˇsno veliko vrednostjo, ki ni moˇzna pri odgovorih na posamezno vpraˇsanje. Recimo, da smo izbrali 99 kot oznako za manjkajoˇce vrednosti pri spre- menljivkah V2 a, V2 b in V2 c. • kliknemo na celico v stolpcu Missing pri spremenljivki V2 a, odpre se okno na sliki 2.9 , • V prvo polje Discrete missing values vpiˇsemo 99, • potrdimo s klikom na gumb OK. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 17 Pri tretjem vpraˇsanju smo anketirancem ponudili veˇc moˇznih odgovorov. V takem primeru je potrebno vsak odgovor vnesti kot novo spremenljivko, kot smo to oznaˇcili na sliki 2.13. Poglejmo si, kako pripravimo spremenljivko za prvi ponujeni moˇzni odgovor tretjega vpraˇsanja. V oknu Variable View vpiˇsemo (slika 2.10): • v stolpec Name vpiˇsemo V3 a, • v stolpec Label vpiˇsemo besedilo odgovora, torej ’podaljˇsanje delovnega ˇcasa do 17. ure’, • v stolpcu Measure nastavimo imensko lestvico (Nominal). Podobno vpiˇsemo ˇse ostale spremenljivke tretjega vpraˇsanja V3 b in V3 h. Slika 2.10: Vpisovanje spremenljivk v primeru veˇc moˇznih odgovorov Ko konˇcamo z vpisom vseh spremenljivk, oznak posameznih vrednosti ter doloˇcimo manjkajoˇce vrednosti naˇse okno Variable View zgleda tako kot je prikazano na sliki 2.11. 18 2 Priprava podatkov v SPSS-u Slika 2.11: Priprava baze podatkov - vpisane vse spremenljivke in vrednosti Pripravljeno bazo shranimo z ukazom v SPSS-u: File → Save as. Odpre se okno na sliki 2.12 . • V oknu Look in poiˇsˇcemo mapo, kamor bomo shranili podatke, • v okno File name vpiˇsemo ime datoteke, npr. podatki podjetjeX, • SPSS datoke imajo konˇcnico .sav, kar je oznaˇceno v oknu Save as type, • kliknemo gumb Save. Slika 2.12: Shranjevanje baze v SPSS-u ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 2.2.2 19 Vpisovanje podatkov Ko konˇcamo s pripravo baze z vsemi spremenljivkami, zaˇcnemo z vpisovanjem podatkov. Primer reˇsenega vpraˇsalnika je predstavljen na sliki 2.13. Pred vpisovanjem podatkov vsak vpraˇsalnik oznaˇcimo z identifikacijsko ˇstevilko ID, da lahko po potrebi, torej ˇce se zmotimo pri vnaˇsanju, poiˇsˇcemo doloˇcen vpraˇsalnik in podatke ustrezno popravimo. 1 x x x 48 21 x x Slika 2.13: Primer reˇsenega vpraˇsalnika Podatke vnaˇsamo v okno Data View. Na sliki 2.14a je prikazan vnos podatkov iz vpraˇsalnika na sliki 2.13. Kjer imamo lestvico vnesemo ˇstevilko, ki jo je na vpraˇsalniku 20 2 Priprava podatkov v SPSS-u oznaˇcil anketiranec (npr. pri prvem in drugem vpraˇsanju). Pri tretjem vpraˇsanju smo pripravili osem spremenljivk (V3 a, V3 b,...,V3 h) in pri posamezni spremenljivki v SPSSu vpiˇsemo 0, ˇce moˇzni odgovor ni bil izbran ter 1, ˇce je anketiranec izbral doloˇceni odgovor. Pri vpraˇsanjih V5 in V6 v oknu Data View vpiˇsemo ˇsteviloske vrednosti, ki jih je anketiranec dopisal na vpraˇsalnik. Na sliki 2.14b je prikazano okno, ko vnesemo vse podatke. Bazo podatkov v SPSS-u (podatki PodjetjeX.sav), s katerimi delamo v tem priroˇcniku, najdete na strani http://www2.fov.uni-mb.si/matstat/upload/PrirocnikSPSS/podatki PodjetjeX.rar v zazipani datoteki. (a) Vnos podatkov iz vpraˇsalnika ˇst. 1 (b) Vneˇseni podatki Slika 2.14: Priprava baze - vnos podatkov 2.3 Delo s pomoˇ cjo ukazov - Syntax V tem poglavju bomo prikazali ˇse en naˇcin, kako lahko pripravimo bazo za vnaˇsanje podatkov, in sicer s pomoˇcjo ukazov. Ustrezne ukaze bomo najprej (zaradi enostavnosti) pripravili v Excelu oziroma Wordu in jih nato prenesli v okno za izvrˇsevanje ukazov Syntax. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 2.3.1 21 Priprava ukazov za vpis besedila vpraˇ sanj Najprej bomo v Ecelu pripravili ukaze za vpis besedila vpraˇsanj. V stolpec A tako vpiˇsemo VAR LAB (okrajˇsava za Variable label ), v stolpec C vpiˇsemo narekovaj (”) ter v stolpec E narekovaj ter piko (”.). Pika v SPSS-u pomeni, da gre Slika 2.15: Excel - priprava ukazov VAR LAB za konec nekega ukaza. Stolpca B in D pustimo zaenkrat prazna, vpis v prvi vrsti pa skopiramo ˇse v 25 vrstic, saj imamo toliko vpraˇsanj oz. podvpraˇsanj (slika 2.15). V naslednjem koraku v stolpec B vpiˇsemo oznake spremenljivk (glej sliko 2.4), v stolpec D pa besedilo vpraˇsanj. Ko vpiˇsemo vse spremenljivke Excel-ov delovni list izgleda kot je prikazano na sliki 2.16. Slika 2.16: Excel - priprava ukazov VAR LAB in vpis spremenljivk ter vpraˇsanj 22 2.3.2 2 Priprava podatkov v SPSS-u Priprava ukazov za vpis besedila odgovorov Nato v Word-u pripravimo ukaze za vpis besedila odgovorov. Ukaz za poimenovanje razliˇcnih kategorij oz. odgovorov se zaˇcne z VAL LAB, kar je okrajˇsava za Value label. Vseh deset spremenljivk prvega vpraˇsanja ima isto lestvico, tako da bomo lahko ukaz za besedilo odgovorov vpisali hkrati. Najprej tako zapiˇsemo ukaz VAL LAB, nato je vmes presledek ter ime prve spremenljivke V 1 a, spet sledi presledek, nato ime druge spremenljivke V 1 b in tako naprej do desete spremenljivke prvega vpraˇsanja V 1 j. V naslednjo vrstico nato zapiˇsemo 1, presledek, narekovaj (’), poimenovanje prve vrednosti na lestvici, torej zelo nezadovoljen. Podobno zapiˇsemo ˇse ostale ˇstevilske vrednosti na lestvici Slika 2.17: Word - priprava ukazov VAL LAB in ustrezna besedila. Na koncu vrstice, kjer opiˇsemo zadnjo kategorijo je spet obvezno pika (.), ker le-ta nakaˇze, da smo zakljuˇcili z navajanjem lestvice posamezne spremenljivke oz. skupine spremenljivk. Na podoben naˇcin vpiˇsemo ˇse odgovore pri drugem, ˇcetrtem, sedmem in osmem vpraˇsanju (slika 2.17). ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 2.3.3 23 Okno Syntax in izvedba ukazov V primeru priprave baze s pomoˇcjo ukazov nam ne bi bilo potrebno niˇcesar vpisovati v okno Variable View, kot smo to storili v poglavju 2.2.1. Po odprtju programa SPSS in nove baze (glej sliko 2.2), bi lahko nadaljevali s spodnjim postopkom. Ukaze, ki smo jih pripravili v prejˇsnjih dveh poglavjih moramo sedaj tudi izvesti, zato potrebujemo ukazno oz. Syntax okno. Le-tega dobimo tako, da kliknemo na File → New → Syntax (slika 2.18). Odpre se nam prazno okno Syntax, kamor bomo skopirali vse Slika 2.18: Odpiranje novega ukaznega okna - Syntax ukaze. Nato vse ukaze za vnos besedila vpraˇsanj in besedila odgovorov, ki smo jih pripravili v poglavjih 2.3.1 in 2.3.2 skopiramo v desno polje Syntax okna. Na sliki 2.19 je skopiran samo del ukazov VAR LAB za prvo anketno vpraˇsanje. Nato vse ukaze oznaˇcimo (lahko ˇ se postavimo z s klikom na Ctrl+A) ter kliknemo na ikono z zelenim trikotnikom. Ce miˇsko na zelen trikotnik, se izpiˇse Run Selection. S tem se izvedejo vsi oznaˇceni ukazi. V primeru s slike 2.19 bi se zdaj v oknu Variable View izpisala besedila vseh desetih spremenljivk prvega anketnega vpraˇsanja. Slika 2.19: Okno Syntax in izvedba ukazov S klikom na ikono z zelenim trikotnikom bi sevedal lahko izvedli tudi vse ukaze, ki so skozi celoten priroˇcnim zapisani v modrih Syntax okvirˇckih. 24 3 3.1 3 Opisne statistike Opisne statistike Fekvence - ukaz Frequences Najprej si bomo ogledali, kako poiskati frekvence ter relativne frekvence oziroma odstotke. Prvo vpraˇsanje, ki se nanaˇsa na socio-demografske spremenljivke v vpraˇsalniku Spol (spremenljivka V3). Kot smo zapisali v poglavju ..., je to imenska spremenljivka, torej je zanjo smiselno raˇcunanje frekvenc. Tako nas najprej zanima koliko ˇzensk in koliko moˇskih je odgovarjalo na naˇsa vpraˇsanja. V SPSS-u izberemo Analyze v menijski vrstici, nato Descriptive Statistics ter na vrhu novega menija ˇse Frequencies (glej sliko 3.1). Ukaze bomo v prihodnje krajˇse zapisali kot: SPSS: Analyze → Descriptive Statistics → Frequencies. Slika 3.1: Frekvence - ukaz ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 25 Odpre se nam okno Frequences 3.2a, kjer imamo na levi seznam vseh spremenljivk, na desni strani pa prazno okno, kamor dodamo spremenljivke, katerih frekvence ˇzelimo izraˇcunati. V desno podokno Variable(s) spremenljivke prenesemo tako, da jih najprej oznaˇcimo ter jih nato prenesemo z miˇsko ali s kilkom na puˇsˇcico med obema oknoma. Na sliki 3.2b je prikazano, da smo izbrali spremenljivko Spol. Pod oknom je ˇze oznaˇcena moˇznost Display frequency tables, ki prikaˇze frekvenˇcno tabelo. V primeru, da ima spre- menljivka veliko moˇznih vrednosti ter vas frekvenˇcna tabela ne zanima, lahko to moˇznost tudi odznaˇcite. (a) Izbira spremenljivke Okno Frequences na desni ponuja ˇse ˇstiri moˇznosti: Statistics, Charts, Format in Bootstrap. V oknu Format lahko na(b) Izbrana spremenljivka Spol stavimo prikaz vrednosti v tabelah, kjer je privzet naraˇsˇcajoˇc prikaz vrednosti spre- Slika 3.2: Frekvence - izbira spremenljivk menljivk, v oknu Statistics doloˇcimo katere mere srednje vrednosti in razprˇsenosti ˇzelimo. Ker je spremenljivka Spol imenska te statistike niso primerne (glej okvirˇcek o lestvicah na strani 14). Poglejmo, kakˇsne moˇznosti nam ponuja okno Charts. Okno Frequencies: Charts nam ponuja tri razliˇcne tipe grafiˇcnih prikazov. Avtomatiˇcno je privzeto, da ne ˇzelimo izrisanega grafa (None). Izbiramo lahko med paliˇcnim grafom (Bar charts), tortnim diagramom (Pie charts) ali histogramom (Histograms) z dorisano normalno krivuljo (oznaˇcena moˇznost Show normal curve on histogram) ali brez. V naˇsem primeru spremenljivke Spol smo izbrali tortni diagram (slika 3.3). Izberemo lahko tudi ali ˇzelimo na grafu oznaˇcene frekvence ali odstotke. V spodnjem delu okno (pod Chart Value) smo pustili privzete freSlika 3.3: Frekvence - izbira grafov kvence (Frequencies), lahko bi izbrali tudi odstotke (Percentages). Svojo izbiro potrdimo s klikom na gumb Continue. 26 3 Opisne statistike SPSS rezultate prikazuje v posebnem oknu, ki je poimenovan Output. Na desni strani okna je prikazano kazalo vseh dosedanjih analiz, na levi strani pa se ob vsaki izvedeni analizi najprej izpiˇsejo ukazi, pod njimi pa rezultati posamezne analize (Slika 3.4). zapis izvedenih ukazov rezultati analiz kazalo analiz Slika 3.4: Output - izpis rezultatov Izpis rezultatov (Output) lahko seveda shranimo ter kasneje dostopamo samo do izraˇcunanih tabel in grafov. V oknu z rezultati zberemo File → Save As ter izberemo ime datoteke, ki bo imela knoˇcnico .spv. Syntax + + + + + ....za programerske frike :) FREQUENCIES VARIABLES=V4 /NTILES=4 /STATISTICS=STDDEV VARIANCE MINIMUM MAXIMUM MEAN MEDIAN MODE /HISTOGRAM NORMAL /ORDER=ANALYSIS. 1 ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u Kot je razvidno ˇze iz slike 3.4 je prvi del rezultatov podan v tabelah, kjer iz prve tabele izvemo, da imamo 74 odgvovorov anketirancev ter nobenega manjkajoˇcega odgovora (Missing) pri spremenljivki Spol (Slika 3.5a). Spodnja tabela podaja frekvence (Frequency), odstotke (Percent), veljavne odstotke (Valid Percent)2 ter kumulativne odstotke (Cumulative Percent). 27 (a) Tabeli V naˇsi anketi je tako sodelovalo 31 ˇzensk (42%) ter 43 (58%) moˇskih. Na sliki (Slika 3.5b) je prikazan tortni diagram. Navadno ˇzelimo, da so na grafu prikazani tudi frekvence ali odstotki. ˇce ˇzelimo spreminjati izgled grafa, najprej dvakrat kliknemo na graf. Odpre se nam okno Chart Editor (glej sliko 20a). (b) Tortni diagram Slika 3.5: Rezultati za spremenljivko Spol ˇ ˇzelimo dodati vrednosti na Ce tortni diagram izberemo Chart Editor: Elements→Show Data Labels (Slika 3.6). Odpre se nam okno z lastnostmi grafa (Properties), kjer lahko urejamo razliˇcne parametre (glej sliko 3.7). Slika 3.6: Urejanje grafov 2 V primeru manjkajoˇcih vrednosti se odstotki ter veljavni odstotki razlikujejo, saj je pod odstotki izraˇcunan ˇse ostotek manjkajoˇcih vrednosti. V takem primeru navadno navedemo veljavne odstotke, ki predstavljajo odstotke pri posamezni kategoriji glede na ˇstevilo vseh odgovorov (in ne na ˇstevilo anketirancev). 28 3 Opisne statistike V oknu z lastnostmi grafa lahko torej urejamo: • velikost grafa (Chart Size), • obliko naslova (Text Layot); vodoravna, navpiˇcna oz. poˇsevna usmerjenost naslova, • oblikovanje besedila (Text Style); vrsta pisave, velikost ter barva, • oblikovanje polj z oznakami (Fill & Border); polnilo in obroba okvirja z vrednostmi, • oblikovanje vrednosti (Number format); ˇstevilo decimalnih mest, prikaz znaka %. S slike 3.6 je razvidno, da smo ˇstevilo decimalk nastavili na 0. Poleg tega smo v zavihku Fill & Border izbrali prosojno ozadje (Transparent) ter velikost pisave za iz-pisane vrednosti nastavili na 20 v zavihku Text Style. Vsakiˇc ko spremenimo kakˇsno izmed nastavitev to potrdimo s klikom na gumb Apply. Slika 3.7: Urejanje oznak grafa Spreminajmo lahko tudi velikost pisave legende ter naslova in sicer tako, da dvokliknemo na napis. Nastavitve spet spreminjamo v zavihku Text Style in potrdimo s klikom na gumb Apply. Na sliki 21 je prikazan urejen tortni diagram kot je opisano zgoraj. V zavihku Fill & Border lahko npr. izberemo barvo ozadja in obrobo oznak na grafu. V naˇsem primeru (Slika 3.8) smo izbrali prosojno ozadje in obrobo (na barvni paleti izberemo bel preˇctan pravokotnik oz. Transparent). Slika 3.8: Urejanje oznak grafa V oknu Chart Editor lahko doloˇcimo tudi, da so pri tortnem diagramu rezine med sabo loˇcene. To moˇznost izberemo z ukazom Chart Editor: Elements→Explode Slice. ˇ ˇzelimo zamenjati barve rezin dvokliknemo ali na posamezno rezino ali na oznako v Ce legendi. Odpre se nam okno z lastnostmi, kjer lahko v zavihku Fill & Border zamenjamo barvo. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 29 Naslednje vpraˇsanje je bilo Starost, oznaˇceno z V5 (glej vpraˇsalnk na sliki 1.1). Starost je merjena na razmernostni letvici (glej okvirˇcek na strani 14, zato lahko zanjo izraˇcunamo tako mere centralne tendence oz. srednje vrednosti (mediano, modus , aritmetiˇcno sredino) kot mere razprˇsenosti (varianca, standardni odklon). Podobno kot prej v SPSS-u izberemo SPSS: AnaSlika 3.9: Frekvence - izbira spremenljivke Starost lyze → Descriptive Statistics → Frequencies. V desno okno Variable(s) prenesemo spremenljivko Starost (ˇse prej odstranimo iz desnega okna spremenljivko Spol iz prve analize in sicer tako da spremenljivko oznaˇcimo ter kliknemo puˇsˇcico levo). Na desni strani izberemo gumb Statistics. Odpre se nam okno prikazano na sliki 3.10. Izmed ponujenih moˇznosti izberemo levo zgoraj pod Percentile values kvartile (Quartiles), med merami centralne tendence Central Tendency pa izberemo povpreˇcje oz. aritmetiˇcno sredino (Mean), mediano (Median) in modus (Mode). Med merami razprˇsenosti (Dispersion) izberemo standardni odklon (Std. deviation), varianco (Variance), poleg tega izberemo ˇse minimum (Minimum) in maksimum Maximum. Izbiro potrdimo s klikom na gumb Continue. Pomen posameznih statistik najdete v okvirˇcku Ponovi na strani 31 Slika 3.10: Frekvence - izbira statistik V oknu Frequencies: Statistics bi lahko pod Percentile values izbrali ˇse decile, v primeru, da pod Cut points for vtipkamo 10. V tem primeru SPSS izraˇcuna toˇcke, ˇ vtipkamo 100, dobimo ka ranˇzirno vrsto podatkov razdelijo na deset enakih delov. Ce seveda centile (za podrobnejˇseinformacije poglej okvirˇcek Ponovi na strani 31 oz. ustreˇ odkljukamo Percentile(s) in v okence vpiˇsemo npr. 30, dobimo zno literaturo). Ce 30. centil oziroma vrednost, ki naˇso ranˇzirno vrsto razdeli v razmerju 30:70. Pod merami razprˇsenosti (Dispersion) bi lahko izbrali razpon vrednosti Rangeter standardno napako povpreˇcja S.E. mean. Desno spodaj pod Distribution lahko izberemo ˇse koeficienta 30 3 Opisne statistike asimetriˇcnosti (Skewness) in sploˇsˇcenosti (Kurtosis) normalne porazdelitve. V oknu Frequencies (slika 3.9) lahko izberemo ˇse ustrezen graf s klikomna gumb Charts. Odpre se nam okno Frequencies: Charts, kjer je privzeto nastavljena moˇznost None, kar pomeni, da se graf ne bo izrisal. V naˇsem primeru bomo tokrat pod Chart type izberali histogram z dorisano normalno krivuljo, kar pomeni, da oznaˇcimo Histograms: in v spodnji vrstici odkljukamo ˇse Show normal curve on histogram. Pod izbiro tipa grafikona imamo moˇznost izbire tipa vrednosti, ki bodo prikazane na grafu (Chart Values). Avtomatiˇcno je potrjena izbira Frequencies, kar pomeni, da bodo pri histogramu (na y osi) prikazane frekvence. ˇ ˇzelimo prikazati odstotke, izbeCe remo Percentages. Izbiro potrdimo s klikom na gumb Continue. Slika 3.11: Frekvence - izbira grafov Razmisli, zakaj je v primeru spremenljivke Starost bolj smiselna izbira histograma kot pa tortnega diagrama ali ˇ ne nejdeˇs odgovora, paliˇcnega grafa. Ce poskusi narisati tortni diagram ali paliˇcni graf ter primerjaj dobljene grafikone. Poskusi sam... Syntax + + + + + ....za programerske frike :) FREQUENCIES VARIABLES=V4 /NTILES=4 /STATISTICS=STDDEV VARIANCE MINIMUM MAXIMUM MEAN MEDIAN MODE /HISTOGRAM NORMAL /ORDER=ANALYSIS. 2 ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u Ponovi, ponovi, ponovi,... Ponovi, 31 katere opisne statistike poznanmo, kaj pomenijo ter kako jih izraˇcunamo. Podrobnejˇsi opis najdeˇs npr. v ˇ Sparl (2010) ali Jesenko (2001). Mere centralne tendence oz. srednje vrednosti: • modus (Mo) je najpogostejˇsa vrednost • mediana (Me) je srednja vrednost po poloˇzaju, • aritmetiˇ cna sredina ali povpreˇ cje (¯ x) (najbolj pogosto uporabljena mer srednje vrednosti) je seˇstevek vseh vrednosti, deljen s ˇstevilom vseh vrednosti. Kvantili: Naj bo 0 ≤ p ≤ 1. p-kvantil xp je tista vrednost za katero velja, da je p odstotkov vrednosti manjˇsih ali enakih xp , (1 − p) odstotkov pa veˇcjih. Posebni kvantili: • Kvartili so kvantili, ki podatke razdelijo na 4 enake dele: Q1 = x0.25 , Q2 = x0,50 = M e, Q3 = x0.75 . • Decili so kvantili, ki podatke razdelijo na 10 enakih delov: d1 = x0.1 , d2 = x0.2 , . . . , d9 = x0.9 . • Centili so kvantili, ki podatke razdelijo na 100 enakih delov: c1 = x0.01 , c2 = x0.02 , . . . , c3 = x0.99 . Mere variabilnosti ali razprˇ senosti: • varianca - s2 je definirana kot povpreˇcje kvadratov odklonov od aritmetiˇcne sredine. √ • Standardni odklon - s se izraˇcuna kot kvadratni koren iz variance (s = s2 ). Standardni odklon pove, koliko se v povpreˇcju odklanjajo vrednosti od aritmetiˇcne sredine. 32 Ker smo v oknu Frequencies pustili oznaˇceno Display frequency tables (slika 3.9) je najprej pri rezultatih, torej v oknu Output, podana frekvenˇcna tabela. Na sliki 3.12 je prikazan le del tabele, ker je tabela precej dolga in nas v tem primeru ne zanima koliko zaposlenih dosega posamezno starost. 3 Opisne statistike ... ... Slika 3.12: Frekvenˇcna tabela za spremenljivko Starost Slika 3.13 prikazuje tabelo z opisnimi statistikami za spremenljivko Starost. Najmlajˇsi zaposleni je star 20 let, najstarejˇsi zaposleni pa 59 let. Povpreˇcna starost anketirancev je 38 let, standardni odklon pa 7.6 let. Polovica anketirancev je mlajˇsa od 39,5 let, polovica pa je starejˇsih (mediana Me = 39, 5). Prvi kvartil Q1 je enak 32,75 (oznaka v tabeli Percentile 25), kar pomeni, da je ˇcetrtina (oziroma 25%) anketiˇ rancev mlajˇsih od 32,75 let. Cetrtina anketirancev je starejˇsih od 43,0 let (Q3 = 43, 0). Slika 3.13: Opisne statistike za spremenljivko Starost Najveˇc anketirancev je starih 43 let (modus Mo = 43). Iz frekvenˇcne tabele (slika 3.12) lahko razberemo, da je 8 anketirancev starih 43 let (glej drugi stolpec Frequency) oziroma 10.8% anketirancev je starih 43 let (glej ˇcetrti stolpec Valid Percent). ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 33 Histogram za spremenljivko Starost je prikazan na sliki 3.14. Na levi so ˇse enkrat podani podatki o ˇstevilu anketirancev (N = 74), povpreˇcni starosti (Mean=38.26) in standardnem odklonu (Std. Dev.=7.646). Slika 3.14: Histogram za spremenljivko Starost Porazdelitev je bimodalna, saj imamo dva vrhova (pri 36 in 42 let) in vendar se normalna krivulja kar dobro prilega histogramu. Kako bi preverili, ali je porazdelitev spremenljivke Starost res normalno porazdeljena? Dve statistiki, ki nam pomagata pri ugotavljanju ali je porazdelitev normalna sta asimetriˇcnost porazdelitve in sploˇsˇcenost porazdelitve. Omenjena koeficienta izraˇcunamo tako, da v oknu Frequencies: Statistics (glej sliko 3.10) pod Dispersion izberemo ˇse asimetriˇcnost Skewness in Kurtosis. ... ... Na sliki 3.15 sta prikazana koeficienta asimetrije in sploˇsˇcenosti. V primeru normalne porazdelitve, sta oba omenjena koeficienta enaka 0. V primeru spremenljivke Starost je koeficient asimetrije (Skewness) enak 0.062, kar pomeni, da je porazdelitev spremenljivke Starost nekoliko bolj razpotegnjena v desno. Koeficient sploˇsˇcenosti, ki meri koniˇcastost porazdelitve, (Kurtosis) je enak 0.552, kar nakuzuje nekoliko bolj ˇspiˇcast vrh porazdelitve spremenljivke Starost. Odloˇcitev o normalnosti porazdelitve na podlagi sploˇsenosti in asimetriˇcnosti je Slika 3.15: Del tabele z opisnimi statistikami lahko seveda precej zahtevna, saj ne obstaza spremenljivko Starost s koeficientoma asi- jajo jasno doloˇcene meje obeh koeficientov, metrije in sploˇsˇcenosti za katere bi lahko rekli, da je porazdelitev spremenljivke zagotovo normalna. Kadar 34 3 Opisne statistike potrebujemo objektivnejˇsi odgovor ali je porazdelitev normalna (npr. zaradi kasnejˇsih testov, izvedemo Kolmogorov-Smirnov test (K-S) ali Shapiro-Wilk-ov (S-W) test (glej poglavje 8.2 na strani 113). Poiˇsˇci frekvenˇcne porazdelitve za spremenljive Delovna doba, Izobrazba ter Delovno mesto. Za vsako izmed spremenljivk izraˇcunaj ustrezne statistike ter izberi ustrezen grafiˇcni prikaz. Interpretiraj dobljene rezultate. Poskusi sam... 3.2 Opisne statistike - ukaz Descriptives Slika 3.16: Opisne statistike - ukaz Opisne statistike lahko izraˇcunamo tudi s pomoˇcjo ukaza Analyze → Descriptive Statistics → Descriptives (glej sliko 3.16). Odpre se pogovorno okno prikazano na sliki 3.17. S pomoˇcjo moˇznosti Descriptives bomo izraˇcunali opisne statistike za vsa podvpraˇsanja vpraˇsanja 1 hkrati (glej vpraˇsalnik prikazan na sliki 1.1). V levem oknu oznaˇcimo spremenljivke V1 a do V1 j tako da drˇzimo tipko Ctrl in kliknemo na vsako izmed desetih spremeljivk posebej ali pa drˇzimo tipko Shift ter kliknemo najprej prvo spremenljivko V1 a in nato ˇse V1 j. Izbrane spremenljivke (obarvane rumeno) prenesemo na desno v okno Variable(s) z miˇsko ali s klikom na puˇsˇcico med obema oknoma. Slika 3.17: Opisne statistike - izbira spremenljivk ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 35 S klikom na gumb Options se odpre pogovorno okno (slika 3.18), kjer izberemo opisne statistike, ki jih ˇzelimo prikazati za izbrane spremenljivke. Izbrali smo povpreˇcje, standardni odklon, minimum ter maksimum. Izbiro potrdimo s klikom na gumb Continue. Moˇznost Sum izraˇcuna seˇstevek vseh vrednosti. Pod Dispersion bi lahko izbrali ˇse varianco (Variance), variacijski razmik (Range), ki je izraˇcunan kot razlika med najveˇcjo in najmanjˇso vrednostjo, ter standardno napako povpreˇcja (S.E. mean), ki meri natanˇcnost vzorˇcne ocene povpreˇcja. Pod Distribution bi lahko izbrali ˇse sploˇsˇcenost (Kurtosis) porazdelitve ter asimetrijo (Skewness). Kadar izberemo veˇc spremenljivk hrati tako kot v naˇsem primeru, lahko pod Display Order doloˇcimo, v kakˇsnem vrstnem redu naj bodo spremenljivke prikazane. Izbiramo lahko med Variable list, kar pomeni v enakem vrstnem redu kot smo jih vnesli v seznam, po abecedi (Alphabetic) ter po naraˇsˇcajoˇcih (Asceding Slika 3.18: Opisne statistike - moˇznosti means) ali padajoˇcih povpreˇcjih (Desceding means). Okno Descriptives (slika 3.18) nam ponuja tudi moˇznost shranitve standardiziranih spremenljivk, ˇce oznaˇcimo moˇznost Save standardized values as variables na dnu okna. V naˇsem primeru standardiziranih spremenljivk ne potrebujemo, zato te moˇznosti nismo oznaˇcili. Izpis rezultatov za vse spremenljivke zadovoljstva zaposlenih z delovnim okoljem in opremo podaja tabela na sliki 3.19. Najprej opazimo, da so na vpraˇsanje o zadovoljstvu s telefonom vsi anketiranci oznaˇcili 3 ali veˇc na pet-stopenjski lestvici. Zaposleni so v povpreˇcju najbolj zadox = Slika 3.19: Opisne statistike - zadovoljstvo z delovnim okoljem voljni s telefonom (¯ 4.0), sledijo fotokopirni in opremo stroj (¯ x = 3.7) ter 36 3 Opisne statistike raˇcunalnik (¯ x = 3.6). Najmanj pa so zaposleni zadovoljni z opremo pisarne (¯ x = 2.8) ter velikostjo pisarne (¯ x = 3.1). Podatki so najmanj razprˇseni pri vpraˇsanju o zado- voljstvu s telefonom (s = 0.702) ter najbolj razprˇseni pri vpraˇsanju o zvoˇcni izolaciji pisarne (s = 1.254). Kadar nam posamezno spremenljivko oz. koncept sestavlja veˇc vpraˇsanj, jih navadno ˇzelimo prikazati tudi na istem grafu. To najlaˇzje storimo tako, da tabelo rezultatov (slika 30) skopiramo v Excel. V oknu Output v SPSS-u kliknemo na tabelo z opisnimi statistikami ter nato pritisnemo tipki Ctrl + C ali pa kliknemo z desnim gumbom miˇske ter izberemo moˇznost Copy. Odpremo Excelov delovni zvezek ter prilepimo skopirane podatke (tipki Ctrl + V ali desni klik z miˇsko ter Paste). Podatki v Excelu so prikazani na sliki 3.20. Najprej oznaˇcimo stolpca z imeni spremenljivk ter s povpreˇcji (Mean). Oba stolpca Slika 3.20: Priprava podatkov v Excelu za vpraˇsanje o zadovoljstvu hkrati oznaˇcimo tako, zaposlenih z delovnim okoljem da drˇzimo tipko Ctrl. Tip grafa v Excelu 2010 izberemo tako, da v menijski vrstici kliknemo na Vstavljanje, izberemo zavihek Grafikoni ter izberemo Paliˇ cni graf 3 (slika 3.21). Med paliˇcnimi grafi izberemo 2D-vrstiˇcni graf prikazan prvi z leve. Paliˇcni grafikoni so primerni posebej v primerih, kadar je besedilo vpraˇsanj, ki ga ˇzelimo prikazati precej dolgo. Slika 3.21: Izbira tipa grafa v Ecelu za vpraˇsanje o zadovoljstvu zaposlenih z delovnim okoljem 3 V primeru angleˇske razliˇcice Excela izberete Insert → Charts → Bar. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 37 Graf zadovoljstva zaposlenih z delovnim okoljem in opremo je prikazan na sliki 3.22a. Graf je potrebno nekoliko urediti. Najprej lahko odstranimo oznako Niz 1 na desni, saj ne podaja nobene koristne informacije. To storimo tako, da kliknemo na oznako Niz 1 in pritisnemo tipko Delete. (a) Osnovni graf V naslednjem koraku uredimo oznake vodoravne osi. Ker smo podatke merili na 5stopenjski lestvici (1-zelo nezadovoljen,..., 5-zelo zadovoljen) naj bodo na taki lestvici prikazani tudi podatki. To storimo tako, da z desnim gumbom miˇske kliknemo na oznake vodoravne osi ter iz(b) Urejanje vodoravne osi grafa beremo zadnjo moˇznost v meniju, to je Oblikuj os (slika Slika 3.22: Graf v Excelu za vpraˇsanje o zadovoljstvuza3.22b). Odpre se nam okno poslenih z delovnim okoljem prikazano na sliki 3.23. V oknu Oblikovanje osi (slika 3.23) izberemo na levi Moˇ znosti osi ter nato na desni oznaˇcimo v prvi vrstici Najmanjˇ se moˇznost Nespremenljivo ter v okvirˇcek vpiˇsemo 1. V drugi vrstici pri zapisu Najveˇ cje spet oznaˇcimo Nespremenljivo ter v okvirˇcek vpiˇsemo 5. Izbiro potrdimo s klikom na gumb Zapri desno spodaj. Slika 3.23: Urejanje osi grafa v Excelu V polju Veˇ cja enota bi lahko nastavili ˇse, kakˇsen naj bo razmik med navpiˇcnimi ˇcrtami v grafu oz. kako pogosto naj bodo na grafu prikazane enote. V naˇsem primeru je izbrana vrednost 1. 38 3 Opisne statistike Grafu dodamo ˇse oznake podatkov. To storimo tako, da se postavimo nad stolpce grafa ter kliknemo z desnim gumbom miˇske. Odpre se nam okno, kjer oznaˇcimo Dodaj oznake podatko (slika 3.25). Avtomatiˇcno se grafu dodajo vrednosti zapisane na dve decimalki, tako kot dobimo izpisane v SPSS-u (slika 3.19) in smo jih nato prenesli v Excel (slika 3.20). Vrednosti lahko zaokroˇzimo na eno decimalko tako, da oznaˇcimo stolpec povpreˇcij (Means) Slika 3.24: Dodajanje oznak podatv Excelovi tabeli (slika 3.19), kliknemo z desnim kov v Excelu gumbom miˇske ter izberemo Oblikuj celice. Odpre se okno Oblikovanje celic, kjer pod Zvrstjo na levi izberemo ˇstevilo, nato pa na desni strani zmanjˇsamo ˇstevilo decimalnih mest na 1 (slika 3.25). Izbiro potrdimo s klikom na gumb V redu. Slika 3.25: Oblikovanje celic v Excelu Slika 3.26 prikazuje urejen graf povpreˇcij na vpraˇsanja o zadovoljstvu zaposlenih z delovnim okoljem in opremo. Poleg zgoraj opisanih sprememb smo nastavili ˇse velikost pisave vpraˇsanj ter oznak podatkov nastavili na 12 ter izbrali odebeljen tip pi- save. Slika 3.26: Urejen graf povpreˇcij v Excelu za vpraˇsanja o zadovoljstvu zaposlenih z delovnim okoljem in opremo ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u Syntax + + + + + 39 ....za programerske frike :) DESCRIPTIVES VARIABLES=V1_a V1_b V1_c V1_d V1_e V1_f V1_g V1_h V1_i V1_j /STATISTICS=MEAN STDDEV MIN MAX. Poskusi sam... 3 Poiˇsˇci povpreˇcja, standardni odklon ter minimalen in maksimalen odgovor za tri vpraˇsanja o Zadovoljstvu zaposlenih s tehniˇcno podporo. Nariˇsi grafe pov- preˇcij. Interpretiraj dobljene rezultate. 3.3 Prilagodljive tabele - ukaz Custom Tables Frekvenˇcno porazdelitev spremenljivk lahko dobimo tudi s pomoˇcjo ukaza Analyze → Tables → Custom Tables (slika 3.27 ), kadar imamo imenske in urejenostne spremenljivke. Navadno pa ukaz Custom Tables uporabimo, kadar ˇzelimo prikazati veˇc spremenljivk v isti tabeli (npr. vse socio-demografske spremenljivke). Slika 3.27: Ukaz - Custom Tables Slika 3.28: Custom Tables - opozorilo Najprej se odpre opozorilo (slika 3.28), da morajo biti oznake spremenljivk urejene za vse kategorialne spremenljivke, prav tako morajo imeti spremenljivke urejen nivo merjenja. Ker smo oznake in nivo merjenja naˇsih spremenljivk uredili ˇze na zaˇcetku, kliknemo Ok (oznaˇcimo lahko tudi, da se to pogovorno okno ne prikazuje veˇc (Don’t show this dialog again)). V primeru, da bi ˇzeleli urediti nivo merjenih spremenljivk, kliknemo Defne Variable Properties. 40 3 Opisne statistike Odpre se pogovorno okno Custom Tables. Oznaˇcimo spremenljivki Spol in Izobrazba (drˇzimo tipko Ctrl) v levem oknu Variables. Spremenljivki prenesemo v desno okno tako, da oznaˇceni spremenljivki prenesemo nad polje z napisom Rows, tako da se le-to obarva rdeˇce (slika 3.29), nato spremenljivki spustimo. V desnem polju se nam nakaˇze obris tabele, ki jo bomo dobili v izpisu rezultaSlika 3.29: Custom Tables - izbira spremenljivk tov (slika 3.30). Avtomatiˇcno se izraˇcunajo frekvence, kar je oznaˇceno v stolpcu Count. Navadno ˇzelimo izpisane tudi odstotke. V spodnjem levem kotu pod napisom Define kliknemo na gumb Summary Statistics. Odpre se nam pogovorno okno Summary Statistics (glej sliko 3.31). V prvi vrstici nas okno opomni, da smo izbrali veˇc spremenljivk (Multiple Variables), saj smo v prejˇsnjem koraku izbrali spremenljivki Spol in Izobrazba. Slika 3.30: Custom Tables - izbira spremenljivk Spol in Izobrazba ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 41 V spodnjem oknu Statistics izberemo odstotke, torej izberemo Column N %. Izbiro s pomoˇcjo puˇsˇcice (ali miˇske) prenesemo v desno okno. Izbiro potrdimo z gumbom Apply to Selection. V primeru, da bi v prejˇsnjem koraku oznaˇcili Slika 3.31: Custom Tables - izbira statistic le eno spremenljivko v desnem obrisu tabele, bi izbira Apply to Selection pomenila, da se bodo odstotki izraˇcunali le za ˇ bi v takem primeru kljub temu ˇzeleli izraˇcunati odstotke oznaˇceno spremenljivko. Ce za celo tabelo, kliknemo na gumb Apply to All. Po zaprtju okna Summary Statistics se v oknu Custom Tables ˇze izriˇse tabela s frekvencami (stolpec Count) in odstotki (stolpec Column N %). Izbiro spremenljivk ter izbranih statistik ˇse enkrat potrdimo s klikom na gumb OK (slika 3.31). Izpis rezultatov v oknu Output je prikazan v tabeli na sliki 3.32. Rezultate za spremenljivko Spol smo prikazali ˇze na sliki 3.4 na strani 26. Rezultati za spremenljivko Izobrazba Slika 3.32: Custom Tables - izpis rezultatov za spremenljivki Spol kaˇzejo, da ima 57% in Izobrazba anketirancev srednjeˇsolsko izobrazbo, 20% anketirancev ima viˇsjeˇsolsko ali visokoˇsolsko izobrazbo, prav toliko anketirancev (20%) ima univerzitetno izobrazbo, magisterij oz. doktorat pa ima le 3% anketirancev. Podatke lahko prikaˇzemo tudi grafiˇcno. Pomagamo si lahko s kopiranjem tabele rezultatov v Excel ali pa z ukazom Graphs v SPSS-u (glej poglavje 5). 42 3 Opisne statistike + + Syntax +++ ....za programerske frike :) * Custom Tables. CTABLES /VLABELS VARIABLES=V3 V6 DISPLAY=LABEL /TABLE V3 [COUNT F40.0, COLPCT.COUNT PCT40.1] + V6 [COUNT F40.0, COLPCT.COUNT PCT40.1] /CATEGORIES VARIABLES=V3 V6 ORDER=A KEY=VALUE EMPTY=INCLUDE. 4 V primeru, da izberemo v oknu Custom Tables razmernostne spremenljivke (nivo merjenja oznaˇcen kot Scale), se nam avtomatiˇcno namesto odstotkov prikaˇzejo povpreˇcja (Mean). V oknu Summary Statistic lahko nato izberamo ˇse med ˇstevilom anketirancev (Count), najveˇcjo vrednostjo (Maximum), mediano (Median), najmanjˇso vrednostjo (Minimum), ˇstevilom manjkajoˇcih podatkov (Missing), modusom (Mode), kvantili (Percentile 05, 25, 75, 95 in 99), variacijskim razmikom (Range), standardno napako povpreˇcja (Standard Error of Mean), standardnim odklonom (Standard Deviation), varianco (Variance) in nekaterimi drugimi. Poskusi sam... Poskusi za razmernostne spremenljivke iz vpraˇsalnika (spremenljivke o zadovoljstvu ali spremenljivki Starost in Delovna doba) sestaviti tabelo z ustreznimi opisnimi statistikami. Rezultate ustrezno interpretiraj. 3.4 Veˇ c moˇ znih odgovorov - ukaz Multiple response V primeru, ko imamo v vpraˇsalniku vpraˇsanje z veˇc kot enim moˇznim odgovorom, moramo SPSS-u najprej povedati katere spremenljivke spadajo skupaj. Pomagamo si z ukazom Multiple Response, ki ga najdemo pod Analyze → Multiple Response → Define Variable Set (slika 3.33). ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 43 Slika 3.33: Ukaz - Multiple Response Odpre se nam okno Define Multiple Response Sets prikazano na sliki 3.34. V levem oknu polja Set Definition oznaˇcimo vse spremenljivke tretjega vpraˇsanja V3 a, V3 b,...,V3 h in sicer tako, da jih oznaˇcimo in prenesemo z miˇsko v okno Variables in Set ali pa kliknemo na puˇsˇcico med obema oknoma. V spodnjem polju Variables Are Coded As pustimo oznaˇceno Dichotomies in v okence Counted value vpiˇsemo 1. V polje Name Slika 3.34: Izbira spremenljivk v primeru veˇc moˇznih od- vpiˇsemo ’Okrepˇcevalnica’ ter pod Label kratko oznako govorov V3 skupaj. 44 3 Opisne statistike Nato kliknemo na gumb Add. V desnem polju Multiple Response Sets se pojavi oznaka $Okrepˇ cevalnica (slika 3.35). Na koncu v oknu Define Multiple Response Sets (slika 3.34) kliknemo ˇse na gumb Slika 3.35: Nova spremenljivka Close. v primeru veˇc odgovorov Nato ˇzelimo seveda izraˇcunati ˇse frekvence in odstotke za novo spremenljivko z oznako Ukaz najdemo pod AnaV3 skupaj. lyze → Multiple Response → Frequencies. Odpre se nam okno Multiple Response Frequencies prikazano na sliki 3.36. Spremenljivko $Okrepˇ cevalnica prenesemo v desno polje Table(s) for ter izbiro potrdimo s klikom na gumb OK. V oknu Output dobimo izpisane rezultate priSlika 3.36: Frekvence v primeru veˇc kazane na sliki 3.37. V stolpcu z oznako N dobimo izpisane frekvence pri vsakem moˇznem odmoˇznih odgovorov govoru, v stolpcu Percent of Cases pa ustrezne odstotke (glede na ˇstevilo vseh anketirancev). Stolpca z oznako Percent v tem primeru ne interpretiramo, saj so to odstotki izraˇcunani glede na skupno ˇstevilo vseh izbranih odgovorov v podatkih. Najveˇc anketirancev si ˇzeli podaljˇsanje delovnega ˇcasa okrepˇcevalnice do 17h (76%), sledi poveˇcana ponudba sadja in sveˇzih sokov (53%) ter moˇznost, da bi okrapˇcevalnico lahko obiskovali tudi druˇzinski ˇclani (53%). Uvedbi ponudbe zajtrka je naklonjenih 51% anketirancem, uvedbi razliˇcnih menijev pa polovica anketirancev. Skoraj polovica anketirancev si ˇzeli tudi ponudbo vsaj dveh vegetarianskih obrokov (49%) in odprtje okrepˇcevalnice ob 7. uri (47%). Najmanj glasov je dobila moˇznost uvedbe naroˇcanja kosil za domov Slika 3.37: Nova spremenljivka v primeru veˇc odgovorov (28%). ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 4 45 Intervali zaupanja Ponovi, ponovi, ponovi,... Ponovi, Zakaj potrebujemo intervale zaupanja? Intervale zaupanja potrebujemo, ker so toˇckovne ocene (npr. povpreˇcje, razlika povpreˇcij, deleˇz,...) nezanesljive. Za posamezno oceno ne vemo ali je toˇcna oziroma za koliko se razlikuje od prave vrednosti. Naj bo q neznani parameter, ki ga ocenjujemo in α vnaprej znana verjetnost. Interval [L, D] imenujemo interval zaupanja s stopnjo zaupanja 1 − α, ˇce z zaupanjem 1 − α priˇcakujemo, da parameter q leˇzi v tem intervalu. Zapisano krajˇse: P (L ≤ q ≤ D) = 1 − α. Meji intervala zaupanja sta sluˇcajni spremenljivki, kar pomeni, da pri vsakem vzorcu zavzameta druge vrednosti. V populaciji vseh vzorcev velikosti n lahko priˇcakujemo, da je deleˇz intervalov zaupanja, ki vsebujejo parameter q enak 1 − α, deleˇz napaˇcnih intervalov zaupanja, kjer q ne leˇzi znotraj intervala, pa je enak α. Poimenovanji: • verjetnost 1 − α - stopnja zaupanja (npr. 95 % stopnja zaupanja), • verjetnost α - stopnja tveganja (npr. 5 % stopnja tveganja), 4.1 Interval zaupanja za povpreˇ cje Interval zaupanja za povpreˇcje lahko izraˇcunamo v SPSS-u s pomoˇcjo ukaza Explore (slika 4.38): SPSS: Analyze → Descriptive Statistics → Explore. Slika 4.38: Raziˇsˇci podatke - ukaz Explore 46 4 Intervali zaupanja Odpre se okno Explore, kjer v desno polje Dependent List prenesemo spremenljivko za katero raˇcunamo interval zaupanja, npr. spremenljivko V 1 a Velikost pisarne (slika 4.39). V spodnjem delu okna v polju Display lahko izberemo ali ˇzelimo prikazati le izraˇcunane statistike (Statistics), le grafiˇcne prikaze (Plots) ali obeje (Both). V naˇsem primeru smo izbrali le statistike, saj nas trenutno zanimajo intervali zaupanja. Slika 4.39: Okno Explore ˇ kliknemo na gumb StatiCe stics lahko doloˇcimo, kakˇsen interval zaupanja nas zanima (slika 4.40). Privzeto je nastavljen 95 % interval zaupanja (Comfidence Interval for Mean: 95 %). Izbrali bi lahko ˇse izraˇcun razliˇcnih kvantilov (Percentiles) ali raziskali osamelce, torej izstopajoˇce podatke (Outliers). Slika 4.40: Okno Explore: Statistics - izbira statistik Syntax + + + + + EXAMINE VARIABLES=V1_a /PLOT NONE /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL. Izbiro potrdimo s klikom na gumb Continue. Nato kliknemo ˇse na gumb OK v oknu Explore (slika 4.39). ....za programerske frike :) 5 ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 47 V izpisu rezultatov se najprej izpiˇse tabela s povzetkom vkljuˇcenih spremenljivk in ˇstevilom podatkov (Case ProcesSlika 4.41: Rezultati z ukazom Explore - vkljuˇcene spremen- sing Summary), ki je v poroˇcilu navadno ne naljivke in ˇstevilo podatkov vajamo (slika 4.41). V tabeli z opisnimi statistikami (Descriptives) v oknu Output dobimo izpisan tudi interval zaupanja (slika 4.42) oziroma njegovo spodnjo (Lower Bound) in zgornjo mejo (Upper Bound). Povpreˇcno zadovoljstvo zaposlenih z velikostjo pisarne je 3.08, 95% interval zaupanja pa je enak [2.81, 3.38]. Torej, povpreˇcno zadovoljstvo z velikostjo pisarne vseh za- Slika 4.42: 95% interval zaupanja za spremenljivko Velikost poslenih v podjetju se s pisarne 95-odstotno verjetnostjo nahaja na intervalu [2.81, 3.38]. Interval zaupanja za povpreˇcje dobimo izraˇcunan tudi poleg rezultatov t-testa, ki ga izvedemo s pomoˇcjo ukaza Analyze → Compare Means → One Sample T Test (glej poglavje 7.1.2). Interval zaupanja za razliko povpreˇcij pa dobimo izpisan v rezultatih t-testa za razliko povpreˇcij (glej poglavje 7.1.1). Interval zaupanja za povpreˇcje dobimo izraˇcunan tudi poleg rezultatov t-testa, ki ga izvedemo s pomoˇcjo ukaza Analyze → Compare Means → One Sample T Test (glej poglavje 7.1.2). Interval zaupanja za razliko povpreˇcij pa dobimo izpisan v rezultatih t-testa za razliko povpreˇcij (glej poglavje 7.1.1). 4.2 Interval zaupanja za deleˇ z Interval zaupanja za deleˇz v SPSS-u lahko dobimo na enak naˇcin kot za povpreˇcje, ˇce imamo dihotomno spremenljivko. To pomeni, da morajo biti podatki zapisani z vrednostmi 1 in 0, kot npr. vse spremenljivke naˇsega tretjega vpraˇsanja (glej vneˇsene podatke na sliki 2.14). V primeru, da imenska spremenljivka z dvema vrednostma ni dihotomna (kot npr. v naˇsih podatkih spremenljivka Spol, kjer vrednost 1 oznaˇcuje ˇzenske, 2 pa 48 4 Intervali zaupanja moˇske), lahko spremenljivko pred izraˇcunom intervala zaupanja prekodiramo. Kako to storimo je opisano v poglavju 6.3. Recimo, da nas zanima 95% interval zaupanja za spremenljivko V 3 a - podaljˇsanje delovnega ˇcasa do 17. ure. Tako kot prej v SPSS-u izberemo Analyze → Descriptive Statistics → Explore. V oknu Explore sedaj v desno polje Dependent List prenesemo spremenljivko V 3 a (slika 4.43). V spodnjem delu okna v polju Display spet oznaˇcimo le (Statistics). Ker ˇzelimo izraˇcunati 95% interval zaupanja ne rabimo v oknu Explore: Statistics, ki bi ga dobili s klikom na gumb Statistics, niˇcesar spreminjati, saj je privzeto nastavljen ravno 95% interval zaupanja (glej sliko 4.40). Izbiro potr- Slika 4.43: Okno Explore - spremenljivka ’podaljˇsanje delovdimo s klikom na gumb nega ˇcasa do 17. ure’ OK. V oknu z rezultati dobimo tabelo z opisnimi statistikami prikazano na sliki 4.44. Deleˇz anketirancev, ki si ˇzelijo, da bi bila okrepˇcevalnica odprta do 17. ure je enak 0.76. 95% interval zaupanja za deleˇz zaposlenih, ki si ˇzelijo odprtje okrepˇcevalnice do 17. ure pa je enak [0.66, 0.86]. Torej, deleˇz Slika 4.44: 95% interval zaupanja za spremenljivko podaljˇsanje vseh zaposlenih v podjetju, ki si ˇzelijo odprdelovnega ˇcasa do 17. ure tje okrepˇcevalnice do 17. ure, se s 95-odstotno verjetnostjo nahaja na intervalu [0.66, 0.86]. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u Syntax + + + + + EXAMINE VARIABLES=V3_a /PLOT NONE /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL. 49 ....za programerske frike :) 6 50 5 5 Grafiˇcni prikazi Grafiˇ cni prikazi Nekaj grafiˇcnih prikazov podatkov smo si pogledali ˇze v poglavju 4. V SPSS-u si lahko ustrezen grafiˇcni prikaz izberemo v meniju Graphs → Chart Builder (slika 5.1). Slika 5.1: Grafi (Graphs) - ukaz Najprej se pokaˇze opozorilo (slika 5.2), da morajo biti pred izrisi grafov nivoji merjenja spremenkljivk pra vilno nastavljeni. Ker smo mi le-te nastavili ˇze na zaˇcetku, kliknemo OK, v nasprotnem primeru bi uredili nivoje merjenja s klikom na gumb Define Variable Properties. Slika 5.2: Okno Graphs - opozorilo Odpre se nam okno Chart Builder na sliki 5.3. Na levi strani zgoraj je prikazan seznam naˇsih spremenljivk, desno zgoraj je okno, kjer se bo prikazal predogled izbranega grafa, v spodnjem delu okna pa so prikazani moˇzni grafi. V galeriji grafov v spodnjem delu okna Chart Builder (slika 47) lahko izbiramo med devetimi osnovnimi vrstami grafov. Prvi na seznamu so stolpiˇcni grafi - Bar (slika 5.4a). Izbiramo lahko (od leve proti desni in od zgoraj navzdol) med preprostim stolpiˇcnim grafom (Simple Bar), stolpiˇcnim grafom s prikazom skupin (Clustered Bar) in naloˇzenim stolpiˇcnim grafom (Stacked Bar), sledijo 3D prikazi omenjenih grafov ter grafikona s prikazom standardnih napak (Simple Error Bar in Clustered Error Bar). Sledijo ˇcrtni grafikoni in sicer preprosti ˇcrtni grafikon (Simple Line) ter ˇcrtni grafikon s prikazom veˇcih skupin (Multiple Line) (slika 5.4c). Med ploˇsˇcinskimi grafi na sliki 5.4c lahko izbiramo med preprostim ploˇsˇcinskim grafom (Simple Area) ter naloˇzenim ploˇsˇcinskim grafom (Stacked Area) s prikazom skupin. Tortni grafikon (Pie Chart) je prikazan na sliki sliki 5.4d. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 51 Slika 5.3: Okno Chart Builder Razsevni diagrami so prikazani na sliki sliki 5.4e. Od leve proti desni izbiramo med preprostim razsevnim diagramom (Simple Scatter), razsevnim grafikonom s prikazom skupin (Grouped Scatter), sledita 3D razliˇcici omenjenih grafikonov, toˇckovni grafikon (Summary Point plot), na katerem lahko prikaˇzemo raliˇcne opisne statistike, kot so povpreˇcje, minimum, mediano,... glede na izbrane skupine. Sledijo preprost toˇckovni diagram (Simple Dot Plot), ki prikaˇze porazdelitev podatkov glede na izbrano spremenljivko, matrika razsevnih diagramov (Scatterplot Matrix) prikaˇze razsevne diagrame za vse pare izbranih spremenljivk ter Drop-Line grafikon. 52 5 Grafiˇcni prikazi Razliˇcni histogrami so predstavljeni na sliki sliki 5.4f. Od leve proti desni so prikazani preprosti histogram (Simple Histogram), naloˇzeni histogram (Stacked Histogram), poligon (Frequency Poligon) ter populacijska piramida (Population Pyramid). (a) Stolpiˇcni grafi Razliˇcni histogrami so predstavljeni na sliki sliki 5.4f. Od leve proti desni so prikazani preprosti histogram (Simple Histogram), naloˇzeni histogram (Stacked Histogram), poligon (Frequency Poligon) ter populacijska piramida (Population Pyramid). Skupina grafikonov na sliki 5.4g prikazuje razlike med naviˇsjimi in najniˇzjimi vrednostmi izbranih spremenljivk (High-Low-Close), kjer lahko za najniˇzjo, najviˇsjo vrednost ter povpreˇcje izberemo isto spremenljivko ali pa za vsako prikazano vrednost izberemo drugo spremenljivko. Podoben prikaz v obliki stolpcev dobimo s preprostim stolpiˇcnim grafikonom razpona (Simple Range Bar), lahko pa prikaz razdelimo ˇse glede na skupine (Clustered Range Bar). Razliko povrˇsin glede na povpreˇcja dveh spremenljivk in izbrane skupine prikazuje Differenced Area. Okvirji z roˇcaji (Boxplot) so prikazani na sliki 5.4h. Preprosti okvirji z roˇcaji (Simple boxplots) prikazujejo pet opisnih statistik, in sicer minimum, prvi kvartil, mediano, tretji kvartil in maksimum. V primeru, da so v podatkih prisotni osamelci (angl. outliers), roˇcaji oz. ˇcrte predstavljajo 1.5 kvartilnega razmika (razlika med tretjim in prvim kvartilom). Okvirji z roˇcaji so lahko prikazani tudi posamiˇcno za izbrane skupine (Clustered Boxplot). 1-D Boxplot prikaˇze okvir z roˇcaji le za eno posamezno spremenljivko. ˇ (b) Crtni grafi (c) Ploˇsˇcinski grafi (d) Tortni grafi (e) Razsevni grafi (f) Histogrami (g) Najviˇsji-najniˇzji (h) Okvirji z roˇcaji S pomoˇcjo grafov z dvojno osjo (Dual Axes) prikazanih na sliki 5.4i lahko izberemo dve spremenljivki, ki bosta prikazani na y osi. V primeru kategorialne spremenljivke na x osi izberemo Dual Y Axes with Categorical X Axes, ˇce pa je spremenljivka na osi x razmerno(i) Dvojna os stna oz. ˇstevilska izberemo Dual Y Axes with Scale X Slika 5.4: Izbira tipa grafa Axes. v okolju Chart Builder V nadaljevanju je po korakih prikazanih nekaj najpogosteje uporabljenih grafikonov. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 5.1 53 Okvirji z roˇ caji Najprej bomo prikazali okvir z roˇcaji za spremenljivko Starost. Kot smo ˇze zapisali, okvirje z roˇcaji najdemo v meniju Graphs → Chart Builder. Levo spodaj v oknu Chart Builder (slika 46) izberemo preproste okvirje z roˇcaji (prva ikona na sliki 47h). Nato kliknemo na izbrano ikono ter jo povleˇcemo v okno desno zgoraj, kjer se prikaˇze predogled grafikona prikazan na sliki 5.5. Nato v okno na levi strani grafikona prenesemo spremenljivko StaSlika 5.5: Izbira grafa - boxplot za spremenljivko Starost rost in sicer tako, da spremenljivko oznaˇcimo ter prenesemo nad polje Y-Axis?, da se te-to obarva rdeˇce. Izbiro potrdimo s s klikom na gumb OK. V izpisu rezultatov (okno Output) se izriˇse okvir z roˇcaji prikazan na sliki ˇ v poglavju opi5.6. Ze snih statistik na strani 32 smo izraˇcunali statistike, ki so sedaj prikazane ˇse na okvirju z roˇcaji. Mediana spremenljivke Starost je 39.5 let, kar pomeni, da je polovica anketirancev starejˇsih, polovica pa mlajˇsih od 39.5 let. ˇ Cetrtina najmlajˇsih anketirancev je stara 32.75 let ali manj, medtem ko je ˇcetrtina najstarejˇsih zaposlenih stara Slika 5.6: Boxplot za spremenljivko Starost vsaj 43.0 let. Okvir z roˇcaji kaˇze, da imamo v podatkih en osamelec (oznaˇcen z identifikacijsko ˇstevilko 20) in sicer gre za zaposlenega, ki je star 59 let. 54 V primeru, da kateri izmed roˇcajev ni v celoti viden oz. ˇzelimo spremeniti razpon vrednosti na y-osi, to storimo tako, da dvokliknemo y os. Najprej se nam odpere okno Chart Editor, kjer ˇse enkrat dvokliknemo vrednosti na y-osi. Odpre se nam okno Properties (slika 5.7), kjer lahko v zavihku Scale doloˇcimo razpon vrednosti na y-osi. Na boxplotu, ki je prikazan na sliki 5.6 smo najniˇzjo vrednost Minimum postavili na 19. Vrednosti v zadnjem stolpcu pod Data prikazujeta najniˇzjo in najviˇsjo vrednost v podatkih (20 let in 59 let), tako da si lahko z njima pomagamo, ko doloˇcamo razpon prikazanih vrednosti na y-osi. 5 Grafiˇcni prikazi Slika 5.7: Boxplot - urejanje vrednosti Nariˇsemo lahko tudi veˇc okvirjev z roˇcaji in sicer za vsako kategorijo izbrane imenske ali ordinalne spremenljivke. V naˇsem primeru nas na primer zanimajo okvirji z roˇcaji za spremenljivko Starost glede na Delovno mesto anketirancev. Izberemo Clustered Boxplots oziroma drugo ikono na sliki 5.4h ter je prenesemo v okno desno zgoraj. Na y os prenesemo tako kot prej spremenljivko Starost, na x Slika 5.8: Izbira grafa - boxploti za spremenljivko Starost glede os pa spremenljivko Dena spremenljivko Delovno mesto lovno mesto. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 55 Izpis rezultatov iz okna Output je prikazan na sliki 5.9. Najprej opazimo, da je sedaj anketiranec z najviˇsjo starostjo (59 let) zaposlen v administraciji. Mediana je najniˇzja v oddelku prodaje (35 let) in najviˇsja v IT oddelku (43let). To pomeni, da je v oddelku prodaje polovica anketirancev mlajˇsa od 35 let, v odelku prodaje pa je polovica anketirancev starejˇsa od 43 let. Najveˇcji kvartilni razmik je v oddelku proSlika 5.9: Boxploti za spremenljivko Starost glede na spremendaje in sicer znaˇsa le ta ljivko Delovno mesto 14let, najmanjˇsi pa v oddelku prodaje (8 let). Starosti, ki jih za posamezne statistike navajamo zgoraj niso izpisane ob posameznem okvirju z roˇcaji. Namig, kako jih izraˇcunati, najdeˇs v okvirˇcku Poskusi sam’ na strani 5.1. Poskusi sam... S pomoˇcjo Custom Tables lahko izraˇcunamo izbrane statistike posebej za vsako skupino anketirancev, ki jo doloˇca imenska ali urejenostna spremenljivka oziroma kombinacija veˇcih spremenljivk. a) Poskusi za spremenljivki Starost in Delovno mesto sestaviti tabelo z opisnimi statistikami, ki so prikazane na okvirjih z roˇcaji na sliki 5.9. b) Spremenljivkama Starost in Delovno mesto, dodajte ˇse spremenljivko Spol, tako da boste dobili opisne statistike prikazane na okvirjih z roˇcaji na sliki 5.11. 56 5 Grafiˇcni prikazi Okvirjem z roˇcaji prikazanim na sliki 5.9 lahko dodamo ˇse eno dimenzijo, ˇce izberemo Clustered Boxplot oziroma tretjo ikono na sliki 5.4h. Podobno kot prej na x os dodamo spreenljivko Delovno mesto ter na y os spremenljivko Starost. V okvirˇcek desno zgoraj Cluster on X: set color prenesemo spremenljivko Spol. Iz- Slika 5.10: Izbira grafa-boxploti za spremenljivko Starost glede biro potrdimo s klikom na spremenljivki Delovno mesto in Spol na gumb OK. Dobimo okvirje z roˇcaji prikazane na sliki 5.11. Slika 5.11: Okvirji z roˇcaji za spremenljivko Starost glede na spremenljivki Delovno mesto in Spol Poskusi sam... strani 55). Interpretirajte dobljene okvirje z roˇcaji, ki so prikazani na sliki 5.11. Pomagajte si z izraˇcunom ustreznih opisnih statistik (glej okvirˇcek ’Poskusi sam’, toˇcka b), na ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 5.2 57 Razsevni grafikoni V nadaljevanju si bomo ogledali razsevna grafikona za spremenljivki Starost in Delovna doba. Razsevni grafikon izberemo s klikom na prvo ikono na sliki 5.4e. V okvirˇcek pod osjo x (slika 5.12) prenesemo spremenljivko Starost, v okvirˇcek levo od osi y pa spremenljivko Delovna Slika 5.12: Izbira grafa - razsevni grafikon za spremenljivko Starost glede doba. Izbiro pona spremenljivko Delovno mesto trdimo s klikom na gumb OK. Dobljeni razsevni grafikon je prikazan na sliki 5.13. Opazimo, da priˇcakovano viˇsja starost pomeni tudi viˇsjo delovno dobo. Ker sta obe spremenljivki razmernostni, lahko v tem primeru izraˇcunamo torej Pearsonov koeficient korelacije (glej poglavje 6.2.2). Slika 5.13: Razsevni grafikon za spremenljivko Starost glede na spremenljivko Delovno mesto 58 5.3 5 Grafiˇcni prikazi ˇ Crtni grafikoni Povpreˇcja posameznih spremenljivk (glede na eno ali dve imenski oz. urejenostni spremenljivki) lahko prikaˇzemo tudi s pomoˇcjo ˇcrtega grafikona in sicer tako, da izberemo drugo ikono na sliki 5.4b oziroma Multiple Line. V okvirˇcek pod Slika 5.14: Izbira ˇcrtnega graf za spremenljivko Delovna doba glede na osjo x prene- spremenljivko Delovno mesto semo spremenljivko Delovno mesto (slika 5.14), levo od y osi spremenljivko Delovna doba in desno zgoraj v okvirˇcek Set Color spremenljivko Spol. V oknu Element properties (ki se navadno odpre desno od osnovnega okna Chart Builder) lahko izberemo statistike, ki naj se prikaˇzejo na ˇcrtnem grafu. V naˇsem primeru smo izbrali povpreˇcje, torej Mean (slika 5.15). Izbiramo lahko ˇse med statistikami navedenimi v oknu Statistics; npr. odstotek, mediana, modus, minimum,... Izbiro potrdimo s klikom na gumb Apply. V oknu Chart Builder izbiro potrdimo s klikom na gumb OK ter dobimo ˇcrtni grafikon prikazan na sliki Slika 5.15: Izbira prikaza statistik za ˇcrtni 5.16. graf Rezultati prikazani na ˇcrtnem grafikonu na sliki 5.16 kaˇzejo, da je najviˇsja povpreˇcna delovna doba med moˇskimi v kadrovski sluˇzbi in v IT oddelku (19.0 let ter 18.2 let), najniˇzja pa v oddelku prodaje (10.0 let). V povpreˇcju imajo najdaljˇso delovno dobo v podjetju ˇzenske zaposlene v IT oddelku (19.0 let), najniˇzjo povpreˇcno delovno dobo pa imajo ˇzenske zaposlene pravni sluˇzbi (12.1 leto). Opisne statistike navedene zgoraj izraˇcunaj s pomoˇcjo namiga iz okvirˇcka ’poskusi sam’ na strani 5.3. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 59 Slika 5.16: Izbira prikaza statistik za ˇcrtni graf Poskusi sam... S pomoˇcjo ukaza Custom Tables poiˇsˇci povpreˇcje spremenljivke Delovna doba glede na spremenljivki Delovno mesto in Spol. 60 6 Preurejanje spremenljivk in izbira dela podatkov 6 Preurejanje spremenljivk in izbira dela podatkov 6.1 Raˇ cunanje s spremenljivkami V postavljenih raziskovalnih vpraˇsanjih na strani 1.2 uporabljamo pojme ’Zadovoljstvo zaposlenih z delovnim okoljem’, ’Zadovoljstvo zaposlenih z delovnim okoljem in opremo’ ter ’Zadovoljstvo s tehniˇcno podporo’. Na podlagi teh raziskovalnih vpraˇsanj smo sestavili vpraˇsalnik (slika prasalnik1.1), v katerem smo posamezen pojem razdelili na veˇc vpraˇsanj. V analizi podatkov, bi radi ta vpraˇsanja na nek naˇcin zdruˇzili v novo spremenljivko. Najpogostejˇsi sta dve moˇznosti: • posamezne spremenljivke seˇstejemo (Na primer, ˇce imamo spremenljivke, ki podajajo meseˇcni stroˇsek za hrano, za oblaˇcila, za prevoz, za zabavo,... bi radi te spremenljivke samo seˇsteli, ter tako dobili skupne meseˇcne stroˇske.), • izraˇcunamo povpreˇcje spremenljivk (ter tako ohranimo podatke v istem razponu (npr. 1-5) kot so bile merjene spremenljivke). Slika 6.1: Ukaz Compute V naˇsem primeru bomo ’zadovoljstvo zaposlenih z delovnim okoljem in opremo’ izraˇcunali kot povpreˇcje desetih spremenljivk prvega vpraˇsanja. Novo spremenljivko lahko izraˇcunamo s pomoˇcjo ukaza Compute Variables, ki ga najdemo v meniju Transform (slika 6.1). SPSS: Transform → Compute Variables. Odpre se okno Variable View (slika 6.2), kjer najprej zapiˇsemo ime nove spremenljivke v oknu Target Variable. V nasem primeru smo zapisali V 1 povprecje. Pod oknom Target Variable kliknemo na gumb Type & Label, kjer zapiˇsemo pisno poimenovanje nove spremenljivke. Slika 6.2: Ukaz Compute - okno Compute Variable ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 61 Odpre se nam pogovorno okno Compute Variable: Type and Label (slika 6.3), kjer vpiˇsemo Zadovoljstvo zaposlenih z delovnim okoljem in opremo. Tip spremenljivke je ˇze avtomatiˇcno doloˇcen kot ˇstevilski (Numeric). Vpisano oznako potrdimo s klikom na gumb Continue. Slika 6.3: Ukaz Compute - dodajanje oznake nove spremenV okno Numeric Expresljivke sion zapiˇsemo formulo za izraˇcun nove spremenljivke. Oznaˇcimo prvo spremenljivko Velikost pisarne (V 1 a) ter jo s pomoˇcjo puˇsˇcice ali miˇske prenesemo v zgornje okno Numeric Expression (slika 62a). Napiˇsemo znak + spomoˇcjo spodnjih gumbov ali tipkovnice. V okno Numeric Expression prenesemo ˇse ostale spremenljivke vpraˇsanja 1, torej spremenljivke V 1 b do V 1 j, ter vmes zapiˇsemo pluse (slika 6.4b). (a) Dodajanje spremenljivke (b) Vsota spremenljivk Zapisali smo, da bomo spremenljivko Za(c) Povpreˇcje spremenljivk dovoljstvo zaposlenih z delovnim okoljem in opremo izraˇcunali kot povpreˇcje dese- Slika 6.4: Ukaz Compute - raˇcunanje povtih spremenljivk prvega vpraˇsanja. Zato preˇcja spremenljivk damo spremenljivke V 1 a do V 1 j v oklepaj (slika 6.4c) ter delimo z 10 (zapiˇsemo /10). Zapisano formulo potrdimo s klikom na gumb OK v oknu Compute Variable (slika 6.2). V oknu Variable View dobimo novo spremenljivko V 1 povprecje z zapisanim opisnim poimenovanjem Zadovoljstvo zaposlenih z delovnim okoljem in opremo v stolpcu Label (slika 6.5). Slika 6.5: Nova spremenljivka prikazana v oknu Variable Viewe 62 6 Preurejanje spremenljivk in izbira dela podatkov + + Syntax +++ ....za programerske frike :) COMPUTE V1_povprecje=(V1_a+V1_b+V1_c+V1_d+V1_e+V1_f+V1_g+V1_h+V1_i+V1_j)/10. VARIABLE LABELS V1_povprecje 'Zadovoljstvo zaposlenih z delovnim okoljem in opremo'. EXECUTE. 7 Povpreˇcje spremenljivk lahko izraˇcunamo tudi tako, da v polju Function group: okna Compute Variable (glej sliko 6.2) izberemo Statistical ter nato v spodnjem oknu Functions and Special Variables: izberemo povpreˇcje oz. Mean, Dvokliknemo na napis Mean, ki se prenese v zgornje polje Numeric Expression. Podobno kot prej moramo vnesti vse spremenljivke s pomoˇcjo katerih ˇzelimo izraˇcunati povpreˇcje nove spremenljivke, le da jih tokrat loˇcimo z vejicami: MEAN(V1 a, V1 b, V1 c, V1 d, V1 e, V1 f, V1 g, V1 h, V1 i, V1 j). Poskusi sam... Poskusi na podoben naˇcin izraˇcunati ˇse vsoto desetih spremenljivk prvega vpraˇsanja. Pomagaj si z ukazom Sum. 6.2 Preoblikovanje zvezne spremenljivke v kategorijalno Kadar ˇzelimo zvezne oziroma razmernostne spremenljivke preoblikovati v kategorialne spremenljivke, torej v doloˇceno ˇstevilo razredov, si lahko pomagamo z ukazom Visual Binning (slika 6.6); SPSS: Transform → Visual Binning. Preoblikujemo lahko tudi urejenostne spremenljivke z zdruˇzevanjem kategorij, npr. 10-stopenjsko lestvico ocenjevanja zdruˇzimo v Slika 6.6: Preoblikovanje zveznih spremenljivk - ukaz tri nove kategorije. Visual Binning ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 63 Odpre se okno prikazano na sliki 6.7. V desno okno Variables to Bin prenesemo spremenljivko Starost ter izbiro potrdimo s klikom na gumb Continue. V primeru velike koliˇcine podatkov lahko omejimo ˇstevilo pregledanih podatkov (Limit number of casses scanned), kar sicer prihrani ˇcas, vendar hkrati tudi vpliva na porazdelitev podatkov in poslediˇcno na izbiro mej novih razredov (IBM, 2011). Po kliku na gumb Continue se odpre okno priSlika 6.7: Preoblikovanje zveznih spremenljivk - izbira spre- kazano na sliki 6.8. Na menljivk levi strani okno Current Variable kaˇze seznam izbranih spremenljivk, Casses Scanned oznaˇcuje ˇstevilo prikazanih podatkov, Missing Values pa ˇstevilo enot z manjkajoˇcimi podatki. Glede na prikazani histogram se npr. odloˇcimo, da bomo spremenljivko Starost razdelili v dva razreda (histogram spremenljivke starost z oˇzjimi razredi je prikazan na sliki 3.14) in sicer na zaposlene stare 38 let in manj ter starejˇse. Izbrano mejo doloˇcimo tako, da vnesemo vrednost 38 v tabelo pod histogramom. S tem smo doloˇcili prvo mejo razreda, v katerem bodo vsi anketiranci stari ˇ ˇzelimo odprto zgornjo mejo intervala (< 38), lahko na desni 38 let ali manj (≤ 38). Ce strani v okvirˇcku Upper Endpoints oznaˇcimo moˇznost Excluded (<). Meja razreda je sedaj z rdeˇco navpiˇcno ˇcrto oznaˇcena tudi na histogramu (ˇce kliknemo nanjo, jo lahko poljubno premikamo, ˇce jo prenesemo izven obmoˇcja diagrama, jo odstranimo). V tabeli je v stolpcu Value zapisan tekst High, kar pomeni, da najveˇcja vrednost spremenljivke ˇ bi ˇzeleli veˇc razredov samo dodamo ˇse preodoloˇca zgornjo mejo zadnjega intervala. Ce stale meje razredov. Oznake razredov zapiˇsemo v stolpec Label, kjer v vrstici z vrednostjo 38 zapiˇsemo oznako 38 let ali manj, v vrstici z oznako HIGH pa veˇc kot 38 let. Na vrhu v okno Binnded Variable ter stolpec Name zapiˇsemo ime nove spremenljivke. Mi smo zapisali V 5 2sk 38, kar oznaˇcuje, da je spremenljivka preoblikovana iz spremenljivke V 4 (Starost), 2sk oznaˇcuje, da nova spremenljivka doloˇca dve skupini, vrednost 38 na koncu pa navaja mejo razdelitve. V stolpec Label lahko zapiˇsemo kar Starost, saj je to ime spremenljivke, ki se bo izpisovalo v vseh tabelah rezultatov. 64 6 Preurejanje spremenljivk in izbira dela podatkov Slika 6.8: Preoblikovanje zveznih spremenljivk - okno Visual Binning Meje razredov lahko doloˇcimo tudi s klikom na gumb Make Cutpoints, odpre se okno prikazano na sliki 6.9. Z izbiro Equal Width Intevals lahko doloˇcimo intervale enakih ˇsirin. Pri tem je potrbno nastaviti dve izmed treh moˇznosti: prvo mejo razredov (First Cutpoint Location), ˇstevilo delilnih toˇck (Number of Cutpoints), ˇsirino razredov (Width). Druga moˇznost za doloˇcitev mej razredov je enako ˇstevilo enot v vsakem razredu (Equal Percentiles Based on Scanned Cases). Pri tem je potrebno doloˇciti eno izmed naslednjih treh moˇznosti: ˇstevilo delilnih toˇck ˇ bi Slika 6.9: Preoblikovanje zveznih spremenljivk (Number of Cutpoints). Ce na primer doloˇcili tri delilne toˇcke, moˇznosti za doloˇcanje mej razredov bi dobili 4 (= 3 + 1) razrede, kjer ˇ bi vsak od njih vseboval 25% enot). Sirina intervala v odstotkih (Width (%)) oznaˇcuje ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 65 odstotek enot v vsakem razredu, torej v naˇsem primeru 25% enot. ˇ izberemo moˇznost Cutpoints at Mean and Selected Standard Deviations BaCe sed on Scanned Cases, se delilne toˇcke razredov izraˇcunajo na podlagi povpreˇcja ter ˇ ne izberemo nobenega standardnega odklona, dobimo dva rastandardnega odklona. Ce zreda in sicer so v enem enote z vrednostmi manjˇsimi ali enakimi povpreˇcju, v drugem ˇ pa izberemo pa enote, ki imajo na izbrani spremenljivki veˇcje vrednosti od povpreˇcja. Ce npr. +\− 1 Std. Deviation, dobimo ˇstiri razrede, katerih delilne toˇcke so povpreˇcje, ter povpreˇcje ± standardni odklon oziroma zapisano drugaˇce (¯ x − s, x¯, x¯ + s). Ko v oknu Visual Binning (slika 6.10) nastavitve potrdimo s klikom na gumb OK nam SPSS pokaˇze opozorilo v katerem nas opomni koliko spremenljivk bo bilo preSlika 6.10: Visual Binning - opozorilo o ˇstevilu novih spremen- urejenih v razrede (slika ljivk 6.10). V oknu Variable View dobimo torej novo preoblikovano spremenljivko Starost, torej spremenljivko z oznako V 5 2sk 38 (slika 6.11). Slika 6.11: Preoblikovanje spremenljivke Starost in dobljena nova spremenljivka v oknu Variable View Syntax + + + + + ....za programerske frike :) * Visual Binning. *V4. RECODE V4 (MISSING=COPY) (LO THRU 38.0=1) (LO THRU HI=2) (ELSE=SYSMIS) INTO V4_2sk_38. VARIABLE LABELS V4_2sk_38 'Starost'. FORMATS V4_2sk_38 (F5.0). VALUE LABELS V4_2sk_38 1 '38 let ali manj' 2 'več kot 38 let'. VARIABLE LEVEL V4_2sk_38 (ORDINAL). EXECUTE. 8 66 6 Preurejanje spremenljivk in izbira dela podatkov 6.3 Prekodiranje spremenljivk Kategorije urejenostnih spremenljivk bi veˇckrat radi ustrezno zdruˇzili. To vˇcasih zahtevajo same analize ali pa bi radi podatke prikazali v lepˇsi obliki, ˇse posebej, ˇce kakˇsna kategorija nima nobene enote oz. zelo majhno ˇstevilo enot. Ukaz za prekodiranje spremenljivk najdemo v meniju Slika 6.12: Prekodiranje spremenljivk - ukaz Recode Transform, natanˇcneje SPSS: Transform → Recode into Different Variables (slika 6.12). V oknu Recode into Different Variables izberemo najprej spremenljivko, ki jo ˇzelimo prekodirati (slika 6.13). V naˇsem primeru smo izbrali spremenljivko Izobrazba, kjer bomo zdruˇzili zadnji dve izobrazbeni skupini, ker imamo v vzorcu le dva anketiranca z magisterijem oz. doktoratom (glej rezultate na sliki 3.32). V okno na sredini (Numeric Variable → Output variable) Slika 6.13: Prekodiranje spremenljivk - izbira spretako prenesemo spremenljivko Izmenljivk obrazba. Na desni strani v okvirˇcu Output Variable za ime spremenljivke (Name) zapiˇsemo V7 3sk, kar oznaˇcuje, da bomo preoblikovali spremenljivko V 7 (Izobrazba) v tri skupine. V okvirˇcek Label zapiˇsemo opisni pomen spremenljivke, torej Izobrazba. Izbiro poimenovanja nove spremenljivke potrdimo s klikom na gumb Change. S klikom na gumb Old and New Values se nam odpre okno prikazano na sliki 6.14a . Prekodiramo lahko posamezne vrednosti, obseg vrednosti ter tudi manjkajoˇce vrednosti. Za stare vrednosti spremenljivke lahko na levi strani izberemo eno izmed naslednjih moˇznosti: • Value - posamezna vrednost, • System-missing - vrednosti, ki jih sistem oznaˇci kot manjkajoˇce in oznaˇci s piko (.), • System- or user-missing - manjkajoˇce vrednosti, ki smo jih definirali v stolpcu Missing ali vrednosti, ki jih sistem doloˇci kot manjkajoˇce ter oznaˇci s piko (.), ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 67 • Range - obseg vrednosti, kjer doloˇcimo najmanjˇso in najveˇcjo vrednost v obsegu, • Range, LOWEST through value - obseg vrednosti od najmanjˇse vrednosti v podatkih do izbrane vrednosti, • Range, value through HIGHEST - obseg vrednosti od izbrane vrednosti do najveˇcje vrednosti v podatkih, • All other values - vse ostale vrednosti, ki jih nismo doloˇcili v seznamu Old → New. Podobno lahko na desni strani nove vrednosti definiramo s ˇstevilko (Value), doloˇcimo manjkajoˇce vrednosti (System-missing) ali pa stare vrednosti le prekopiramo (Copy old values). Vrednosti spremenljivke V 7 prekodiramo na naslednji naˇcin: • Vrednost 1 spremenljivke V 7 oznaˇcuje srednjeˇsolsko izobrazbo, ˇcesar v novi spremenljivki V 7 3sk ne ˇzelimo spreminjati. Zato v polje Value zapiˇsemo v okvirˇcek na desni strani, kjer doloˇcamo vrednosti nove spremenljivke (uporabili bi lahko tudi moˇznost Copy old values, ker se vrednost ne spremeni). Izbiro potrdimo s klikom na gumb Add (slika 6.14a). (a) Posamezna vrednost • Podobno ne spreminjamo druge kategorije, ki oznaˇcuje viˇsjeˇsolsko ali visokoˇsolsko izobrazbo, zato v okno Value na levi in na desni zapiˇsemo 2. (b) Obseg vrednosti • Na koncu bi radi univerzitetno izobrazbo (v podatkih Slika 6.14: Prekodiranje spremenljivk - izbira starih kodirano s 3) ter magiste- in novih vrednosti rij oz. doktorat (v podatkih kodirano s 4) zdruˇzili. Na desni strani izberemo Range ter v prvi okvirˇcek zapiˇsemo 3, v spodnji okvirˇcek pa 4. Na levi strani zapiˇsemo v okvirˇcek New value vrednost 3 ter izbor prekodiranih vrednosti potrdimo s klikom na gumb Add (slika 6.14b). 68 6 Preurejanje spremenljivk in izbira dela podatkov Ko za vse vrednosti spremenljivke V 7 povemo, v kaj se prekodirajo, izbiro potrdimo s ˇ enkrat se pokaˇze okno s slike 6.13, kjer pritisnemo OK. klikom na gumb Continue. Se V oknu Variable View dobimo novo spremenljivko (slika 6.15). Novi spremenljivki dodamo oznake kategorij, tako da kliknemo trenutno oznako None v stolpcu Values. Odpre se nam okno prikazano na sliki 6.16. Slika 6.15: Prekodirana spremenljivka Izobrazba in dobljena nova spremenljivka v oknu Variable View V okno Valu Labels vpiˇsemo: • V polje Value zapiˇsemo 1, v polje Label ’srednjeˇsolska’, kliknemo gumb Add. • V polje Value zapiˇsemo 2, v poljeLabel ’viˇsjeˇsolska ali visokoˇsolska’, kliknemo gumb Add. • V polje Value zapiˇsemo 3, v polje Label ’univerzitetna ali veˇc’, kliknemo gumb Add. Slika 6.16: Prekodiranje spremenljivk - poimenovanje Dodane vrednosti spremenljivk kategorij potrdimo s klikom na gumb OK. Syntax + + + + + ....za programerske frike :) RECODE V6 (1=1) (2=2) (3 thru 4=3) INTO V6_3sk. VARIABLE LABELS V6_3sk 'Izobrazba'. EXECUTE. * Dodajanje oznak kategorij novi spremenljivki. VAL LAB V6_3sk 1 'srednješolska' 2 'višješolska ali visokošolska' 3 'univerzitetna ali več'. Poskusi sam... storili s pomoˇcjo ukaza Visual Binning.) 9 S pomoˇcjo ukaza Recode into different variables preoblikuj spremenljivko Starost v dve skupini: 38 let ali manj ter veˇc kot 38 let. (V poglavju 6.2 smo to ˇze ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 7 69 Testiranje hipotez 7.1 t-testi t-testi se uporabljajo za preverjanje domnev o povpreˇcjih spremenljivk. V SPSS-u jih najdemo pod SPSS: Analyze → Compare Means. Ponujene imamo tri t-teste: • za en vzorec ( One-Sample T Test), kjer preverjamo ali je povpreˇcna vrednost ene spremenljivke enaka doloˇceni hipotetiˇcni vrednosti, • za dva neodvisna vzorca (Independent-Samples T Test), kjer preverjamo ali se povpreˇcna vrednost spremenljivke razlikuje med dvema skupinama enot. • za odvisna vzorca (Paired-Samples T Test), kjer preverjamo ali je povpreˇcna vrednost ene spremenljivke enaka povpreˇcni vrednosti druge spremenljivke na isti mnoˇzici enot oziroma anketirancev. ˇ ˇzelimo preveriti ali je povpreˇcje spremenljivke enako med veˇc kot dvema skupinama Ce enot uporabimo analizo variance ali ANOVO (One-Way ANOVA). Primer uporabe najdete v poglavju 7.2. ˇ ˇzelimo le pogledati povpreˇcja neke spremenljivke (brez testiranja ustrezne domneve) Ce med veˇc skupinami lahko izberemo tudi ukaz SPSS: Analyze → Compare Means. 7.1.1 Razlike v povpreˇ cjih med dvema skupinama Zadovolstvo z delovnim okoljem in opremo glede na Spol (RV1) V prvem raziskovalnem vpraˇsanju na strani 4 smo zapisali RVl: Se zadovoljstvo zaposlenih z delovnim okoljem in opremo razlikuje glede na spol? Na podlagi raziskovalnega vpraˇsanja najprej postavimo statistiˇcni hipotezi: H0 : Povpreˇcno zadovoljstvo zaposlenih z delovnim okoljem in opremo je enako pri moˇskih in pri ˇzenskah (µM = µz ). H1 : Povpreˇcno zadovoljstvo zaposlenih z delovnim okoljem in opremo se pri moˇskih in ˇzenskah razlikuje (µM 6= µz ). Opomba: Alternativna hipoteza H1 je v tem primeru zapisana dvostransko, saj smo zapisali, da povpreˇcji pri moˇskih in ˇzenskah nista enaki. Hipotezi bomo testirali s t-testom neodvisnih vzorcev: SPSS: Analyze → Compare Means → Independent-Samples T Test (slika 7.1). 70 7 Testiranje hipotez Slika 7.1: t-test neodvisnih vzorcev - ukaz Odpre se nam pogovorno okno Independent-Samples T Test prikazano na sliki 7.2. V zgornje okno Test Variable(s) prenesemo spremenljivko Zadovoljstvo z delovnim okoljem in opremo 4 z oznako V 1 povprecje. V spodnje okno Grouping Variable prenesemo spremenljivko Spol. V oknu Grouping Variable se nam izpiˇse oznaka V4(? ?), kar oznaˇcuje, da moramo ˇse definirati oznake skupin. Slika 7.2: Izbira spremenljivk v t-testu neodvisnih vzorcev Syntax + + + + + T-TEST GROUPS=V4(1 2) /MISSING=ANALYSIS /VARIABLES=V1_povprecje /CRITERIA=CI(.95). 4 ....za programerske frike :) 10 Spremenljivka Zadovoljstvo z delovnim okoljem in opremo je dobljena kot povpreˇcje 10 spremenljivk prvega vpraˇsanja, glej pogalvje 6.1 ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 71 Ko kliknemo na gumb Define Groups se odpre okno prikazano na sliki 7.3. Na vpraˇsalniku (slika 2.4) smo ˇzenske oznaˇcili z 1 in moˇske z 2, zato v okno Define Groups zapiˇsemo 1 v polje Group 1 in 2 v polje Group 2. Izbiro potrdimo s klikom na gumb Continue ter s klikom na gumb OK v oknu Independent-Samples T Test (slika 7.2). S klikom na gumb Options lahko nastavimo, kakˇsen in- Slika 7.3: Doloˇcitev skupin pri terval zaupanja za razliko povpre´cij ˇzelimo (slika 7.4). t-testu neodvisnih vzorcev Privzeto je nastavljen 95% interval zaupanja, izberemo lahko seveda tudi kakˇsno drugo vrednost. V okvirˇcku Missing Values lahko nastavimo, na kakˇsen naˇcin naj bodo vkljuˇcene enote z manjkajoˇcimi vrednostmi. Excluded cases analysis by analysis pomeni, da bo enota izkljuˇcena iz analize, ˇce bo imela manjkajoˇco vrednost na obravnavani spremenljivki. Izbira Excluded cases listwise pomeni, da bo enota izkluˇcena iz analize, ˇce ima manjkajoˇco vrednost pri vsaj eni izmed spremenljivk, katerih povpreˇcja ˇzelimo primerjati (kadar v oknu Target Variable(s) izberemo veˇc spremenljivk Slika 7.4: t-test neodvisnih vzorcev - izbira intervala zaupanja hkrati). Rezultati t-testa neodvisnih vzorcev se v oknu Output izpiˇsejo v dveh tabelah. V prvi tabeli so predstavljene opisne statistike (slika 7.5), v drugi pa rezultati t-testa (slika 7.6). Iz tabele z opisnimi statistikami razberemo, da je povpreˇcno zadovoljstvo ˇzensk z delovnim okoljem in opremo enako 3,38 (s = 0.265), moˇskih Slika 7.5: Opisne statistike pri t-testu za spremenljivki Zado- pa 3,41 (s = 0.354). Da voljstvo zaposlenih z delovnim okoljem in opremo glede na Spol bi lahko iz teh rezultatov na vzorcu odgovorili ali je zadovoljstvo zaposlenih z delovnim okoljem in opremo enako v celotem podjetju (oz. sploˇsno v populaciji), potrebujemo rezultate t-testa. Pri t-testu neodvisnih vzorcev se testna statistika t izraˇcuna drugaˇce, ˇce so variance med skupinama enake oziroma ˇce so le-te razliˇcne. V SPSS-u dobimo izpisani obe moˇznosti in moramo sami izbrati pravo. Prvi del tabele na sliki 7.6 predstavlja rezultate Levene- 72 7 Testiranje hipotez ovega testa enakosti varianc (Levene’s Test for Equality of Variances). Glede na to, ali sprejmemo ali zavrnemo niˇcelno domnevo o enakosti varianc, izberemo ustrezno vrstico v tabeli pri rezultatih t-testa neodvisnih vzorcev (t-test for Equality of Means). Kako formalno zapiˇsemo statistiˇcni hipotezi pri Levene-ovem testu si oglej v okvirˇcku na 7.1.1. Kako postavimo hipotezi pri Levene-ovem testu? H0 : Varianci spremenljivke Zadovoljstvo zaposlenih z delovnim okoljem in opremo 2 sta enaki v obeh skupinah (σM = σZ2 ). H1 : Varianci spremenljivke Zadovoljstvo zaposlenih z delovnim okoljem in opremo 2 sta v skupinah razliˇcni (σM 6= σZ2 ) ˇ je p-vrednost (angl. significance, oznaka Sig.) Levene-ovega testa enakosti varianc: Ce • veˇcja od 0.05, niˇcelno domnevo o enakosti varianc sprejmemo pri 5% stopnji znaˇcilnosti5 (α = 0.05)6 . V tem primeru gledamo pri rezultatih t-testa prvo vrstico (Equal variances assumed, sl. predpostavljene enake variance). • manjˇsa od 0.05, niˇcelno domnevo o enakosti varianc zavrnemo pri 5% tveganju (α = 0.05). V tem primeru gledamo pri rezultatih t-testa drugo vrstico (Equal variances not assumed, sl. predpostavljene razliˇcne variance). V naˇsem primeru lahko torej zapiˇsemo naslednji sklep (slika 7.6): Na podlagi Levene-ovega testa ne moremo zavrniti niˇcelne domnevo o enakosti varianc pri 5% stopnji znaˇcilnosti, saj je p-vrednost enaka 0.283 > 0.05 (F = 1.168). p-vrednost7 t-testa enakosti povpreˇcij je enaka 0.645 > 0.05 (tsp=72 = −0.422), torej niˇcelne domneve o enakosti povpreˇcij ne moremo zavrniti pri 5% stopnji znaˇcilnosti, kar pomeni, da ni statistiˇcno znaˇcilnih razlik v povpreˇcni oceni zadovoljstva zaposlenih z delovnim okoljem in opremo med moˇskimi in ˇzenskami. To hkrati pomeni, da je odgovor na prvo raziskovalno vpraˇsanje (Se zadovoljstvo zaposlenih z delovnim okoljem in opremo razlikuje glede na spol?) negativen. 5 Vˇcasih uporabimo tudi izraz 5% tveganje namesto stopnja znaˇcilnosti. Poleg stopnje znaˇcilnosti α = 0.05 se v druˇzboslovnih raziskavah vˇcasih uporabi tudi α = 0.01 ali α = 0.10, kar je odvisno od tega, kakˇsno tveganje privzamemo, da zavrnemo pravilno niˇcelno domnevo. Stopnjo tveganja nastavimo v oknu moˇznosti (Options), glej sliko 7.4 7 V tabeli, ki jo izpiˇse SPSS, je zapisana oznaka Sig. (2-tailed), kar pomeni, da je kritiˇcno obmoˇcje zavrnitve niˇcelne domneve sestavljene iz dveh delov. V tem primeru je to v redu, saj smo v alternativni domnevi zapisali, da povpreˇcji nista enaki (6=), kar pomeni, da moramo izbrati dvostranski test. 6 ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u Levene-ov test enakosti varianc 73 t-test enakosti povprečij Slika 7.6: Rezultati t-testa za spremenljivki Zadovoljstvo zaposlenih z delovnim okoljem in opremo in Spol Vˇcasih moramo vse izraze v tabeli prevesti v slovenˇsˇcino. Veˇcino izrazov smo zapisali ˇze zgoraj, preostali so navedeni v nadaljevanju: • df (angl. degrees of freedom); slovenski prevod je stopinje prostosti in okrajˇsava sp, • Mean Diference; slovenski prevod je povpreˇcna razlika, • Std. Error Difference; slovenski prevod je standardna napaka razlike, • 95% Confidence Interval of the Difference; slovenski prevod je 95% interval zaupanja za razliko, • Lower; slovenski prevod je spodnja meja, • Upper; slovenski prevod je zgornja meja. Zadovoljstvo s fotokopirnim strojem glede na spol (RV2) Poglejmo si ˇse primer, kjer uporabimo enostranski test za neodvisne vzorce. V drugem raziskovalnem vpraˇsanju (RV2) so v podjetju zapisali (stran 4): Moˇski so bolj zadovoljni s fotokopirnimi stroji, ki jih imamo v podjetju, kot ˇzenske. V tem primeru niˇcelno domnevo zapiˇsemo podobno kot prej, alternativno domnevo pa zapiˇsemo pa s pomoˇcjo neenaˇcaja: H0 : Moˇski in ˇzenske so v povpreˇcju enako zadovoljni s fotokopirnimi stroji (µM = µz ). H1 : Moˇski so v povpreˇcju bolj zadovoljni s fotokopirnimi stroji kot ˇzenske (µM > µz ). 74 7 Testiranje hipotez Podobno kot prej izberemo test z ukazom SPSS: Analyze → Compare Means → IndependentSamples T Test. Za testno spremenljivko (Test Variable(s)) v tem primeru izberemo spremenljivko V 1 i, medtem ko je spremenljivka, ki doloˇca skupini (Grouping Variable) enaka kot v prejˇsnjem primeru, torej Spol. Pri doloˇcitvi skupin moramo v tem primeru nekoliko paziti, saj moramo za prvo skupino izbrati moˇske, za drugo Slika 7.7: Doloˇcitev skupin v pa ˇzenske, ker smo alternativno hipotezo zapit-testu neodvisnih vzorcev pri sali kot µM > µZ . V okno Define Groups RV2 vpiˇsemo torej najprej 2 in v spodnje okno 1 (slika 7.7). Syntax + + + + + T-TEST GROUPS=V4(2 1) /MISSING=ANALYSIS /VARIABLES=V1_i /CRITERIA=CI(.95). ....za programerske frike :) 11 V izpisu rezultatov (okno Output) dobimo najprej tabelo opisnih statistik (slika 7.8), iz katere razberemo naslednje: Moˇski so v povSlika 7.8: Opisne statistike za spremenljivko Zadovoljstvo s preˇcju ocenili zadovoljfotokopirnim strojem glede na Spol stvo s fotokopirnim strojem s povpreˇcno oceno 3.93 (s = 1.26), ˇzenske pa niˇzje in sicer s povpreˇcno oceno 3.45 (s = 0.72). V naˇsem primeru lahko torej na podlagi rezultatov (slika 7.9) zapiˇsemo naslednji sklep: Na podlagi Levenovega-testa zavrnemo niˇcelno domnevo enakosti varianc pri 5% stopnji znaˇcilnosti, saj je p-vrednost enaka 0.005 < 0.05 (F = 8.263). Glede na zgornji sklep bomo torej pri t-testu enakosti povpreˇcij gledali drugo vrstico tabele (Equal variances not assmed). Ker smo pri alternativni hipotezi uporabili neenaˇcaj, moramo uporabiti enostranski test. V tabeli piˇse Sig. (2-tailed), kar pomeni, da moramo dobljeno p-vrednost iz tabele deliti z 2: p = 0.043 = 0.022. Sklep o enakosti 2 povpreˇcij je zapisan v nadaljevanju. Na podlagi rezultatov t-testa (slika 7.9) niˇcelno domnevo o enakosti povpreˇcij zavrnemo pri 5% stopnji znaˇcilnosti (p = 0.022 < 0.05, tsp=72 = 2.063), kar pomeni, da so moˇski povpreˇcju statistiˇcno znaˇcilno bolj zadovoljni s fotokopirnim strojem (¯ x = 3.9) kot ˇzenske ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 75 :2, ker imamo enostranski test Levene-ov test enakosti varianc t-test enakosti povprečij Slika 7.9: Rezultati t-testa za spremenljivko Zadovoljstvo s fotokopirnim strojem in dve skupini glede na Spol (¯ x = 3.5), kar pomeni da lahko raziskovalno vpraˇsanje RV2 (Moˇski so bolj zadovoljni s fotokopirnimi stroji, ki jih imamo v podjetju, kot ˇzenske.) potrdimo. Zadovoljstvo zaposlenih s programsko opremo glede na starostni skupini (RV6) V obeh do sedaj predstavljenih t-testih smo kot spremenljivko, ki doloˇca dve skupini vzeli ˇ pogledamo vpraˇsalnik na strani 6, na prvi pogled izgleda, da je spremenljivko Spol. Ce to tudi edina spremenljivka, ki nam anketirance deli na dve skupini. Vendar pa lahko izmerjene spremenljivke tudi preuredimo kot smo videli v poglavju 60. Tako npr. preurejeno spremenljivko Starost potrebujemo v ˇsestem raziskovalnem vpraˇsanju (glej stran 4), kjer nas zanima ali so starejˇsi res manj zadovoljni s programsko opremo. Kako bomo doloˇcili mlajˇse in starejˇse zaposlene seveda ni natanˇcno doloˇceno. Smiselno je, da v takˇsnem in podobnih primerih uporabimo vnaprej znane definicije oz. kriterije ali pa vsaj smiselno delitev glede na trenutne podatke. V naˇsem primeru bomo uporabili spremenljivko Starost preoblikovano v dve skupini, kot zapisano na strani 6.2. Glede na raziskovalno vpraˇsanje RV6: Ali so starejˇsi res manj zadovoljni s programsko opremo? postavimo statistiˇcni hipotezi: postavimo statistiˇcni hipotezi: H0 : Mlajˇsi zaposleni (do vkljuˇcno 38 let) in starejˇsi zaposleni (39 let ali starejˇsi) so v povpreˇcju enako zadovoljni s programsko opremo (µdo38 = µnad39 ). H1 : Mlajˇsi zaposleni (do vkljuˇcno 38 let) so bolj zadovoljni s programsko opremo kot starejˇsi zaposleni (39 let ali starejˇsi) (µdo38 > µnad39 ). Ker predvidevamo, da so mlajˇsi zaposleni bolj zadovoljni s programsko opremo v podjetju, smo alternativno hipotezo postavili enostransko. Z ukazom SPSS: Analyze → Compare Means → Independent-Samples T Test izberemo ustrezen test neodvisnih vzorcev. Za testno spremenljivko (Test Variable(s)) 76 7 Testiranje hipotez v tem primeru izberemo spremenljivko V1 g (Programska oprema), medtem ko za spremenljivko, ki doloˇca skupini (Grouping Variable) izberemo spremenljivko V5 2sk 38. Pri doloˇcitvi skupin (Define Groups) za oznako prve skupine vtipkamo 1, za doloˇcitev druge pa 2. Syntax + + + + + ....za programerske frike :) T-TEST GROUPS=V5_2sk_38(1 2) /MISSING=ANALYSIS /VARIABLES=V1_g /CRITERIA=CI(.95). 12 V izpisu rezultatov Output dobimo najprej tabelo opisnih statistik (slika 7.10). iz katere razberemo, da so mlajˇsi zapoSlika 7.10: Opisne statistike za spremenljivko Zadovoljstvo s sleni ocenili zadovoljstvo s programsko opremo s programsko opremo glede na dve starostni skupini povpreˇcjem 4.4 (s = 0.59), medtem ko so starejˇsi zaposleni (39 let in veˇc) ocenili zadovoljstvo s programsko opremo s povpreˇcjem 2.7 (s = 0.84). Sklep: Na podlagi Levenovega-testa (slika 7.11) sprejmemo niˇcelno domnevo o enakosti varianc pri 5% stopnji znaˇcilnosti, saj je p-vrednost enaka 0.052 > 0.05 (F = 3.914). Glede na zgornji sklep bomo torej pri t-testu enakosti povpreˇcij gledali prvo vrstico tabele (Equal variances assumed). Ker smo pri alternativni hipotezi uporabili neenaˇcaj, moramo uporabiti enostranski test. V tabeli piˇse Sig. (2-tailed), kar pomeni, da moramo dobljeno p-vrednost iz tabele deliti z 2: p = 0.000 = 0.000. Sklep o enakosti povpreˇcjih je 2 zapisan v nadaljevanju. :2, ker imamo enostranski test Levene-ov test enakosti varianc t-test enakosti povprečij Slika 7.11: Rezultati t-testa za spremenljivko Zadovoljstvo s programsko opremo in dve skupini glede na Starost Na podlagi rezultatov t-testa (slika 83) niˇcelno domnevo o enakosti povpreˇcij zavrnemo pri 5% stopnji znaˇcilnosti (p = 0.000 < 0.05, tsp=72 = 9.858), kar pomeni, da so mlajˇsi ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 77 zaposleni (do vkljuˇcno 38 let) v povpreˇcju bolj zadovoljni s programsko opremo (¯ x = 4.4) kot starejˇsi zaposleni (¯ x = 2.7), kar pomeni, da lahko na ˇsesto raziskovalno vpraˇsanje (Ali so starejˇsi res manj zadovoljni s programsko opremo?) odgovorimo pritrdilno. 7.1.2 Testiranje populacijskega povpreˇ cja Poglejmo, kako bi odgovorili na ˇstirinajsto raziskovalno vpraˇsanje RV13: Ali je povpreˇcna starost zaposlenih v podjetju niˇzja od 40 let? Na podlagi raziskovalnega vpraˇsanja najprej postavimo statistiˇcni hipotezi: H0 : Povpreˇcna starost zaposlenih v podjetju je 40 let. (µ = 40). H1 : Povpreˇcna starost zaposlenih v podjetju je niˇzja od 40 let (µ < 40). Alternativna hipoteza H1 je tudi v tem primeru zapisana enostransko, saj smo zapisali, ˇ bi alternativno hipotezo zapisali kot µ 6= 40, da je povpreˇcna starost niˇzja od 40 let. Ce potem bi morali uporabiti dvostranski test. Hipoteze bomo testirali s t-testom za testiranje populacijskih povpreˇcij oziroma s t-testom za en vzorec. V SPSS-u najdemo test pod Analyze → Compare Means → One Sample T Test (slika 7.12). Slika 7.12: t-test za en vzorec - ukaz Odpre se okno prikazano na sliki 7.13. V zgornje okno Test Variable (s) prenesemo spremenljivko Starost. Testna vrednost (Test Value) je privzeto nastavljena na 0, kar glede na postavljeni hipotezi spremenimo v 40. s klikom na gumb Options lahko nastavimo interval zaupanja podobno kot pri Slika 7.13: t-test za populacijsko povpreˇcje za spremenljivko testu neodvisnih vzorcev (slika 7.4). Starost 78 7 Testiranje hipotez V prikazu rezultatov (okno Output) dobimo najprej tabelo opisnih statistik (slika 7.15), iz katere razberemo, da je povpreˇcna starost 74 anketi- Slika 7.14: t-test za populacijsko povpreˇcje za spremenljivko rancev 38.3 leta s stan- Starost - opisne statistike dardnim odklonom 7.6 let. :2, ker imamo enostranski test Slika 7.15: Rezultati t-testa za populacijsko povpreˇcje spremenljivke Starost Rezultati t-testa so prikazani v tabeli na sliki 7.15. Ker smo alternativno domnevo zapisali enostransko, moramo p-vrednost iz tabele (Sig. (2-tailed)) deliti z 2; p = 0.054 = 0.027. 2 Zapiˇsemo lahko naslednji sklep: p-vrednost enostranskega t-testa je enaka 0.027 < 0.05 (tsp=73 = −1.961), torej niˇcelno domnevo zavrnemo pri 5% stopnji znaˇcilnosti. To pomeni, da je povpreˇcna starost zaposlenih v podjetju niˇzja od 40 let, kar pomeni, da lahko na naˇse trinajsto raziskovalno vpraˇsanje odgovorimo pritrdilno. Syntax + + + + + ....za programerske frike :) T-TEST /TESTVAL=40 /MISSING=ANALYSIS /VARIABLES=V4 /CRITERIA=CI(.95). Poskusi sam... pretirajte dobljene rezultate.) 13 S pomoˇcjo ustreznih t-testov odgovorite na raziskovalna vpraˇsanja RV3, RV4, RV5 in RV7. Postavite ustrezni statistiˇcni hipotezi, izvedite analizo ter inter- ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 7.1.3 79 Primerjanje povpreˇ cij dveh spremenljivk (parni t-test) Kadar ˇzelimo primerjati povpreˇcji dveh spremenljivk, kot v primeru osmega raziskovalnega vpraˇsanja, to storimo s parnim t-testom. RV8: Ali se zadovoljstvo zaposlenih s tiskalnikom razlikuje od zadovoljstva zaposlenih s telefonom? Na podlagi raziskovalnega vpraˇsanja postavimo naslednji statistiˇcni hipotezi: H0 : Povpreˇcno zadovoljstvo zaposlenih s tiskalnikom je enako povpreˇcnemu zadovoljstvu zaposlenih s telefonom (µtisk = µtel ). H1 : Povpreˇcno zadovoljstvo zaposlenih s tiskalnikom ni enako povpreˇcnemu zadovoljstvu zaposlenih s telefonom (µtisk 6= µtel ). Parni t-test najdemo v SPPS-u pod Analyze → Compare Means → Paired-Samples T Test (slika 7.16). Slika 7.16: Parni t-test - ukaz Odpre se okno Paires-Samples T Test (slika 7.17), kjer v desno polje Paired Variables v prvo vrstico, ki doloˇca en par spremenljivk, prenesemo najprej spremenljivko Tiskalnik (V1 h) v stolpec Variable 1. V zadnji stolpec Variable 2 pa prenesemo spremenljivko Telefon (V1 j). S klikom na gumb Options bi lahko nastavili ˇse interval zaupanja, privzeto je nastavljen 95% interval zaupanja. Izbiro potrdimo s klikom na gumb OK. Besedilni apis ukaza je predstavljen v spodnjem okvirˇcku. Syntax + + + + + ....za programerske frike :) T-TEST PAIRS=V1_h WITH V1_j (PAIRED) /CRITERIA=CI(.9500) /MISSING=ANALYSIS. 14 80 7 Testiranje hipotez Slika 7.17: Parni t-test - izbira spremenljivk V izpisu rezultatov (okno Output) dobimo izpisane najprej opisne statistike za obe spremenljivki. Povpreˇcno zadovoljstvo 74 anketirancev s tiskalnikom je 3.6 s standardnim odklonom Slika 7.18: Opisne statistike za spremenljivki Tiskalnik in Te0.908, povpreˇcno zado- lefon voljstvo s telefonom pa je nekoliko viˇsje, in sicer je enako 4.0 s standardnim odklonom 0.702 (slika 7.18). V naslednji tabeli dobimo izpisan koeficient korelacije8 med obema spremenljivkama. Le-ta je enak -0.083, vendar ni statistiˇcno znaˇcilen pri 5% tveganju, saj je pSlika 7.19: Opisne statistike za spremenljivki Tiskal- vrednost enaka 0.481>0.05. (slika nik in Telefon 7.19). Rezultati parnega t-testa so predstavljeni v tabeli Paired Samples Test na sliki 7.20. Zapiˇsemo lahko naslednji sklep: p-vrednost parnega t-testa je enaka 0.005<0.05 (t = −2.924, sp = 73), torej niˇcelno domnevo o enakosti povpreˇcij obeh spremenljivk zavrnemo pri 5% tveganju. Med povpreˇcnim zadovoljstvom zaposlenih s tiskalnikom in povpreˇcnim zadovoljstvom s telefonom obstajajo torej statistiˇcno znaˇcilne razlike. Odgovor na osmo raziskovalno vpraˇsanje (Ali se zadovoljstvo zaposlenih s tiskalnikom razlikuje od zadovoljstva zaposlenih s telefonom?) je torej pritrdilen. 8 Izraˇcun koeficienta korelacije in njegova interpretacija sta predstavljena v poglavju 7.3.2 . ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 81 Slika 7.20: Rezultati parnega t-testa za spremenljivki Tiskalnik in Telefon 7.2 ANOVA Kadar ˇzelimo primerjati povpreˇcja med veˇc kot dvema skupinama ne moremo uporabiti t-testa, paˇc pa uporabimo analizo variance ali krajˇse ANOVO. 7.2.1 Homogene variance med skupinami in statistiˇ cno neznaˇ cilne razlike v povpreˇ cju spremenljivke med skupinami Pri naˇctovanju raziskave na strani 4 smo si zastavili naslednje raziskovalno vpraˇsanje (RV10): Se zadovoljstvo zaposlenih z opremo razlikuje glede na oddelek v podjetju? Na podlagi raziskovalnega vpraˇsanja postavimo najprej statistiˇcni hipotezi: H0 : Povpreˇcno zadovoljstvo zaposlenih z opremo je enako v vseh petih oddelkih v podjetju (µA = µOP = µKS = µP S = µIT ). H1 : Povpreˇcno zadovoljstvo zaposlenih z opremo se v vsaj enem oddelku razlikuje od ostalih (µi 6= µj , za i, j ∈ {A, OP, KS, P S, IT }9 ). Analizo variance najdemo v SPPS-u pod Analyze → Compare Means → One-Way ANOVA (slika 7.21). Slika 7.21: Analiza variance (ANOVA) - ukaz 9 V vpraˇsalniku na strani 6 imamo navedenih pet oddelkov: A - administracija, OP - oddelek prodaje, KS- kadrovska sluˇzba, P S - pravna sluˇzba, IT - IT oddelek 82 7 Testiranje hipotez Odpre se nam okno OneWay ANOVA prikazano na sliki 7.22. V desno zgornje polje Dependent list prenesemo spremenljivko katere povpreˇcja nas zanimajo, v naˇsem primeru torej spremenljivko z oznako V1 b - Oprema pisarne. V spodnje polje Factor prenesemo spremenljivko, ki doloˇca skupine, torej Delovno mesto (V 8). Nato kliknemo na gumb Options, kjer bomo izberali razliˇcne moˇznosti izpisa. Slika 7.22: ANOVA - izbira spremenljivk Odpre se nam okno One-Way ANOVA: Options, kjer pod oznako Statistics izberemo opisne statistike (Descriptive), test homogenosti varianc po skupinah (Test of Homogeneity of variance test) in, ˇce ˇzelimo, tudi graf povpreˇcij (Means plot) (slika 7.23). Izbiro potrdimo s klikom na gumb Apply. V izpisu rezultatov (okno Output) se najprej izpiˇseju ukazi (glej okvirˇcek Syntax 7.15), v nadaljevanju pa so izpisane opisne statistike za spremenljivko Oprema pisarne glede na oddelek podjetja (slika 7.24). Slika 7.23: Izbira moˇznosti pri ANOVI ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u Syntax + + + + + 83 ....za programerske frike :) ONEWAY V1_b BY V7 /STATISTICS DESCRIPTIVES HOMOGENEITY /PLOT MEANS /MISSING ANALYSIS. 15 Iz tabele z opisnimi statistikami najprej razberemo, da je na anketo odgovorilo 19 zaposlenih iz administracije, 12 iz oddelka prodaje, po 14 zaposlenih iz kadrovske sluˇzbe in pravne sluˇzbe ter 15 zaposlenih iz IT oddelka. Z opremo pisarne so najbolj zadovoljni v oddelku prodaje (¯ x = 3.08), sledi pravna sluˇzba (¯ x = 3.07) in kadrovska sluˇzba (¯ x = 2.86), ˇ pogledamo stolpec s najmanj zadovoljni pa so zaposleni v administraciji (¯ x = 2.47). Ce standardnim odklonom (Std. Deviation) ugotovimo, da so odgovori glede zadovoljstva z opremo pisarne najmanj razprˇseni v kadrovski sluˇzbi (s = 1.027), najbolj pa v IT oddelku (s = 1.457). Zanimiva je ˇse ugotovitev, da nihˇce med anketiranci iz administracije in kadrovske sluˇzbe ni ocenil opreme pisarne z ocene 5 - zelo zadovoljen (stolpec Maximum). Slika 7.24: Opisne statistike za spremenljivko Oprema pisarne glede na oddelek v podjetju Naslednji izpis je test homogenosti varianc med skupinami Test of Homogeneity of Variances (slika 7.25). V okvirˇcku si lahko ogledate, kako bi formalno zapisali statistiˇcni hipotezi za test homogenosti varianc med skupani. Na podlagi izpisa na sliki 7.25 pa lahko zapiˇsemo naslednji sklep: p-vrednost testa homogenosti vari- Slika 7.25: Test homogenosti varianc za spreanc je 0.474 > 0.05, torej niˇcelne domneve menljivko Oprema pisarne in skupine glede o enakosti varianc ne moremo zavrniti pri na oddelek podjetja 5% tveganju. To pomeni, da lahko nadaljujemo z interpretacijo tabele ANOVA (slika 7.26). 84 7 Testiranje hipotez Kako postavimo hipotezi pri Levene-ovem testu v primeru ANOVE? H0 : Variance spremenljivke Oprema pisarne so enake v vseh petih skupinah glede 2 2 2 na oddelek v podjetju (σA2 = σOP = σKS = σP2 S = σIT ). H1 : Vsaj dve varianci spremenljivke Oprema pisarne se razlikujeta od ostalih (σi2 6= σj2 , za i, j ∈ {A, OP, KS, P S, IT }. Rezultati ANOVE so prikazani na sliki 7.26), in sicer lahko zapiˇsemo naslednji sklep: p-vrednost analize variance je enaka 0.608¿0.05, torej niˇcelne domneve o enakosti povpreˇcnega zadovoljstva z Slika 7.26: Rezultati ANOVE za spremenljivki Oprema pisarne opremo pisarne glede na in in skupine glede na oddelek podjetja oddelek v podjetju ne moremo zavrniti pri 5% tveganju. Odgovor na naˇse deseto raziskovalno (Se zadovoljstvo zaposlenih z opremo razlikuje glede na oddelek v podjetju?) je torej negativen; med oddelki v podjetju namreˇc ni statistiˇcno znaˇcilnih razlik v zadovoljstvu zaposlenih z opremo pisarne. V primeru, da smo v oknu One-Way ANOVA: Options na sliki 7.23 izbrali izris povpreˇcij (Means Plot) dobimo v oknu z rezultati (Output) ˇse graf prikazan na sliki 7.27. Na podlagi tega grafa bi na prvi pogled najbrˇz rekli, da so velike razlike v povpreˇcnem zadovoljstvu zaposlenih z opremo pisarne predvsem med administracijo in oddelkom prodaje. Vendar pa je ta slika nekoliko popaˇcena, saj je lestvica na y-osi med 2.4 in 3.1 in ne med 1 in 5, tako kot v ˇ ˇzelimo povpraˇsalniku. Ce praviti razpon vrednosti dvo- Slika 7.27: Prikaz povpreˇcij za spremenljivko Oprema pikliknemo na vrednosti na y- sarne glede na oddelek podjetja osi. Odpre se okno Chart ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 85 Editor, kjer ˇse enkrat dvokliknemo na y-os. Odpre se nam okno Properties, kjer v zavihku Scale doloˇcimo najniˇzjo vrednost na y-osi z 1 (vrednost vpiˇsemo v polje Custom v vrstici Minimum) in najviˇsjo s 5 Custom v vrstici Maximum). Izbiro potrdimo s klikom na gumb Apply, nato pa ˇse zapremo okno Chart Editor (s klikom na x desno zgoraj). Na grafu lahko popravimo tudi besedilona obeh oseh in sicer tako, da kliknemo na samo besedilo v oknuChart Editor ter vnesemo ustrezne spremembe. Na sliki 7.29 je prikazan graf s popra- Slika 7.28: Rezultati ANOVE za spremenvljeno lestvico in slovenskim napisom na ljivki Oprema pisarne in in skupine glede na oddelek podjetja y-osi. Slika 7.29: Prikaz povpreˇcij za spremenljivko Oprema pisarne glede na oddelek podjetja - popravljen graf 86 7.2.2 7 Testiranje hipotez Homogene variance med skupinami in statistiˇ cno znaˇ cilne razlike v povpreˇ cju spremenljivke med skupinami Med raziskovalnimi vpraˇsanji na strani 4 smo si zastavili tudi naslednje raziskovalno vpraˇsanje (RV11): Se zadovoljstvo zaposlenih z velikostjo pisarne razlikuje glede na oddelek v podjetju? Na podlagi raziskovalnega vpraˇsanja postavimo statistiˇcni hipotezi: H0 : Povpreˇcno zadovoljstvo zaposlenih z velikostjo pisarne je enako v vseh petih oddelkih v podjetju (µA = µOP = µKS = µP S = µIT ). H1 : Povpreˇcno zadovoljstvo zaposlenih z velikostjo pisarne se v vsaj enem oddelku razlikuje od ostalih (µi 6= µj , za i, j ∈ {A, OP, KS, P S, IT }). Tako kot v prejˇsnjem primeru test izberemo Analyze → Compare Means → One-Way ANOVA (slika 7.21). Odpre se okno OneWay ANOVA, kjer V zgornje polje Dependent List prenesemo spremenljivko Velikost pisarne (V1 a), v spodnje pole Factor pa tako kot prej spremenljivko Delovno mesto (slika 7.30). S klikom na gumb OptiSlika 7.30: ANOVA - izbira spremenljivk ons izberemo opisne statistike, test homogenosti varianc in, ˇce ˇzelimo, ˇse graf povpreˇcij (glej sliko 7.23). V izpisu rezultatov (okno Output) so najprej prikazane opisne statistike (slika 7.31). Tako kot prej iz tabele z opisnimi statistikami najprej razberemo, da je na anketo odgovorilo 19 zaposlenih iz administracije, 12 iz oddelka prodaje, po 14 zaposlenih iz kadrovske sluˇzbe in pravne sluˇzbe ter 15 zaposlenih iz IT oddelka. Z velikostjo pisarne so najbolj zadovoljni v administraciji (¯ x = 4.0), sledi kadrovska sluˇzba (¯ x = 3.9) in pravna sluˇzba (¯ x = 3.07), najmanj zadovoljni pa so zaposleni v oddelku prodaje (¯ x = 1.9) in IT oddelku ˇ (¯ x = 2.1). Ce pogledamo stolpec s standardnim odklonom (Std. Deviation) ugotovimo, da so odgovori glede zadovoljstva z velikostjo pisarne najmanj razprˇseni v oddelku prodaje (s = 0.669), najbolj pa v pravnem oddelku (s = 0.915). Zanimiva je ˇse ugotovitev, da je bila najviˇsja ocena velikosti pisarne enaka 3 (stolpec Maximum). ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 87 Slika 7.31: Opisne statistike za spremenljivko Velikost pisarne glede na oddelek v podjetju Rezultati testa homogenosti varianc med skupinami Test of Homogeneity of Variances so prikazani na sliki 7.32). Zapiˇsemo naslednji sklep: p-vrednost testa homogenosti varianc je 0.586 > 0.05, torej niˇcelne domneve o enakosti varianc ne moremo zavrniti pri 5% tvega- Slika 7.32: Test homogenosti varianc za sprenju. To pomeni, da lahko nadalju- menljivko Velikost pisarne in skupine glede jemo z interpretacijo tabele ANOVA (slika na oddelek podjetja 7.33). Na podlagi rezultatov ANOVE (slika 7.33) zapiˇsemo naslednji sklep: pvrednost analize variance je enaka 0.000¡0.05, torej niˇcelno domnevo o enakosti povpreˇcnega zadovoljstva zaposlenih z Slika 7.33: Rezultati ANOVE za spremenljivki Velikost pisarne velikostjo pisarne glede in skupine glede na oddelek podjetja na oddelek v podjetju zavrnemo pri 5% tveganju. Odgovor na naˇse enajsto raziskovalno (Se zadovoljstvo zaposlenih z velikostjo pisarne razlikuje glede na oddelek v podjetju?) je torej pozitiven; med oddelki v podjetju namreˇc obstajajo statistiˇcno znaˇcilne razlike v zadovoljstvu zaposlenih z velikostjo pisarne. Ker smo ugotovili, da obstajajo statistiˇcno znaˇcilne razlike v zadovoljstvu zaposlenih z velikostjo pisarne, nas v nadaljevanju zanima ˇse, med katerimi oddelki prihaja do razlik. V ta namen izvedemo tako imenovane multiple (ali veˇckratne) primerjave. Smernice, kateri test izbrati, najdete v okvirˇcku na strani 7.2.2. Glede na navedene smernice izberemo ˇ ustrezni test na podlagi velikosti skupin in predpostavke o homogenosti varianc. Ce pogledamo tabelo z opisnimi statistikami (slika 7.31 ugotovimo, da se velikosti skupin (oz. anketirancev po oddelkih) nekoliko razlikujejo, hkari pa je izpolnjena predpostavka o enakosti varianc med skupinami (slika 7.32). Na podlagi smernic iz okvirˇcka na strani 88 bomo torej v naˇsem primeru izvedli Gabriel-ov postopek. 88 7 Testiranje hipotez Kateri test izbrati v primeru, ko pri ANOVI ugotovimo, da med skupinami obstajajo statistiˇ cno znaˇ cilne razlike v povpreˇ cju neke spremenljivke? Smernice za izbiro testa (Field, 2009, str. 388): ˇ so skupine enako velike in je izpolnjen pogoj o homogenosti varianc med • Ce skupinami uporabimo REGWQ ali Tukey-jev HSD. ˇ se velikosti skupin nekoliko razlikujejo, uporabimo Gabriel-ov postopek. • Ce ˇ so velikosti skupin zelo razliˇcne in je izpolnjen pogoj o homogenosti varianc, • Ce uporabimo Hochberg’s GT2. ˇ predpostavka o enakosti varianc ni izpolnjena, uporabimo Games–Howell• Ce ov postopek. V SPSS-u izberemo ustrezni test za multiple primerjave s klikom na gumb Post Hoc v oknu One-Way ANOVA (slika 7.30). Odpre se na okno One-Way ANOVA: Post Hoc Multiple Comparisons (slika 7.34), kjer v zgornjem polju Equal Variances Assumed izberemo Gabriel-ov postopek. izbiro potrdimo s klikom na gumb Continue. Slika 7.34: Izbira testa za multiple primerjave pri ANOVI V oknu Output dobimo izpisane rezultate multiplih primerjav, ki so prikazane na sliki 7.35. Razlike med posameznimi skupinami oziroma v naˇsem primeru med oddelki so oznaˇcene z ∗ v stolpcu povpreˇcna razlika (Mean Difference (I-J)). Sklep o znaˇcilnih razlikah med povpreˇcjema dveh skupin lahko sprejmemo tudi na podlagi p-vrednosti v stolpcu Sig., seveda ˇce so p-vrednosti manjˇse od 0.05 (v primeru 5% tveganja). ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 89 V naˇsem primeru obstajajo statistiˇcno znaˇcilne razlike v povpreˇcnem zadovoljstvu zaposlenih z velikostjo pisarne med (slika 7.35): • administracijo in kadrovsko sluˇzbo (p=0.000), • administracijoin pravno sluˇzbo (p=0.039), • administracijo in IT oddelkom (p=0.000), • oddelkom prodaje in kadrovsko sluˇzbo (p=0.000), • oddelkom prodaje in pravno sluˇzbo (p=0.015), • kadrovsko sluˇzboin IT oddelkom (p=0.000). Slika 7.35: Rezultati multiplih primerjav v ANOVI za spremenljivko Velikost pisarne in skupine glede na oddelek podjetja 90 7 Testiranje hipotez Syntax + + + + + ....za programerske frike :) ONEWAY V1_b BY V7 /STATISTICS DESCRIPTIVES HOMOGENEITY /PLOT MEANS /MISSING ANALYSIS /POSTHOC=GABRIEL ALPHA(0.05). 7.2.3 16 Nehomogene variance med skupinami in statistiˇ cno znaˇ cilne razlike v povpreˇ cju spremenljivke med skupinami Poskuˇsajmo odgovoriti ˇse na dvanajsto raziskovalno vpraˇsanje predstavljeno na strani 4: Se zadovoljstvo zaposlenih s tiskalnikome razlikuje glede na oddelek v podjetju? Na podlagi raziskovalnega vpraˇsanja postavimo statistiˇcni hipotezi: H0 : Povpreˇcno zadovoljstvo zaposlenih s tiskalnikom je enako v vseh petih oddelkih v podjetju (µA = µOP = µKS = µP S = µIT ). H1 : Povpreˇcno zadovoljstvo zaposlenih s tiskalnikom se v vsaj enem oddelku razlikuje od ostalih (µi 6= µj , za i, j ∈ {A, OP, KS, P S, IT }). Tako kot v prejˇsnjih dveh primerih izberemo Analyze → Compare Means → OneWay ANOVA (slika 7.21). Odpre se okno One-Way ANOVA, kjer V zgornje polje Dependent List prenesemo spremenljivko Tiskalnik (V1 h), v spodnje pole Factor pa tako kot prej spremenljivko Delovno mesto (slika 7.30). S klikom na gumb Options izberemo opisne statistike, test homogenosti varianc in, ˇce ˇzelimo, ˇse graf povpreˇcij (glej sliko 7.23). V izpisu rezultatov (okno Output) so najprej prikazane opisne statistike (slika 7.36). V stolpcu z oznako N najprej razberemo ˇstevilo zaposlenih poposameznih odddelkih. Na anketo odgovorilo 19 zaposlenih iz administracije, 12 iz oddelka prodaje, po 14 zaposlenih iz kadrovske sluˇzbe in pravne sluˇzbe ter 15 zaposlenih iz IT oddelka. S tiskalniki so najbolj zadovoljni v IT oddelku (¯ x = 4.0), sledi oddelek prodaje (¯ x = 3.8) in pravna sluˇzba ˇ pogledamo (¯ x = 3.6), najmanj zadovoljni pa so zaposleni v kadrovski sluˇzbi (¯ x = 3.0). Ce stolpec s standardnim odklonom (Std. Deviation) ugotovimo, da so odgovori glede zadovoljstva z velikostjo pisarne najmanj razprˇseni v kadrovski sluˇzbi (s = 0.555), najbolj pa v oddelku prodaje (s = 1.030). Zanimiva je ˇse ugotovitev, da je bila najviˇsja ocena tiskalnikov v kadrovski sluˇzbi 4 (stolpec Maximum), v IT oddelku pa je bila najniˇzja ocena 3 (stolpec Minimum). ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 91 Slika 7.36: Opisne statistike za spremenljivko Tiskalnik glede na oddelek v podjetju Rezultati testa homogenosti varianc med skupinami Test of Homogeneity of Variances so prikazani na sliki 7.32). Zapiˇsemo naslednji sklep: p-vrednost testa homogenosti varianc je 0.016 < 0.05, torej niˇcelno domnevo o enakosti varianc zavrnemo pri 5% tveganju. To pomeni, da tabele ANOVA, ki je izpisana Slika 7.37: Test homogenosti varianc za sprev nadaljevanju rezultatov ne moremo in- menljivko Tiskalnik in skupine glede na odterpretirati, paˇc pa moramo izbrati drug delek podjetja test. Ustrezen test v primeru neenakih varianc in veˇc kot dveh skupin najdemo spet pod Analyze → Compare Means → One-Way ANOVA, nato kliknemo na gumb Options, vendar sedaj, poleg opisnih statistik, testa homogenosti varianc in grafa povpreˇcij, odkljukamo ˇse BrownForsythe in Welch (slika 7.38). Izbiro potrdimo s klikom na gumb Continue. Slika 7.38: Izbira postopka BrownForsythe v primeru neenakih varianc med skupinami pri ANOVI 92 7 Testiranje hipotez V izpisu rezultatov dobimo sedaj ˇse enkrat izpisane opisne statistike in test enakosti varianc, nova pa je tabela z napisom Robust Tests of Equality of Means (slika 7.39). Priporoˇcilo Slika 7.39: Rezultati robustnega testa enakosti povpreˇcij za pravi, da ˇce je vsaj en izspremenljivki Tiskalnik in skupine glede na oddelek podjetja med izpisanih testov statitiˇcno znaˇcilen, nadaljujemo naˇso analizo s testi multiplih primerjav. Na podlagi robustnih testov enakosti povpreˇcij v naˇsem primeru zapiˇsemo naslednji sklep: p-vrednosti tako Brown-Forsytheovega testa (F(4, 32.78)=4.11, p=0.008¡0.05) kot Welch-ovega testa (F(4, 57.56)=2.75, p=0.008¡0.05) sta manjˇsi od 0.05, torej niˇcelno domnevo o enakosti povpreˇcnega zadovoljstva zaposlenih s tiskalnikom glede na oddelek v podjetju zavrnemo pri 5% tveganju. Odgovor na dvanajsto raziskovalno (Se zadovoljstvo zaposlenih s tiskalnikom razlikuje glede na oddelek v podjetju?) je torej pozitiven; med oddelki v podjetju namreˇc obstajajo statistiˇcno znaˇcilne razlike v zadovoljstvu zaposlenih s tiskalnikom. V nadaljevanju nas seveda zanima med katerimi oddelki prihaja do statistiˇcno znaˇcilnh razlik. Glede na okvirˇcek s smernicami za izbiro testa za multiple primerjave na strani 88 je torej v naˇsem primeru zaradi neenakih varianc med skupinami primeren Games-Howell-ov postopek. Izberemo ga tako, da v oknu One-Way ANOVA kliknemo na gumb Post Hoc. Odpre se nam okno One-Way ANOVA: Post Hoc Multiple Comparisons (glej sliko 7.34), kjer v spodnjem polju pod napisom Equal Variances Not Assumed odkljukamo Games-Howell. Izbiro potrdimo s klikom na gumb Continue. V oknu Output dobimo izpisane rezultate multiplih primerjav, ki so prikazane na sliki 7.41. V naˇsem primeru obstajajo statistiˇcno znaˇcilne razlike v povpreˇcnem zadovoljstvu zaposlenih s tiskalnikom le med IT oddelkom in kadrovsko sluˇzbo (p=0.007). Kot smo videli ˇze v tabeli z opisnimi statistikami (slika 7.36) je povpreˇcno zadovoljstvo zaposlenih s tiskalnikom v kadrovski sluˇzbi enako 3.0, v IT oddelku pa 4.0, povpreˇcja so prikazana tudi na sliki 7.40. Slika 7.40: Prikaz povpreˇcij za spremenljivko za spremenljivko Tiskalnik in skupine glede na oddelek podjetja ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 93 Slika 7.41: Rezultati multiplih primerjav v ANOVI za spremenljivko Tiskalnik in skupine glede na oddelek podjetja Syntax + + + + + ....za programerske frike :) ONEWAY V1_h BY V7 /STATISTICS DESCRIPTIVES HOMOGENEITY BROWNFORSYTHE WELCH /PLOT MEANS /MISSING ANALYSIS /POSTHOC=GH ALPHA(0.05). 17 94 7.3 7.3.1 7 Testiranje hipotez Povezanost spremenljivk χ2 test χ2 test (hi-kvadrat test) uporabljamo za testiranje hipotez o povezanosti dveh imenskih ali urejenostnih spremenljivk. Tako lahko z omenjenim testom analiziramo devetnajsto raziskovalno vpraˇsanje (predstavljeno na strani 4), ki spraˇsuje ali obstajajo razlike v izobrazbeni strukturi zaposlenih glede na spol. Postavimo ustrezni statistiˇcni hipotezi: H0 : Spremenljivki Spol in Izobrazba nista povezani. H1 : Spremenljivki Spol in Izobrazba sta povezani. χ2 test najdemo v meniju s kontingenˇcnimi tabelami (Crosstabs), natanˇcneje SPSS: Analyze → Descreptive Statistics → Crosstabs (slika 7.1). Slika 7.1: χ2 test - ukaz Odpre se nam pogovorno okno Crosstabs (slika 7.2 ), kjer izberemo ustrezne spremenljivke. V polje Row(s) vnesemo npr. spremenljivko Spol, v polje Column(s) pa spremenljivko Izobrazba. To pomeni, da bomo imeli v kontingenˇcni tabeli v vrsticah zapisane kategorije spremenljivke Spol, torej ˇzenski in moˇski, v stolpcih pa izobrazbene skupine. Spremenljivke, dodane v vrstice in stolpce tabele, lahko seveda poljubno zamenjamo. Slika 7.2: χ2 test - izbira spremenljivk ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 95 s klikom na gumb Statistics v oknu Crosstabs na sliki 7.2 izberemo statistike, ki jih ˇzelimo izraˇcunati. V naˇsem primeru potrebujemo le χ2 (Chi-square) (slika 7.3a). Izbiro potrdimo s klikom na gumb Continue. (a) Izbira ststistik (b) Prikaz podatkov v celicah tabele Slika 7.3: χ2 test - izbira moˇznosti v oknu Statistics in Options S klikom na gumb Cells v oknu Crosstabs se odpre okno prikazano na sliki 7.3b, kjer lahko doloˇcimo, kako naj se izpiˇsejo podatki v kontingenˇcni tabeli. Privzeto je v okvirˇcu Counts oznaˇceno Obsereved, kar pomeni, da bo v vsaki celici prikazano ˇstevilo opazovanih enot. Oznaˇcili smo ˇse moˇznost Expected, kar pomeni, da se bodo izpisale ˇse teoretiˇcne frekvence. V okvirˇcu Percentages smo oznaˇcili ˇse moˇznost Rows, kar pomeni, da se bodo izraˇcunali ˇse odstotki glede na vsako vrstico tabele. V izpisu rezultatov dobimo najprej kontingenˇcno tabelo (slika 7.4). Opazimo, da imata v naˇsem vzorcu le ena ˇzenska in en moˇski magisterij oz. doktorat. Teoretiˇcna frekvenca pri moˇskih z magisterijem oz. doktoratom je enaka 1.2, χ2 test pa zahteva, da so teo- Slika 7.4: Izpis χ2 testa - kontingenˇcna tabela za spremenljivki retiˇcne frekvence v vsaki Spol in Izobrazba celici tabele veˇcje ali ˇ to ni mogoˇce, enake 5. V takih primerih lahko poskusimo kategorije ustrezno zdruˇziti. Ce 2 2 χ testa ne moremo izvesti oziroma interpretacija p-vrednosti χ testa ni smiselna (durga dobljena tabela v oknu Output z naslovom Chi-Square Tests). 96 7 Testiranje hipotez Spomnimo se, da smo v poglavju 6.3 o preurejanju spemenljivk na strani 66 spremenljivko Izobrazba ˇze ustrezno preoblikovali v 3 skupine. Ponovno izvedemo χ2 test. V zgornjem polju Rows je ˇze zapisana spremenljivka Spol, iz polja Column(s) pa najprej odstranimo spremenljivko V 7 ter nato vanj prenesemo spremenljivko V7 3sk (slika 7.2). Izbiro potrdimo s sklikom na gumb OK. Slika 7.5: χ2 test - izbira preurejene spremenljivke Izobrazba Syntax + + + + + CROSSTABS /TABLES=V4 BY V7_3sk /FORMAT=AVALUE TABLES /STATISTICS=CHISQ /CELLS=COUNT EXPECTED ROW /COUNT ROUND CELL. ....za programerske frike :) 18 Na sliki 7.6 je prikazana kontingenˇcna tabela. Sedaj so teoretiˇcne frekvence v vsaki celica veˇcje ali enake 5. Ker smo v oknu Cells izbrali izraˇcunane odstotke po vrsticah opazimo, da se izraˇcunani odstotki v vsaki vrstici seˇstejejo v 100 %. Slika 7.6: Izpis rezultatov pri χ2 testu - kontingenˇcna tabela Med ˇzenskami jih ima 17 za spremenljivko Spol in preurejeno spremenljivko Izobrazba oz. 55% srednjeˇsolsko izobrazbo, 23% ima viˇsjeˇsolsko oz. visokoˇsolsko izobrazbo ter 23% univerzitetno izobrazbo ali veˇc. Med moˇskimi ima 58% zaposlenih srednjeˇsolsko izobrazbo, univerzitetno oz. viˇsjo ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 97 izobrazbo pa ima 23%. V primeru, da bi oknu Cells (slika 7.3b) izbrali izraˇcunane odstotke po stolpcih (Column), bi dobili tabelo prikazano na sliki 7.7. Iz nje razberemo, da je med zaposlenimi s srednjeˇsolsko izobrazbo 40.5% ˇzensk ter 59.5 odstotkov moˇskih. Med zaposlenimi z viˇsjeˇsolsko oz. visokoˇsolsko izo- Slika 7.7: Izpis rezultatov pri χ2 testu - kontingenˇcna tabela brazbo je 47% ˇzensk ter za spremenljivko Spol in preurejeno spremenljivko Izobrazba 53 % moˇskih, medtem ko (odstotki izraˇcunani po stolpcih) je med zaposlenimi z univerzitetno oz. viˇsjo izobrazbo 42% ˇzensk ter 58 % moˇskih. Katere odstotke izberemo, po vrsticah ali po stolpcih, je seveda odvisno od tega, na kakˇsen ˇ oznaˇcimo hkrati moˇznosti Rows in Columns bomo naˇcin bi radi prestavili rezultate. Ce ˇ v oknu Cells izberemo dobili odstotke po vrsticah in stolpcih zapisane v isti tabeli. Ce Total, dobimo izraˇcunane odstotke glede na skupno ˇstevilo enot v tabeli. Tako bi v naˇsem primeru npr. dobili, da je med vsemi zaposlenimi 23 % ˇzensk s srednjeˇsolsko izobrazbo. Za odgovor na vpraˇsanje ali sta spremenljivki Spol in Izobrazba povezani, pogledamo rezultate v tabeli na sliki 7.8. Ali je povezava med spremenljivkama znaˇcilna, nam pove p-vrednost v prvi vrstici (pri Pearson Chisquare). 2 p-vrednost χ2 testa je Slika 7.8: Rezultati χ testa za spremenljivko Spol in preureenaka 0.915 < 0.05 jeno spremenljivko Izobrazba (χ2 = 0.179), kar pomeni, da niˇcelno domnevo, da spremenljivki Spol in Izobrazba nista povezani pri 5% stopnji znaˇcilnosti , torej niˇcelne domneve ne moremo zavrniti. To pomeni, da na devetnajsto raziskovalno vpraˇsanje (Ali obstajajo razlike v izobrazbeni strukturi zaposlenih glede na spol?) odgovorimo negativno. 98 7 Testiranje hipotez Kdaj izraˇ cunamo koeficient kontingence in kaj le-ta pomeni? V primeru, da bi ugotovili, da sta naˇsi dve imenski spremenljivki povezani, bi izraˇcunali ˇse koeficient kontingence, ki meri intenzivnost oziroma stopnjo povezanosti dveh spremenljivk. Koeficient kontingence C zavzame vrednosti med 0 in 1, in sicer veˇcji kot je koeficient, moˇcneje sta povezani obe spremenljivki. Koeficient kontigence izraˇcunamo tako, da v oknu Crosstabs (SPSS: Analyze → Descreptive Statistics → Crosstabs) kliknemo gumb Statistics ter izberemo v polju Nominal moˇznost Contigency coefficient (glej sliko 7.3a). V vpraˇsalniku na strani 6 imamo zapisane tri imenske spremenljivke. Zapiˇsi ˇse dve raziskovalni vpraˇsanji, ki povezujeta po dve imenski spremenljivki. Postavi ustrezni statistiˇcni hipotezi, izvedi analizo s pomoˇcjo χ2 testa ter interpretiraj dobljene rezultate. Poskusi sam... 7.3.2 Korelacija V primeru dveh razmernostnih spremenljivk (ali vsaj urejenostnih) ugotavljamo povezanost spremenljivk s Pearsonovim koeficientom korelacije. V SPSS-u ga najdemo pod Analyze → Correlate → Bivariate (slika 7.9 ). Slika 7.9: Korelacija - ukaz S pomoˇcjo korelacije bi torej radi odgovorili na ˇsestnajsto raziskovalno vpraˇsanje: V kakˇsni povezavi sta delovna doba in starost v naˇsem podjetju? ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 99 Postavimo, ustrezni statistiˇcni hipotezi: H0 : Spremenljivki Starost in Delovna doba nista povezani (ρ = 0). H1 : Spremenljivki Starost in Delovna doba sta povezani (ρ 6= 0). Odpre se okno Bivariate correlations, kjer v desno okno Variables prenesemo obe spremenljivki Starost in Delovna Doba (slika 7.10). V oknu Options bi lahko oznaˇcili ˇse izraˇcun povpreˇcij ter standardnih odklonov. Slika 7.10: Korelacija - izbira spremenljivk Starost in Delovna doba Syntax + + + + + CORRELATIONS /VARIABLES=V5 V5 /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE. ....za programerske frike :) 19 100 7 Testiranje hipotez V prikazu rezultatov (okno Output) dobimo tabelo izraˇcunanimi korelacijskimi koeficienti (slika 7.11). p-vrednost je 0.000 < 0.01, kar kaˇze, da sta spremenljivki Starost in Delovna doba povezani pri 1 % tveganju (torej niˇcelne domneve ne moremo potrditi). Pearso- Slika 7.11: Izpis rezultatov za korelacijo med spremenljivkama nov koeficient korelacije Starost in Delovna doba je enak 0.923, kar nakazuje visoko pozitivno linearno povezanost med spremenljivkama Starost in Delovna doba. Torej, starejˇsi kot je anketiranec, daljˇsa je njegova delovna doba. S pomoˇcjo izraˇcuna Pearsonovega koeficienta korelacije odgovori na raziskovalni vpraˇsanji RV12 in RV15 na stani 4. Postavi ustrezni statistiˇcni hipotezi, izvedi analizo ter interpretiraj dobljene rezultate. 7.4 Linearna regresija Kadar nas ne zanima samo ali sta dve spremenljivki povezani, paˇc pa tudi ali lahko s pomoˇcjo prve spremenljivke pojasnimo drugo spremenljivko oziroma, povedano drugaˇce, kakˇsen vpliv ima prva spremenljivka na drugo spremenljivko, lahko uporabimo linearno regresijo. Pri regresiji tako loˇcimo neodvisno spremenljivko, navadno oznaˇcena z X, ter odvisno spremenljivko, ki jo navadno oznaˇcimo z Y . V tem poglavju se bomo omejili na linearno regresijo, kjer poskuˇsamo odvisnost med dvema spremenljivkama opisati z linearno funkcijo. V sedemnajstem raziskovalnem vpraˇsanju na strani 4 smo se vpraˇsali RVl7: Kako natanˇcno lahko iz starosti zaposlenega napovemo njegovo delovno dobo? Vpraˇsanje je napisano zelo sploˇsno, tako da moramo najprej sploh ugotoviti, za kakˇsno odvisnost gre med preuˇcevanjima spremenljivkama. Izvedba linearne regresije je namreˇc smiselna, kadar ˇze v samih podatkih zaznamo linearno odvisnost, zato najprej nariˇsemo razsevni grafikon. Razsevni grafikon spremenljivk Starost in Delovna doba smo narisali ˇze na sliki 5.13 na strani 57, kjer se jasno kaˇze linearna odvisnost med obema spremenljivkama. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 101 Linearna funkcija, ki jo iˇsˇcemo ima enaˇcbo Y = a + b · X + ε na populaciji in y = a ˆ + ˆb · x + εˆ na vzorcu, kjer oznaki ε in εˆ predstavljata sluˇcajni vpliv oz. napako regresijskega modela. Z linearno regresijo ˇzelimo tako dobiti parametre premice a ˆ in ˆb, ter hkrati oceno, kako dobro se model, torej dobljena linearna funkcija, prilega naˇsim podatkom. V naˇsem primeru nas torej zanima, kako dobro lahko iz starosti posameznika napovemo njegovo delovno dobo. Regresijsko enaˇcbo bi tako lahko zapisali tudi kot: delovna doba = a ˆ + ˆb · starost . Linearno regresijo v SPSS-u najdemo pod SPSS: Analyze → Regression → Linear... (slika 7.12). Slika 7.12: Linearna regresija - ukaz Odpre se nam okno Linear Regression (slika 7.13), kjer v zgornje polje pod Dependent: prenesemo odvisno spremenljivko, torej v naˇsem primeru Delovno dobo, v spodnje okno pod Independent(s): pa prenesemo neodvisno spremenljivko, torej Starost. S klikom na gumb Statistics lahko izberemo dodatne statistike, ki jih ˇzelimo izraˇcunati oz. preverimo kaj se bo izpisalo pri rezultatih. Slika 7.13: Izbira spremenljivk pri linearni regresiji 102 7 Testiranje hipotez Odpre se nam okno Linear Regression: Statistics (slika 7.14), kjer v zgornjem levem polju Regression Coefficientsˇze oznaˇceno Estimates, torej oceni obeh parametrov premice, oznaˇcimo pa lahko ˇse interval zaupanja Confidence Intervals. Desno zgoraj je ˇze oznaˇceno Model fit, torej ocena kako dobro se linearni model prilega podatkom, ˇce ˇzelimo pa lahko oznaˇcimo ˇse prikaz opisnih statistik Descriptives. Ostalih statistik pri enostavni regresiji ne potrebujemo, uporabili bi jih v primeru multiple regresije, ˇce bi imeli torej veˇc neodvisnih spremenljivk, kar pa presega okvire tega priroˇcnika. Izbiro potr- Slika 7.14: Linearna regresija - izbira statidimo s klikom na gumb Continue. Nato stik pa v oknu Linear Regression kliknemo ˇse OK. + + Syntax +++ ....za programerske frike :) REGRESSION /DESCRIPTIVES MEAN STDDEV CORR SIG N /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT V6 /METHOD=ENTER V5. 20 V izpisu rezultatov (okno Output) se najprej izpiˇse tabela opisnih statistik (slika 7.15), seveda ˇce smo jo oznaˇcili v oknu Linear Regression: Statistics (slika 7.14). Povpreˇcna delovna doba Slika 7.15: Opisne statistike za spremenljivke je tako enaka 15.2 leti (s standardnim odklonom s = 8.3), medtem vkljuˇcene v regresijo ko je povpreˇcna starost zaposlenih 38.3 let (s standardnim odklonom 7.6 let). ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 103 Nato se v izpisu rezultatov (v oknu Output) izpiˇse tabela prikazana na sliki 7.16 iz katere razberemo, da smo dobili en model v katerem je Starost neodvisna spremenljivka, odvisnma spremenljivka pa Delovna doba. Te tabele pri linearni regresiji Slika 7.16: Spremenljivke vkljuˇcene v linearno regrenavadno ne vkljuˇcujemo v naˇsa sijo poroˇcila. Naslednja tabela v izpisou rezultatov nam prikazuje povzetek oz. lastnosti modela (slika 7.16). Vrednost R2 nam pove, da lahko spremenljivka Starost pojasni 85.2 % Slika 7.17: Linearna regresija - povzetek modela variance spremenljivke Delovna doba. V primeru enostavne linearne regresije nam R predstavlja (Pearsonov) korelacijski koeficient med spremenljivkama Starost in Delovna doba (R = 0.923), ki smo ga izraˇcunali ˇze na strani 100. Tabela na sliki 7.18 z naslovom ANOVA nam pove ali je naˇs model dobro opisuje podatke ali ne. Ker je p-vrednost 0.000 < 0.05 lahko pri 5 % tveganju trdimo, da je naˇs model doSlika 7.18: Linearna regresija - tabela ANOVA ber oz. da statistiˇcno znaˇcilno bolje napove delovno dobo kot ˇce bi vzeli le povpreˇcje delovne dobe. Slika 7.19: Linearna regresija - koeficienti modela V tabeli z naslovom Coefficients (slika 7.19) so prikazani koeficienti regresijskega modela. V naˇso regresijsko enaˇcbo prepiˇsemo nestandardizirane regresijske modele iz drugega stolpca (Unstandardized Co- 104 7 Testiranje hipotez efficients: B), tako da dobimo delovna doba = −23.205 + 1.04 · starost . p-vrednosti v zadnjem stolpcu nam povedo, da sta oba kooeficienta (ˆ a in ˆb) statistiˇcno znaˇcilno razliˇcna od 0. Kako interpretiramo koeficiente regresijske premice? Koeficient ˆb nam pove za koliko se spremeni odvisna spremenljivka, ˇce se neodvisna spremnljivka poveˇca za 1 enoto. V naˇsem primeru lahko torej reˇcemo, da ˇce se starost zaposlenega poveˇca za eno leto, se njegova delovna doba poveˇca za 1.004 let. Pri interpretacija a ˆ moramo biti nekoliko previdini ali le-ta smiselna. a ˆ namreˇc pove, kakˇsna je vrednost odvisne spremenljivke, ˇce je vrednost neodvisne spremenljivke enaka 0. V naˇsem primeru torej to ni smiselno, saj delavci ne morejo biti stari 0 let. S pomoˇcjo regresijske enaˇcbe lahko tudi napovemo vrednost odvisne spremenljivke za neko neodvisno spremenljivko. Pri tem moramo paziti, da vzamemo vrednost neodvisne spremenljivke samo na intervalu, na katerem imamo podatke. V naˇsem primeru je najmlajˇsi zaposleni star 20 let, najstarejˇsi pa 59 let. Recimo, da nas zanima, kakˇsna je v povpreˇcju delovna doba zaposlenega, ki je star 45 let. Izbrano starost vstavimo v enaˇcbo in dobimo delovna doba = −23.205 + 1.04 · 45 = 23.6 . Torej, toˇckasta ocena za delovno dobo za zaposlenega starega 45 let je enaka 23.6 let. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 8 105 Neparametriˇ cni testi Paleta neparametriˇcnih testov je zelo ˇsiroka, saj praktiˇcno za vsak parametriˇcen test obstaja njegova neparametriˇcna razliˇcica. V poglavju bomo prikazali test deleˇza za en vzorec ter Kolmogorov-Smirnov test za en vzorec. In v ˇ cem je sploh razlika med parametriˇ cnimi in neparametriˇ cnimi testi? Parametriˇcni testi predpostavljajo doloˇceno porazdelitev, in sicer v veˇcini primerov normalno porazdelitev. Poleg tega zahtevajo, da imamo ˇstevilske spremenljivke, navadno merjene z razmernostno oz. intervalno lestvico. Neparametriˇcni testi ne zahtevajo predpostavke o normalni porazdelitvi in homogenosti varianc in so primerni tudi za urejenostne in imenske spremenljivke. Vsak parametriˇcen test ima vsaj eno neparametriˇcno razliˇcico, vendar, ˇce je moˇzno, raje uporabljamo parametriˇcne teste, saj imajo veˇcjo moˇc. Pri istem ˇstevilu podatkov, parametriˇcni testi z veˇcjo verjetnostjo zavrnejo napaˇcno postavljeno niˇcelno domnevo. V primeru velikih vzorcev nam centralni limitni izrek zagotavlja, da bomo s parametriˇcnimi testi dobili dobre rezultate tudi ˇce podatki niso normalno porazdeljeni. 8.1 Test deleˇ zev V dvajsetem raziskovalnem vpraˇsanju na strani 4 smo se vpraˇsali Ali si veˇc kot tri ˇcetrtine zaposlenih ˇzeli odprto okrepˇcevalnico do 17. ure? Na podlagi raziskovalnega vpraˇsanja najprej postavimo statistiˇcni hipotezi: H0 : Deleˇz zaposlenih, ki si ˇzelijo, da bi bila okrepˇcevalnica odprta do 17. ure je enak 0.75 (p = 0.75). H1 : Deleˇz zaposlenih, ki si ˇzelijo, da bi bila okrepˇcevalnica odprta do 17. ure je veˇcji kot 0.75 (p > 0.75). Opomba: V primeru, ˇce vzorˇcni deleˇz primerjamo z 0.5 bo v SPSS-u avtomatiˇcno izveden dvostranski test, v nasprotnem primeru se bo izvedel ustrezen enostranski test. Hipotezi bomo testirali s testom deleˇzev (slika 8.1): SPSS: Analyze → Nonparametric Tests → One Sample. 106 8 Neparametriˇcni testi Slika 8.1: Test deleˇzev - izbira ukaza (1. moˇznost) Odpre se nam okno One-Sample Nonparametric Tests s tremi zavihki: Objective, Fields in Settings. V zavihku Objective izberemo Customize analysis (slika 8.2) . Nato kliknemo na zavihek Fields, kjer najprej na vrhu izberemo Use custom field assignments (slika 8.3). Avtomatiˇcno so v desnem oknu Test Fields zbrane vse naˇse spremenljivke. Ker ˇzelimo izvesti le test deleˇzev za spremenljivko ’podaljˇsanje delovnega ˇcasa okrepˇcevalnice do 17. ure’ (V 3 a), najprej vse spremenljivke prenesemo na levo in sicer tako, da vse spremenljivke oznaˇcimo in prenesemo v levo polje Fields ali pa kliknemo na puˇsˇcico med obema poSlika 8.3: Okno One-Sample Nonparametric Tests - zaviljema. hek Fields ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 107 Slika 8.2: Okno One-Sample Nonparametric Tests - zavihek Objective Nato v desno polje Test Fields prenesemo spremenljivko Starost (slika 8.4). Seveda bi lahko spremenljivko V 3 a ˇze na zaˇcetku pustili v desnem oknu in na levo prenesli le vse ostale spremenljivke. V naslednjem koraku se pomaknemo na zavihek Settings, kjer v levem polju Select an item pustimo izbrano prvo moˇznost Choose Tests. Na desni nato izberemo Customize tests, odkljukamo prvo polje Compare observed Slika 8.4: Okno One-Sample Nonparametric Tests - izbira probability to hypo- spremenljivke V 3 a v zavihku Objective thesized (Binomial test) ter kliknemo na gumb Options (slika 8.5). 108 8 Neparametriˇcni testi Slika 8.5: Okno One-Sample Nonparametric Tests - zavihek Settings Odpre se nam okno Binomial Options prikazano na sliki 8.6, kjer v zgornje polje Hypothesized proportion vpiˇsemo deleˇz iz hipoteze, torej v naˇsem primeru ˇ ˇzelimo izraˇcunati 0.75. Ce ˇse interval zaupanja bi lahko izbrali ClopperPearson (exact). V spodnjem polju Define Success for Categorial Fields lahko doloˇcimo, katero kategorijo Slika 8.6: Okno Binomial Test Options ˇzelimo izbrati. Izberemo seveda tisto, ki je navedena v postavljeni hipotezi. V naˇsem primeru spremenljivke V 3 a vrednost 1 pomeni, da se anketiranec strinja s trditvijo, da bi bilo potrebno delovni ˇcas okrepˇcevalnice podaljaˇsti do 17. ure, medtem ko 0 a pomeni, da se anketiranec z navedeno trditvijo ne strinja. V hipotezi omenjamo deleˇz anketirancev, ki se s trditvijo strinjajo, kar pomeni, da ˇzelimo ˇ bi oznaˇcili ta deleˇz primerjati z 0.75. Pri izbiri kategorije imamo tako dve moˇznosti. Ce prvo moˇznost Use first category found in data, bi SPSS kot kategorijo, katere deleˇz ˇ pogledamo bazo pobi testiral, vzel tisto kategorijo, ki je prva navedena v podatkih. Ce datkov, vidimo, da imamo v prvi vrstici pri spremenljivki V 3 a vpisano vrednost 1 (glej sliko 2.14b na strani 20). V naˇsem primeru, ko ˇzelimo preˇsteti deleˇz anketirancev, ki se ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 109 strinjajo s trditvijo, torej 1 v podatkih, bi bila tudi izbira te moˇznosti v redu. V naˇsem primeru smo izbrali drugo moˇznost Specify success values, kjer lahko sami doloˇcimo, deleˇz katere kategorije bomo testirali, torej v polje Success Values vpiˇsemo v naˇsem primeru vrednost 1. Izbiro potrdimo s klikom na gumb OK. V oknu zavihku Settings One-Sample Nonparametric Tests nato kliknem ˇse gumb Run. V oknu z rezultati Output dobimo izpisano tabelo z rezultati prikazano na sliki 8.7. V tabeli je najprej zapisana niˇcelna hipoteza, ki bi jo lahko prevedli in (na nekoliko lepˇsi naˇcin) zapiSlika 8.7: Rezultati testa deleˇzev za spremenljivko ’podaljˇsanje sali kot: Deleˇz anketirancev, ki se strinjajo ozidelovnega ˇcasa okrepˇcevalnice do 17. ure’ roma se ne strinjajo s trditvijo ’podaljˇsanje delovnega ˇcasa okrepˇcevalnice do 17. ure’ je enak 0.75 oziroma 0.25. V stolpcu Test je zapisan uporabljen test, torej test deleˇzev za en vzorec. p-vrednost testa deleˇzev je 0.500>0.05 (glej tretji stolpec Sig.), torej niˇcelne domneve ne moremo zavrniti pri 5% tveganju. Sklep je zapisan tudi v zadnjem stolpcu Decision, kjer piˇse, da niˇcelno domnevo obdrˇzimo. Odgovor na dvajsteto raziskovalno vpraˇsanje je torej negativen, saj ne moremo trditi, da si veˇc kot tri ˇcetrtine zaposlenih ˇzeli odprto okrepˇcevalnico do 17. ure? ˇ dvokliknemo na tabelo na sliki 8.7 se odpre Model Viewer (slika 8.8), kjer dobimo Ce ˇ se z miˇsko pomaknemo prikazane dejanske in teoretiˇcne deleˇze na grafu desno zgoraj. Ce na stolpec na grafu se deleˇzi ˇse izpiˇsejo. V naˇsem primeru se torej 76% anketirancev strinja s trditvijo o ’podaljˇsanju delovnega ˇcasa okrepˇcevalnice do 17. ure’, 24% odstotkov pa se ne strinja. Hipotetiˇcni deleˇz pa smo nastavili na 0.75 oz 75%. V spodnjem delu je ˇse enkrat zapisana p-vrednost enostranskega t-testa (1-sided test)10 . Syntax + + + + + ....za programerske frike :) *Nonparametric Tests: One Sample. NPTESTS /ONESAMPLE TEST (V3_a) BINOMIAL(TESTVALUE=0.75 SUCCESSCATEGORICAL=LIST(1) SUCCESSCONTINUOUS=CUTPOINT(MIDPOINT)) /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE /CRITERIA ALPHA=0.05 CILEVEL=95. 10 21 Kot smo ˇze zapisali, se v primeru, ko je deleˇz iz hipoteze razliˇcen od 0.5 v SPSS-u avtomatiˇcno izveden ustrezen enostranski test. 110 8 Neparametriˇcni testi Slika 8.8: Test deleˇzev - pregled modela Druga moˇznost za izvedbo testa deleˇzev je: SPSS: Analyze → Nonparametric Tests → Legacy Dialog → Binomial. Slika 8.9: Test deleˇzev - izbira ukaza (2. moˇznost) Odpre se nam pogovorno okno Binomial Test, ki je prikazano na sliki 8.9. Najprej v desno polje Test Variable List prenesemo spremenljivko ’podaljˇsanju delovnega ˇcasa okrepˇcevalnice do 17. ure’, nato pa v sponje okence Test Proportion vpiˇsemo 0.75. S klikom na gumb Options bi lahko izbrali ˇse izraˇcun opisnih statistik in kvartile. V oknu Exact Tests, ki bi ga dobili s klikom na gumb Exact, ni potrebno spreminjati niˇcesar. Nato izbiro spremenljivk in Slika 8.10: Test deleˇzev - izbira spremenljivk in testnega deleˇza potrdimo s klikom na doloˇcitev testnega deleˇza gumb OK. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 111 Rezultati so prikazani na sliki 8.11. SPSS za prvo kategorijo vedno izbere tisto vrednost, ki je prva vpisana pri podatkih, torej vrednost, ki je v prvi vrstici pri Slika 8.11: Rezultati testa deleˇzev za spremenljivko spremenljivki V a, kar je v naˇsem ’podaljˇsanje delovnega ˇcasa okrepˇcevalnice do 17. ure’ primeru 1 (glej sliko 2.14a). Iz (2. moˇznost) stolpca N razberemo, da se 56 oziroma 0.76 anketirancev strinja s trditvijo ’podaljˇsanje delovnega ˇcasa okrepˇcevalnice do 17. ure’, 18 pa ne, kar znaˇsa 0.24; Testni deleˇz je bil seveda tako kot prej enak 0.76 (stolpec Test Prop.). p-vrednost t-testa je 0.509>0.05, kar pomeni, da niˇcelne domneve ne moremo zavrniti pri 5% tveganju. Syntax + + + + + ....za programerske frike :) NPAR TESTS /BINOMIAL (0.75)=V3_a /MISSING ANALYSIS. 22 Poglejmo si ˇse, kako bi s pomoˇcjo testa deleˇzev odgovorili na enaindvajseto raziskovalno vpraˇsane postavljeno na strani 4: Ali je odstotek zaposlenih, ki si ˇzelijo naroˇcanje kosil tudi za domov niˇzji od 40%? Na podlagi raziskovalnega vpraˇsanja najprej postavimo statistiˇcni hipotezi: H0 : Deleˇz zaposlenih, ki si ˇzelijo, da bi bilo moˇzno naroˇcati kosila tudi za domov je enak 0.4 (p = 0.4). H1 : Deleˇz zaposlenih, ki si ˇzelijo, da bi bilo moˇzno naroˇcati kosila tudi za domov je majˇsi kot 0.4 (p < 0.75). ˇ pogledamo podatke (slika 2.14a ) imamo v prvi vrstici pri spremenljivki V 3 g (’uvedba Ce moˇznosti naroˇcanja kosil tudi za domov ’) zapisano vrednost 0. Zato bo bolje, da test deleˇzev izvedemo s pomoˇcjo ukaza SPSS: Analyze → Nonparametric Tests → One Sample, kjer bomo lahko sami doloˇcili kategorijo, ki nas zanima. 112 8 Neparametriˇcni testi Odpre se nam okno OneSample Nonparametric Tests, kjer v zavihku Objective izberemo Customize analysis, nato pa v zavihku Fields prenesemo v desno polje Test Fields spremenljivko ’uvedba moˇznosti Slika 8.12: Okno One-Sample Nonparametric Tests naroˇcanja kosil tudi za do- izbira spremenljivke mov ’ (slika 8.12). V zavihku Settings najprej izberemo moˇznost Customized Tests in nato Compare observed probability to hypothesized (Binomial test). Kliknemo na gumb Options. Odpre se nam okno Binomial Options, kjer v zgornje polje Hypothesized proportion vpiˇsemo 0.4. V podnjem polju Define Success for Categorical Fields izberemo Specify success values ter v spodnje polje vpiˇsemo 1 (slika 8.13). Celoten ukaz v obliki Slika 8.13: Okno One-Sample Nonparametric Tesintakse je prikazan v spodnjem sts - izbira spremenljivke okvirˇcku. + + Syntax +++ ....za programerske frike :) *Nonparametric Tests: One Sample. NPTESTS /ONESAMPLE TEST (V3_ "OM"TESTVA0.4 SUCCESSCATEGORICAL=LIST(1) SUCCESSCONTINUOUS=CUTPOINT(MIDPOINT)) /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE /CRITERIA ALPHA=0.05 CILEVEL=95. 23 ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 113 Rezultati testa deleˇzev so predstavljeni na sliki 8.14. Niˇcelno hipotezo, da je deleˇz zaposlenih, ki si ˇzelijo ’uvedbo moˇznosti naroˇcanja kosil tudi za domov ’enak 0.4, zavrnemo pri 5% tveganju, Slika 8.14: Rezultati testa deleˇzev za spremenljivko ’uvedba saj je p-vrednost testa moˇznosti naroˇcanja kosil tudi za domov ’ deleˇzev enaka 0.027. Odgovor na 21. raziskovalno vpraˇsanj je torej pritrdilen: manj kot 40% zaposlenih si ˇzeli uvedbo moˇznosti naroˇcanja kosil tudi za domov. ˇ dvokliknemo na priCe kazano tabelo se nam odpre novo okno Model Viewer (slika 8.15). Na desni strani sta grafiˇcno prikazana dejanska in teoretiˇcna deleˇza. V tem primeru se stolpca precej razlikujeta, in sicer lahko razberemo, da si 28% anketirancev ˇzeli uvedbo moˇznosti naroˇcanja kosil za domov, medtem ko je bil teoretiˇcni deleˇz postavljen na 0.4. V spodnjem delu desnega okna lahko preverimo, kakˇsna je bila alternativna domneva: ”deleˇz v uspeˇsni skupini je manjˇsi od hipotetiˇcne verjetnoSlika 8.15: Test deleˇzev za spremenljivko ’uvedba moˇznosti sti uspeˇsnih”, kar je v naroˇcanja kosil tudi za domov ’ - pregled modela skladu z naˇso alternativno hipotezo. 8.2 Kolmogorov-Smirnov test za en vzorec Kolmogorov-Smirnov test za en vzorec uporabimo, kadar ˇzelimo vzorec primerjati z referenˇcno porazdelitvijo. V naˇsem primeru torej zanima, ali je spremenljivka Starost porazdeljena normalno (glej histogram spremenljivke Starost na strani 33, slika 3.14). Postavimo naslednji statistiˇcni hipotezi: 114 8 Neparametriˇcni testi H0 : Porazdelitev spremenljivke Starost je normalno porazdeljena s povpreˇcjem x¯ = 38.26 in standardnim odklonom s = 7.65. H1 : Porazdelitev spremenljivke Starost ni normalno porazdeljena s povpreˇcjem x¯ = 38.26 in standardnim odklonom s = 7.65. Test najdemo v SPSS-u pod: SPSS: Analyze → Nonparametric Tests → One Sample.... Odpre se nam okno One-Sample Nonparametric Tests s tremi zavihki: Objective, Fields in Settings. V zavihku Objective izberemo Customize analysis (slika 8.16). Slika 8.16: Okno One-Sample Nonparametric Tests - zavihek Objective Nato kliknemo na zavihek Fields, kjer najprej na vrhu izberemo Use custom field assignments (slika 8.17a). Avtomatiˇcno so v desnem oknu Test Fields zbrane vse naˇse spremenljivke. Ker ˇzelimo izvesti le Kolmogorov-Smirnov test za spremenljivko Starost, najprej vse spremenljivke prenesemo na levo in sicer tako, da vse spremenljivke oznaˇcimo in prenesemo na levo ali pa kliknemo na puˇsˇcico med obema poljema (slika 8.17a). Nato v desno polje prenesemo spremenljivko Starost (slika 8.17b). Seveda bi lahko spremenljivko Starost ˇze na zaˇcetku pustili v desnem oknu in na levo prenesli le vse ostale spremenljivke. ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 115 (a) Zavihek Fields (b) Izbira spremenljivke Starost Slika 8.17: Okno One-Sample Nonparametric Tests - zavihek Fields V naslednjem koraku se pomaknemo na zavihek Settings, kjer v levem oknu pustimo izbrano prvo moˇznost Choose Tests. Na desni nato izberemo Custom tests, odkljukamo tretje polje Test observed distribution against hypothesized (KolmogorovSmirnov test (slika 8.18) ter kliknemo na gumb Options. 116 8 Neparametriˇcni testi Slika 8.18: Okno Kolmogorov-Smirnov Test Options Odpre se nam okno Kolmogorov-Smirnov Test Options prikazano na sliki 8.19, kjer izberemo tip porazdelitve s katero ˇzelimo primerjati naˇs vzorec. Ker ˇzelimo preveriti, ali je spremenljivka Starost porazdeljena normalno, oznaˇcimo prvo moˇznost Normal. V polju Distribution parameters lahko izberemo ali naj se za testna parameta vzameta povpreˇcje in standardni odklon vzorˇcnih podatkov (Use sample data) ali pa sami doloˇcimo povpreˇcje (Mean) in standardi odklon (Std.Dev.). V naˇsem primeru izberemo Use sample data ter izbiro potrdimo s klikom na gumb OK. V sredinskem delu okna KolmogorovSmirnov Test Options bi lahko izbrali enakomerno porazdelitev (Uniform), v spodnjem delu pa eksponentno porazdelitev (Exponential) ali Poissonovo poraz- Slika 8.19: Opisne statistike za spremenljivko delitev (Poisson). Podrobnejˇsi opis poraz- Starost ˇ delitev lahko poiˇsˇceˇs npr. v Sparl (2010) ali Jesenko (2001). ˇ A. Znidarˇ siˇc: Vodnik po SPSS-u 117 Na sliki 8.20 je prikazan rezultat Kolmogorov-Smirnov testa za en vzorec za spremenljivko Starost. Na levi je zapisana niˇcelna domneva (Null Hypothesis), kot smo jo zapisali na strani 114. Na desni v stolpcu Sig. je zapisana p-vrednost, ki je enaka 0.584>0.05, torej niˇcelne domneve ne moremo zavrniti pri 5% tveganju. Spremenljivka Starost je torej normalno porazdeljena s povpreˇcjem x¯ = 38.26 in standardnim odklonom s = 7.65. SPSS nam tudi sam ˇze zapiˇse sklep v zadnjem stolpcu tabele, kjer pod Decision piˇse Retain the null hypothesis. Slika 8.20: Rezultati Kolmogorov-Smirnov testa za spremenljivko Starost Syntax + + + + + ....za programerske frike :) *Nonparametric Tests: One Sample. NPTESTS /ONESAMPLE TEST (V5) KOLMOGOROV_SMIRNOV(NORMAL=SAMPLE ) /MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE /CRITERIA ALPHA=0.05 CILEVEL=95. 24 118 Literatura Literatura Babbie, Earl R. 2007. The practice of social research. 11th ed. Wadsworth Pub. Co. Field, A. 2009. Discovering statistics using spss. Introducing Statistical Methods, SAGE Publications. Fink, Arlene. 2003. How to ask survey questions. Thousand Oaks, ZDA: Sage Publications. Fowler, Floyd J. Jr. 1995. Improving survey questions. design and evaluation. 2nd ed. Thousand Oaks, ZDA: Sage Publications. IBM. 2011. Ibm spss statistics 20 core system user’s guide. Jesenko, Joˇze. 2001. Statistika v organizaciji in managementu. Kranj: Moderna organizacija. Neuman, William Lawrence. 2007. Basics of social research: qualitative and quantitative approaches. 2nd ed. Pearson Education, Inc. Salant, Priscilla, and Don. A. Dillman. 1994. How to conduct your own survey. New York, ZDA: John Wiley & Sons. ˇ Sparl, Petra. 2010. Statistika UN: zapiski predavanj. Kranj: Fakulteta za organizacijske vede.