aySTAT2100 TILASTOLLINEN TIETOJENKÄSITTELY SPSS
Transcription
aySTAT2100 TILASTOLLINEN TIETOJENKÄSITTELY SPSS
aySTAT2100 TILASTOLLINEN TIETOJENKÄSITTELY SPSS HARJOITUSTYÖ Harjoitustyössä tehdään pieni empiirinen tutkimus ja raportoidaan kirjallisesti tutkimuksen tulokset. Harjoitustyön tavoitteena on oppia tilastollisen menetelmän valintaa, tilastollisten menetelmien toteutusta SPSS-ohjelmalla ja saatujen tutkimustulosten raportointia. Harjoitustyön aineisto on ”Kulttuuri ja vapaa-aika Suomessa 2007”. SPSS-havaintoaineistoversio ko. aineistosta on saatavilla kurssin kotisivulta (http://lipas.uwasa.fi/~chg/aySTAT2100sj.html). SPSS-aineiston muuttujat eivät ole täydellisesti määritelty: kaikkien muuttujien tilastolliseksi mittaasteikoksi on merkitty Nominal, joten ko. tieto joudutaan tarpeen tullen korjaamaan sopivaksi! Lyhyt kuvaus tilastoyksiköistä ja muuttujista on saatavana erillisenä pdf-tiedostona kurssin kotisivulta. Harjoitustyö alkaa tutkimusongelmien pohtimisella, ja niihin sopivien muuttujien valinnalla. Jos harjoitustyö tehdään yksin, tutkitaan yksi ongelma. Jos harjoitustyö tehdään parin kanssa, tutkitaan 2 ongelmaa. SPSS-aineistossa muuttujat bv5 – k26a ovat taustamuuttujia ja muuttujat k30a – k77 kartoittavat vapaa-ajanviettoa ja kulttuurimieltymyksiä. Tutkimusongelman on liityttävä riippuvuustutkimukseen siten, että kussakin riippuvuustutkimuksessa on yksittäisenä selitettävänä muuttujana jokin muuttujista k30 – k77, ja selittävänä muuttujana jokin taustamuuttuja. Tutkimusongelmat voivat olla mm. seuraavanlaisia: onko syntymävuodella ja kirjojen määrällä yhteyttä (selittäjä: syntymävuosi, selitettävä: kirjojen määrä), katsovatko naiset useammin Euroviisuja kuin miehet (selittäjä: sukupuoli, selitettävä: Euroviisujen katselu), kokevatko Oulun läänissä asuvat terveydentilansa samanlaiseksi kuin Länsi-Suomen läänissä asuvat (selittäjä: asuinlääni, selitettävä: terveydentila), jne Aineiston analysointi alkaa esittelemällä tutkimusongelmiin valittujen muuttujien jakaumat käyttäen frekvenssijakaumataulukoita, tilastollisia tunnuslukuja ja/tai kuvioita. Kuvailutapa valitaan sopivaksi muuttujan mitta-asteikon perusteella. Raporttiin voi lisätä SPSS:stä kuvioita ja taulukoita (muokattuna tarpeen mukaan) tekstin joukkoon, kunhan tekstissä niihin viitataan Muuttujien jakaumien esittelyn jälkeen selvitellään riippuvuussuhteita opintojaksolla opituin menetelmin. Riippuvuustutkimusmenetelmä valitaan muuttujien tilastollisten mitta-asteikkojen ja jakaumamuotojen perusteella. Jokaisessa riippuvuustarkastelussa käytetään vain yhtä, tilanteeseen parhaiten sopivaa menetelmää. Kaikkiin näistä riippuvuusanalyyseistä on liitettävä tilastollinen päättely. Kuvaileva tilastotiede ei siis riitä, vaan tilastollisia testejä käytetään tilastolliseen päättelyyn. Menetelmävihjeitä löytyy myöhemmin esitettävästä taulukosta. Tulosraportin rakenne voi olla esim. seuraavanlainen 1 Johdanto Tässä kerrotaan lyhyesti aineistosta (mitkä ovat aineiston tilastoyksiköt, mitä muuttujia työssä tarkastellaan) ja tutkimusongelmista, joita tarkastellaan. 2 Aineiston kuvaus Tässä kuvaillaan valittujen muuttujien jakaumia hyödyntäen graafisia esityksiä, taulukoita ja/tai tunnuslukuja. 3 Riippuvuustarkastelu tai riippuvuustarkastelut (otsikko aiheen mukaan) Nro 1 2 3 4 Mitta-asteikko X (selittävä NOMINAALI /ORDINAALI NOM (kaksiarvoinen) NOM (useita arvoja) NOM (kaksiarvoinen) Y selitettävä) NOM ORD ORD INT/ SUHDE 5 NOM (useampi kuin 2 arvoa) INT/ SUHDE 6 ORD ORD 7 ORD INT/ SUHDE 8 INTERVALLI/ SUHDE NOM 9 INT/ SUHDE ORD Riippuvuustutkimusmenetelmä, -tunnuslukuja ja/tai testejä (tilastollista päättelyä varten). (Jos useita, on ensisijainen menetelmä ensimmäisenä.) Ristiintaulukointi, kontigenssikerroin, Cramerin V ja ristiintaulukosta 2-riippumattomuustesti Mann-Whitneyn U–testi Sama menetelmä kuin kohdassa 1 Kruskal-Wallis –testi Sama menetelmä kuin kohdassa 1 Y normaalijakautunut kummassakin ryhmässä: kahden otoksen keskiarvotesti Y ei normaalijakautunut: Mann-Whitneyn U-testi (Jos Y normaalijakautunut, myös lineaarinen regressio testeineen niin, että selittäjä on dummy-muuttuja.) Y normaalijakautunut ryhmissä ja populaatiovarianssit ovat yhtä suuret: yksisuuntainen varianssianalyysi ja siitä F-testi Y normaalijakautunut ryhmissä ja populaatiovarianssit eivät yhtä suuret: esim. Welchin testi Y ei normaalijakautunut: Kruskal-Wallis –testi (Jos Y normaalijakautunut, myös lineaarinen regressio testeineen niin, että selittäjät ovat dummy-muuttujia.) Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja korrelaatiotesti Sama menetelmä kuin kohdassa 1 Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja korrelaatiotesti Samat menetelmät kuin kohdassa 5 (Logistinen regressio testeineen; ei tällä kurssilla) Luokittele X:n arvot luokkiin ja sama menetelmä kuin kohdassa 1 10 INT/ SUHDE INT/ SUHDE Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja korrelaatiotesti Luokittele X:n arvot luokkiin ja samat menetelmät kuin kohdassa 3 X:n ja Y:n yhteisjakaumana 2-uloitteinen normaalijakauma: Pearsonin korrelaatio ja korrelaatiotesti X:n ja Y:n yhteisjakaumana 2-uloitteinen normaalijakauma: lineaarinen regressio ja siihen liittyvät testit Jos ei normaalijakauma: Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja korrelaatiotesti