V10 - NTNU
Transcription
V10 - NTNU
NTNU Norges teknisk-naturvitenskapelige universitet Institutt for sosiologi og statsvitenskap SENSORVEILEDNING I SOS1002 SAMFUNNSVITENSKAPELIG FORSKNINGSMETODE Eksamensdato: 28. mai 2010 Eksamenstid: 5 timer Studiepoeng: 15 Antall sider bokmål: 2 (Formler: se side 7) Antall sider nynorsk: 2 (Formler: se side 7) Number of pages in English: 2 (Formulas: page 7) Tillatte hjelpemiddel: Kalkulator (alle typer) Sensurdato: 18. juni 2010 Faglig kontakt under eksamen: Arild Blekesaune (73 59 17 54) Sensurtelefon: 815 48014 __________________________________________________________________________ BOKMÅL Alle de tre oppgavene skal besvares. De tre oppgavene teller hver en tredjedel av den samlede karakteren. Oppgave 1 På neste side ser du en tabell med to regresjonsmodeller basert på data fra den norske delen av ”European Social Survey” fra årene 2002, 2004, 2006 og 2008. Utvalget skal behandles som et sannsynlighetsutvalg fra populasjonen, hvor alle respondentene er personer på 15 år og eldre som var bosatt i Norge. Den avhengige variabelen nettbruk måler svarene på spørsmålet: ”Hvor ofte bruker du Internett, World Wide Web eller e-post til privat bruk, enten hjemme eller på jobben?”. De opprinnelige svarkategoriene ”Har ikke nettilgang, verken hjemme eller på jobben”, ”Bruker aldri”, ”Mindre enn en gang i måneden”, ”En gang i måneden”, ”Flere ganger i måneden”, ”En gang i uken” og ”Flere ganger i uken” er slått sammen i en kategori med verdien 0, mens de som har svart ”Hver dag” er kodet med verdien 1. Videre er variabelen mann kodet med verdien 1 for menn og verdien 0 for kvinner, mens variabelen alder er kodet i antall tiår med en desimal. Forklar hva tabell 1 viser. 1 Tabell 1. Internettbruk fordelt etter alder og kjønn (N=7095) Mann (kvinne=0, mann=1) Alder (antall 10-år) Årstall (dummyer med 2002 som referanse) År 2004 År 2006 År 2008 Alder kvadrert Samspill Mann*År 2004 Mann*År 2006 Mann*År 2008 Konstant B 0,635 -0,662 0,616 1,180 1,767 2,725 Modell1 S.E. p 0,059 0,000 0,019 0,000 OR 1,888 0,516 B 0,693 0,561 0,076 0,080 0,090 1,851 3,256 5,851 0,103 0,000 0,000 0,000 0,000 15,264 Modell 2 S.E. p 0,100 0,000 0,100 0,000 OR 2,000 1,753 0,610 1,303 1,932 -0,127 0,107 0,113 0,128 0,011 0,000 0,000 0,000 0,000 1,841 3,681 6,906 0,881 0,028 -0,158 -0,139 0,025 0,151 0,161 0,181 0,233 0,855 0,325 0,441 0,914 1,028 0,854 0,870 1,026 B = logistiske regresjonskoeffisienter S.E. = regresjonskoeffisientenes standardfeil p = signifikanssannsynligheten OR = oddsratioet er antilogaritmen av B (exp(B)) MÅL: Teste studentenes evne til å kunne beskrive det sosiale mønsteret som fremstilles i en logistisk regresjonstabell, og teste ut om studenten klarer å bruke det de har lært av statistiske beregninger til en slik tolkning. Viktig informasjon til sensor: I oppgaveteksten har det dessverre kommet inn en skrivefeil i tabell 1. OR for dummyen År 2004 er i tabellen oppgitt til å være 0,851, men den riktige verdien skal være 1,851. Alle fikk muntlig beskjed om denne feilen i løpet av eksamenen, men det kan tenkes at noen løste ferdig oppgaven før de fikk denne beskjeden. Vi bør derfor våre åpne for ulike tolkninger av dette oddsratioet. Informasjon for vurdering av løsninger: I pensum (Ringdal 2007, kap. 18.8.5) og på forelesningene har vi presentert hvordan logistiske regresjonskoeffisienter kan tolkes i tre skalaer: Logit-, odds-, og sannsynlighetsskalaer. Tolkninger i logitskalaen er som vanlig lineær regresjon, og her skal studentene kunne avgjøre om de uavhengige variablene har statistisk signifikant effekt på den avhengige variabelen og samtidig kunne tolke om koeffisientene er positive eller negative. Dette må regnes som et minimumskrav for å få godkjent oppgaven. De studentene som i tillegg til dette klarer å tolke ut substansiell informasjon ut fra koeffisientenes størrelse eller ut fra oddsratioer bør få litt tillegg for dette. De studentene som i tillegg klarer å gi gode beskrivelser av modellene basert på (1) at de setter opp riktige regresjonslikninger fra en eller begge modellene, regner ut (2) predikerte logiter for sammenlignbare idealtyper basert på ulike kombinasjoner av verdier på de uavhengige variablene, og (3) regner om dette til sannsynligheter for å bruke internett daglig har oppnådd de målene som er realistisk på SOS1002 og bør honoreres med god karakter. Minimumskrav i tolkningen av modell 1: Alle bør kunne se at det er en større andel blant menn enn blant kvinner som bruker internett daglig. Videre bør alle kunne se at andelen som bruker internett daglig går ned med økende alder, og at andelen som bruker internett har økt jevnt fra 2002 og fram til 2008. I tillegg er det sannsynligvis noen som ser den kurvelineære alderseffekten i modell 2, og noen klarer kanskje også å finne ut at knekkpunktet på alderskurven er 2,2 noe som da 2 tilsvarer 22 år. Det vi i så fall si at internettbruker øker fram til de blir 22 år, for så å avta gradvis jo eldre de blir. Dette kan de enten finne ut ved å predikere logiter (L) for alle aldersgruppene (noe som vil ta så mye tid at det neppe er noen som har gjort det), eller noen få har kanskje fått med seg fra forelesningen eller den anbefalte tilleggslitteraturen (Thrane 2003) at knekkpunktet for kurven kan beregnes med formelen –b1/(2 x b2) som i dette tilfellet blir -0,561/(2 x -0,127) = 2,22 som vil si 22,2 år. En del vil sannsynligvis også forsøke å forklare samspillene i modell 2, men ettersom ingen av disse er statistisk signifikante på 5%-nivået så er det viktigste funnet her at det ikke har skjedd noen vesentlig endring i kjønnsmønsteret mellom 2002 og 2008. Det vil si at det alltid har vært en større andel brukere blant menn enn blant kvinner som bruker internett daglig. De som velger å kommentere tabellen med utgangspunkt i oddsratioer bør bruke omregningsformelen for å regne OR om til prosentvise forskjeller i odds. For modell 1 blir dette: Oddsen for å bruke internett daglig for menn blir da 88,8 [100(OR-1)=100(1,888-1)=88,8] prosent høyere enn for kvinner, og oddsen for å bruke internett daglig blir 47,4 [100(OR1)=100(0,516-1)=47,4] prosent lavere for hvert tiår. Dette betyr at nedganen i oddsen blir 4,7 prosent for hvert år. De som framhever at alderseffekten kun måler forskjeller mellom aldersgrupper, og ikke sier noe om at vi bruker internett mindre jo eldre vi blir, bør belønnes for dette. De som også gir tilsvarende beskrivelser av modellen bør honoreres for dette. De predikerte sannsynlighetene for å bruke internett daglig for en person på 20 år i 2002 blir da ut i fra modell 1 slik: Hvis personen er mann: LMann 20 i 2002 = 2,725 + (0,635*1) + (-0,662*2) + (0,616*0) + (1,180*0) + (1,767*0) = 2,036 PredMann 20 i 2002 blir da: 1/(1+EKSP(-2,036) = 0,885 som vil si 88,5 prosent Hvis personen er kvinne: LKvinne 20 i 2002 = 2,725 + (0,635*0) + (-0,662*2) + (0,616*0) + (1,180*0) + (1,767*0) = 1,401 PredKvinne 20 i 2002 blir da: 1/(1+EKSP(-1,401) = 0,802 som vil si 80,2 prosent De tilsvarende predikerte sannsynlighetene for å bruke internett daglig for en person på 20 år i 2008 blir da ut i fra modell 1 slik: Hvis personen er mann: LMann 20 i 2008 = 2,725 + (0,635*1) + (-0,662*2) + (0,616*0) + (1,180*0) + (1,767*1) = 3,803 PredMann 20 i 2008 blir da: 1/(1+EKSP(-3,803) = 0,978 som vil si 97,8 prosent Hvis personen er kvinne: LKvinne 20 i 2008 = 2,725 + (0,635*0) + (-0,662*2) + (0,616*0) + (1,180*0) + (1,767*1) = 3,168 PredKvinne 20 i 2008 blir da: 1/(1+EKSP(-3,168) = 0,960 som vil si 96 prosent 3 Oppgave 2 MÅL: Teste studentenes kjennskap til sentrale begrep i pensum. Vurderingskriterier: Seks av ni oppgaver skal besvares, og vi bør derfor kun vurdere seks svar også fra de som har besvart alle spørsmålene. Hver besvarelse skal være på inntil ½ side, og det bør tilsi at de bør skrive mer enn en kort definisjon på hvert begrep. Ved tidligere eksamener har vi kun gitt begreper som står i begrepsdefinisjonene på side 459 til 474 i Ringdal 2007, men i denne eksamensoppgaven har satt opp flere begrep som ikke defineres i denne lista. En del av begrepene er også sammensatt av begrep i pensum, der sammensetningen sannsynligvis vil være nye for kandidatene. I disse tilfellene forventer vi at kandidatene er i stand til å avklare begrepene hvis de har utviklet en god forståelse av den metodiske begrepsbruken. a) Multippel regresjonskoeffisient Begrepet kan ha forvirret en del. I pensum skriver Ringdal om multippel regresjonsanalyse i kapitlene 17 og 18, som vil si regresjonsmodeller med en yvariabel og minst to x-variabler. En regresjonskoeffisient er i følge Ringdals definisjon (b1 viser endringen i Y når X endres med en måleenhet, kontrollert for de andre variablene i modellen), og her viser den andre leddsetningen til den multiple modellen. De som skal få full uttelling her må derfor både ha med det om endring i Y når vi endrer på X, og at dette er endringen etter at vi har kontrollert for effektene av alle de andre X-variabelen i regresjonsmodellen. b) Deterministisk og ikke-deterministisk årsaksforklaring Ringdals begrepsdefinisjon av årsaksforklaring er ”Består av en robust sammenheng mellom X og Y som kan forklares gjennom en eller flere årsaksmekanismer. En sammenheng er robust hvis årsaksrekkefølgen mellom X og Y er spesifisert, og sammenhengen er kontrollert for andre relevante forklaringsvariabler”. I delkapittel 2.5.2 skriver Ringdal at ”Hempels modell har en rekke problemer. For det første innebærer en generell lovmessighet en deterministisk sammenheng: Hvis X så alltid Y. En mulighet til å gjøre modellen mer anvendelig er å erstatte den allmenngyldige loven med en sannsynlighetsformulering: Hvis X så ofte Y” (s. 46). Ringdal bruker determinismebegrepet flere ganger utover i boka, men han bruker ikke begrepet ”ikkedeterministisk” som er et begrep som er brukt i forelesningene for å klassifisere sannsynlighetsformuleringer som kontrast til determinisme. De som ikke har fått med seg dette bør likevel kunne klare å si noe om hva som ligger i begrepet deterministiske årsaksforklaringer, og se at disse sjelden kan brukes i samfunnsfaglige årsaksforklaringer. c) Systematiske og tilfeldige utvalgsfeil Disse begrepene er ikke satt opp i begrepslista til Ringdal, men problemer knyttet til systematiske feilkilder drøftes i kapittel 15.5 i forbindelse med målefeil. På forelesningene ble det lagt stor vekt på forskjellen mellom systematiske og tilfeldige utvalgsfeil i forbindelse med teknikkene for sannsynlighetsutvelging, og målefeil har også blitt behandlet på dataøvingene. Vi forventer derfor at alle klarer å resonnere seg fram til at tilfeldige utvalgsfeil viser til skjevheter i utvalget som oppstår på grunn av at enhetene i utvalget er tilfeldig trukket fra en populasjon, mens systematiske 4 utvalgsfeil viser til skjevheter som skyldes at enhetene i populasjonen har ulik sannsynlighet for å bli trukket ut i utvalget. Det siste oppstod bl.a. da Literary Digest Magazine brukte telefonkatalogen for å trekke et utvalg på 10 millioner amerikanske velgere før presidentvalget i 1936. Da fikk de på grunn av at republikanske velgere var overrepresentert blant de som hadde telefon et utvalg som bestod av flere som stemte på den republikanske presidentkandidaten enn den demokratiske. d) Kjikvadratfordelingen Ringdals begrepsdefinisjon: Sannsynlighetsfordeling for kjikvadratet (χ2). Her er vi ut etter forståelsen av hva en sannsynlighetsfordeling er, og ikke ute etter en beskrivelse av hvordan vi gjennomfører en kjikvadrattest. e) Tosidig test Ringdals begrepsdefinisjon: Statistisk test der nullhypotesen forkastes både ved høye og lave verdier av testobservatoren. Dette er den normale testen når vi benytter 1,96 som kritisk verdi i forhold til en normalfordeling og t-fordeling. I regresjonsanalyse forkaster vi for eksempel H0 både når t er større en 1,96 og når t er mindre enn -1,96. f) Konfidensintervall Ringdals begrepsdefinisjon: Et intervall rundt den estimerte verdi av en parameter der vi med stor (95 %) sikkerhet kan si at den sanne verdien befinner seg. På forelesningene er det blant annet vist hvordan den norske gaupebestanden vinteren 2006-2007 var estimert til 424 individer ± 15, som vil si et estimat i et konfidensintervall mellom 409 og 439. g) Samspillseffekt Ringdals begrepsdefinisjon: Effekt av en x-variabel er betinget av en annen X, for eksempel at effekten av utdanning på timelønn er sterkere for menn enn for kvinner. Eksempelet i Ringdals definisjon er detaljert gjennomgått på forelesningene, og er et sentralt eksempel i Ringdals gjennomgang av samspill på sidene 391 til 394. h) Forklar og illustrer forskjellen mellom sentraltendens og spredning. Navngi to mål på sentraltendens og to mål på spredning. På forelesningene har vi lagt mest vekt på sentraltendensmålene modus, median og gjennomsnitt, og de tilhørende spredningsmålene modalprosent, variasjonsbredde og standardavvik. Ringdal har dette som hovedtema i kapittel 12. i) Når skal man bruke korrelasjonsmålet tau-c, og når skal man bruke Cramers V? Forklar forskjellen mellom disse målene. Ringdals begrepsdefinisjoner: 5 Tau-c: Korrelasjonsmål beregnet på ordinale variabler, som også fungerer selv om det er sammenfallende ranger. Cramers V: Et korrelasjonsmål beregnet på å måle statistisk sammenheng mellom to nominalvariabler i krysstabeller. Det er en normering av kjikvadratet (χ2). I forelesningene har vi lagt vekt på at når vi velger korrelasjonsmål så tar vi hensyn til målenivået på den av de to korrelerende variablene som har lavest målenivå. Vi velger da Cramers V hvis minst en av variablene bør legges på nominalnivå, og tau-c hvis begge variablene tilfredsstiller kravene til ordinalnivå. Vi kan likevel avvike fra denne regelen hvis vi har to rangerbare variabler som ikke er lineære. 6 Oppgave 3 De sentrumsnære skolene og idrettslagene i Trondheim er bekymret for at studenter "okkuperer" ballbinger og fotballbaner på kveldstid. Dette sliter på anleggene og fortrenger yngre brukere. For å få mer informasjon om dette problemet går Trondheim kommune (TK) og Studentsamskipnaden (SiT) sammen og engasjerer Trondheim Øst Forskningsfabrikk (TØFF), hvor du er ansatt som forsker. a) Du vil undersøke studenters opplevelse av disse nærmiljøressursene. Hva slags metoder kan du bruke for å generere kvalitative data? b) Du er usikker på hvor stort dette "okkupasjons"-problemet egentlig er og hvordan det fortoner seg. Du ser for deg at du kan benytte observasjon for å få mer kunnskap. Hvordan kan du gjøre dette og hva slags data kan du generere? c) Hvordan kan du vurdere og redegjøre for kvaliteten av det arbeidet du har gjort? d) Du finner ut at tilsvarende problemer finnes i Bergen. Beskriv 3 typer av generalisering som du kan benytte for at også Bergen kommune kan kunne nyttiggjøre seg resultatene dine? MÅL: Få innsikt i studentenes kunnskaper og ferdigheter i kvalitative forskningsmetoder. a) Siden dette handler om OPPLEVELSE, er det sentralt at dybdeintervjuer tas med. Observasjon og dokumenter (og eventuelt annet) kan også nevnes, men her er det sentralt at man tenker konkret på hva det er man skal finne ut. I begrepet "generering" ligger det at data skapes i den situasjon de samles inn. b) Observasjonsroller bør nevnes, og det er naturlig at man her ender opp med å anbefale én eller annen form for deltakende observasjon. Et viktig spørsmål når man gjør observasjonsstudier er å finne en rolle som er legitim på den plassen man skal observere. I de fleste situasjoner er det ikke naturlig at forskere ”henger rundt” for å studere det som skjer. Sosiologen Erving Goffman hadde en rolle som gymlærer i sitt studium av livet på mentalsykehus (1961) og fikk på denne måten legitimert sin tilstedeværelse både i forhold til andre ansatte og pasientene. Men ofte er det vanskelig å finne slike roller eller jobber som man kan gå inn i, og man er rett og slett en observatør og ikke noe annet. En av de første diskusjonene av roller under observasjon er presentert av Gold (1958). Han redegjør for fire roller, fullstendig deltaker, observerende deltaker, deltakende observatør og fullstendig observatør. Begge de fullstendige rollene er skjult observasjon, enten som deltaker på linje med alle de andre eller som fullstendig utenfor situasjonen, for eksempel med oversyn over et område. Observerende deltaker og deltakende observatør er begge åpne observatørroller, hvor de observerte vet at forskeren er observatør (deltakende observatør) eller at deltakeren også er forsker (observerende deltaker). c) Her det å diskutere pålitelighet og gyldighet. Ofte benyttes de tre kriteriene reliabilitet (pålitelighet), validitet (gyldighet) og generaliserbarhet som indikatorer på kvalitet. I kvalitativ forskning har man i noen grad snakket om troverdighet, bekreftbarhet og overførbarhet (Thagaard 1998) som de tilsvarende tre indikatorer. Man kan godt oversette de godt innarbeidede indikatorene til norsk, men å innføre nye begreper for det samme er lite 7 hensiktmessig. De norske begrepene pålitelighet, gyldighet og generaliserbarhet fungerer utmerket godt som kriterier for kvaliteten på kvalitativ forskning. Pålitelighet: Innenfor all type samfunnsforskning vil forskeren ha ett eller annet nivå av engasjement i det tema det forskes på. Innenfor en positivistisk tradisjon er idealet nøytrale eller objektive observatører. Forskerens engasjement i tematikken vil da kunne betraktes som støy i prosjektet ved at det kan påvirke resultatene. Innenfor den fortolkende tradisjonen, som kvalitativ forskning er basert på, har man innsett at en fullstendig nøytralitet ikke kan eksistere. Her vil forskerens engasjement også kunne betraktes som støy, men også som en ressurs. Det blir viktig å gjøre rede for hvordan ens egen posisjon kan komme til å prege forskningsarbeidet. I en rekke prosjekter er det en forutsetning at forskeren har et spesielt engasjement og særlig kunnskap om det området som studeres. For å styrke prosjektets pålitelighet, eller reliabilitet, blir det viktig å reflektere over om man har noe til felles med informantene, eller om man har spesiell kunnskap og engasjementet, og hvordan slikt kan ha påvirket tilgang til feltet, utvalg, datainnsamling, analyse og resultater. Mye kunnskap om det aktuelle temaet er en fordel for å stille presise spørsmål, men kan også være en ulempe ved at man har med seg mange forutinntattheter. Som påpekt av Clive Seale (1999) er det viktig at forskeren redegjør for hvilken informasjon som kommer gjennom datainnsamling og hva som er forskerens egne analyser. Ved dybdeintervjuer gjør bruk av diktafon det mulig for forskeren å legge fram direkte sitater, slik informantene la dem fram. Dette vil kunne styrke troverdigheten til undersøkelsen fordi informantens ”stemme” gjøres synlig i noen grad helt fram til leseren. Men det er da også viktig at det redegjøres for hvordan sitatene er valgt ut: Hva representerer de i forhold til alt det informantene har sagt som ikke er sitert? Teori vil kunne forme forskningen i større eller mindre grad. Når man formidler resultater blir det viktig å redegjøre for hvordan perspektiver eller teorier har bidratt til å forme forskningsdesign og analyse. Hvordan informanter har blitt valgt ut, og knyttet til dette, hva slags relasjoner det er mellom forsker og informanter, kan ha betydning for reliabiliteten. I noen sammenhenger kan det være tette forbindelser mellom dem; kanskje var dette eneste mulighet til å kunne gjøre forskning. I så fall blir det avgjørende å være åpen for disse relasjonene. Jeg mener at man også innenfor kvalitative studier kan stille spørsmålet som man bruker for å teste reliabiliteten i kvantitative studier: Ville resultatene blitt de samme dersom en annen forsker gjorde den samme jobben? Man trenger ikke svare et klart ”ja” for høy reliabilitet, men redegjøre for hvilke faktorer som kan peke i retning av at disse resultatene framkom fordi det var denne forskeren og disse informantene som var involvert. Eller motsatt, redegjøre for hvorfor resultatene ville ha blitt mye det samme om man forsøkte å gjøre prosjektet om igjen med andre folk. Kort sagt, blir det viktig å fortelle om konteksten til undersøkelsen for å heve reliabiliteten. Gyldighet (validitet): Innenfor den kvantitative forskningstradisjonen har man fornorsket det engelske ”validity” til validitet for å snakke om gyldighet (som jo faktisk er ”validity” på norsk). Jeg foreslår derfor at den reelle, i stedet for Validitet betyr gyldighet. Når vi snakker om validitet i forskningen tenker vi på om de svarene vi finner i forskningen faktisk er svar på de spørsmål vi forsøker å stille. Innenfor en fortolkende tradisjon kan dette være en relativt komplisert affære. Kvale (1997) foreslår at vi kan snakke om kommunikativ og pragmatisk validitet, hvor den første testes i dialog med forskersamfunnet og den andre testes ved spørsmålet om forskningen fører til endring eller forbedring. Innenfor samfunnsforskningen vil sistnevnte form for validitet først og fremst være relevant for såkalt aksjonsforskning, hvor 8 forskning ses på som en form for demokratisk erkjennelsesprosess. Innenfor de fleste samfunnsvitenskapene er det den kommunikative validiteten vi er opptatt av. Vi tester den i dialog med forskersamfunnet, for eksempel på konferanser og ved publisering av resultater i vitenskapelige tidsskrifter, men også ved at vi konstant forholder oss til tidligere relevant forskning, aktuelle teorier og perspektiver. Vi kan styrke validiteten ved å være åpne på hvordan vi praktiserer forskningen, ved å redegjøre for de valg vi tar, og ved å være sensitive for hva som vesentlig innenfor tematikken vår, og om dette endrer seg. Den viktigste sikringen for høy validitet er uansett at forskningen pågår innenfor rammene av faglighet, forankret i relevant annen forskning. Dette betyr i praksis at vi forholder oss bevisst til tidligere forskning som er gjort innenfor samme tema og/eller med samme metoder, ved at vi sammenstiller våre funn med funn fra andres relaterte forskning og hva vi selv eventuelt har konkludert med tidligere. Man kan innvende at dette kravet vil gjøre forskningen konservativ, og det stemmer at forskningen nettopp er konservativ; den beveger seg med bitte små skritt. Men disse små skrittene sikrer at forskning bygger på forskning for best mulig validitet. Vi bør ikke forstå dette som at våre resultater bør s d) Ingen generalisering: (Vel, dette er jo ingen form for generalisering, men et argument i dette henseendet.) Målet med et kvalitativt forskningsprosjekt kan være å gå dypt inn i et spesifikt problemområde, hvor det situasjonsbestemte møtet mellom forsker og informant (for eksempel i et dybdeintervju) eller informasjon knyttet til det spesifikke caset, ikke lar seg, eller ikke er ønskelig å generalisere. Naturalistisk generalisering: Man kan i rapporteringen av forskningen redegjøre godt nok for detaljene i for eksempel et case, til at leseren selv kan vurdere hvorvidt funnene vil ha gyldighet for eksempel for leserens eget case. Moderat generalisering: Generalisering kan tenkes i en mer kvantitativ forstand, hvor det er opp til forskeren å beskrive for hvilke situasjoner (tider, steder, kontekster og andre variasjoner) resultatene vil kunne være gyldige. Konseptuel generalisering: Man kan ved kvalitativ forskning utvikle konsepter, typologier eller teorier som vil ha relevans for andre case enn det (eller dem) som er studert. Konseptuel generalisering er å anbefale for et induktivt studium. 9 Formler som kan komme til nytte: (O E) 2 Kjikvadratet: E 2 Pˆ 1 der O er observert fordeling, og E er fordeling ved statistisk uavhengighet der P sannsynlighet og L er predikert logit (L = β0 + β1X1 + β2X2 + … + βkXk) ˆ 1 e-L Cramer V Kjikvadratet N (k 1) Kendalls Tau c der k er antall kategorier i variabelen med færrest verdier 2k ( L U ) n 2 (k 1) der L er par ordnet likt, og U er par ordnet ulikt Kritiske verdier i normalfordelingen: Kjikvadratfordelingen: A n ta ll fr ih e ts g r . df 1 2 3 4 5 6 0 ,9 9 0 ,0 0 0 2 0 ,0 2 0 ,1 2 0 ,3 0 0 ,5 5 0 ,8 7 0 ,9 0 0 ,0 2 0 ,2 1 0 ,5 8 1 ,0 6 1 ,6 1 2 ,2 0 0 ,5 0 0 ,4 6 1 ,3 9 2 ,3 7 3 ,3 6 4 ,3 5 5 ,3 5 S a n n s y n lig h e t 0 ,2 0 0 ,1 0 1 ,6 4 2 ,7 1 3 ,2 2 4 ,6 1 4 ,6 4 6 ,2 5 5 ,9 9 7 ,7 8 7 ,2 9 9 ,2 4 8 ,5 6 1 0 ,6 5 0 ,0 5 3 ,8 4 5 ,9 9 7 ,8 2 9 ,4 9 1 1 ,0 7 1 2 ,5 9 0 ,0 2 5 ,4 1 7 ,8 2 9 ,8 4 1 1 ,6 7 1 3 ,3 9 1 5 ,0 3 0 ,0 1 6 ,6 4 9 ,2 1 1 1 ,3 4 1 3 ,2 8 1 5 ,0 9 1 6 ,8 1 0 ,0 0 1 1 0 ,8 3 1 3 ,8 2 1 6 ,2 7 1 8 ,4 7 2 0 ,5 2 2 2 ,4 6 10