Skriftlig eksamen i Økonomistyring
Transcription
Skriftlig eksamen i Økonomistyring
Det sociale helbred - en sociologisk undersøgelse af social kapitals indflydelse på helbredet Eksamensnumre: ( DDS: 848, kvant.: 1011), (DDS: 850, kvant. 1017), (DDS: 844, kvant.: 1044) og (DDS: 849, kvant.: 1107) Fag: Det danske samfund i sociologisk perspektiv og Kvantitative metoder Underviser i DDS: Jørgen Elm Larsen Vejleder i DDS: Hannah Heelund Madsen Underviser i Kvantitative metoder: Lars Pico Geerdsen Vejleder i Kvantitative metoder: Siri Dencker Antal tegn med mellemrum: 119.920 Antal tegn i fodnoter med mellemrum: 852 Indholdsfortegnelse 1. Introduktion (848,1011), (850,1017), (844,1044), (849,1107) 1.1 Indledning og problemformulering 1.2 Læsevejledning 4 4 5 2. Helbredsbegrebet i et socialkonstruktivistisk perspektiv (848, 849) 2.1 Biomedicinen 2.2 Socialkonstruktivismen 2.3 Selvvurderet helbred 5 6 7 8 3. Social kapital (850, 848, 849) 3.1 Indledende om kapitalformerne 3.2 Definition af social kapital 3.3 Social reproduktion 3.4 Det sociale rum 3.5 Hverdagspraktikker 3.6 Social kapitals indflydelse på den enkeltes helbred 10 11 12 12 14 15 15 4. Teoretisk hypotese (844,1044) 17 5. Operationalisering (849,1107) 5.1 Helbred 5.2 Social kapital 17 17 18 6. Empirisk hypotese (848,1011) 20 7. Datapræsentation (1044) 7.2 Sammensætning af stikprøven 7.3 Bortfald 7.4 Bortfaldets sammensætning 20 21 22 22 8. Analysestrategi (1044) 8.1 Test af analysevariabler 8.2 Repræsentativitetstest 8.3 Test af empirisk hypotese 8.4 Test af bagvedliggende faktor 23 23 23 24 24 9. Statistisk teori (1011,1017) 9.1 Hvorfor statistik? 9.2 Stokastisk variabel 9.3 Sandsynlighedsmål 9.3.1 Simultan sandsynlighed 9.3.2 Marginal sandsynlighed 9.3.3 Betinget sandsynlighed 9.4 Uafhængighed 9.5 Beskrivende mål 9.5.1 Middelværdi 9.5.2 Varians 9.6 Fordelinger 9.6.1 Bernoullifordeling 9.6.2 Normalfordeling 24 25 25 26 26 26 26 27 27 27 28 28 28 28 2 9.7 Den standardiserede normalfordeling 9.8 Stikprøver og karakteristika ved stikprøver 9.8.1 En estimator for middelværdien 9.8.2 En estimator for variansen 9.9 Den centrale grænseværdisætning 29 30 30 31 31 10. Variabelpræsentation (1044) 10.1 Nære venskaber 10.1.2 Konfidensintervaller 10.2 Selvvurderet helbred 32 32 33 35 11. Repræsentativitetstest (1011,1017,1044,1107) 11.1 Opstilling af hypotesetest 11.2 Repræsentativitetstest for køn 11.3 Repræsentativitet for alder 11.3.1 P-‐værdi 11.4 Repræsentativitetstest for indkomst 36 36 37 42 46 47 12. Test af empirisk hypotese (1011,1107) 12.1 χ2-‐test for uafhængighed 12.2 Enkeltcelletest 52 52 57 13. Test af supplerende empirisk hypotese 13.2 Enkeltcelletest 59 63 14. Diskussion (848,850,844,849) 14.1 Empiriske resultater (848,1011),(850,1017),(844,1044),(849,1107) 14.2 Kausalitetsforhold mellem social kapital og helbred 14.3 Helbred som årsag til social eksklusion? 14.4 Helbred og refleksivitet i det senmoderne samfund 14.4.1. Sundhedsdiskurs og –politik i en dansk kontekst 65 65 67 68 69 71 15. Konklusion (848,1011), (850,1017), (844,1044), (849,1107) 72 16. Perspektivering (844,1044) 16.1 Adfærdsregulerende tiltag eller ej? 73 73 17. Litteraturliste 17.1 Bøger 17.2 Rapporter 17.3 Artikler 17.4 Internet 75 75 77 77 77 18. Bilag 18.1 Do-‐file fra Stata 78 78 3 1. Introduktion 1.1 Indledning og problemformulering Vi vil i denne opgave undersøge sammenhængen mellem social kapital og helbred. Motivationen for at undersøge denne sammenhæng er en undren over, at vi i dag stadig oplever social ulighed i helbredsniveauet i Danmark. Dette forekommer på trods af en række socialpolitiske tiltag, der netop skal sikre alle danskere gode levekår. Et gratis offentligt sygehusvæsen lader ikke alene til at kunne løfte denne opgave, idet der stadig forekommer højere dødelighed og mere sygdom blandt lavere socioøkonomiske grupper. En forebyggende og sundhedsfremmende indsats bliver da også mere og mere en del af det sundhedspolitiske arbejde. Der findes en del forskning i forskellige forklaringsårsager til den sociale ulighed i det danske samfund. Man er nået til en erkendelse af, at der må andre midler til end alene økonomisk omfordeling for at kunne sikre alle borgere en acceptabel levestandard. Den traditionelle sundhedsforskning har hidtil været domineret og underlagt af det økonomiske og politiske magtfelt (Jensen et al 2007:25). Men man kan anskue et paradigmeskrift i sundhedsforskningen, idet man har bevæget sig mere imod at måle på individuelle faktorer så som venskabsrelationer og tillidsforhold frem for alene økonomiske parametre og strukturer (Jensen et al. 2007:24). Vores baggrund for at undersøge sammenhængen mellem social kapital og helbred læner sig op ad de senere års sundhedsforskning. Vi vil i denne opgave give et kritisk blik på den traditionelle forståelse af sundhed og helbred, og belyse hvordan selvvurderet helbred på mange måder kan være væsentligt at inddrage, når man vil beskrive menneskers helbredsniveau. Dernæst vil vi fokusere på hvorledes helbredet hos den enkelte kan ses i sammenhæng med Pierre Bourdieus begreb om social kapital. Vi tager fat i hans teori om social reproduktion, og kan herved belyse hvorledes mekanismer skaber og opretholder ulighed i helbredsniveauet. Dette udmønter sig i følgende problemformulering: ”Hvordan medvirker social kapital til at skabe ulighed i helbred?” 4 Med denne problemformulering ønsker vi således at finde en teoretisk og empirisk sammenhæng mellem social kapital og helbred. 1.2 Læsevejledning I det følgende vil vi redegøre for helbred i et socialkonstruktivistisk perspektiv samt for Bourdieus reproduktions- og kapitalteori. Dernæst præsenteres den teoretiske hypotese, efterfulgt af en operationalisering af de teoretiske nøglebegreber, social kapital og helbred, der ligger til grund for den fremadrettede analyse. Dette munder ud i udformningen af den empiriske hypotese. Vi gennemgår da den grundlæggende statistiske teori, der danner basis for de tests, som vil blive foretaget i de følgende afsnit; først af analysevariablerne, dernæst i repræsentativitetstesten og sidst i forbindelse med vores statistiske test af sammenhængen mellem analysevariablerne. Der foretages desuden en test for om indkomst også influerer på helbredet. Der konkluderes følgeligt på den empiriske analyses samlede resultater, som også i dette afsnit diskuteres. Derpå følger en diskussion af kausalitetsforholdet mellem analysevariablerne 'nære venskaber' og 'selvvurderet helbred'. I forlængelse heraf præsenteres teori om social eksklusion, som underbygger en vekselvirkning mellem disse. Desuden diskuteres opgavens teoretiske grundlag, Bourdieus reproduktions og -kapitalteori i forhold til teori om den senmoderne individualisering og risiko, samt hvordan disse forskellige aspekter kan have en indflydelse på sundhedspolitiske diskurser. Slutteligt konkluderes der samlet på opgaven og der perspektiveres, med diskussionen som springbræt, til den sundhedspolitiske indsat i Danmark. 2. Helbredsbegrebet i et socialkonstruktivistisk perspektiv I dagens Danmark er der, som bekendt, et stort politisk og mediemæssigt fokus på den danske befolknings generelle helbredsniveau. Derfor hører man også ofte begrebet helbred nævnt i medierne, men hvad ligger der egentlig i dette begreb? I Politikens dansk ordbog defineres helbred som: ”En persons fysiske tilstand med hensyn til at være sund og rask.” (Becker-Christensen et.al., 2007: 295). Denne ret brede definition dækker således over den enkeltes overordnede fysiske velbefindende. En person med et godt helbred er derfor én, der hverken lider af nogle synderlige sygdomme eller fysiske skavanker. Det omvendte gør sig, som en logisk følge heraf, gældende for en person med et dårligt helbred. Denne almene opfattelse af helbredsbegrebet er forholdsvis let at gå til, men for at anskueliggøre hvordan helbredsbegrebet opfattes indenfor sociologien, er det vigtigt at forstå begrebet i relation til biomedicinen. I det følgende vil vi derfor redegøre for, hvordan og hvorfor sociologien har udviklet et helbredsbegreb, der står i kontrast til det biomedicinske. Redegørelsen 5 tager udgangspunkt i den socialkonstruktivistiske tekst The Sociology of Health and Illness af sociologen, Sarah Nettleton samt en undersøgelse af selvvurderet helbred foretaget af de to amerikanske forskere, Jana Mossey og Evelyn Shapiro. 2.1 Biomedicinen Den såkaldte biomedicin er den fremherskende model indenfor den vestlige moderne lægevidenskab. Denne model bygger på fem grundantagelser; At kroppen og sindet kan behandles separat, at kroppen kan repareres som en maskine, at teknologiske fortjenester overdrives således, at medicin indoptager et teknologisk imperativ, at medicin er reduktionistisk, idet sygdomsforklaringer reduceres til biologiske forandringer, og at enhver sygdom er forårsaget af én sygdomsenhed. Disse fem grundantagelser danner så at sige rammen om hele biomedicinen, der har været den samfundsmæssige diskurs i historiens løb i forhold til at forstå og forklare den menneskelige krop, sygdomme samt helbredstilstande (Nettleton 2006:2). I de senere år er denne diskurs dog blevet voldsomt kritiseret af sociologien og samfundsvidenskaben i øvrigt. Denne kritik, der ligger i forlængelse af biomedicinens grundantagelser, tydeliggør kontrasten imellem biomedicinen og sociologiens helbredsopfattelser (Nettleton 2006:4). Et sociologisk kritikpunkt af biomedicinen går på, at mennesket opfattes som et objekt frem for et subjekt. Ved udelukkende at fokusere på de kropslige symptomer, opfattes patienten altså ikke som et helt menneske. Ud fra et sociologisk perspektiv er dette problematisk, fordi der foruden en dehumanisering af mennesket samtidig er en risiko for, at biomedicinen overser karaktertræk hos patienten, der kan være af stor betydning for dennes helbred (Nettleton 2006:5f). I kritikken tydeligøres også, at biomedicinen og sociologien har to ret forskellige opfattelser af den menneskelige krop. Mens biomedicinen ser kroppen som en passiv anatomi, der skal kureres for sygdomme, ser sociologien kroppen som en del af et menneske, der interagerer i sociale relationer (Nettleton 2006:10). Den biomedicinske model er baseret på en tydelig adskillelse mellem krop og psyke – det gælder altså om at forstå sygdommen og ikke patienten (Kristensen 2002:18). En anden kritik går på, at biomedicinen mere eller mindre bevidst overser faktorer, der indenfor sociologien opfattes som værende altafgørende for den enkeltes helbred. Biomedicinen formår således ikke at forstå den menneskelige krop i en større samfundsmæssig kontekst. Hermed negligeres økonomiske, kulturelle og sociale faktorer, som ellers gentagende gange har vist sig at være afgørende for den enkeltes 6 livschancer. Helbred kan altså ifølge sociologien ikke udelukkende forstås ud fra den biomedicinske model (Nettleton 2006:5). 2.2 Socialkonstruktivismen Den vel nok mest dominerende retning indenfor sociologien, der beskæftiger sig med menneskets helbred, er socialkonstruktivismen (Nettleton 2006:16). Som det er tilfældet med langt de fleste teoretiske opfattelser, findes der også indenfor socialkonstruktivismen flere forskellige retninger og varianter. Vi vil her redegøre for nogle af hovedtrækkene i teorien for at belyse helbredsbegrebet. Socialkonstruktivisme er, som betegnelsen antyder, en opfattelse af, at mennesket lever i en konstrueret social virkelighed (Bredsdorff 2011:631). Det er teoriens påstand, at al viden og dermed også den lægevidenskabelige, er samfundsskabt. Viden om sygdomme og helbredstilstande er ikke givet på forhånd, idet den er et resultat af menneskelig forskning (Nettleton 2006:13). Sygdomme skal derfor ifølge socialkonstruktivismen betragtes som biomedicinske fabrikationer frem for opdagelser af reelle naturgivne fænomener (Nettleton 2006:18). Heri ligger også den slet skjulte kritik af det faktum, at biomedicinen ikke nødvendigvis har fundet frem til den endegyldige og objektive sandhed om sygdomme og helbred – en opfattelse der ellers har været fremherskende tidligere (Nettleton, 2006:6;18). Ifølge socialkonstruktivismen bør man analysere biomedicinen i dennes sociale, kulturelle og historiske kontekst, for at finde frem til de dominerende diskurser. Ingen diskurser er konstante størrelser, men er betinget af deres samtid. Den nuværende diskurs om helbred kan derfor meget vel forandres markant over tid (Nettleton 2006:15f;20f). Diskurserne indenfor biomedicinen kan desuden være med til at reproducere de sociale strukturer i samfundet, hvis ikke de problematiseres (Nettleton 2006:23f). Socialkonstruktivismen retter hermed en skarp kritik imod biomedicinen for at problematisere dennes opfattelse af helbredsbegrebet. I de senere år har der været en tendens til, at den ellers så stærke kontrast mellem biomedicinen og sociologien, herunder socialkonstruktivismen, er blevet mindre udtalt. Dette skyldes til dels, at begge videnskaber har gjort nogle indrømmelser i forhold til hinanden. Dels er det et resultat af, at sygdommenes karakter samt samfundets reaktion herpå er ændret. Helt overordnet set er opmærksomheden både indenfor biomedicinen og sociologien rykket fra sygdomme til helbredstilstande. I dag er der således et stigende fokus på de livstilsforebyggende og strukturelle faktorer, der har afgøren- 7 de betydning for menneskets helbred. For at tydeliggøre den forandring som sociologiens betragtninger om helbred har gennemgået, skelner man ofte mellem sociologien i biomedicinen og sociologien om biomedicinen. Sociologien i biomedicinen refererer til 1950’erne og 60’ernes sociologi, hvor sociologer arbejdede på at finde svar på helbredsmæssige problematikker ud fra lægevidenskabelige interesser. Sociologien om biomedicinen henviser til den nutidige sociologi med socialkonstruktivismen i spidsen, der forholder sig mere kritisk til biomedicinen. Her er den enkeltes egen opfattelse af sit helbred som udgangspunkt mindst lige så gyldig som den lægefaglige vurdering heraf (Nettleton 2006:10ff). Denne teoretiske tilgang eksemplificeres i det engelske sprog. Foruden det overordnede begreb ’sickness’ har man på engelsk to andre begreber for sygdom; ’disease’ og ’illness’. Det første begreb dækker over forskellige fysiologiske symptomer forårsaget af patologiske ændringer i kroppen, mens sidstnævnte referer til den enkeltes egen fortolkning af og reaktioner på disse symptomer. Groft stillet op kan man her sige, at biomedicinen fokuserer på ’dieseases’, mens sociologien beskæftiger sig med ’illnesses’ (Nettleton 2006:13). Indenfor sociologien er der således en opfattelse af, at menneskets egen fortolkning af dets helbred er mindst lige så gyldig som den biomedicinske (Nettleton 2006:6). Man opererer her med begrebet selvvurderet helbred, som henviser til den enkeltes egen vurdering af sit eget helbred. 2.3 Selvvurderet helbred Der er to helt centrale forskelle mellem den biomedicinske model og den sociologiske samt socialkonstruktivistiske tilgang, hvor den førnævnte sociologiske kritik af biomedicinens dehumanisering kommer til udtryk: For det første tager den biomedicinske model udgangspunkt i, hvad patienten fejler, hvilket står i modsætning til, hvad selvvurderet helbred handler om – nemlig hvordan personen selv føler han eller hun har det (Kristensen 2002:19f). En anden væsentlig forskel mellem den biomedicinske tilgang og det selvvurderede helbred er, at den biomedicinske model kun betragter de medicinske diagnoser som ”objektive”, mens selvvurderet helbred anses for at være ”subjektivt” (ibid.). Her står sociologien og den socialkonstruktivistiske tilgang igen i modsætning til biomedicinen: Menneskets egen tolkning af dets helbred anses, som nævnt, mindst ligeså gyldig som de lægefaglige diagnoser. Der har ligefrem været en tendens til, at folk i højere grad tager kontrol over deres eget helbred som en modreaktion på den øgede ekspertliggørelse af det menneskelige helbred (Nettleton 2006:5). I de senere år har der imidlertid også været en tendens til, at lægevidenskaben 8 ikke længere udelukkende arbejder ud fra den biomedicinske model, men ligeledes anerkender og tager patientens selvvurderede helbred i betragtning, når der skal stilles en diagnose (Nettleton 2006:21). I 1982 publicerede forskerne, Jana Mossey og Evelyn Shapiro, en undersøgelse, der i dag bliver set som en klassiker indenfor litteraturen om selvvurderet helbred. Mossey og Shapiro adspurgte i 1971 3.000 ældre mennesker på 65 år eller derover om, hvordan de ville vurdere deres helbred deres alder taget i betragtning. De fulgte herefter de medvirkende i seks år og kunne efterhånden se en klar tendens blandt de adspurgte; Jo dårligere selvvurderet helbred i 1971, jo højere dødelighed i de efterfølgende seks år (Kristensen 2002:21). Mossey og Shapiro kunne altså påvise en sammenhæng mellem det selvvurderede helbred og dødeligheden blandt de medvirkende. Selv ved kontrol for socioøkonomiske faktorer såsom køn, alder og indkomst, gjorde denne sammenhæng sig stadig gældende. De interviewede ”vidste” altså noget om deres helbred, selvom det ikke var understøttet af en diagnose. Resultaterne fra Mossey og Shapiros undersøgelse ses i følgende søjlediagram: Figur 2.1: Selvvurderet helbred og dødelighed. I diagrammet ses resultaterne fra de første 3 års opfølgning af 3128 mennesker på 65 år eller derover (Kristensen 2002:21). Det fremgår af figuren, at gruppen med dårligst selvvurderet helbred havde 2-3 gange så høj dødelighed som gruppen af medvirkende med ’fremragende’ helbred. Personer med ’fremragende’ selvvurderet helbred havde således også den laveste dødelighedsrate i undersøgelsen. Dette understøtter 9 undersøgelsens pointe: Det selvvurderede helbredsniveau passede med, hvordan dødeligheden i de følgende år fordelte sig blandt de adspurgte. Mossey og Shapiros undersøgelse af selvvurderet helbred er blevet forbillede for en – i dag – omfattende forskning på området (Kristensen 2002:22). Senere forskning indenfor området har for eksempel forsøgt at forklare, hvordan det selvvurderede helbredes skabes hos individet. Det ser ud til, at individet samlet vurderer sit psykiske og somatiske helbred, og inddrager i denne forbindelse både funktionsevne, lægelige diagnoser, symptomer og almindeligt velbefindende (Bjørner et al. 1996 i Kristensen 2002:22). Andre faktorer, der inddrages, er en række sociale og kulturelle forestillinger1 (ibid.). samt en vurdering af, hvad der er det ”normale” for en given alder (ibid.). En ældre person kan således vurdere sit helbred ’godt’ eller ’fremragende’, selvom vedkommende måske lider af gangbesvær eller dårlig hørelse. Sociologien og herunder socialkonstruktivismen reformulerer det traditionelle helbredsbegreb igennem en kritisk problematisering af biomedicinen. Den biomedicinske viden hævdes at være socialt konstrueret og denne kan derfor ikke nødvendigvis betragtes som værende den endegyldige sandhed. Det sociologiske helbredsbegreb efterstræber at rumme alle de aspekter af det personlige og det sociale, som opfattes som influerende på menneskets helbred samt oplevelsen heraf. Økonomiske, kulturelle og sociale faktorer må derfor ikke negligeres, når der er tale om helbred. Det selvvurderede helbred, forstået som den enkeltes egen fortolkning af sit helbred, er vægtet højt indenfor sociologien efter Mossey og Shapiro publicerede undersøgelsen herom. Vi vil med afsæt i denne redegørelse for det sociologiske helbredsbegreb introducere Pierre Bourdieus begreb om social kapital, som er vores teoretiske fokus for forståelsen af ulighed i danskerne helbredsniveau. 3. Social kapital Begrebet ’social kapital’ er blevet defineret af flere teoretikere igennem det 20. århundrede. Disse tæller blandt andre, James S. Coleman, Robert D. Putnam og Pierre Bourdieu. Vi har, som sagt, valgt at tage udgangspunkt i sidstnævntes forståelse af begrebet, da vi med Bourdieus begreb kan belyse væsentlige aspekter og årsagsforhold ved social ulighed og sætte dette i relation til helbredsforskelle i befolkningen. Den franske sociolog, Bourdieu, har med sin teori og empiriske arbejde 1 Der er nogle kulturelt bestemte forståelsesrammer (”schemata”), der er bestemmende for den måde, vi vurderer kropslige- og psykiske signaler. 10 synliggjort, hvordan social reproduktion finder sted i det moderne vestlige samfund. Vi vil her redegøre for denne teori ved først at introducere kapitalbegrebet med særlig fokus på social kapital. Dernæst vil vi se på social reproduktion samt Bourdieus teori om sociale felter, sociale positioner, agenters dispositioner (habitus) og positionering. Til sidst vil vi anskueliggøre, hvorfor dette er centralt for at forstå forskelle i menneskers helbred. 3.1 Indledende om kapitalformerne Bourdieu synliggør med sit begrebsapparat nogle af de reproduktionsprocesser, der kan forklare uligheder i menneskers levekår. Han introducerer et kapitalbegreb (Bourdieu 1986:241), der nuancerer og udvider det klassiske økonomiske kapitalbegreb og overskrider hermed den for Bourdieu fuldstændig unaturlige grænse mellem økonomi og sociologi (Svendsen et al. 2006:27-28). Traditionelt set er kapital blevet defineret af Adam Smith som akkumuleret arbejde. Smith skelner mellem fikseret og cirkulerende kapital – en definition som både, David Ricardo og Karl Marx, anerkender. Fikseret kapital består af fire grupper: 1) maskiner og redskaber, som letter arbejdet; 2) bygninger; 3) landforbedringer; 4) tilegnede og nyttige egenskaber ved en person. Sidstnævnte er senere blevet kaldt ’human kapital’. Cirkulerende kapital er den form for kapital, der skabes ved bytte (Svendsen et al. 2006:28-29). Bourdieu betragter ligeledes kapital som akkumuleret arbejde i en materialiseret eller kropsliggjort form (Bourdieu 1986:241). Bourdieus kapitalbegreb omfatter økonomisk, kulturel og social kapital. Økonomisk kapital er direkte omvekslelig til penge eller er institutionaliseret i ejendomsrettigheder (Bourdieu 1986:243). Kulturel kapital figurerer i tre former: Den kropsliggjorte (kropslige dispositioner), den objektiverede (i form af kulturelle goder såsom bøger og malerier) og den institutionaliserede (blandt andet uddannelsesmæssige kvalifikationer) (ibid.). Social kapital er de ressourcer, der opnås gennem netværk. Dette vil blive beskrevet nærmere i det følgende afsnit. Den overordnede kapitalform hos Bourdieu er den symbolske kapital, som er det, de førnævnte tre kapitalformer omformes til, når de anerkendes indenfor et felt eller socialt rum (Järvinen 2007:365). Det er væsentligt at fremhæve, at disse kapitalformer kan omveksles til hinanden (Bourdieu 1986:243), og at kapital, der er fikseret i et medie kan overføres fra generation til generation (Svendsen et al. 2006:35). Individer – eller med Bourdieus begreb agenter – overtager og viderefører tidligere akkumuleret historie (Jensen et al. 2007:31). 11 3.2 Definition af social kapital Bourdieu introducerer begrebet social kapital i ”The Forms of Capital” fra 1986, hvori han skriver: "The volume of the social capital possesed by a given agent thus depends on the size of the network of connections he can effectively mobilize and on the volume of capital (economic, cultural and symbolic) possesed in his own right by each of those to whom he is connected” (Bourdieu 1986:249). Ved social kapital forstår Bourdieu den samlede mængde af ressourcer, aktuelle såvel som potentielle, som den enkelte opnår gennem de netværksrelationer eller grupper, vedkommende indgår i (ibid.). Ens netværk består både af tilfældige relationer som for eksempel naboen og arbejdskollegaen samt af mere forudbestemte relationer som det netværk, man har igennem familien (Jensen et al 2007.:33). I netværket eksisterer en række ressourcer, som den enkelte kan trække på. Der er således tale om ressourcer, som er til rådighed for alle gruppens medlemmer (Bourdieu 1986:249). Herigennem skabes der en solidaritet mellem netværkets medlemmer (Bourdieu 1986:248). Social kapital er modsat den økonomiske kapitalform ikke en kapitalform, der er synlig, men det betyder dog ikke, at den ikke har synlige effekter (Svendsen et al. 2006:37). Mængden af social kapital afhænger både af størrelsen af den enkeltes netværk og kvaliteten heraf. Kvaliteten bestemmes af netværkets besiddelse af økonomisk, kulturel eller symbolsk kapital, som det også fremgår af citatet øverst i afsnittet (Bourdieu 1986:249). Gennem netværket kan den enkelte opnå materielt og symbolsk udbytte, hvilket kan være afgørende for, hvordan den enkelte positionerer sig i samfundet. Social kapital er ikke en naturlig eller given størrelse, men er et resultat af investeringsstrategier, der kan være bevidste såvel som ubevidste, kollektive såvel som individuelle (Jensen et al. 2007:33). Der er tale om en evindelig indsats for at producere og reproducere holdbare, nyttige relationer, der kan sikre en materiel og symbolsk profit (Bourdieu 1986:249). Social kapital har desuden en række lighedspunkter med økonomisk kapital, idet Bourdieu betragter det som noget, der kan investeres i og forrentes – man kan således vedligeholde og videreudvikle sin sociale kapital (Jensen et al. 2007:33). 3.3 Social reproduktion På trods af idealer om lighed og demokrati, er der stadig store levekårsmæssige forskelle på sociale grupper i det vestlige samfund. Denne problematik belyser Bourdieu med sin teori om social repro- 12 duktion. Bourdieu bidrager til at forstå social ulighed ved at vise, hvordan der sker en differentiering mellem de mere og de mindre privilegerede i samfundet (Jensen et al. 2007:23) I forbindelse med sin undersøgelse af det franske uddannelsessystem, beskriver han dette som en institution, der helliger sig til en sikring af privilegier til de i forvejen privilegerede (Jørgensen 2003:43). Uddannelsessystemet reproducerer hermed klassesamfundet, idet skolen forudsætter en specifik kulturel baggrundskapital for de studerende (Järvinen 2007:355). Der vil i undervisningssammenhæng altid være et særligt indhold og sprog, som nogle har bedre forudsætninger for at forstå. Det samme gælder den måde, man eksaminerer og afholder prøver på (Jensen et al. 2007:35). Uddannelsessystemet udøver på denne vis symbolsk vold. Med symbolsk vold henviser Bourdieu til den måde hvorpå en dominerende gruppe mennesker og deres virkelighed bliver til den objektive virkelighed. Det er en form for magtform, der er med til at konstruere virkeligheden (Bourdieu 1996:40). Dette anser Bourdieu som en følge af en social fortrængning i alle sociale lag, hvorved magtrelationer mellem de dominerende og de dominerede er objektiveret i rumlige og tingslige relationer, som mellem store godser og små lejelejligheder (Jensen et al. 2007:34). Langt mere magtfuld er den måde hvorpå den kultur, som man er født ind i, opleves som den universelle kultur. Bourdieu beskriver, hvordan kulturen internaliseres i individet og opleves som dén eneste kultur (ibid.). Dermed er de dominerede med til at undertrykke sig selv ved ubevidst at acceptere en ’universel’ og arbitrær kultur (Jensen et al. 2007:35). Men hvem er så de dominerende og de dominerede i vestens samfund, og hvordan er de positioneret i forhold til hinanden i det sociale rum? Det har Bourdieu opstillet et skema for, som vi i det næste afsnit vil uddybe. 13 3.4 Det sociale rum Bourdieu har i ”Distinktionen” opstillet et skema kaldet ’rummet af sociale positioner og rummet af livsstile’, som er både teoretisk og empirisk forankret. Skemaet, som ses nedenfor, tager udgangspunkt i de to dominerende differentieringsprincipper i det moderne samfund (Bourdieu 1994:21). De er forskellene i økonomisk og kulturel kapital. Figur 3.1 Pierre Bourdieu: ”Rummet af sociale positioner og rummet af livsstile”2 2 http://c-samf.systime.dk/typo3temp/pics/43b6c40822.png 14 Agenterne placeres i dette skema ud fra deres besiddelse af disse to kapitaler, og skemaet tydeliggør da agenternes placering i forhold til hinanden. De rumlige afstande svarer til de sociale afstande (ibid.), hvilket tydeliggøres gennem de to dimensioner i skemaet. For det første gennem den samlede mængde af kapital og for det andet gennem den relative mængde af henholdsvis økonomisk og kulturel kapital. Hermed indtræder en afstand mellem agenterne i skemaet, der tilsvarer den sociale afstand (ibid.). Rummet af sociale positioner angiver agenters positioneringer i samfundslivet. I denne forbindelse er Bourdieus begreb om dispositioner eller habitus nødvendig for at forstå fordelingen i det sociale rum. Dette vil vi redegøre for i det følgende. 3.5 Hverdagspraktikker Den position, agenten har i det sociale rum, er afgørende for agentens smagspræferencer og habitus. Der skabes for agenten en livsstil, der udgøres af en række personvalg og valg af hverdagspraktikker. Bourdieu fremhæver, at samtidig med, at habitus er forskelliggjort i passiv forstand, idet den er et produkt af forskellige positioner, er den tilmed aktivt forskelliggørende, idet den fører til en differentiering i praktikker (Bourdieu 1994:24). Med habitus forklarer Bourdieu, hvordan individ og samfund sammen regulerer handling. Den samfundsmæssige praksis er nemlig inkorporeret i agenterne (Larsen 1999:75). Habitus er en disposition, der er overført gennem generationer uden at det hverken anerkendes eller opleves sådan hos den enkelte (Jensen et al 2007:34). Habitus er et resultat af underliggende faktorer såsom adgang til kulturelle, uddannelsesmæssige, informationsmæssige, økonomiske og sociale ressourcer (ibid.). Med udgangspunkt i dispositioner og habitusbegrebet kan man altså anskue hvorledes hverdagspraktikker mellem generationer og forskellige sociale positioner differentierer og reproduceres. Det er derfor en meget brugbar teori til at analysere forskelle i helbred med. 3.6 Social kapitals indflydelse på den enkeltes helbred En række studier taler for, at social kapital er af stor betydning for menneskers helbred. Det gælder både studier af social kapital i form af den samlede mængde af tillid i et samfund (Diderichsen, 2011:359), og undersøgelser af sammenhængen mellem sociale relationer og helbred. Vi fokuserer på sidstnævnte sammenhæng i tråd med Bourdieus begrebsapparat. Modtageligheden for sygdomme er således forøget hos personer med få sociale relationer og en ringe grad af følelsesmæssig støtte. Helbredelsen af disse sygdomme tager også ofte længere tid end hos personer med mange relati- 15 oner (Lund et al. 2002:98). Derudover ses mange og gode relationer som fremmende for den enkeltes sundhedsadfærd og velbefindende generelt (Lund et al. 2002:102f). I denne forbindelse kan vi med Bourdieus teori forklare, hvordan den enkeltes sociale position er bestemmende for den enkeltes sundhedsadfærd. Bourdieu beskriver, hvordan skelnen mellem det gode og det dårlige, det rigtige og det forkerte, det fine og det vulgære, er forskellig fra agent til agent (Bourdieu 1994:24). Opfattelser af hvad der er det sunde og usunde må derfor variere i forhold til agenternes sociale position. Hvad der et sted opfattes som sundt, opfattes måske som usundt et andet sted. Der etableres en form for helbredskultur. For eksempel kan en agent være i et netværk, der har en bred viden om ”det sunde liv”, hvilket kommer alle agenterne i dette netværk til gode. Men en agent kan også være i et netværk, hvor den dominerende diskurs er decideret helbredsskadelig for eksempel i forhold til overdreven indtagelse af fastfood, tobak, alkohol og andre rusmidler. Den enkeltes hverdagspraktik forankret i dennes sociale kapital kan altså både være gavnlig og skadelig for helbredet. Når man prøver at forstå sig på forskelle i helbred blandt mennesker, er Bourdieus teori derfor særlig relevant at inddrage. Det er en kendsgerning for sundhedsprofessionelle, at det er svært at ændre på de uligheder, der er i helbredsniveauet hos forskellige sociale grupper. Bourdieu beskriver med sit habitusbegreb, hvordan hverdagspraktikker er et resultat af sociale positioner, som den enkelte agent har meget svært ved at ændre på grundet symbolsk vold. Hvis en agent for eksempel fra barns ben har internaliseret en helbredsskadelig habitus, kræver en forandring først og fremmest, at agenten bliver opmærksom på sin skadelige habitus og dernæst arbejder hårdt på at ændre tingenes tilstand. Bourdieus teori om reproduktion fremhæver og tydeliggør hermed stabiliteten frem for forandringen i disse praktikker (Jensen et al:36). Med disse betragtninger kan vi nu formulere vores teoretiske hypotese. 16 4. Teoretisk hypotese Med udgangspunkt i den foregående redegørelse af helbredsbegrebet og Bourdieus reproduktionsteori med særlig vægt på social kapital, opstiller vi følgende teoretiske hypotese som genstand for vores videre arbejde: Social kapital Helbred Det er vores forventning, at vi ved behandling af det empiriske materiale, vil finde en tendens til, at respondenter med meget social kapital, vil have et relativt bedre helbred, end de respondenter, der besidder mindre social kapital. For at kunne applicere dette teoretiske udgangspunkt på vores empiri, vil vi i det følgende afsnit redegøre for operationaliseringen af de teoretiske begreber, vi beskæftiger os med. Dernæst vil vi i afsnit 6 udforme to empiriske hypoteser på baggrund af operationaliseringen, som vil være grundlaget for det statistiske arbejde med empirien. 5. Operationalisering Vil vi i det følgende argumentere for, hvordan vi har valgt at operationalisere vores teoretiske begreber til målbare variable fra Levekårsundersøgelsen 2000. Denne proces kaldes operationaliseringen, og er et vigtigt skridt i en kvantitativ undersøgelse, idet den muliggør de empiriske test af vores hypoteser. Dog er det ikke muligt at foretage en operationalisering, hvor man indfanger alle dimensionerne af de teoretiske begreber (Hansen et.al., 2009:21f). Kunsten består således i at bevare hovedessensen i begreberne, når disse omformes til empiriske variable, så man med rimelighed kan sige, at operationaliseringen er valid (Hansen et. al., 2009:154f). Vi vil derfor i det følgende begrunde vores valg og fravalg med henvisning til de anvendte teorier. 5.1 Helbred Økonomiske, kulturelle, sociale og personlige omstændigheder betragtes indenfor sociologien som afgørende faktorer for den enkeltes helbred, som tidligere nævnt. I relation hertil opfattes den biomedicinske model, som er den mest udbredte indenfor den vestlige lægevidenskab, i mange hense- 17 ender som utilstrækkelig, idet den mere eller mindre bevidst negligerer denne samfundsmæssige kontekst i en forståelse af helbredet (Nettleton 2006:5). Blandt socialkonstruktivistiske sociologer vægtes den enkeltes selvvurderede helbred derfor som udgangspunkt mindst ligeså højt end den lægefaglige vurdering heraf (Nettleton 2006:6;12). Der er desuden en generel tendens til, at den enkelte tager mere ansvar for sit eget helbred (Nettleton 2006:5), samtidig med at lægevidenskaben i højere grad inkluderer den enkeltes selvvurderede helbred i behandlingsforløbet (Nettleton 2006:21). En klassisk undersøgelse indenfor selvvurderet helbred, er lavet af forskerne, Mossey og Shapiro. De har i deres undersøgelse fra 1982 påvist en klar sammenhæng mellem selvvurderet helbred hos ældre og dødeligheden blandt disse: Jo dårligere selvvurderet helbred de ældre havde i 1971, jo højere dødelighed var der blandt disse i de efterfølgende seks år (Kristensen 2002:21).Vi har derfor valgt at operationalisere helbred til selvvurderet helbred, som det fremgår af følgende figur: Spørgmål 3: Helbred Hvordan vil De alt i alt vurdere Deres helbred? Selvvurderet helbred Vi antager, at denne variabel giver os et godt billede af den enkeltes overordnede fysiske og psykiske velbefindende, idet vi formoder, at respondenterne svarer ud fra deres umiddelbare opfattelse af deres helbredstilstand. Respondenterne vil altså formodentlig ikke vurdere deres helbred godt, hvis de for eksempel har psykiske problemer. Vi har derfor bevidst fravalgt de variable, der handler om specifikke fysiske sygdomme og skavanker, idet vi ønsker at belyse det gennerelle helbredsniveau. Desuden betyder dét, at spørgsmålet allerede stilles som nummer tre i spørgeskemaet, at vi stort set undgår konteksteffekter. Besvarelserne er altså ikke umiddelbart påvirket af tidligere stillede spørgsmål, hvilket alt andet lige også er af betydning (Hansen et. al. 2009:137f). I den videre undersøgelse refererer ’selvvurderet helbred’ derfor til, hvordan den enkelte alt i alt vurderer sit helbred. 5.2 Social kapital Bourdieu definerer, som nævnt, social kapital som den samlede mængde af aktuelle og potentielle ressourcer, som den enkelte besidder i kraft af de netværk, relationer og grupper, som vedkommen- 18 de indgår i (Bourdieu 1986:249). Med begrebet fremhæver Bourdieu, at såvel kvantiteten som kvaliteten af den sociale kapital er af betydning for den samlede kapitalmængde. Kvantiteten refererer her til størrelsen på de netværk, som den enkelte besidder, mens kvaliteten henviser til dette netværks adgang til de øvrige kapitalformer. Det drejer sig derfor ikke kun om at have netværk, men også om at have de rigtige netværk (Bourdieu 1986: 249). Ud fra en overvejelse om, at den enkeltes helbred er mere influeret af kvaliteten end af kvantiteten af den sociale kapital, er det kvalitetsaspektet, vi vil belyse. I dag såvel som i år 2000, hvor Levekårsundersøgelsen stammer fra, er vi i den danske velfærdsstat alle i teorien sikret en vis økonomisk levestandard. Vi antager hermed, at sociale relationer i form af nære venskaber er af større betydning for den enkeltes helbred end den samlede mængde af kapitalformer indenfor den enkeltes netværk. Vi har derfor valgt at operationalisere social kapital til ’nære venskaber’, som det fremgår af følgende figur: Social kapital Spørgsmål 125: Har De nogen venner De kan tale med om personlige problemer? Nære venskaber Vi er af den overbevisning, at denne variabel indfanger de hovedtræk i Bourdieus sociale kapitalbegreb, der er relevante i forståelsen af den enkeltes helbred. Nære venskaber påvirker den enkeltes oplevelse af at blive værdsat og have følelsesmæssig støtte, hvilket alt andet lige er af betydning for dennes fysiske og psykiske velbefindende (Lund et.al 2002: 88). Dét, at have mindst én ven at kunne snakke med om personlige problemer, er altså afgørende i forståelsen af den enkeltes helbred. Fremefter henviser ’nære venskaber’ således til den sociale kapital i forhold til hvorvidt den enkelte har nogen venner at snakke med om personlige problemer. 19 6. Empirisk hypotese På baggrund af operationaliseringen af helbred og social kapital opstiller vi følgende to empiriske hypoteser, som tilsvarer vores teoretiske hypotese: 1. Hvis man ingen venner har at tale med om personlige problemer, medfører det et ringe selvvurderet helbred. Ingen nære venskaber Ringe selvvurderet helbred 2. Hvis man har venner at tale med om personlige problemer, medfører det et godt selvvurderet helbred. Nære venskaber Godt selvvurderet helbred I afsnit 12.1 og 12.2 afprøves disse hypoteser ved brug af statistiske tests. I det nedenstående indleder vi vores empiriske undersøgelse. 7. Datapræsentation Den følgende analyse tager sit empiriske udgangspunkt i data indsamlet i forbindelse med Levekårsundersøgelsen i år 2000. Levekårsundersøgelsen er en prospektiv, longitudinel undersøgelse, der senest er udført i år 2000 og desuden i henholdsvis 1986 og 1976. Undersøgelsen er foretaget ved ansigt-til-ansigt interviews på baggrund af et struktureret spørgeskema, der søger at afdække for- 20 skellige aspekter af danskernes levekår; i undersøgelsen konkretiseret ved en række tematisk inddelte serier af spørgsmål omhandlede blandt andet helbred, deltagelse i sociale aktiviteter, tilgængelighed til materielle goder og så videre. Nedenfor ses en figur, der viser en induktiv analyse. Det ses, at vi går fra en simpel tilfældig udvælgelse til en stikprøve. Vi foretager derefter en induktiv analyse, det vil sige en analyse, hvor man ønsker at udtale sig om en population ud fra denne stikprøve: Simpelt tilfældig udvælgelse Population Stikprøven Induktiv analyse Figur 7.1: Induktiv analyse 7.1 Populationen I 1976 var undersøgelsens genstand den danske befolkning mellem 20 og 69 år, hvilket senere er udvidet til at omfatte den danske befolkning fra 20 til 93 år (Andersen 2003:47)– grunden hertil er at man har søgt at geninterviewe personerne fra den oprindelige stikprøve trukket i 1976, som i mellemtiden var blevet 24 år ældre. Vi kommer ind på mere herom i det følgende afsnit. 7.2 Sammensætning af stikprøven I den oprindelige stikprøve fra 1976 blev respondenterne udtrukket ved hjælp af simpel, tilfældig udvælgelse. I en bestræbelse på at geninterviewe respondenterne i de senere undersøgelser, har man søgt at bevare den oprindelige stikprøve – for at sikre den oprindelige stikprøves fortsatte repræsentativitet, er der, grundet frafald af forskellig art, suppleret med nye respondenter. Tidsfaktoren, 24 år 21 fra første til seneste undersøgelse, har især resulteret i en mangelfuld repræsentation af den yngre befolkning i den oprindelige stikprøve. Desuden er en andel af den oprindelige stikprøve faldet fra som følge af dødsfald og en mindre andel grundet flytning af bopæl til udlandet. Stikprøven fra 2000 består således af to dele: 1. Længdesnitsstikprøve – gengangere fra den oprindelige stikprøve og 2. tværsnitsstikprøve – supplerende udtræk med nye respondenter i aldersgruppen 20-42 år og et mindre antal nye respondenter i aldersgruppen 42-93 år, udtrukket ved hjælp af stratificeret, tilfældig udvælgelse. Stikprøven består i alt af 7.602 respondenter (4.245 fra den oprindelige stikprøve, 3.357 suppleret), hvoraf der er opnået interviews med 4.981 (2.755 fra den oprindelige stikprøve, 2.226 suppleret), svarende til 2/3 eller 66%. Stikprøvens bortfald vil blive nærmere belyst i følgende afsnit. 7.3 Bortfald Undersøgelsens bortfald er i år 2000 af en anseelig størrelse på 34%, mod henholdsvis 13% i 1976 og 17% i 1986. Dette kan givet skabe problemer for at opnå en tilfredsstillende svarprocent samlet set, men i særdeleshed i forhold til undersøgelsens repræsentativitet af populationen. Er bortfaldet af systematisk karakter, kan det medføre, at repræsentativiteten forringes i særlig grad, idet personer med særlige karakteristika over- eller underrepræsenteres i analyseudvalget sammenlignet med populationen. Ie. et systematisk bortfald kompromitterer muligheden for at generalisere på basis af undersøgelsens resultater. Des større et bortfald, des større effekt har den eventuelle systematiske skævhed (Andersen et al. 2003:48). 7.4 Bortfaldets sammensætning I alle de tre runder, hvor Levekårsundersøgelsen er udført, har nægtere været den mest væsentlige årsag til bortfald – en tendens som skønnes at være stigende (Andersen 2003:49) I år 2000 var nægterprocenten således 23, mens det øvrige frafald skyldtes ”ikke truffet / bortrejst” i 6% af tilfældene og ”sygdom, handicap mv.” i 5% af tilfældene. At de to sidste bortfaldskategorier er større end tidligere år tilskriver vi henholdsvis: 1) Fysisk mobilitet – siden 1976 er det blevet lettere og mere almindeligt at rejse, hvorfor folk vil være mindre tilbøjelige til at kunne træffes på deres bopæl. Desuden er stikprøven i 2000 suppleret med unge mennesker, som har en tendens til at flytte hyppigt, hvilket gør dem mere vanskelige at komme i kontakt med. 2) At analyseudvalgets sammensætning i 2000 omfatter de aldrende respondenter fra den oprindelige stikprøve og således flere ældre end de 22 tidligere års stikprøver, hvorfor sygdoms- og handicapfaktoren spiller en mere væsentlig rolle (ibid.). 8. Analysestrategi I vores statistiske analyse af det empiriske materiale vil vi først præsentere vores udvalgte variable, dernæst vil vi foretage en repræsentativitetstest for derefter at teste vores empiriske hypotese. Desuden vil vi til sidst undersøge om indkomst har en betydning for vores variabel ’selvvurderet helbred’. Til at teste disse forskellige elementer i materialet, anvender vi en række teststatistikker, som i det følgende vil blive nærmere præsenteret. 8.1 Test af analysevariabler Vi vil i forbindelse med vores analysevariabler foretage følgende test: • Opstilling af konfidensintervaller for den Bernoullifordelte variabel ’nære venskaber’ Vores analysevariabler består af information, som vi udelukkende er i besiddelse af for vores stikprøve. Vi er dog, ligesom i repræsentativitetstesten, interesserede i at sammenligne disse resultater med populationen, for at få en idé om den statistiske usikkerhed forbundet med vores resultater. Vi konstruerer derfor et konfidensinterval for ’nære venskaber’ og placerer vores stikprøves værdi i forhold hertil. 8.2 Repræsentativitetstest I repræsentativitetstesten foretager vi følgende tests: • En Z- test på den Bernoullifordelte variabel køn • En χ2-test på den kategoriserede variabel alder • En χ2test på den kategoriserede variabel indkomst Vi beskæftiger os med variablerne alder, køn og indkomst, da disse i sociologisk teori betragtes som grundlæggende differentierende faktorer i samfundet. Ved brug af tests undersøger vi, om der er et systematisk bortfald på de tre udvalgte parametre. Vi benytter en Z-test til at vurdere om andelen af mænd og kvinder er den samme i stikprøven og populationen. Dernæst opstiller vi to χ2-tests på 23 henholdsvis alder og indkomst, da vi er interesserede i at sammenligne stikprøvens og populationens fordelinger, for at kunne udtale os om der er repræsentativitet. 8.3 Test af empirisk hypotese Til at afprøve vores empiriske hypotese foretager vi følgende tests: • χ2-test for uafhængighed mellem variablerne ’nære venskaber’ og ’selvvurderet helbred’ • Enkeltcelletest af variablerne ’nære venskaber’ og ’selvvurderet helbred’ Vi tester først om der er uafhængighed mellem vores analysevariabler. Dernæst ser vi på, hvilke kategorier, der er signifikant over- eller underrepræsenteret i forhold til vores H0-hypotese. 8.4 Test af bagvedliggende faktor Vi tester om indkomst har en betydning for, hvordan respondenterne vurderer deres helbred. Dette gør vi ved at foretage en χ2-test for uafhængighed og en enkeltcelletest mellem variablerne ’brutto indkomst’ og ’selvvurderet helbred’. Undervejs samles der op på testenes resultater og afslutningsvis sammenfattes de væsentligste pointer fra den samlede statistiske analyse. 9. Statistisk teori Vi har nu præsenteret de empiriske hypoteser vi gerne vil teste ved hjælp af statistiske værktøjer, og vi har præsenteret det datasæt, vi vil basere opgaven på. Med udgangspunktet i Levekårsundersøgelsen har vi en stikprøve, som vi vil bruge til at undersøge forhold, der kunne gøre sig gældende for hele populationen. Derfor må vi først lave en repræsentativitetstest. Til en sådan test skal vi bruge nogle statistiske værktøjer, som vi vil redegøre for i det følgende. 24 9.1 Hvorfor statistik? Statistik er et redskab, der kan bruges til at undersøge om vores teoretiske ideer kan påvises empirisk gennem de observationer, vi gør os i den virkelige verden3 (Malchow-Møller et al. 2010:17;54). Statistisk teori fortæller os noget om sammenhængen mellem stikprøver og populationer. Det viser sig, at tilfældigt udtaget stikprøver fordeler sig på en særlig måde, der kan beskrives ved hjælp af statistikken. Ved brug af den viden kan vi finde frem til, om det analyseudvalg, vi behandler i denne opgave, med en vis sandsynlighed kan fortælle os noget om hele population. Men først er der noget mere basalt statistisk viden der må på plads. Det drejer sig om stokastiske variable, deres sandsynlighedsfunktion samt nogle væsentlige sandsynlighedsmål. Med sandsynlighedsmålene kan vi senere beskrive, hvordan man statistisk kan påvise ikke-uafhængighed mellem stokastiske variable, der er grundlæggende for at kunne teste for sammenhænge mellem vores variable. Vi vil også introducere beskrivende mål og relevante fordelinger for stokastiske variable. Afsnittet afsluttes med standardisering og den centrale grænseværdisætning inden vi endelig beskriver, hvorledes disse statiske værktøjer kan fortælle os noget generelt om stikprøver. 9.2 Stokastisk variabel En stokastisk variabel er en funktion, der forbinder en talværdi til ethvert udfald i udfaldsrummet, Ω, af et eksperiment. En stokastisk variabel kan repræsentere mange forskellige hændelser med et enkelt symbol, og disse er nyttige, når der skal undersøges sammenhænge, der involverer usikkerhed (Malchow-Møller et al 2010:75). Ved brug af stokastiske variable kan vi benytte os af, at deres værdier svarer til sandsynligheder (Malchow-Møller et al. 2010:78). En stokastisk variabel betegnes med store bogstaver, mens specifikke værdier betegnes med små (Malchow-Møller et al. 2010:76). Man skelner mellem to typer af stokastiske variable; diskrete og kontinuerte. En stokastisk variabel er diskret, når der er et endeligt antal udfald i et eksperiment. Man kan opskrive en sandsynlighedsfunktion , der angiver sandsynligheden for at en stokastisk variabel, X, antager en given værdi x (Malchow-Møller et al. 2010:79). Derimod har en kontinuert stokastisk variabel uendeligt mange udfald og kan derfor antage uendeligt mange værdier med uendeligt mange decimaler (Malchow-Møller et al. 2010:77f). De variable, vi arbejder med, er alle diskrete, mens stikprøverne er kontinuerte, hvilket vi vil uddybe senere. 3 Man sondrer i statistik mellem virkelige populationer og superpopulationer. Når vi skriver i den virkelige verden, henviser vi til, at vi vil undersøge noget om en virkelig population. Det vil sige en population, der reelt eksisterer i modsætning til en superpopulation, der er et mere abstrakt begreb. 25 9.3 Sandsynlighedsmål Med de stokastiske variable kan vi sige noget om sammenhænge i sociologiske problemstillinger. Vi benytter os af statistiske redskaber, hvor vi arbejder med to eller flere stokastiske variable, der repræsenterer de sociologiske aspekter, vi er interesseret i at undersøge om der er en sammenhæng imellem (Malchow-Møller et al. 2010:84). I det følgende vil vi redegøre for forskellige sandsynlighedsmål, som er relevante i forhold til vores analyse. 9.3.1 Simultan sandsynlighed Simultane sandsynligheder kan bruges til at belyse ”både-og-sandsynligheder”. Altså sandsynligheden for, at en bestemt værdi af den stokastiske variabel, X, og en bestemt værdi af den stokastiske variabel, Y, indtræffer samtidig: (Malchow-Møller et al. 2010:84). 9.3.2 Marginal sandsynlighed Med de marginale sandsynligheder kan vi finde, hvad sandsynligheden er for en bestemt værdi den stokastiske variabel X antager uafhængigt af, hvilken værdi Y antager. Man finder den marginale sandsynlighed ved at summere den simultane sandsynlighed over alle mulige y-værdier, hvor xværdien er fastholdt (Malchow-Møller et al. 2010:86): NY f X (x) = " f (x, y i ) = f (x, y1 ) + f (x, y 2 ) + ...+ f (x, y NY ) ( i=1 9.3.3 Betinget sandsynlighed Sandsynligheden for at en given stokastisk variabel, X, betinget på en stokastisk variabel, Y, kaldes ! den betingede sandsynlighed. Den betingede sandsynlighed kan man udregne ved at dividere den simultane sandsynlighed med den marginale sandsynlighed: f X Y (x y) = ! f (x, y) f Y (y) (Malchow-Møller et al. 2010:87) De ovenstående tre sandsynlighedsmål kan bruges til at afsløre, om der er uafhængighed mellem to stokastiske variable, hvilket vi vil benytte os af i den statistiske analyse. 26 9.4 Uafhængighed Uafhængighed betyder, at information om en stokastisk variabel, X, ikke ændrer på en anden stokastisk variabel, Y. Det er udgangspunktet for den senere χ2-test. To stokastiske variable er uafhængige, hvis det gælder, at: for alle værdier af x og y, eller for alle værdier af x og y (Malchow-Møller et al. 2010:90-91). Uafhængighed er et centralt statistisk begreb, når man skal se på en mulig sammenhæng mellem flere hændelser og afgøre om sammenhængen er kausal (Malchow-Møller et al. 2010:69ff). Hvis en sammenhæng er kausal betyder det, at én variabel påvirker en anden, for eksempel at mængden af social kapital har en indvirkning på helbred. Det er dog vigtigt at pointere, at vi ikke statistisk kan bestemme kausalitetsforholdet, dette kan kun gøres teoretisk. Vi kan med vores tests heller ikke afgøre hvorvidt der er afhængighed, vi kan udelukkende be- eller afkræfte en uafhængighed. Testen man bruger til dette formål er en X2-test, som vi senere i opgaven vil bruge til at teste for netop uafhængighed mellem vores variable. 9.5 Beskrivende mål Momenter er i statistikkens verden beskrivende mål eller gennemsnitsbetragtninger. Det er altså karakteristika ved vores variable (Malchow-Møller et al. 2010:103). Vi vil i det følgende gøre rede for to udvalgte momenter for stokastiske variable, nemlig middelværdi og varians4 (MalchowMøller et al. 2010:104). De er udvalgt, da de er grundlæggende for at forstå principperne for vores undersøgelse. 9.5.1 Middelværdi Det mest kendte moment for en stokastisk variabel, X, er middelværdien – den forventede værdi, der betegnes med det græske bogstav, µ eller E(X), (Malchow-Møller et al. 2010:106) 4 Ved brug af beskrivende mål for stokastiske variable kan man håndtere situationer, hvor der er usikkerhed involveret 27 9.5.2 Varians Varians fortæller os, hvor meget værdierne spreder sig omkring middelværdien. Når man skal undersøge den forventede spredning omkring middelværdien bruger man varians, betegnet med, V(X) eller σ,2 (Malchow-Møller et al. 2010::112). 9.6 Fordelinger Stokastiske variable kan fordele sig på mange måder, men oftest finder man, at stokastiske variable følger nogle bestemte fordelinger (Malchow-Møller et al. 2010:135). Vi vil i det følgende fremhæve to fordelinger, der er relevante i forhold til vores opgave. Vi kan nemlig trække på denne viden, når vi senere skal udtale os om vores stikprøve. 9.6.1 Bernoullifordeling I tilfælde hvor en diskret stokastisk variabel kan antage to udfald, enten 1 (succes) eller 0 (fiasko), da gælder, at P(X=1)=p og P(X=0)=(1-p)5. Man siger X er Bernoullifordelt med parameteren p: X~Ber(p). En Bernoullifordeling har middelværdien E(X) = p og variansen V(X) = p·(1-p) (Malchow-Møller et al. 2010:135ff). Et eksempel på en sådan fordeling er køn, hvilket vi kommer nærmere ind på senere i opgaven. 9.6.2 Normalfordeling En anden brugbar fordeling er normalfordelingen, da både estimatorer og teststatistikker er normalfordelt (Malchow-Mølleret al. 2010:148). Dette vil vi komme ind på i det efterfølgende afsnit om stikprøver og deres karakteristika. En kontinuert stokastisk variabel, der er normalfordelt opskrives således: X~N(µ, ) (Malchow- Møller et al. 2010:149). En betingelse for, at en kontinuert stokastisk variabel, X, er normalfordelt, er at den har følgende tæthedsfunktion: f (x) = 1 2 ! ! !" 2 !e 1 x"µ 2 " !( ) 2 " , hvor µ = E(X) er middelværdien og = V(X) er variansen (Malchow-Møller et al. 2010:148). 5 Dette gælder, da den samlede sandsynlighed (andel) for alle mulige udfald skal summe til 1 28 f(x) betegner her en tæthedsfunktion. Arealet af en tæthedsfunktion er lig 1, da den angiver den samlede sum af sandsynligheder. Man kan dog ikke finde en given punktsandsynlighed – kun belyse hvor sandsynligt et givent areal er (Malchow-Møller et al. 2010:94). På figur 9.1 nedenfor ses tæthedsfunktionen for en normalfordelt variabel, X. Figur 9.1: Tæthedsfunktion Som det fremgår af figur 9.1 angiver µ funktionens midtpunktet og dens vidde. Imidlertid er det ikke muligt at udregne arealet, også kaldet den kumulative sandsynlighedsfunktion, ved at integrere denne tæthedsfunktion. I stedet kan man benytte sig af en standardiseret normalfordeling, da det for denne er muligt at slå sandsynlighederne for funktionen op i en tabel (Malchow-Møller et al. 2010:149-50). Normalfordelingen bruges til at anskueliggøre, hvordan simple, tilfældige stikprøver vil fordele sig omkring den sande middelværdi i populationen jf. den centrale grænseværdisætning, som beskrives i afsnit 9.9. 9.7 Den standardiserede normalfordeling Den standardiserede normalfordeling har middelværdi µ = 0 og varians = 1. Den kumulative sandsynlighedsfunktion betegnes !(z) med tæthedsfunktionen ! (z) , hvorom det det gælder: ! (z) ! P(Z " z) . Man siger, at Z er standardnormalfordelt, dvs. Z~N(0,1) (Malchow-Møller et al. 2010:150)Man kalder det en standardisering, når man ændrer en stokastisk variabel med middel- 29 værdi, µ, til en ny stokastisk variabel med middelværdi 0 og varians, , til en ny stokastisk varia- bel med varians 1. Hvis man har en stokastisk variabel, Y, med middelværdi E(Y) = µ og varians V(Y) = , kan denne standardiseres ved at benytte sig af: Z = Y !µ ! Z er da en stokastisk variabel med middelværdi E(Z) = 0 og varians V(Z)=1 (Malchow-Møller et al. 2010:150f). Det er et meget brugbart værktøj indenfor statistikken, da man ved hjælp af den fundne Z-værdi kan finde den kumulative sandsynlighed. Dette fremgår af en tabeloversigt (MalchowMøller et al. 2010:434f). Nu vil vi lade blikket falde på, hvad vi egentligt kan sige om en stikprøve. De foregående bemærkninger om normalfordelinger og standardisering er helt essentielle for at kunne forstå, hvordan man statistisk kan sige noget generelt om stikprøver. 9.8 Stikprøver og karakteristika ved stikprøver Når vi vil beskrive forhold, der gælder for en ukendt fordeling (populationen), bruger vi den viden, at en simpel tilfældig stikprøve vil følge en normalfordeling, som beskrevet tidligere. Dermed kan stikprøvens beskrivende mål give os et bud på de samme mål i den fordeling, vi egentligt er interesseret i. Dette kaldes at give et skøn eller en estimator. Vi introducerede tidligere i afsnittet middelværdi og varians, og disse to størrelser vil vi nu se nærmere på. 9.8.1 En estimator for middelværdien Vi ønsker at give et skøn for den sande middelværdi, µ, i populationen. Til dette bruger vi en estimator. Det gælder, at estimatoren eller stikprøvegennemsnittet, , er summen af de realiserede værdier af X divideret med antallet af observationer, n (Malchow-Møller et al. 2010:225ff)6: 1 n X = ! Xi n i=1 6 Dette følger af stikprøveanalogprincippet, der bygger på, at et givet skøn inkluderer alle observationer 30 Stikprøvegennemsnittet er stokastisk eftersom variablerne er stokastiske, mens den sande middelværdi, µ, for populationen er en konstant. Ved at indsætte en realiseret stikprøve i formlen ovenfor, 1 n finder vi det realiserede stikprøvegennemsnit. Dette er et estimat: x = ! xi (ibid.) n i=1 Men hvordan ved man, om et givent estimat giver et godt bud på den sande værdi? Der gælder, at hvis man udtrækker et antal simple tilfældige stikprøver, da vil de i gennemsnit ramme den sande værdi, og dermed være et godt bud herpå. I det tilfælde kalder vi estimatoren central eller unbiased, og der gælder, at E( ) = µ (Malchow-Møller et al. 2010:228). Man kan sige, at gennemsnittet af gennemsnittene er lig med det sande gennemsnit. Men dette betyder imidlertid også, at det er muligt at udtrække en stikprøve, der alligevel ligger langt fra den sande værdi, da denne stikprøve kun er baseret på et udsnit af populationen (Malchow-Møller et al. 2010:228). 9.8.2 En estimator for variansen Med samme udgangspunkt kan man opskrive variansen af stikprøvegennemsnittet, tilfældig stikprøve som: V (X) = , i en simpel !2 , hvor ! 2 er variansen i fordelingen af interesse. n Det gælder for estimatoren X at når n à ! så vil E(X) à µ og V (X) à 0, og man siger estimatoren er konsistent. Hvis en estimator har en mindre varians end en anden, siger man, at den er mere efficient (Malchow-Møller et al. 2010:229). 9.9 Den centrale grænseværdisætning Den centrale grænseværdisætning er, som betegnelsen antyder, helt central inden for den statistiske verden. Hvis vi antager, at vi har en simpel tilfældig stikprøve på n elementer, viser det sig, at uanset hvilken fordeling stikprøven følger, så vil stikprøvegennemsnittet approksimativt være normalfordelt omkring det sande populationsgennemsnit, så længe stikprøven er tilstrækkelig stor. Denne vigtige pointe kalder man den centrale grænseværdisætning (Malchow-Møller et al. 2010:232), og formlen ser ud som følgende: X ~ A N(µ, ! 2 / n) Formlen angiver hvordan et gennemsnit af stikprøver vil fordele sig approksimativt normalfordelt, idet summen af middelværdierne er µ, og summen af varianserne er σ2/n (Malchow-Møller et al. 31 2010:232). Med denne bemærkning om den centrale grænseværdisætning kan vi nu udføre vores repræsentativitetstest. De statistiske værktøjer vi skal bruge her og når vi skal teste vores hypotese vil blive forklaret undervejs. 10. Variabelpræsentation I det følgende vi vil præsentere de to variable vi har valgt, nemlig ’nære venskaber’ og ’selvvurderet helbred’. Vi vil fremlægge, hvordan vores givne analyseudvalg fordeler sig på disse variable. Efter at have fjernet data om de respondenter, der ikke har svaret på blot en eller begge af vores variable, har vi fundet et analyseudvalg på 4.973 personer. Vi har fjernet data i de tilfælde, hvor en respondent enten ikke har ønsket at svare, har svaret ved-ikke eller af andre årsager er kodet som enten ”uoplyst” eller ”missing”. Disse respondenter er ikke anvendelige for vores undersøgelse. 10.1 Nære venskaber Jf. vores operationalisering af spørgsmålet: ”Har De nogle venner, De kan tale med om personlige problemer?” gjort til udtryk for om hvorvidt man har ’nære venskaber’ eller ej. Vi finder, at 4.296 respondenter eller 86,39% har sagt ”ja” til dette, mens 677 respondenter eller 13,61% har svaret ”nej”. Tallene kan aflæses i tabellen nedenfor: Nære venskaber Frekvens Procent ”Har De nogle venner, de kan tale med om personlige problemer?” Ja Nære venskaber 4,296 86,39% Nej Ingen nære venskaber 677 13,61% I alt Både nære og ingen 4.973 100% nære venskaber Tabel 10.1: Data for variablen ’nære venskaber’. Tallene stammer fra Levekårsundersøgelsen år 2000. ’Nære venskaber’ er en binær variabel, idet man kun kan svare ’ja’ eller ’nej’, og den følger dermed også en normal skala, da der ikke er nogen struktur eller sammenhæng mellem de to værdier (Malchow-Møller et al. 2010:27). Det er en diskret stokastisk variabel, idet den der er tællelig, og den følger en Bernoullifordeling, jf. det teoretiske afsnit 9.6.1. Vi vil nu opstille konfidensintervaller. 32 10.1.2 Konfidensintervaller Konfidensintervaller er et statistisk værktøj, der gør os i stand til ud fra et stikprøvegennemsnit, , i en stikprøve at estimere et skøn i form af et interval, med en nedre og øvre grænse, inden for hvilket vi med en given sandsynlighed (1- α) kan sige, at en sand værdi, µ, i populationen befinder sig. Konfidensintervallet afhænger af stikprøvens størrelse (Malchow-Møller et al. 2010:270f). Denne type test gør sig således relevant i de tilfælde, hvor man er i besiddelse af en værdi for en stikprøve, men ingen tilsvarende for populationen, og alligevel ønsker at udtale sig om i hvilken grad stikprøvens værdi kan siges at være repræsentativ for populationen. Konfidensintervaller benævnes matematisk: Î = [Wned ;Wop ] (Malchow-Møller et. al 2010:270) Hvor Wned betegner den nedre grænse for konfidensintervallet, og Wop betegner den øvre grænse. Da stikprøven er simpelt tilfældigt udtrukket, er (jf. den centrale grænseværdisætning afsnit 9.9) en unbiased estimator for vores middelværdi. Den følger approksimativt en normalfordeling, når n bliver stor. Derfor kan vi bruge denne til at konstruere et konfidensinterval, der fordeler sig symmetrisk omkring . Det gør vi således: Î = [X ! k; X + k] , hvor k er en positiv konstant, der i det følgende vil blive forklaret (ibid.). Nu vil vi så bestemme den sandsynlighed (1- α) for hvilken den sande værdi befinder sig indenfor. Indenfor sociologien er det normalt at acceptere en usikkerhed på 5%, derfor vil vi sætte α = 0,05. Det vil betyde, at konfidensintervallet med 95 % sandsynlighed rummer den sande værdi, såfremt stikprøven er repræsentativ. Som nævnt tidligere, følger stikprøvegennemsnittet den centrale grænseværdisætning, hvilket gør, at vi kan omskrive den til et standardiseret stikprøvegennemsnit, Z, der approksimativt følger en standardnormalfordeling: Z= X !µ 2 ! /n ~ A N(0,1) (Malchow-Møller et al 2010:272) Med udgangspunkt i konfidensniveauet kan man opstille Z a/2 og Z1!a/2 . Som det ses på figuren nedenfor angiver disse øvre og nedre Z-værdi (ibid.). 33 Figur 10.2: Konfidensintervaller 2 Man finder, at k kan udtrykkes ved Z1!a/2 " ! / n , og dermed er formlen for konfidensintervallet: Konfidensintervallet er således baseret på varians og stikprøvestørrelse, som tilsammen bestemmer hvor bredt eller smalt et konfidensinterval, man har mulighed for at konstruere. I vores tilfælde, hvor vi vil lave et konfindensinterval på ’nære venskaber’, er der tale om en Bernoullifordelt stokastisk variabel. Man kan i dette tilfælde simplificere formlen til: hvor er er andelen af de med ’nære venskaber’ stikprøven, n er antallet i stikprøven. Vi finder Z1!a/2 =+/-1,96, idet vi har sat a = 0, 05 . Vi indsætter værdierne fra tabel 10.1 og finder: 34 Dette betyder, at andelen af de med ’nære venskaber’ med 95% sandsynlighed ligger mellem 85,44% og 87,34%. Vores værdi er, som nævnt, 86,39%. Med dette konfidensinterval har vi mere information om vores variabel, idet der er taget forbehold for usikkerhed. 10.2 Selvvurderet helbred Selvvurderet helbred har vi operationaliseret på baggrund af spørgsmålet: ”Hvordan vil De i alt vurdere Deres helbred?”. Som det ses af tabel 10.3 nedenfor har 1.998 respondenter eller 40,18% svaret ’virkelig godt’, 1.992 eller 40,06% svaret ’godt’, 716 eller 14,40% svaret ’nogenlunde’, 204 eller 4,10% svaret ’dårligt’, mens 63 eller 1,27% svarede ’meget dårligt’. Selvvurderet Frekvens Procent Virkelig godt 1.998 40,18% Godt 1.992 40,06% Nogenlunde 716 14,40% Dårligt 204 4,10% Meget dårligt 63 1,27% 4.973 100% helbred ”Hvordan vil De i alt vurdere Deres helbred?” I alt Tabel 10.3: Data for variablen selvvurderet helbred ’Selvvurderet helbred’ følger en ordinal skala, idet værdierne er rangordnede. Derimod kan man ikke vurdere størrelsen mellem værdierne (Malchow-Møller et al. 2010:27). Vi kunne vælge at opstille konfidensintervaller for hver kategori ved for eksempel at betragte ’godt’ i modsætning til alle andre kategorier. I det tilfælde kunne vi betragte kategorierne som Bernoullifordelinger og opstille konfidensintervaller. Men da et konfidensinterval vil være afhængig af de andre konfidensintervaller, idet andelene i hver kategori samlet skal summe til 1 har vi vurderet, at vi ikke kan konkludere noget entydigt om vores variabel ved at gøre dette. 35 11. Repræsentativitetstest Når man tager udgangspunkt i en stikprøve fra en population, vil den altid være forbundet med en vis usikkerhed. Nu vil vi derfor teste, om vores stikprøve overhovedet er repræsentativ med hensyn til køn, alder og indkomst. Disse tre parametre er udvalgt, da de indenfor sociologien står som nogle af de centrale årsager til social differentiering. Hvis der forekommer en skævhed i en eller flere af disse repræsentativitetstest, kan det influere på de statistiske test af vores empiriske hypotese. I det næste afsnit vil vi således teste, om der er tale om signifikante forskelle mellem vores stikprøve og populationen. Viden om populationen er hentet fra Danmarks Statistik. Inden vi udfører de egentlige tests, vil vi først præsentere noget generel teori om hypotesetest. 11.1 Opstilling af hypotesetest Man kan ikke umiddelbart være sikker på, at den stikprøve, man har udtrukket, bekræfter ens teoretiske hypotese. Derfor opstiller man to statistiske hypoteser; én der bekræfter teorien og én der afkræfter den. Derudover opstiller man en beslutningsregel, som er bestemmende for, hvornår man kan forkaste hypotesen, og hvornår man kan bekræfte den (Malchow-Møller et al. 2010:297). Ved brug af en hypotesetest kan man altså finde ud af, om der er en signifikant forskel mellem stikprøvegennemsnittet og det sande gennemsnit i populationen. Første trin i en hypotesetest er, som nævnt, at dele teorien op i to statistiske hypoteser; en nulhypotese, H0, og en alternativhypotese, H1 (Malchow-Møller et al. 2010:298). Det varierer fra situation til situation, hvilken en af hypoteserne, der skal støtte op om teorien. Dette vil de følgende test, vi udfører, vidne om. Det er kutyme at gøre den hypotese, der understøtter teorien, til alternativhypotesen, og dermed sætte den hypotese, der forkaster teorien som nulhypotesen (Malchow-Møller et al. 2010:299). Man accepterer kun alternativhypotesen i det tilfælde, at der er stærke indicier imod nulhypotesen. Dermed gør man det svært at bekræfte teorien, og i det tilfælde man kan bekræfte den, vil det derfor være mere overbevisende (ibid.). Når vi foretager en hypotesetest, er det vigtigt, at vi tager forbehold for fejl, da vi jo grundlæggende ikke kan vide, hvad der er ”det sande” i populationen. Der er risiko for at begå to typer fejl (ibid.): 1. En type I-fejl, der forekommer, hvis man forkaster en nulhypotese, der er sand 2. En type II-fejl, der forekommer, hvis den nulhypotese man accepterer, er falsk 36 For at beregne sandsynligheden for at begå henholdsvis en type I og en type II-fejl, skal der opskrives en beslutningsregel (Malchow-Møller et al. 2010:300). Sandsynligheden for at begå en type Ifejl benævnes med α – defineret som en betinget sandsynlighed: P (type I-fejl) = P (forkaste H0⏐ H0 sand) = α, mens sandsynligheden for at begå en type II-fejl benævnes med β – også defineret som en betinget sandsynlighed: P (type II-fejl) = P (acceptere H0⏐ H0 falsk = β 11.2 Repræsentativitetstest for køn Vi vil i det følgende foretage en såkaldt Z-test, for at undersøge om stikprøven er repræsentativ for population i forhold til fordelingen mellem mænd og kvinder. Men først opstiller vi en nulhypotese, H0, og en alternativhypotese, H1, så vi kan teste om andelen af mænd i stikprøven er lig andelen af mænd i populationen: H0: pstikprøven = ppopulationen H1: pstikprøven ≠ ppopulationen hvor p angiver andelen af mænd. Altså kommer hypoteserne til at se således ud: H0: Andelen af mænd i stikprøven er lig med andelen af mænd i populationen H1: Andelen mænd i stikprøven er forskellig fra andelen af mænd i populationen Som det ses, er alternativhypotesen formuleret med ”forskellig fra”, hvilket vil sige, at det er en såkaldt dobbeltsidet hypotese, da værdier på begge sider af nulhypotesen ligger inden for alternativhypotesen (Malchow-Møller et al. 2010:315). Det næste der skal ske er, at vi laver en beslutningsregel. Denne beslutningsregel kommer til at afgøre, hvornår vi vil vælge at tro på vores nulhypotese. For teststatistikken, Z, kan man opskrive en beslutningsregel på baggrund af en kritisk værdi, cv, som angiver de værdier indenfor hvilke, man er villig til at acceptere nulhypotesen. Man accepterer H0, hvis Z ! cv og H1, hvis Z > cv (Malchow-Møller et al. 2010:304). Typisk fastsætter man den kritiske værdi i forhold til risikoen for at begår en type-I-fejl, da en lille risiko for denne fejl tyder på, at ens alternativhypotese holder (Malchow-Møller et al. 2010:305). I dette tilfælde betegner α 37 signifikansniveauet, som vi vælger at sætte til 5%. Det skal dog siges, at et lavt α medfører en øget sandsynlighed for at begå en type-II-fejl, da der er et trade-off mellem α og β (Malchow-Møller et al. 2010:306). Under H0, det vil sige, når H0 gælder, da vil cv være lig Z1-α, da Z er standardnormalfordelt. Det vil sige, at vi accepterer H0, hvis Z ! Z1-α og H1, hvis Z > Z1-α (ibid.). I tabellen ”Standardnormalfordeling: Fraktiler” (Malchow-Møller et al. 2010:436) finder vi, at z=+/-1,96, med et signifikansniveau på 5%. Vi slår op under 0,975, da hypotesen er dobbeltsidet. Det vil sige, at den nedre grænse Za/2 = Z0,025 og den øvre grænse er Z1-a = Z0,975. Som det ses i figur 1,1.1 er arealet på ”halerne” af tæthedsfunktionen α/2. Figur 11.1. Dobbeltsidet standardnormalfordeling med øvre og nedre grænse 38 Nedenfor ses en tabel over henholdsvis stikprøven og populationens kønsfordeling. Stikprøve Population Frekvens Procent Frekvens Procent Mand 2.486 49,91% 1.843.420 48,90% Kvinde 2.495 50,09% 1.926.076 51,10% Total 4.981 100 3.769.496 100 Tabel 11.2 Kønsfordelingen i hhv. stikprøve og populationen. Som det ses i tabel 11.2 består stikprøven af 4.981 personer, hvoraf 49,91% er mænd og 50,09% er kvinder. Populationen består af 3.769.496 personer, hvoraf 48,90% er mænd og 51,10% er kvinder. Bemærk, at populationen såvel som stikprøven kun består af personer over 20 år. Resultaterne fra tabellen har vi opstillet i figur 11.3 nedenfor, hvor man ser procentandelen for kvinder og mænd i henholdsvis stikprøven og populationen. Man kan umiddelbart se, at forskellen mellem mænd og kvinders andel er større i populationen end i stikprøven. Kønsfordeling 60 50 40 Mand 30 Kvinde 20 10 49.91% 50.09% 48.9% 51.1% 0 Stikprøve Population Figur 11.3 Andelen af mænd og kvinder i hhv. stikprøven og population. 39 I det følgende vil det sige sig, om forskellen er signifikant. Med data fra tabel 11.2 kan vi nu udføre en Z-test for repræsentativitet på køn. p angiver andelen af mænd. Man kan betragte pstikprøve og ppopulation som to stikprøver. Da der er tale om en bernoullifordelt variabel, kan man udregne Z ved brug af denne formel: Z= hvor p ! p0 ( p0 " (1! p0 )) n angiver andelen af mænd i stikprøven, angiver andelen af mænd i populationen, og n betegner de to stikprøvers størrelse (Malchow-Møller et al. 2010:318). Vi indsætter vores tal i formlen: Z= 0, 4991! 0, 4890 = 1, 43 (0, 4890 " (1! 0, 4890)) 4.981 Da vores Z-værdi på 1,43 ligger mellem vores kritiske værdier på +/-1,96, kan vi ikke forkaste vores H0-hypotese. Dette er illustreret i figur 11.4 nedenfor: Figur 11.4: Dobbeltsidet standardnormalfordeling med anvist z-værdi på 1,43. 40 Hermed kan vi konstatere, at stikprøven er repræsentativ for kønsfordelingen i populationen. Desuden kan vi udregne en såkaldt p-værdi, der er en mere informativ indikator. Der gælder ved en dobbeltsidet alternativhypotese, at: p ! værdi = 2 " ! (! z ) , hvor angiver den kumulative sandsynlighed. Z-værdien – nu med negativt fortegn – slås op i tabellen ”Standardnormalfordelingen: kumulative sandsynligheder” i (Malchow-Møller et al. 2010:434). For z =-1,43 er den kumulative sandsynlighed 0,0764. Da er p-værdien = 2 ! 0, 0764 = 0,1528 . Dette fortæller os, at der er 15,28% sandsynlighed for at trække en stikprøve, hvor andelen af mænd er 0,4990 eller længere væk fra 0,4890, hvis den sande værdi i populationen er 0,4890. Med de 15,28% overskrider vi altså vores fastsatte signifikansniveau på 5%. Det vil sige, at der er en for stor sandsynlighed for at begå en type-1-fejl, altså at forkaste en sand H0-hypotese. Da det netop er H0-hypotesen, der underbygger repræsentativitet, kan vi på baggrund af p-værdien anskue, at vi faktisk med en større sandsynlighed end de påkrævede 5%, kan konkludere, at stikprøven er repræsentativ. 41 11.3 Repræsentativitet for alder Nu hvor vi har testet, om kønsfordelingen i vores stikprøve er repræsentativ for populationen, vil vi teste om det samme gør sig gældende for aldersfordelingen. Vi har valgt at omkode aldersvariablen i otte intervaller à 10 år, for at undgå at få for få respondenter i hver celle, da det skaber for stor usikkerhed, at skulle udtale sig om dem, hvis det er tilfældet. Desuden bliver aldersfordelingen mere overskuelig, når den opdeles i intervaller (se omkodningen i do-file, bilag xx). Nedenfor ses et søjlediagram og en tabel over den procentvise aldersfordeling i henholdsvis stikprøven og populationen: Aldersfordeling 90 år og derover 0,78 0,56 4,59 4,00 80-‐89 år 9,31 9,03 70-‐79 år 12,16 60-‐69 år 12,05 50-‐59 år 18,51 19,27 40-‐49 år 18,10 19,98 19,35 19,45 30-‐39 år 17,19 15,66 20-‐29 år 0 10 Fordeling i population 20 30 Fordeling i levekårsundersøgelsen Figur 11.5 Aldersfordelingen i hhv. population og stikprøven i procent 42 Aldersfordeling Alder i år 20-29 30-39 40-49 50-59 60-69 70-79 80-89 90+ I alt Analyse- 780 969 995 960 600 450 199 28 4.981 udvalg 15,66% 19,45% 19,98% 19,27% 12,05% 9,03% 4,00% 0,56% 100% Populati- 647.873 729.300 682.379 697.914 458.221 351.046 173.184 29.579 3.769. on 17,19% 19,35% 496 18,10% 18,51% 12,16% 9,31% 4,59% 0,78% 100% Tabel 11.6 Aldersfordelingen i hhv. population og stikprøven opgivet i frekvens og procent Som det fremgår af figur 11.5 og tabel 11.6 er der en underrepræsentation på 1,53 procentpoint af de 20-29 årige og en overrepræsentation af de 40-49 årige på 1,88 procentpoint. Spørgsmålet er så, om der blot er tale om tilfældige afvigelser eller om bortfaldet er skævt. Til at undersøge om denne stikprøvefordeling er signifikant afvigende fra fordelingen i populationen, vil vi benytte os af en såkaldt χ2-test for fordelinger. Årsagen til at vi har valgt en χ2-test frem for en Z-test er, at vi med en χ2-test kan teste om fordelingen er den samme, mens en Z-test bruges til at teste forskelle i middelværdier. I denne sammenhæng kan en Z-test altså bruges til at teste, om der er en signifikant over- eller underrepræsentation af respondenter for hvert aldersinterval i stikprøven sammenlignet med populationen. Ved hjælp af en χ2-test kan vi derimod sammenligne om den samlede observerede aldersfordeling i vores stikprøve svarer til den faktiske aldersfordeling i populationen (Malchow-Møller et al. 2010:363). En χ2-test har to funktioner. For det første kan man teste om en given diskret stokastisk variabels fordeling, følger en hypotetisk fordeling, der for eksempel stammer fra en teori (Malchow-Møller et. al. 2010:361). For det andet kan man med en χ2-test teste for uafhængighed mellem to variabler (Malchow-Møller et al. 2010:370f). Denne funktion vender vi tilbage til, når vi afprøver vores empiriske hypotese (jf. afsnit 12.1 om χ2-test for uafhængighed). I det følgende vil vi gøre brug af den første funktion. For at udføre en sådan χ2-test sætter vi et signifikansniveau α til 5 %, og opstiller en nul- og alternativhypotese: 43 H0: p1 = π1 , p2 = π2 , … , pK = πK H1: mindst én pk ≠ πk , k = 1, … , K Hvor K, kaldet kategorier, angiver de mulige værdier, som den stokastiske variabel kan antage, p er sandsynligheden for hver af disse kategorier og π1, …, πK er kategoriernes hypotetiske sandsynligheder (Malchow-Møller et. al. 2010:361f). Nulhypotesen er altså her, at aldersfordelingen i stikprøven er lig populationens aldersfordeling, mens alternativhypotesen angiver, at stikprøvefordelingen er forskellig fra fordelingen i populationen. χ2-testen er derfor her en test for homogenitet (Malchow-Møller et al. 2010:374). Idéen bag en χ2-test er, at den sammenligner den observerede frekvens, Zk, med den faktiske frekvens svarende til H0, n ⋅ πk. Selve teststatistikken for en χ2fordeling ser derfor ud som følger (Malchow-Møller et. al. 2010:362): K (Z k / n " ! k )2 K (Z k " n ! ! k )2 =# #n ! ! n !!k k k=1 k=1 Hvor antallet af observationer i stikprøven med værdien xk betegnes Zk, og det forventede antal observationer under H0 med værdien xk i en stikprøve med n observationer betegnes n ⋅ πk (Malchow-Møller et al. 2010:362). Vi vil nu vise udregningen af χ2-cellebidraget for aldersintervallet 20-29 år. De anvendte data fremgår af henholdsvis ovenstående og nedenstående tabel, 11.6 og 11.7: χ2 = K (780 ! 886)2 " 886 k=1 χ2 = 12, 59 44 χ2-cellebidragene for resten af aldersintervallerne er angivet i tabellen nedenfor: Andel under Frekvens under χ2 H0, populationens π H0 (n ⋅π) cellebidrag 20-29 år 0,18 886 12,59 30-39 år 0,20 1001 1,02 40-49 år 0,18 907 8,59 50-59 år 0,18 901 3,85 60-69 år 0,12 586 0,32 70-79 år 0,09 445 0,07 80-89 år 0,04 218 1,71 90-99 år 0,01 37 2,12 100-109 år 0,00 1 0,59 110 år + 0,00 0 0,00 Total 1 4981 31 Alder Tabel 11.7: χ2-cellebidrag for aldersintervaller Da signifikans ikke alene afhænger af χ2-værdien, udregner vi også de såkaldte frihedsgrader. Frihedsgrader betegner antallet af sandsynligheder, der kan vælges ”frit” fratrukket estimerede parametre (Malchow-Møller et al. 2010:372). Antallet af frihedsgrader beregnes ved følgende formel: d.f. = (c-1) ⋅ (r-1) Hvor c angiver antal udfald i X-variablen og r er antallet af Y-variablens udfald. I dette tilfælde, hvor vi kun arbejder med en variabels udfald, udregnes frihedsgraderne ved at trække 1 fra antallet af udfald i variablen. Antallet af frihedsgrader er hermed: d.f. = 10-1 = 9 Den samlede χ2-værdi er summen af de enkelte χ2-cellebidrag. Som det fremgår af tabel 11.7 har vi udregnet denne χ2-værdi til 31, hvilket med 9 frihedsgrader overskrider den kritiske værdi på 16,9 (Malchow-Møller et al. 2010:438). Aldersfordelingen i stikprøven er hermed signifikant afvigende 45 fra populationens aldersfordeling. Det betyder, at vi må forkaste vores H0-hypotese og tro på H1hypotesen. Da vi kun arbejder med en enkelt variabel, er det ikke muligt at foretage en såkaldt enkeltcelletest, for at finde ud af, hvilke alderskategorier, der forårsager skævvridningen med en signifikant under- eller overrepræsentation. Vi vil dog udføre en sådan enkeltcelletest, når vi afprøver vores empiriske hypotese (se afsnit 12.2 om enkeltcelletest). Til at undersøge under- og overrepræsentationen for hver alderskategori, kan man i stedet benytte en Z-test, som tidligere beskrevet. Vi har dog skønnet, at det er vigtigere for vores analyse at vide noget om den generelle aldersrepræsentativitet, frem for at kende til de specifikke alderskategoriers fordeling. I vores videre analyse skal denne repræsentativitetstest af alder tages in mente, fordi analyseresultaterne fra stikprøven ikke umiddelbart kan generaliseres til populationen. I vores undersøgelse har netop aldersfordelingen en betydning, da helbred alt andet lige er påvirket af den enkeltes alder. Dog betyder denne skævvridning af aldersfordelingen i stikprøven ikke, at vi ikke kan udtale os om vores variable ud fra vores kommende statistiske analyse, vi skal blot tage forbehold for den manglende repræsentativitet. 11.3.1 P-værdi I ovenstående udregnede vi antallet af frihedsgrader til at være 9. Når vi kender antal frihedsgrader, kan vi udregne en p-værdi. P-værdi er et matematisk udtryk for sandsynligheden (p = probability) for at observere den fundne forskel eller en der er større, forudsat at nulhypotesen er sand. Hvor stor eller lille p-værdi, vi kan acceptere afhænger af signifikansniveauet. Da vi som bekendt, har sat vores signifikansniveau til 5%, skal vores p-værdi være under disse 5%, hvis vi skal kunne afvise vores H0-hypotese jf. risikoen for type-I-fejl (jf. afsnit 11.2). For at udregne p-værdien indsætter vi i Excel funktionen: ”CHIFORDELING” (χ2-værdi;frihedsgrader). P-værdi = (31;9) = 0,000311536 Vi har således udregnet vores p-værdi til 0,000311536, hvilket betyder, at vi kan forkaste H0hypotesen, da den ligger under 0,5. Aldersfordelingen i Levekårsundersøgelsen er altså ikke repræsentativ for populationen, som vi også kunne konstatere ud fra vores χ2-værdi på 31, der overskrider den kritiske værdi på 16,9. 46 11.4 Repræsentativitetstest for indkomst Vi vil nu lave en χ2-test for fordeling af indkomst. Denne test er brugbar, fordi vi ønsker at sammenligne intervaller. I Levekårsundersøgelsen bliver respondenterne nemlig bedt om at placere deres bruttoindkomst i intervaller ud fra spørgsmålet: ”Hvor stor var Deres/familiens samlede indkomst i 1999 brutto, dvs. før skat og fradrag er trukket fra?” (Levekårsundersøgelsen 2000). Derfor har vi hentet information fra Danmarks Statistik, hvor indkomsten brutto også er opdelt i intervaller. Dog har det ikke været muligt for os at finde information fra samme år. I Levekårsundersøgelsen fra år 2000 bliver respondenterne spurgt til deres bruttoindkomst året før, mens data fra Danmarks Statistik er fra år 2001. Dette giver alt andet lige anledning til fejlkilder. Derudover har vi omkodet intervallerne fra Levekårsundersøgelsen, så de matcher dem fra Danmarks Statistik (jf. dofile i bilag, afsnit 18.1). I de to tabeller nedenfor ses indkomstintervallerne for henholdsvis stikprøven og populationen i tabel 11.8 og 11.9. Vores stikprøve består af 4.650 personer. Bortfaldet består af 275 respondenter, der har svaret ’ved-ikke’, 48 der ’ikke vil svare’, mens information om 8 af respondenterne er ’uoplyst’. Det kan tænkes, at nogle respondenter har syntes, at det er ubehageligt at oplyse deres indkomst eller at de ikke har haft noget overblik over deres indkomst året før. Selvoplyst indkomst er i det hele taget forbundet med en del usikkerhed, i modsætning til baggrundsvariablerne køn og alder, som vi også har lavet repræsentationstest for. Det skyldes, at information om køn og alder ikke stammer fra respondenterne selv, men er hentet fra CPR-registret. Stikprøve, indkomst Frekvens Procent Under 200.000 kr. 1.213 26,09 200.000 - 299.999 kr. 747 16,06 300.000 - 399.999 kr. 710 15,27 400.000 - 499.999 kr. 730 15,70 500.000 - 599.999 kr. 579 12,45 600.000 kr. og derover 671 14,43 I alt (antal) 4.650 100,00 Tabel 11.8: Bruttoindkomst, strikprøve 47 Population, indkomst Frekvens Procent Under 200.000 kr. 90.1444 33,64 200.000 - 299.999 kr. 51.5784 19,25 300.000 - 399.999 kr. 32.0193 11,95 400.000 - 499.999 kr. 29.0598 10,85 500.000 - 599.999 kr. 25.2505 9,42 600.000 kr. og derover 39.8896 14,89 I alt (antal) 2.679.420 100,00 Tabel 11.9: Bruttoindkomst, population I stikprøven såvel som populationen er der procentvist flest placeret i det laveste indkomstinterval på under 200.000kr, henholdsvis 26,09% og 33,64%. Som indkomstintervallerne øges, falder andelen i både stikprøve og population, men i den højeste kategori (600.000 kr. og derover) er der igen procentvist flere placeret. Dette kan måske skyldes, at mange husholdninger med to eller flere indtægter falder ind her. På figur 11.10 nedenfor kan man tydeligere se forskellene mellem hvert indkomstinterval i henholdsvis stikprøven og populationen. 48 Indkomstintervaller 14,89 14,43 600.000 kr. og derover 500.000 -‐ 599.999 kr. 9,42 12,45 400.000 -‐ 499.999 kr. 10,85 15,7 Population 11,95 15,27 300.000 -‐ 399.999 kr. Stikprøve 19,25 16,06 200.000 -‐ 299.999 kr. Under 200.000 kr. 26,09 0 5 10 15 20 25 30 33,64 35 40 Figur 11.10: Indkomstintervaller opdelt i population og stikprøve Nu er vi klar til at foretage selve χ2-testen. Vi sætter vores nulhypotese og alternativhypotese til: H0: p1 = π1 , p2 = π2 , … , pK = πK H1: mindst én pk ≠ πk , k = 1, … , K Hvor K, kaldet kategorier, angiver de mulige værdier, som den stokastiske variabel kan antage, p er sandsynligheden for hver af disse kategorier og π1, …, πK er kategoriernes hypotetiske sandsynligheder (Malcho-Møller et al. 2010:361f). Vores nulhypotesen er, at indkomstfordelingen i stikprøven er lig populationens indkomstfordeling, og alternativhypotese er, at stikprøvefordelingen er forskellig fra fordelingen i populationen. 49 Vi sætter signifikansniveauet, , til 5%. Vi opsummerer vores udregninger for χ2-testen i det nedenstående: Andel under Frekvens under χ2 H0, populatio- H0 (n ⋅π) Cellebidrag Indkomstintervaller nens π Under 200.000 kr. 0,33 1564 78,87 200.000 - 299.999 kr. 0,19 895 24,51 300.000 - 399.999 kr. 0,11 556 42,85 400.000 - 499.999 kr. 0,10 505 100,7 500.000 - 599.999 kr. 0,09 438 45,36 600.000 kr. og derover 0,14 692 0,66 Total 1 4650 293 Frihedsgrader 5 P-værdi 3,13488E-61 Tabel 11.11: χ2-test for indkomst Vi finder, at antallet af frihedsgrader er 5, idet der er 6 udfald for χ2-værdien, som vi trækker 1 fra. Vi aflæser i tabellen ”χ2-fordelingen: Fraktiler” i Malchow-Møller et al. (2010:438), at med 5 frihedsgrader og et signifikansniveau på 5% er den kritiske værdi 11,1. Vores fundne χ2-værdi på 293 er dermed signifikant afvigende fra den teoretiske kritiske grænse, da den overskrider den kritiske værdi. 50 Nedenfor ses figur 11.12, der viser H0- og H1-rummet for vores χ2-test for fordeling af indkomst. Den kritiske værdi på 11,1 samt vores χ2-værdi på 293 er markeret. Figur 11.12: χ2-fordeling for indkomst med opstillede hypoteser Som det fremgår af figur 11.12, må vi forkaste vores H0-hypotese og tro på H1-hypotesen, hvilket betyder, at stikprøven ikke er repræsentativ for populationen. Derudover er p-værdien=3,13488E-61 (se tabel 11.11), hvilket er langt under vores signifikansniveau på 5%. Dette underbygger forkastningen af H0-hypotese. At stikprøven ikke er repræsentativ kan til dels skyldes, at der er en forskel mellem data fra stikprøven og populationen grundet de to års forskel. Derudover er det forbundet med en vis usikkerhed, at respondenterne er blevet bedt om selv at estimere deres indkomst. Da indkomst er en parameter, der medvirker til social differentiering i samfundet, er det væsentligt for vores analyseresultater, at der er denne forskel. I den følgende statistiske analyse af vores empiriske hypotese, må vi derfor tage forbehold for den manglende repræsentativitet på indkomst. 51 12. Test af empirisk hypotese 12.1 χ2-test for uafhængighed Nu hvor vi har testet for repræsentativitet på baggrundsvariablene køn, alder og indkomst, er vi klar til at teste vores empiriske hypotese. I det følgende vil vi udføre en såkaldt χ2-test for uafhængighed. Denne test bygger på den samme teststatisk, som vi benyttede, da vi testede for repræsentativitet af alder og indkomst. Forskellen er, at vi ikke tester, om der er homogenitet mellem to fordelinger, men om to diskrete stokastiske variable er uafhængige af hinanden (Malchow-Møller et al. 2010:370). Uafhængighed referer her til, at information om den ene variabel ikke ændrer fordelingen af den anden (Malchow-Møller et al. 2010:90). Herved afprøver vi vores empiriske hypotese, idet vi tester, om der er en statistisk sammenhæng mellem ’nære venskaber’ og ’selvvurderet helbred’. Første skridt i konstruktionen af en χ2-test for uafhængighed er at opstille to hypoteser – en nul- og en alternativhypotese: H0: Uafhængighed dvs. f(x,y) = fx(x) ⋅ fy(y) for alle værdier af x og y H1: Ikke-uafhængighed dvs. f(x,y) ≠ fx(x) ⋅ fy(y) for mindst én værdi af x og y Under H0 er den marginale sandsynlighedsfunktion for X, fx(x), ganget med den marginale sandsynlighedsfunktion for Y, fy(y) lig den simultane sandsynlighedsfunktion, f(x,y) (Malchow-Møller et.al. 2010:370). Vores nulhypotese er således, at der er uafhængighed mellem vores variabler ’nære venskaber’ og ’selvvurderet helbred’, mens alternativhypotesen angiver, at der ikke er uafhængighed mellem disse variabler. Årsagen til, at vi skriver ikke-uafhængighed, er, at vi statistisk ikke kan konkludere noget om afhængighed – blot ikke-uafhængighed. Vi fastsætter desuden vores signifikansniveau til 5 %, hvilket gør det forholdsvis svært for os at ”lande” i H1-rummet. 52 Før vi går i gang med selve testen, vil vi skabe et overblik over variablernes fordeling. Her kommer først et søjlediagram, der viser procentfordelingen af ’nære venskaber’ og ’selvvurderet helbred’: Sammenhæng mellem nære venskaber og selvvurderet helbred 90 80 Har De nogen venner, som De kan tale med om personlige problemer? 70 60 39% Ja Nej 26% 50 40 30 24% 20 42% 40% 10 13% 9% 2% 3% 0 Virkelig godt Godt Nogenlunde Dårligt 1% Meget dårligt Hvordan vil De alt i alt vurdere Deres helbred? Figur 12.1: Søjlediagram over sammenhængen mellem ’nære venskaber’ og ’helbred’ Som det fremgår af diagrammet summer de to udfaldsrum ’ja’ og ’nej’ i variablen ’nære venskaber’ hver især til 100%. Søjlerne angiver således procentfordelingen af henholdsvis ’nære venskaber’ og ’ingen nære venskaber’ for de fem udfaldsrum af variablen ’selvvurderet helbred’. Langt de fleste respondenter fordeler sig i kategorierne ’godt’ og ’virkelig godt’, hvorimod kun ganske få respondenter har svaret ’meget dårligt’. Det er vigtigt at være opmærksom på dette relativt lave antal af respondenter, eftersom den statistiske usikkerhed øges jo færre respondenter, der er i en celle. 53 Nedenfor ses en tovejstabel, der ligeledes viser sammenhængen mellem ’nære venskaber’ og ’selvvurderet helbred’. Her angives antallet af respondenter i hver celle samt de marginale sandsynligheder: Har De nogen Hvordan vil De alt i alt vurdere Deres helbred? venner, som De kan tale med om Virkelig personlige pro- godt Godt Nogenlunde Dårligt Meget Total dårligt Marginal sandsynlighed blemer? Ja 1.823 1.728 554 144 47 4.296 0,86 Nej 175 264 162 60 16 677 0,14 Total 1.998 1.992 716 204 63 4.973 1 Marginal sandsyn- 0,40 0,40 0,14 0,04 0,01 1 lighed Tabel 12.2: Sammenhængen mellem ’nære venskaber’ og ’selvvurderet helbred’ Vi har udregnet de marginale sandsynligheder, som er sandsynlighederne for hver af de stokastiske variabler (Malchow-Møller et.al. 2010: 85f), ved at dividere totalen for hver kolonne med den samlede total jf. afsnit 9.3.2 i teoridelen. Disse skal bruges senere hen, når vi skal udføre en enkeltcelletest. Her er udregningen af den marginale sandsynlighed for kolonnen ’virkelig godt’: Marginal sandsynlighed = 1998 = 0, 40 4973 For at kunne udføre en χ2-test for uafhængighed, udregner vi den forventede fordelingen under H0 ud fra følgende formel: f (x, y) = f x (x)! f y (y) n Ved at gange kolonnens total med rækkens total og dernæst dividere med antallet af observationer fås den forventede fordeling under H0. 54 Nedenfor ses en tabel, der viser, hvordan respondenterne i stikprøven ville fordele sig, hvis der var uafhængighed mellem de to variabler: Har De nogen venner, som De Hvordan vil De alt i alt vurdere Deres helbred? Virkelig godt Godt Nogenlunde Dårligt Meget kan tale med dårligt om personlige problemer? Ja 1726 1721 619 176 54 Nej 272 271 97 28 9 Tabel 12.3 Forventet fordeling under H0 Vi bruger tallene fra tabel 12.2. Nedenfor ses en udregning for hvor mange respondenter, der ville svare ’virkelig godt’ og ’ja’ under H0: f (x, y) = 1998! 4296 = 1726 4973 Efter at have udregnet de forventede værdier under H0, er vi nu klar til at udføre selve χ2-testen for uafhængighed. Det enkelte cellebidrag udregnes med den samme formel, som vi anvendte i χ2testen for fordelinger i repræsentativitetstesten for alder og indkomst: K (Z k ! n " ! k )2 x =# n "!k k=1 2 Ved at udnytte forskellen mellem den observerede fordeling i stikprøven, Zk, og den forventede fordeling under H0, n ⋅ πk, udregnes hver enkelt celles χ2-værdi. 55 Her ses en tabel, der viser disse χ2-cellebidrag, den samlede χ2-værdi samt antallet af frihedsgrader: Har De nogen venner, som De kan tale med om Hvordan vil De alt i alt vurdere Deres helbred? personlige problemer? Virkelig Godt Nogenlunde Dårligt Meget dårligt godt Ja 5,45 0,03 6,73 5,89 1,01 Nej 34,59 0,19 42,72 37,40 6,43 χ 2-værdi 140,44 Frihedsgrader 4 Tabel 12.4: χ2-test for uafhængighed mellem ’nære venskaber’ og ’selvvurderet helbred’ Vi indsætter tallene fra ’virkelig godt’ og ’ja’ fra tabel 12.2 og 12.3 i formlen, så det kommer til at se ud som følger: K (1823!1726)2 = 5, 45 1726 k=1 x2 = " Ligesom i repræsentativitetstesten for alder og indkomst, afhænger signifikans ikke kun af χ2værdien, men også af antal frihedsgrader. Vi benytter den samme formel som tidligere – nemlig: d.f. = (c-1) ⋅ (r-1) Og får antallet af frihedsgrader til: d.f. = (2-1) ⋅ (5-1) = 4 Vi får vores samlede χ2-værdi til at være 140,44 ved at summere alle χ2-cellebidragene fra tabel 12.4. Med 4 frihedsgrader og et 5% signifikansniveau overskrider vi derfor vores kritiske værdi på 9,49 (Malchow-Møller et al. 2010:438). Vi må derfor forkaste vores H0-hypotese og bekræfte vores H1-hypotese. Hermed kan vi konstatere, at der er en ikke-uafhængighed mellem ’nære venskaber’ og ’selvvurderet helbred’. Vi kan således ikke umiddelbart forkaste vores empiriske hypotese. 56 12.2 Enkeltcelletest Da χ2-testen for uafhængighed ikke kan sige os noget om hvilke kategorier, der er signifikant under- eller overrepræsenteret, vil nu udføre en enkeltcelletest – også kaldet en rxy-test. . En enkeltcelletest kan vise os, hvilke sammenhænge mellem ’nære venskaber’ og ’selvvurderet helbred’, som ikke passer på H0-hypotesen. Vi udregner rxy-værdier for hver kategori. Disse kan enten være numerisk store eller små afhængig af, om den observerede frekvens afviger fra den forventede frekvens under H0. Enkeltcelletesten bygger således videre på de samme idéer som vores χ2-testen for uafhængighed. En rxy-teststatistik følger principperne for en normalfordeling, idet rxy under H0 er approksimativt standardnormalfordelt. Derfor anvender vi stadig et signifikansniveau på 5%, som betyder, at hvis rxy-værdien for en celle er numerisk større end +1,96, er denne i uoverensstemmelse med vores H0-hypotese. rxy-værdien er givet ved følgende formel (Malchow-Møller et al. 2010:372f): rxy = (Z xy ! n " ! xy ) n " ! xy (1! f x (x))" (1! f y (y)) Hvor den forventede værdi er udtrykt i n ⋅ πxy = n ⋅ fx(x) ⋅ fy(y), og Zxy er det observerede antal i den celle, hvor X=x og Y=y (Malchow-Møller et al. 2010:373). Når vi indsætter tallene fra tabel 12.2 og 12.3, får vi hermed: rxy = (1823!1726) = 8,18 1726 " (1! 0, 40)" (1! 0,86) Da der kun er to udfaldsrum for den Bernoullifordelte variabel ’selvvurderet helbred’, er rxyværdierne logisk nok det samme tal i hver kolonne bare med omvendt fortegn. 57 I følgende tabel ses alle de udregnede rxy-værdier: Har De nogen venner, som Hvordan vil De alt i alt vurdere Deres helbred? De kan tale med om personlige problemer? Virkelig Godt Nogenlunde Dårligt Meget dårligt godt Ja 8,18 0,61 -7,60 -6,72 -2,74 Nej -8,18 -0,61 7,60 6,72 2,74 Tabel 12.5: Enkeltcelleværdier Som det fremgår af tabel 12.5, overskrider alle rxy-værdierne med et 5%-signifikansniveau de kritiske værdier på +1,96 på nær værdierne for ’godt’. For disse celler må vi derfor forkaste H0 og tro på H1-hypotesen. Det betyder, at vi for disse kategorier kan tale om en ikke-uafhængighed. Ud fra rxyværdiernes fortegn kan vi vurdere, om kategorierne er signifikant under eller over de forventede værdier for uafhængighed. Hvis fortegnet er negativt betyder det således, at vores faktiske fordeling er lavere end under H0. Hvis fortegnet derimod er positivt, angiver dette, at den faktiske fordeling er højere end under H0. Forklaringen herpå er, at vi med rxy-teststatistikken trækker den hypotetiske fordeling fra den faktiske fordeling. Vi har markeret de værdier, der er numerisk for store i forhold til den forventede værdi under H0 med grønt. Vi kan se, at der er en klar overrepræsentation af dem, der har ’nære venskaber’, som har vurderet deres helbred til ’virkelig godt’ i forhold til dem, der ikke har ’nære venskaber’. Samtidig kan vi ud fra rxy-værdierne i tabel 12.5 se, at de, der har ’nære venskaber’ og vurderer deres helbred dårligere – det vil sige ’nogenlunde’, ’dårligt’ og ’meget dårligt’ – er signifikant underrepræsenteret. De værdier, der er numerisk for små, har vi markeret med rødt. Her kan vi, når vi kigger på dem med ’ingen nære venskaber’, se en underrepræsentation i kategorien ’virkelig godt’ og omvendt se en signifikant overrepræsentation under ’nogenlunde’, ’dårligt’ og ’meget dårligt’. Som nævnt, er fordelingen for ’godt’ den eneste kategori, hvor vores rxy-værdier ikke overskrider de kritiske værdier på +1,96. Vi kan derfor ikke tale udtale os om en specifik over-eller underrepræsentation i denne kategori, fordi vi ikke har at gøre med signifikante værdier. I en anden stikprøve kunne vi nemlig lige så godt få det omvendte resultat grundet stikprøvetilfældigheder. 58 På baggrund af vores χ2-test samt vores enkeltcelletest kan vi hermed konkludere, at der er en signifikant ikke-uafhængighed mellem ’nære venskaber’ og ’selvvurderet helbred’. Der er således en tendens til, at respondenter med ’nære venskaber’, vurderer deres helbred bedre end dem, der har svaret, at de ’ingen nære venskaber’ har. Det vil altså sige, at vi kan forkaste vores H0-hypotese om uafhængighed og acceptere vores H1-hypotese om ikke-uafhængighed. Vi kan på baggrund af vores tests derfor ikke afkræfte vores empiriske hypotese om en sammenhæng mellem ’nære venskaber’ og ’selvvurderet helbred’. Dog kan vi ikke udtale os statistisk om et eventuelt kausalitetsforhold. 13. Test af supplerende empirisk hypotese 13.1 χ 2 -test for uafhængighed Som det fremgår af ovenstående statistiske analyse, kan vi ikke afkræfte vores empiriske hypotese om, at der er en sammenhæng mellem ’nære venskaber’ og ’selvvurderet helbred’. Ud fra vores teoretiske udgangspunkt kan vi derfor tale for, at social kapital påvirker den enkeltes helbred. I denne forbindelse er det relevant at undersøge, om der eventuelt kan være andre faktorer, der ligeledes påvirker helbredet. Her er det yderst relevant at teste, om der er en sammenhæng mellem ’indkomst’ og ’selvvurderet helbred’, eftersom indkomst er en af de helt klassiske differentieringskræfter i samfundet. Desuden lægger valget af baggrundsvariablen ’indkomst’ også i naturlig forlængelse af vores teoretiske redegørelse for Bourdieus teori, som foruden social kapitalbegrebet også opererer med et økonomisk kapitalbegreb (jf. afsnit 3.1). Det er derfor interessant at undersøge, om ’selvvurderet helbred’ ligeledes påvirkes af ’indkomst’ Det er dog vigtigt endnu en gang at understrege, at vi ikke statistisk kan udtale os om kausalitet. I det følgende vil vi derfor ved hjælp af en χ2-test for uafhængighed undersøge, om der er en statistisk ikke-uafhængighed mellem ’indkomst’ og ’selvvurderet helbred’. Vi benytter således den samme teststatistisk som i ovenstående analyse af vores overordnede empiriske hypotese. Først opstiller vi en ny supplerende empirisk hypotese: Indkomst Selvvurderet helbred 59 Vores hypotese er hermed, at der er en sammenhæng mellem den enkeltes årlige hustandsindkomst og selvvurderede helbred. Her er denne hypotese uddybet i to underhypoteser: Høj indkomst Lav indkomst Godt selvvurderet helbred Dårligt selvvurderet helbred Med disse empiriske hypoteser på plads er vi klar til at udføre selve χ2-testen for uafhængighed. Vi sætter igen vores signifikansniveau til 5% og opstiller en nul- og alternativhypotese: H0: Uafhængighed dvs. f(x,y) = fx(x) ⋅ fy(y) for alle værdier af x og y H1: Ikke-uafhængighed dvs. f(x,y) ≠ fx(x) ⋅ fy(y) for mindst én værdi af x og y Vores nulhypotese er hermed, at der er uafhængighed mellem vores variabler ’indkomst’ og ’selvvurderet helbred’, mens alternativhypotesen angiver, at der er en ikke-uafhængighed mellem disse variabler. 60 Nedenfor ses en tovejstabel, der viser sammenhængen mellem ’indkomst’ og ’selvvurderet helbred’ samt de marginale sandsynligheder: Hvordan vil De alt i alt vurdere Hvor stor var Deres/familiens samlede indkomst i 1999 (brutto)? Deres helbred? 200.000- 300.000- 299.999 399.9999 499.999 599.999 kr. kr. kr. kr. 351 285 299 324 283 358 433 303 304 326 241 254 Nogenlunde 298 112 77 59 45 49 Dårligt 100 35 26 13 7 5 30 10 4 8 2 5 1212 745 710 730 578 671 0,26 0,16 0,15 0,16 0,12 0,14 <200.0 00 kr. Virkelig godt Godt Meget dårligt Total Marginal sandsynlig- 400.000- 500.000- >600.000 Total Marginal sandsynlig- kr. hed 1900 1861 640 186 59 4646 0,41 0,40 0,14 0,04 0,01 1 1 hed Tabel 13.1: Sammenhængen mellem ’indkomst’ og ’selvvurderet helbred’ Vi er opmærksomme på, at det samlede antal af respondenter er væsentlig lavere her (4.646) sammenlignet med antallet i den statistiske analyse af den overordnede empiriske hypotese (4.973). Årsagen er, at en del respondenter har svaret ’ved ikke’ eller ’vil ikke svare’ på indkomst’variablen. Vi har dog vurderet, at det er vigtigere at beholde et så stort respondentantal som muligt i selve analysen, end at slette de 327 respondenter fra alle vores data, for at udføre denne ekstra ana- 61 lysetest. Desuden er det vigtigt at påpege, at to af kategorierne ikke opfylder ”reglen” om minimum fem respondenter i hver celle. Det drejer sig om kategorierne ’meget dårligt’ samt henholdsvis ’300.000-399.999 kr.’ og ’500.000-599.999 kr.’. Her er den statistiske usikkerhed altså for stor til, at vi med rimelighed kan udtale os om disse kategorier. Selve fremgangsmåden i denne test følger, som nævnt, de samme principper, som χ2-testen for uafhængighed mellem ’nære venskaber’ og ’selvvurderet helbred’ (jf. afsnit 12.1). Først udregnes således de forventede værdier under H0 for hver kategori, og dernæst udregnes hver enkelt celles χ2værdi ved at sammenholde den observerede frekvens, Zk, med den forventede frekvens under H0, n ⋅ πk. Her har vi dog ikke beregnet χ2-værdierne manuelt i Excel som før, men udregnet χ2- cellebidragene ved hjælp af statistikprogrammet, Stata (jf. dofile afsnit 18.1). Nedenfor ses hermed en tabel med Statas udregninger af χ2-cellebidragene, den samlede χ2-værdi og antallet af frihedsgrader: Hvordan vil De alt i alt vurdere Deres hel- Hvor stor var Deres/familiens samlede indkomst i 1999? (brutto) bred? Under 200.000- 300.000- 400.000- 500.000- 600.000 kr. og 200.000 kr. 299.999 kr. 399.999 kr. 499.999 kr. 599.999 kr. derover Virkelig godt 42,2 1,3 0,3 2,2 9,2 25,5 Godt 5,7 0,1 1,4 3,9 0,4 0,8 Nogenlunde 102,9 0,9 4,4 17,2 15,1 20,4 Dårligt 54,6 0,9 0,2 9 11,3 17,8 ligt 13,9 0 2,8 0,2 3,9 1,5 χ2-værdi 369,48 Meget dår- Frihedsgrader 20 Tabel 13.2: χ2-test for uafhængighed 62 Med et signifikansniveau på 5% og 20 frihedsgrader overskrider den samlede χ2-værdi på 369,48 den kritiske grænse på 31,4 (Malchow-Møller et al. 2010:438). Vi må derfor forkaste vores H0hypotese og tro på H1-hypotesen om ikke-uafhængighed. Vi kan altså ikke umiddelbart afkræfte vores supplerende empiriske hypotese om, at der er en sammenhæng mellem ’indkomst’ og ’selvvurderet helbred’. 13.2 Enkeltcelletest Ligesom i den statistiske analyse af vores overordnede empiriske hypotese, er det yderst relevant at udføre en enkeltcelletest i forlængelse af χ2-testen for uafhængighed. Med denne kan vi nemlig finde ud af, hvilke kategorier, der er signifikant over- eller underrepræsenteret i den observerede fordeling sammenholdt med den forventede fordeling under H0. Vi fastholder vores signifikansniveau på 5%, hvilket betyder, at vi kan udtale os om en henholdsvis over- eller underrepræsentation, hvis rxy-værdien for en kategori er numerisk større end +1,96. Teststatistikken for rxy-værdien følger de samme principper som enkeltcelletesten af ’nære venskaber’ og ’selvvurderet helbred’ (jf. afsnit 12.2). Her er enkeltcelletesten ligeledes regnet ved hjælp af Stata (jf. dofile afsnit 18.1). Nedenfor ses således en tabel, der viser Statas udregninger af rxy-værdierne for sammenhængen mellem ’indkomst’ og ’selvvurderet helbred’: Hvordan vil De alt i alt vurdere Deres helbred? Hvor stor var Deres/familiens samlede indkomst i 1999? (brutto) Under 200.000 kr. 200.000- 300.000- 400.000- 500.000- 299.999 kr. 399.999 kr. 499.999 kr. 599.999 kr. 600.000 kr. og derover Virkelig godt -9,83 -1,6 0,72 2,09 4,22 7,1 Godt -3,58 0,37 1,63 2,76 0,86 -1,26 Nogenlunde 12,7 1,09 -2,46 -4,86 -4,47 -5,26 Dårligt 8,77 1,06 -0,5 -3,37 -3,66 -4,66 4,36 0,19 -1,83 -0,46 -2,12 -1,31 Meget dårligt Tabel 13.3: Enkeltcelletest 63 Som det fremgår af tabellen, overskrider mere end halvdelen af rxy-værdierne for vores kategorier den kritiske værdi på +1,96. Vi har igen markeret de kategorier, der er numerisk for store i forhold til den forventede værdi under H0 med grønt. Mens de kategorier, der er numerisk for små er markeret med rødt. De resterende sorte kategorier kan vi ikke med rimelighed udtale os om, da der hverken er tale om signifikante over- eller underrepræsentationer. Desuden er de førnævnte kategorier, som ikke lever op til kravet om minimum 5 respondenter i hver celle, overstreget. Helt overordnet betragtet kan man se to tilnærmelsesvise diagonale linjer i tabel 13.3, der antyder en interessant sammenhæng mellem ’indkomst’ og ’selvvurderet helbred’. Den første linje går fra ’virkelig godt’ og ’under 200.000 kr.’ til ’meget dårligt’ og ’600.000 kr. og derover’. Den anden linje går omvendt fra ’meget dårligt’ og ’under 200.000 kr. til ’virkelig godt’ og ’600.000 kr. og derover’. Disse linjer kan indikere en tendens til, at personer, der tjener relativt få penge, generelt vurderer deres helbred dårligere end personer, der tjener relativt mange penge. Det ses således, at der er en klar overrepræsentation af respondenter i ’under 200.000 kr.’ i kategorierne ’nogenlunde’, ’dårligt’ og ’meget dårligt helbred’. Samtidig er respondenterne med et ’nogenlunde’ og ’dårligt helbred’ markant underrepræsenteret for henholdsvis ’300.000-399.999 kr.’ og ’400.000-499.999 kr.’ samt indkomstkategorierne derover. Omvendt er respondenter med et ’virkelig godt helbred’ signifikant overrepræsenteret i indkomstkategorierne fra ’400.000-499.999 kr.’ og opefter, mens respondenter med en indkomst på ’under 200.000 kr.’ er underrepræsenteret i forhold til at have et ’virkelig godt’ og ’godt helbred’. Med vores χ2-test for uafhængighed og enkeltcelletest må vi forkaste vores H0-hypotese og tro på vores H1-hypotese om ikke-uafhængighed. Hermed kan vi ikke afkræfte vores supplerende empiriske hypotese. Det tyder altså på, at der er en statistisk sammenhæng mellem ’indkomst’ og selvvurderet helbred’, idet personer med en relativ lav indkomst generelt vurderer deres helbred dårligere end personer med en relativ høj indkomst. Vi kan dog ikke statistisk udtale os om et bestemt kausalitetsforhold. Hvis man har det teoretiske udgangspunkt for øje, tyder alle vores statiske test dog på, at den enkeltes helbred er påvirkeligt af ’nære venskaber’ og ’indkomst’ – eller i Bourdieuske termer; social og økonomisk kapital. Dette vil vi uddybe nærmere i den kommende diskussion, hvor vores empiriske analyse sammenholdes med den sociologiske teori. 64 14. Diskussion 14.1 Empiriske resultater I det følgende vil vi opridse de væsentligste resultater, som vi har fundet ved brug af de statistiske værktøjer. Først har vi kategoriseret vores to udvalgte variabler; ’nære venskaber’ og ’selvvurderet helbred’. For ’nære venskaber’ har vi fundet ud af, at populationen med stor sandsynlighed ligger inden for et interval plus/minus 1 procentpoint fra værdien i stikprøven. Den består af 86,39% respondenter med ’nære venskaber’ og 13,61% ’uden nære venskaber’. Det selvvurderede helbred ligger hos langt de fleste respondenter i den gode ende: 40,18% har et ’virkelig godt helbred’ og 40,06% har et ’godt helbred’. Kun 4,10% og 1,27% har henholdsvis et ’dårligt’ eller ’meget dårligt helbred’. I midterkategorien er 14,40% placeret med et ’nogenlunde helbred’. Efter kategoriseringen har vi testet om vores stikprøve kan siges at være repræsentativ i forhold til den viden, vi har om populationen fra Danmarks Statistik. Vi har fundet ud af, at kønsfordelingen med et 5%-signifikansniveau er repræsentativ for population. Men med hensyn til baggrundsvariablen alder har vi fundet, at stikprøven ikke er repræsentativ for populationen inden for den usikkerhedsgrænse, vi er villige til at acceptere. Det samme gør sig gældende for indkomst. Da disse tre parametre alle er væsentlige årsager til social differentiering i den sociologiske teori, er det problematisk, at der for to af disse ikke er tale om repræsentativitet. Derudover kan der også være andre socioøkonomiske faktorer, som stikprøven ikke er repræsentativ for. Man skal huske på, at selvom stikprøven er repræsentativ for køn, er det ikke sikkert den er det, hvis man betragter køn sammen med andre parametre. Det har ikke været muligt for os at lave repræsentativitetstest på vores udvalgte variabler for analysen, da information om disse ikke kan findes i forhold til populationen. I den egentlige test af vores empiriske hypotese har det vist sig, at der er en signifikant forskel i ’selvvurderet helbred’ mellem dem med ’nære venskaber’ og dem ’uden nære venskaber’. Således har dem med ’nære venskaber’ vist sig generelt at have et bedre helbred end dem ’uden nære venskaber’. Dette underbygger vores teoretiske hypotese om, at der er en sammenhæng mellem social kapital og helbred. Derudover har vi valgt at undersøge om der også er en sammenhæng mellem ’indkomst’ og ’selvvurderet helbred’. Der har vist sig at være en tendens til, at grupper med en lavere ’indkomst’ er signifikant overrepræsenteret i forhold til ’dårligt helbred’, og underrepræsenteret i forhold til ’godt helbred’ sammenlignet med de bedre økonomisk stillede. Der er dog en statistisk 65 usikkerhed, idet der er for få mennesker i nogle af kategorierne til at vi med rimelighed kan udtale os. Vi har altså igennem vores analyse kunne påvise en tendens til, at social såvel som økonomisk kapital influerer menneskers helbred. Men i og med vores stikprøve på en række parametre ikke er repræsentativ, kan vi ikke uden problemer overføre denne viden til populationen. Derudover kan vi problematisere vores operationalisering. Vi har valgt at bruge ’nære venskaber’ som et udtryk for social kapital. Bourdieus begreb om social kapital omfatter mange aspekter, der er afgørende for mængden af de ressourcer den enkelte opnår gennem dennes netværk. Bourdieu fremhæver, at mængden af ressourcer både afgøres af kvaliteten såvel som kvantiteten. Vi har, som sagt, valgt at fokusere på kvaliteten i form af, dét at have mindst én at tale om personlige problemer med. Men en del andre aspekter af den enkeltes sociale kapital kan også tænkes at påvirke helbredsniveauet. Vi har blandt andet berørt, at ens netværk kan skaffe én en særlig brugbar viden i forhold til helbred, og ikke mindst kan ens mere forudbestemte relationer så som forældre have en stor betydning for ens helbredsniveau. Men dét, som vi indfanger med vores valgte variabel, er en form for aktuel social kapital, idet der spørges til ’nære venskaber’ på interviewtidspunktet, hvilket også gør sig gældende for ’selvvurderet helbred’. Derudover vurderer vi, at dét at have mindst en at tale om personlige problemer med, er en form for social kapital, der må være særlig relevant i forhold til selvvurderet helbred. Man kan selvfølgelig også sætte spørgsmålstegn ved ’selvvurderet helbred’ som mål for helbredsniveauet blandt danskerne. Men i henhold til Nettletons betragtninger (jf. afsnit 2), mener vi det er det bedste mål for dette. Opsummerende kan man sige, at der er en række problematikker i forhold til repræsentativiteten og operationaliseringen, der ikke gør os i stand til at generalisere vores resultater til hele populationen uden at tage nogle forbehold. Men der ser ud til at være en tendens til et sammenfald mellem social kapital og helbred, hvilket da også underbygges af teorien. I de følgende afsnit vil vi diskutere nogle interessante aspekter, der knytter sig til vores problemformulering. Først vil vi diskutere kausalitetsforholdet mellem social kapital og selvvurderet helbred, som er væsentligt i forståelsen af vores problemformulering. 66 14.2 Kausalitetsforhold mellem social kapital og helbred Ud fra vores statistiske analyseresultater af nære venskaber og selvvurderet helbred ved vi nu, at der er en sammenhæng mellem social kapital og helbred. Men hvori består denne sammenhæng? Hvilken form for kausalitet har vi egentlig med at gøre? Begrebet kausalitet refererer her til forholdet mellem årsag og virkning. I denne opgave har vi indtil nu fokuseret på den sociale kapital som årsag og helbredet som en virkning heraf, men er kausalitetsforholdet i virkeligheden omvendt? I det følgende vil vi kort diskutere, hvilke(t) kausalitetsforhold, der kan være tale om. Da vi ikke kan konkludere noget om kausalitet på baggrund af vores statistiske analyse, tager denne diskussion udelukkende udgangspunkt i teoretiske overvejelser. Indenfor både den empiriske og den teoretiske sociologi fokuseres der hovedsagligt på et kausalitetsforhold, hvor menneskets sociale ressourcer eller mangel på samme ses som årsagen til et bestemt helbredsniveau. En række studier har således afdækket, hvilken betydning sociale relationer har for en række fysiske og psykiske sygdomme såsom infektionssygdomme, kræft og mentale lidelser. Dog er forskningen på dette område så forholdsvis ny, at der stadig er mange ubesvarede spørgsmål i forhold til at forstå sammenhængen mellem sociale relationer og helbred (Lund et al. 2002:87). Det er især kausalitetsforholdet med helbred som årsag, der står ubelyst hen, idet færre studier afdækker denne sammenhæng (Lund et al. 2002:100). Alligevel kan man forestille sig, at helbredet kan være af stor betydning for den enkeltes sociale kapital. Hvis et menneske for eksempel rammes af sygdom, kan det forhindre vedligeholdelsen af kontakten til familie og venner. Omvendt kan sygdommen også føre familie og venner endnu tættere på hinanden (ibid.). Helbredet kan altså påvirke den enkeltes sociale kapital både negativt og positivt, hvilket vi senere vil uddybe. I virkeligheden er der måske nok snarere tale om et dobbeltrettet kausalitetsforhold mellem social kapital og helbred ligesom det er tilfældet med sammenhængen mellem sygdomme og indkomst. Denne relation er en form for vekselvirkning, idet sygdomme både kan være forårsaget af og fremme en lav indkomst (Diderichsen 2011:359). Man kan således argumentere for, at et dårligt helbred både kan være en effekt af og en årsag til en lav social kapital, og at det samme gør sig gældende for relationen mellem et godt helbred og en høj social kapital. I en belysning af sammenhængen mellem social kapital og helbred bør man derfor være opmærksom på, at kausaliteten ikke udelukkende går fra social kapital til helbred. 67 14.3 Helbred som årsag til social eksklusion? I det følgende vil vi beskrive og diskutere det modsatte kausalforhold – hvordan et individs helbred har betydning for dets sociale relationer og dermed mængde af social kapital. Dette gør vi ud fra begrebet social eksklusion, der må siges at være den yderste sociale konsekvens af et dårligt helbred. Social eksklusion er en betegnelse for de socialt udsatte individer, der på en eller flere områder lever på kanten af eller uden for samfundet (Andersen et al. 2011:211). Der er både synlige og usynlige socialt ekskluderede, og der er en stor fare for at overse de mindre synlige – eksempelvis førtidspensionister – da fokus ofte er på de synlige – herunder hjemløse og stofmisbrugere (Andersen et al. 2011:227). Social eksklusion er ensbetydende med en mangel på ressourcer samt manglende muligheder for at deltage i en række normale sociale relationer og aktiviteter. Et menneske siges således at være ekskluderet, hvis det ikke deltager i sociale relationer og i samfundet generelt (Andersen et al. 2011:230). Indekset for inklusion og eksklusion består af forskellige elementer indenfor blandt andet politisk deltagelse, helbred og sociale relationer (ibid.). I dagens Danmark er det en meget begrænset andel af befolkningen, der er socialt ekskluderet. Men hvordan bliver et menneske i et velfærdssamfund som Danmark ekskluderet, og hvilke faktorer spiller ind, når et menneske ekskluderes fra det sociale liv? Der er forskellige grunde til, at man bliver socialt ekskluderet. Social eksklusion kan bunde i en opvækst under socialt belastede forhold. Det har vist sig, at der er en klar sammenhæng mellem en problematisk opvækst og social eksklusion senere i livet (Larsen 2005 i Larsen 2009:31f), men disse tilfælde udgør kun en mindre del af de socialt ekskluderede. En anden årsag til eksklusion er sociale begivenheder, der finder sted i voksenlivet, herunder blandt andet langvarig sygdom, mens den tredje årsag er bundet op på placering i sociale, økonomiske og kulturelle hierarkier (ibid.). Den mest centrale bagvedliggende faktor for social eksklusion er dog langtidsledighed og arbejdsløshed, da den arbejdsløse her ekskluderes fra arbejdsmarkedet (Andersen et al. 2011:227). Andre vigtige socioøkonomiske faktorer for eksklusion er blandt andet lav indkomst, kort eller ingen uddannelse, hjemløshed og/eller svagt helbred (ibid.). Netop den sidstnævnte faktor, dårligt helbred, er den faktor, vi i det følgende vil uddybe. Når et menneske rammes af en længerevarende eller livstruende sygdom, får sygdommen både betydning for personens helbred og samtidig store konsekvenser for livskvaliteten i øvrigt. Et dårligt helbred kan først og fremmest føre til arbejdsløshed og reducere muligheden for efterfølgende at 68 finde et nyt arbejde (Larsen 2009:22), hvilket kan resultere i dårlige økonomiske forhold og manglende kontakt til kollegaer. Hvis den syge bliver fyret eller må opgive at arbejde af helbredsmæssige årsager, bliver han eller hun på denne måde ekskluderet fra arbejdsmarkedet. Men et ringe helbred kan også betyde, at det bliver sværere at bevare et socialt netværk. Det ses, når den syge af helbredsmæssige årsager ikke længere kan opretholde en jævnlig kontakt til venner og familie, idet ”opretholdelsen af gensidig anerkendelse kræver et materielt og mentalt overskud til at være noget for andre end sig selv”, som John Andersen og Jørgen Elm Larsen skriver (Andersen et al. 2011:233). De sociale konsekvenser, der skyldes sygdom og dårligt helbred, er således et ringere og ustabilt socialt netværk, og dette kan få konsekvenser for en persons mængde af sociale kapital. Med Bourdieu in mente kan man argumentere for, at den syge har en lavere social kapital end en velfungerende og rask person, der uden problemer kan pleje sit netværk. Dette kan i yderste konsekvens føre til, at vedkommende bliver socialt ekskluderet. Det er dog vigtigt at pointere, at det er de færreste i Danmark, der decideret er socialt ekskluderet. Der kan være tale om, at sygdom og dårligt helbred kan have en betydning for ens sociale liv og dermed sociale kapital, men det er problematisk at sidestille lav social kapital med social eksklusion. Politisk diskuterede man tidligere social eksklusion i forbindelse med arbejds- og boligproblemer, og tillagde noget af skylden en fejlagtig socialpolitik, men i 1990’erne begyndte politikerne i stedet at betone individets rolle og ansvar for egen situation (Järvinen 2011:238). Dette kan ses i sammenhæng med det postmoderne samfunds stigende individualisering, som vi kommer ind på i næste afsnit. 14.4 Helbred og refleksivitet i det senmoderne samfund I hvor vid udstrækning er vi mennesker og vores valg determineret af strukturer? Og i hvilken grad har vi en fri vilje til at handle i forhold til vores helbred? Sociologerne, Ulrich Beck og Anthony Giddens, har begge formuleret teorier om en udpræget individualisering i senmoderniteten. I det følgende vil vi diskutere netop Beck og Giddens i forhold til individualisme, refleksivitet og sundhedsadfærd samt stille dette op imod Bourdieus teori. I den Bourdieuske ontologi er strukturer og reproduktion af disse i vid udstrækning determinerende for det enkelte individ - her kan, jf. afsnit 3, i flæng nævnes habitus, positionering i det sociale rum, kumulation af diverse kapitalformer og reproduktionsmekanismer. Bourdieu kalder dog selv sit 69 arbejde for ’konstruktivistisk strukturalisme’, idet han bestræber sig på at distancere sig fra de mest rigide former for strukturalisme, som ikke levner noget råderum for aktivt handlende, selvbestemmende og selektive aktører (Järvinen 2007:363). Han indfører, i tråd med denne bestræbelse, mønsterbryderbegrebet, som betegner et individ, der aktivt handler imod den prædisponerede skæbne som dets positionering i det sociale rum og habitus anslår – eksempelvis i forhold til sundhedsvalg (Esmark 2006:78). Hvorvidt Bourdieu formår at bløde determinismen op i sin konstruktivistiske strukturalisme stilles der spørgsmålstegn ved af hans kritikere, der mener, at han for skarpt fokuserer på magt og reproduktion og kun meget lidt på modmagt og forandring. Bourdieus agenter tillægges således kun meget lidt handlefrihed ligesom strukturforandringer forekommer meget trægt (Järvinen 2007:363). Et alternativ til denne tænkning af samfundet er Giddens' ’strukturationsteori’, hvori individ/struktur dikotomien ligeledes søges ophævet. Individet ses i denne forbindelse som et socialt handlende væsen, hvis handlinger på en og samme tid konstitueres af og er konstituerende for de sociale strukturer (Kaspersen 2007:432). Her ses agenten i det senmoderne som frit flydende og selvskabende, der ikke, ligesom i det præmoderne samfund, har en fastlagt kurs determineret af slægt, stand og klasse. Der er tale om et individualiseret samfund, hvori selvet bliver er refleksivt projekt; individet opfinder og former selv sit sunde eller usunde liv. Sociale problemer ses således ikke som en klasseskæbne, men som en individuel dysfunktion (Larsen 1999:97). Hos Beck er der ligeledes tale om et refleksivt projekt i forlængelse af individualiseringen (Rasborg 2007:466). I sin teori om risikosamfundet hævder han desuden, at omfordeling af risici (onder), defineret som utilsigtede konsekvenser af den menneskelige handlen for eksempel i forhold til miljø, erstatter rigdom (goder) (Beck 1997a:27-23; 1993:37 i Rasborg 2007:461). Beck mener, at risikosamfundet er et post-klassesamfund, idet risici principielt fordeler sig uden hensyn til sociale faktorer (ibid.). Dog er det vigtigt at notere sig, at Beck ikke mener, at vi på grund af risikosamfundets indtræden, har frigjort os fra de stratifikationsmekanismer, der gjorde sig gældende for klassesamfundet, idet ”…rigdom akkumuleres for oven, risici for neden” (Beck 1997:48). Han mener, at klassesamfundets uligheder gentages i risikosamfundet, da dét at være velstillet økonomisk samt at besidde en uddannelse og et højt informationsniveau, betyder, at man har mulighed for at købe en sikker bolig, fødevarer af høj kvalitet og undgå jobs, der involverer helbredsrisici (ibid.). Når senmodernitetsteoretikere bruges til at belyse sundhedsproblematikken er det derfor vigtigt at holde 70 den sidste pointe in mente – blot fordi vi indtræder i den refleksive fase af moderniteten, betyder det ikke, at vi mennesker er frie til at vælge i alle henseender, idet vi er begrænsede af vores ressourcer – eller i en Bourdieusk terminologi; kapital. 14.4.1. Sundhedsdiskurs og –politik i en dansk kontekst I Danmark har der været en tradition for, at staten er forsigtige med at blande sig i befolkningens sundhedsadfærd; tilsvarende er sygelighed- og dødelighedsraten i Danmark relativ høj (Diderichsen 2011:364). Sammenlignet med andre velstillede lande, både de der har en mere eller mindre udbygget velfærdsmodel og socialpolitik, placerer danskerne sig dårligere i forhold til middellevetid jf. Forebyggelseskommisionens rapport ”Vi kan leve længere og sundere” fra 2009 (Diderichsen 2011: 365). Tendensen anslås at skyldes, at de øvrige lande har en mere veludbygget sundhedsfremmende politik. Man har i Danmark så at sige vægtet borgernes personlige frihed til at vælge – i tråd med tanker om refleksivitet og individualisering som berettet af Giddens og Beck. I et sådant perspektiv er der dog en overhængende fare for at overse og derfor også miskende bagvedliggende strukturer som bestemmende for sundhedsadfærd og helbred generelt. Af kritikere er det polemisk blevet sagt, at dét, der tidligere blev betegnet som det miljømæssige og dét, der drejede sig om forskelle i sociale levevilkår, nu angår det naturlige og de menneskeskabte vilkår (Jensen et. al.: 2007). Ie. et individs helbredsproblemer ses som resultatet og konsekvensen af den individuelle livsstil – man taler om deciderede livsstilssygdomme, der anslår, at sygdommene er direkte forårsaget af individets livsstilsvalg og placerer dermed ansvaret for det gode helbred hos den enkelte. Gentagne undersøgelser viser dog, at der ikke er tale om et arbitrært forhold mellem social positionering og helbred, men derimod en påfaldende sammenhæng, hvorfor Bourdieus teori, på trods af at mangle forandringsaspektet, fortsat er yderst relevant. Den senmoderne refleksive frisættelse er ikke udbredt på samme måde og i samme omfang i alle sociale lag, hvilket skaber risici for nye sociale differentieringer mellem ”refleksive vindere” og ”refleksive tabere” (Lasch 1994 i Larsen 2000: 33). Her kan eksempelvis nævnes en nylig undersøgelse fra AE-rådet, der konstaterer, at de 25% rigeste danske mænd har en middellevetid på 82 år og de 25% fattigste en middellevetid på 72,2 år (AErådet 1). Andre undersøgelser fra AE-rådet konstaterer ligeledes, at ufaglærte har en kortere middellevetid end de med uddannelse. Desuden forbruger ufaglærte mere medicin og benytter flere sund- 71 hedsydelser end de uddannede (AE-rådet 2). Tendensen er, som nævnt i det foregående afsnit og som påvist af AE-rådets undersøgelser, at socialt velstillede generelt har et bedre sundhedsniveau end de mindre socialt velstillede. Desuden tjener Bourdieus teori til, ud fra et magtsociologisk perspektiv, at forklare, hvordan de dominerendes virkelighed igennem symbolsk vold indlejres i de dominerede jf. afsnit 3.. Og hvordan dét faktum, at flere mennesker føler sig som subjekter for deres eget liv, medfører en ikke-bevidst social fortrængning af strukturelle forhold. Politisk kan en sådan diskurs medføre en negligering af indsatsen mod og forebyggelsen af social skævvridning på sundhedsområdet. 15. Konklusion Vi har i denne opgave belyst social kapital og dennes betydning for helbredet hos den enkelte. Sundhedsforskning har før lagt særlig vægt på økonomiske faktorer i forhold til at ræsonnere ulighed i sundhed, men idet, at man har fået øjnene op for at andre parametre kan spille ind, er der i nyere tid også blevet forsket i sociale relationers betydning for helbredet. Ved at trække på vores empiri samt den gennemgåede teori i opgaven, er det nu muligt at svare på vores problemformulering, som lyder: ”Hvordan medvirker social kapital til at skabe ulighed i helbred?” I teoridelen har vi belyst, hvordan forskning har vist, at modtageligheden for sygdomme er forøget hos personer med få sociale relationer og en ringe grad af følelsesmæssig støtte. Desuden er det påvist, at personer, der har et begrænset socialt netværk, også er længere tid om at blive raske, hvorfor gode relationer derfor er fordrende for menneskers sundhedsadfærd og generelle helbred. Med udgangspunkt i Bourdieus begreb om social kapital – forstået som mængden og kvaliteten af ressourcer, en given agent opnår gennem sit netværk – har vi således forsøgt at afsøge om vi empirisk kan finde en sammenhæng mellem mængden af social kapital i form af nære venskaber og helbred udtrykt ved selvvurderet helbred. Efter at have foretaget tests af vores empiriske hypotese, har vi fundet en klar sammenhæng mellem dem, der vurderer deres helbred virkelig godt eller godt og dem, der har nære venskaber. Ligeledes har det vist sig, at dem, der ikke har nære venskaber, i høj grad vurderer deres helbred dårligere end dem med nære venskaber. Dette bekræfter således, at der er en signifikant ikke-uafhængighed mellem social kapital og helbred. Dog er vi bevidste om, at vi må tage forbehold, når vi udtaler os om det generelle tilfælde grundet den manglende repræsentati- 72 vitet for stikprøven. Statistisk set kan vi heller ikke påvise noget om kausalitetsforhold. Vi er således opmærksomme på, at social kapital og helbred lige så godt kan påvirke hinanden gensidigt. Men vores teoretiske udgangspunkt har været at beskrive hvorledes mængden af social kapital har en betydning for helbredet, og hvorledes dette kan forklare ulighed i helbredsniveauet blandt danskere. Vi har diskuteret, hvordan denne ulighed i helbred forekommer og reproduceres ud fra Bourdieus teori om social reproduktion og social kapital. Med udgangspunkt i hans teoretiske begreber om dispositioner, habitus og symbolsk vold kan man anskue, hvorledes hverdagspraktikker differentierer sociale grupper imellem og hvordan forskellige sociale positioner reproduceres over generationer. Gennem sociale netværk får mennesker adgang til ressourcer, som den enkelte kan trække på, og som er tilgængelig for alle i den pågældende gruppe. Dette kan have betydning for den enkeltes helbred, for eksempel kan netværk både befordre en sund og en usund livsstil. Det er dog vigtigt at pointere, at opfattelser af, hvad der er det sunde og usunde kan variere i forhold til den sociale position. Man kan tale om en sundhedskultur, der indlejres hos den enkelte. Bourdieu beskriver, hvorledes der forekommer en social fortrængning i alle sociale lag. Med denne betragtning kan man trække en parallel til, hvordan ulighed i helbred stadig kan være udbredt på trods af sociale- og sundhedspolitiske indsatser for netop at bekæmpe dette. 16. Perspektivering 16.1 Adfærdsregulerende tiltag eller ej? Vi så i 2007 indførslen af et rygeforbud på offentlige steder og forhøjelsen af minimumsalderen for køb af stærk spiritus i 2011. Seneste eksempel på adfærdsregulerende lovgivning er indførslen af fedtafgift på fødevarer i 2012. Man kan diskutere om den gavnlige effekt, som disse tiltag har haft i andre lande, er direkte overførbar til en dansk sammenhæng, og hvor hurtigt denne effekt eventuelt vil sætte ind. Dog kan man konstatere, at tiltagene tilsyneladende har haft en markant effekt i blandt andet Australien og Frankrig (Diderichsen 2011:365). Man kan desuden konstatere, at middellevetiden i Danmark er støt stigende (Danmarks Statistik). En tendens, der formodentligt er hjulpet på vej af den senere tids sundhedspolitiske tiltag. 73 Dog konstaterer en nylig opgørelse over danskernes sundhed fordelt på socialgrupper, at der fortsat er et markant voksende skel mellem de socialt velstillede og de mindre socialt velstillede både hvad angår rygning, kostvaner og motion (Den nationale sundhedsprofil 2010). I 2010 forekom rygning således tre gange oftere hos dem med kort uddannelse sammenlignet dem med en lang uddannelse. Der ses en tendens til, at oplysningskampagner rammer socialt skævt, idét de kun lader til at virke på den højtuddannede del af befolkningen. Afgifter er derimod et bedre værktøj til at ramme den udsatte del af befolkningen, typisk de lavtuddannede, da de oftest placerer sig i lavindkomstgruppen og således er mere prisfølsomme. Ræsonnementet bag at vælge oplysningskampagner frem for adfærdsregulerende tiltag er, at disse giver den enkelte den nødvendige viden til at foretage ”det gode valg” på egen hånd (Søgaard i Hansen 2011:15) – i tråd med Giddens og Becks teorier om refleksivitet (jf. afsnit 14.4). Man kan dog, set i lyset af denne opgaves problemformulering, fristes til at spørge: Behandler vi 'sygdommen' eller blot symptomerne herpå ved at adfærdsregulere gennem afgifter på sundhedsområdet? Og i hvor vid udstrækning skal vi pålægge den enkelte at kunne foretage ”det gode valg” i forhold til sit eget helbred? 74 17. Litteraturliste 17.1 Bøger Andersen, John og Jørgen Elm Larsen 2011: ”Fattigdom og social eksklusion”, i Socialpolitik af Møller, Iver Hornemann og Larsen, Jørgen Elm (red.), København: Hans Reitzel forlag, s. 211-232 Becker-Christensen, Christian og Gitte Hou Olsen 2007: Politikens dansk ordbog. Finland: JP/Politikens Forlagshus Bourdieu, Pierre 1986: ”The forms of Capital”, i John G. Richardson (red.): Handbook of Theory and Research for the Sociology of Education. New York: Greenwood Press Bourdieu, Pierre 1994: ”Socialt rum og symbolsk magt”, i Bourdieu, Pierre: Centrale tekster inden for sociologi og kulturteori. København: Akademisk Forlag Bredsdorff, Nils 2011: ”Socialkonstruktivisme”, i Sociologisk leksikon af Larsen, Steen Nepper og Inge Kryger Pedersen (red.). København: Hans Reitzels Forlag: 631 Diderichsen, Finn 2011: ”Socialpolitik og sundhed”, i Socialpolitik af Møller, Iver Hornemann og Larsen, Jørgen Elm (red.). København: Hans Reitzels Forlag: 359-372 Due, Pernille og Rikke Lund 2002: ”Sociale relationer og helbred”, i Medicinsk sociologi – samfund, sundhed og sygdom af Due, Pernille, Bjørn Evald Holstein, Lars Iversen og Tage Søndergård Kristensen (red.). København: Munksgaard Danmark Esmark, Kim 2006: ”Bourdieus uddannelsessociologi”, i Annick Prieur & Carsten Sestoft: Pierre Bourdieu – en introduktion. København: Hans Reitzels forlag, s. 71-114 Hansen, Erik Jørgen 2003: Uddannelsessystemerne i et sociologisk perspektiv. København: Hans Reitzels Forlag 75 Hansen, Erik Jørgen og Bjarne Hjorth Andersen 2009: Et sociologisk værktøj – Introduktion til den kvantitative metode. København: Hans Reitzels Forlag Järvinen, Margretha 2007: ”Pierre Bourdieu”, i Andersen, Heine og Lars Bo Kaspersen (red.): Klassisk og moderne samfundsteori. København: Hans Reitzels Forlag. Järvinen, Margretha 2011: ”Socialt udstødte”, i Socialpolitik af Møller, Iver Hornemann og Jørgen Elm Larsen (red.) København: Hans Reitzel forlag, s. 237 Jensen, Bente, Kristian Larsen, Peter Koudahl og Gry Andsager 2007: Ulighed i børn og unges sundhed – set i lyset af social kapital. København: Danmarks Pædagogiske Universitets Forlag Kaspersen, Lars Bo: ”Anthony Giddens”, i Andersen, Heine og Lars Bo Kaspersen (red.): Klassisk og moderne samfundsteori. København: Hans Reitzels Forlag. Kristensen, Tage Søndergård 2002: ”Sygdom og årsager til sygdom”, i Medicinsk sociologi – samfund, sundhed og sygdom af Due, Pernille, Bjørn Evald Holstein, Lars Iversen og Tage Søndergård Kristensen (red.). København, Munksgaard Danmark Larsen, Jørgen Elm 2000: ”Klassebiografi og individuel biografi”, i Larsen, J. E., J. Lind og I.E Møller (red.), Kontinuitet og Forandring. Frederiksberg: Samfundslitteratur. Malchow-Møller, Nikolaj og Allan H. Würtz 2010: Indblik i statistik – for samfundsvidenskab. København: Hans Reitzels Forlag. Nettleton, Sarah 2006: ”Introduction: The Changing Domians of the Sociology of Helath and Illness”, i Nettleton, S., The Sociology of Health and Illness. Cambridge: Polity Press. Kap. 1 Nettleton, Sarah 2006, ”The Social Construction of Medical Knowledge”, I Nettleton, S., The Sociology of Health and Illness. Cambridge: Polity Press. Kap. 2 76 Rasborg, Klaus 2011, ”Individualisering” i Sociologisk leksion af Larsen, Steen Nepper og Inge Kryger Pedersen. København: Hans Reitzels forlag Svendsen, Gert Tinggaard og Gunnas Lind Haase Svendsen 2006, ”Social kapital – en introduktion”. København: Hans Reitzels Forlag 17.2 Rapporter Andersen, Bjarne Hjort 2003: ”Bortfaldets omfang, skævhed og betydning” i Udvikling i befolkningens levekår over et kvart århundrede (rapport), København: SFI Christensen, Anne Illemann, Michael Davidsen, David Ekholm, Stig Elberg Hansen, Maria Holst, Knud Juel 2011: ”Den nationale sundhedsprofil 2010 – hvordan har du det?” København: Sundhedsstyrelsen 17.3 Artikler Hansen, Theis Holtz 2012: ”Afgifter øger ligheden” i Vision nr. 01/2012 Cevea (artikel). København: Cevea Larsen, Jørgen Elm 1999: ”Fattigdom og social arv som konstruktion”, i Social Forskning, december 1999, s. 72-82 17.4 Internet Arbejdernes Erhvervsråd: ”Social ulighed i levetiden” af Mikkel Baadsgaard (2012) http://www.ae.dk/analyse/social-ulighed-levetiden (besøgt d. 10/5-2012) Arbejdernes Erhvervsråd: ”Øget uddannelse giver danskerne et bedre helbred” af Jonas Schytz Juul og Mie Dalskov Pihl (2011) http://www.ae.dk/analyse/oget-uddannelse-giver-danskerne-et-bedre-helbred (besøgt d. 11/5-12) Danmarks Statistik: ”BEF5 - Folketal pr 1 januar efter køn, alder og fødeland”, Statistikbanken (http://www.dst.dk/da/Statistik/statistikbanken.aspx) (besøgt d. 1/5-2012) Danmarks Statistik: ”INDKF4 – Familiernes indkomster efter område, enhed, socioøkonomiske status og indkomsttype”, Statistikbanken (http://www.dst.dk/da/Statistik/statistikbanken.aspx) (besøgt d. 28/4-2012) Systime: ”Rummet af sociale positioner og rummet af livsstile” http://c-samf.systime.dk/typo3temp/pics/43b6c40822.png (besøgt d. 11/5-12) 77 18. Bilag 18.1 Do-file fra Stata ** fjerner observationer, som ikke er relevante i 2000 keep if inlist(RUNDKOMB,4,5,6,7) & v00_12! =. ** vi skal finde vores analyseudvalg. Så vi sletter respondenter der ikke har svaret på en af vores variable. keep if inlist(RUNDKOMB,4,5,6,7) & v00_366!=. & v00_16!=. ** dropper irrelevant I nære venner-variablen drop if v00_366==9 ** dropper irrelevant I selvvurdet helbred-variablen drop if v00_16==8 drop if v00_16==9 **recode af indkomst i intervaller recode v00_466 (1 2 3=1 "under 200.000 kr.") (4 5=2 "200.000 - 299.999 kr.") (6 7=3 "300.000 - 399.999 kr.") (8=4 "400.000 - 499.999 kr.")/// (9=5 "500.000 - 599.999 kr.") (10=6 "600.000 kr. og derover") (77 88 99=.), gen(katindkomst) **recode af alder til intervaller recode beregnet_alder_00 (min/29=1 "20-29 Âr") (30/39=2 "30-39 Âr") (40/49=3 "40-49 Âr") (50/59=4 "50-59 Âr") /// (60/69=5 "60-69 Âr") (70/79=6 "70-79 Âr") (80/89=7 "80-89 Âr") (90/max=8 "90 Âr og derover") (else=.), gen(katalder) ** Chi2-test - helbred og kategoriseret indkomst tab v00_16 katindkomst, cchi chi **Installering af community-lavet funktion til stata - til enkeltcelletest ssc install tab_chi ** Enkeltcelletest - helbred og kategoriseret indkomst tabchi v00_16 katindkomst, a noo noe 78