Basal statistik - Logaritmer. Kovariansanalyse
Transcription
Basal statistik - Logaritmer. Kovariansanalyse
university of copenhagen Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 d e pa rt m e n t o f b i o s tat i s t i c s university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Logaritmer og kovariansanalyse I Parret sammenligning, målemetoder med logaritmer I Tosidet variansanalyse med logaritmer I Kovariansanalyse: Eksempel om baseline og follow-up I Sammenligning af hældninger Interaktion - igen Hjemmesider: http://biostat.ku.dk/~lts/basal15_2 E-mail: [email protected] 2 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Nyt eksempel vedr. sammenligning af målemetoder (jvf. eksemplet MF vs. SV fra første forelæsning) To forskellige metoder til bestemmelse af glucosekoncentration. Ref: R.G. Miller et.al. (eds): Biostatistics Casebook. Wiley, 1980 REFE: Farvetest, der kan ’forurenes’ af urinsyre TEST: Enzymatisk test, mere specifikt for glucose. 3 / 84 nr. 1 2 3 . . . 44 45 46 X̄ SD REFE 155 160 180 . . . 94 111 210 144.1 91.0 TEST 150 155 169 . . . 88 102 188 134.2 83.2 university of copenhagen Scatter plot af de to metoder Det ser jo pænt ud...., eller? 4 / 84 d e pa rt m e n t o f b i o s tat i s t i c s university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Parret sammenligning Naturligt at se på differenser (dif) I Test om middelværdien kan være 0: Systematisk forskel? I Kvantificer individuelle differenser: Limits of agreement The MEANS Procedure Variable N Mean Std Dev t Value Pr > |t| --------------------------------------------------------------dif 46 9.8913043 9.7027562 6.91 <.0001 --------------------------------------------------------------- Med en P-værdi < 0.0001 er der stærk indikation af bias 5 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Limits of agreement På basis af en normalfordelingsantagelse på differenserne finder vi referenceintervallet (normalområdet): 9.89 ± 2 × 9.70 = (−9.51, 29.29) med fortolkningen: “Når vi måler med begge metoder på samme person, vil differensen typisk ligge i intervallet (-9.5, 29.3)” På tegningen ses, at dette er en dårlig beskrivelse, idet I differenserne stiger med niveauet (repræsenteret ved gennemsnittet) I variationen stiger også med niveauet 6 / 84 university of copenhagen Bland-Altman plot Plot af differenser mod gennemsnit (af de to målinger på samme person): Store afvigelser ved høje målinger, dvs. relative afvigelser Så er det smart at se på logaritmer 7 / 84 d e pa rt m e n t o f b i o s tat i s t i c s university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Scatter plot efter logaritmetransformation (her “den naturlige”) 8 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Bemærk I Det er de oprindelige målinger, der skal logaritmetransformeres, ikke differenserne! I Det er ligegyldigt, hvilken logaritmefunktion, der vælges (der er proportionalitet mellem alle logaritmer) I Efter logaritmering gentages proceduren med differenser og konstruktion af limits of agreement 9 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Bland-Altman plot for logaritmer Der er en tydelig outlier (den mindste observation) 10 / 84 university of copenhagen Vi udelader en outlier.... og laver igen et Bland-Altman plot som bliver acceptabelt.... 11 / 84 d e pa rt m e n t o f b i o s tat i s t i c s university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s En slags konklusion The MEANS Procedure Variable N Mean Std Dev t Value Pr > |t| ------------------------------------------------------------ldif 45 0.0657295 0.0419547 10.51 <.0001 ------------------------------------------------------------- Limits of agreement på logaritmisk skala: 0.066 ± 2 × 0.042 = (−0.018, 0.150) Det betyder, at der i 95% af tilfældene vil gælde REFE ) < 0.150 −0.018 < log(REFE) − log(TEST) = log( TEST Men hvad kan vi bruge det til? 12 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Konklusion på brugbar facon Vi kan tilbagetransformere med anti-logaritmen (her er det eksponentialfunktionen exp()) og få REFE < 1.162 = exp(0.150) exp(−0.018) = 0.982 < TEST ’omvendt’ 0.861 < TEST REFE < 1.018 Det betyder: TEST ligger typisk mellem 14% under 13 / 84 og 2% over REFE. eller university of copenhagen Limits of agreement tilbagetransformeret til oprindelig skala 14 / 84 d e pa rt m e n t o f b i o s tat i s t i c s university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Regninger direkte på ratio-skala refe får vi: Med definitionen ratio = test The MEANS Procedure Variable N Mean Std Dev Std Error -----------------------------------------------------------ratio 46 1.0688607 0.0451184 0.0067259 ------------------------------------------------------------ svarende til limits of agreement: 1.069 ± 2 × 0.045 = (0.979, 1.159) altså refe fra 2% under til 16% over test, på 2 decimaler identisk med resultatet for logaritmerne Dette er ikke altid tilfældet!! 15 / 84 university of copenhagen Limits of agreement på ratio-skala 16 / 84 d e pa rt m e n t o f b i o s tat i s t i c s university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Terminologi for kvantitativt outcome, f.eks. vitamin D Regressionsanalyse: Kovariaterne er også kvantitative I Simpel (lineær) regression: kun en enkelt kovariat I Multipel (lineær) regression: to eller flere kovariater Variansanalyse: Kovariaterne er kategoriske (grupper) I Ensidet variansanalyse: kun en enkelt kovariat I Tosidet variansanalyse: to kovariater Generel lineær model GLM: Begge typer kovariater i samme model I Kovariansanalyse: Netop en kvantitativ og en kategorisk kovariat 17 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Sammenligning af to grupper - som ikke er helt sammenlignelige, pga en confounder: En variabel, som I har en effekt på outcome I er relateret til gruppen (dvs. der er forskel på værdierne i de to grupper) Herved kan opstå bias. Gruppe/behandling @ @ R @ Outcome Confounder 18 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Eksempel: vægt blandt mænd og kvinder Mulig confounder: Højde To forskellige sammenligninger: I T-test: Er der forskel på middel vægt blandt mænd og kvinder? I Kovariansanalyse: Er der forskel på middel vægt for mænd og kvinder, med samme højde? Kønseffekten korrigeres for forskel i højde: To forskellige videnskabelige spørgsmål 19 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Eksemplet om sædkvalitet fra øvelserne To grupper skal sammenlignes: SAS-ansatte vs. økologisk landmænd, men abstinenstiden (1: kort, 2: mellem, 3:lang) er en mulig confounder 20 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Repetition: Tosidet varians-analyse To Class-variable (her sas_ansat og abstid) med hhv k1 og k2 niveauer (her 2 hhv. 3), dvs. k1 × k2 (her 6) grupper. Default parametrisering: I Et niveau (intercept) for referencegruppen (sidste niveau af samtlige indgående faktorer) I (k1 − 1) parametre, der beskriver forskelle til sidste niveau af faktor nr. 1 I (k2 − 1) parametre, der beskriver forskelle til sidste niveau af faktor nr. 2 Faktorerne kan indgå additivt eller med interaktion 21 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Interaktion i eksemplet om sædkvalitet Når interaktionen er med i modellen, tilføjes yderligere (k1 − 1)(k2 − 1) = (2 − 1)(3 − 1) = 2 interaktionsparametre, der beskriver: I hvordan effekten af den ene faktor modificeres, når vi går fra referencegruppen for den anden faktor til et af de andre niveauer Interaktionen repræsenterer synergi-effekten mellem kovariat 1 og 2, og er et symmetrisk begreb. I epidemiologiske termer: Kovariat 1 modificerer effekten af kovariat 2 (og vice versa) og kaldes derfor også en effekt modifikator. 22 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Antal, gennemsnit og (spredning) gruppe Landmænd SAS-ansatte 1:kort 12 59.0 (47.0) 25 67.0 (63.5) abstinenstid 2:mellem 3:lang 16 25 80.5 134.2 (55.6) (105.5) 47 63 60.1 81.3 (67.7) (75.4) I Valg af skala? Se på variationen (og evt. fordeling) I Confounding? Se på antallene I Interaktion? 23 / 84 Se på gennemsnittene university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Valg af skala? Plot af spredninger mod gennemsnit: Er der nogen sammenhæng her? svært at sige... Man kan også efterfølgende se på modelkontrollen. 24 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Modelkontrol for sædkoncentration i model med interaktion På denne skala ser både normalfordelingsantagelse og varianshomogenitet suspekte ud. 25 / 84 university of copenhagen Logaritmetransformerede data (her er brugt log10): 26 / 84 d e pa rt m e n t o f b i o s tat i s t i c s university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Modelkontrol på logaritmeskala På denne skala ser antagelserne noget bedre ud, men med tydelige tendenser til overtransformation. 27 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Mulig confounding (gruppe og abstinenstid)? Er der samme fordeling af abstinenstider i de to grupper? sas_ansat abstid Frequency| Row Pct | 1| 2| 3| ---------+--------+--------+--------+ ja | 25 | 47 | 63 | | 18.52 | 34.81 | 46.67 | ---------+--------+--------+--------+ nej | 12 | 16 | 25 | | 22.64 | 30.19 | 47.17 | ---------+--------+--------+--------+ Total 37 63 88 Total 135 53 188 Statistic DF Value Prob -----------------------------------------------------Chi-Square 2 0.5738 0.7506 Næsten, dog lidt forskel på abstinenstid 1 og 2. Svag confounding mulig, hvis der er effekt af abstinenstid. 28 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Interaktion? Vi kan jo starte med at se på medianer: Der kunne måske se ud til at være interaktion.... men vi kan jo ikke se spredningerne her 29 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Vekselvirkning (interaktion) Tænkt eksempel: I To inddelingskriterier: køn og rygestatus I Outcome: FEV1 I Effekten af rygning afhænger af køn I Forskellen på kønnene afhænger af rygestatus 30 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Mulige forklaringer I biologisk kønsforskel på effekt af rygning – holder vist ikke i praksis, men eksemplet er jo også blot ’tænkt’ I måske ryger kvinderne ikke helt så meget – antal pakkeår confounder for køn I måske virker rygningen som en relativ (%-vis) nedsættelse af FEV1 – kunne undersøges ved en longitudinel undersøgelse 31 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Eksempel: Rygnings effekt på fødselsvægt 32 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Interaktion/vekselvirkning mellem mængden og varigheden af rygningen I Der er effekt af mængden, men kun hvis man har røget længe. I Der er effekt af varigheden, og denne effekt øges med mængden. Effekten af mængden afhænger af.... og effekten af varigheden afhænger af.... 33 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Analyse af log(sædkoncentration) Model med interaktion: Source sas_ansat abstid sas_ansat*abstid DF Type III SS Mean Square F Value Pr > F 1 2 2 0.91298917 1.25068088 0.34579420 0.91298917 0.62534044 0.17289710 4.45 3.05 0.84 0.0363 0.0499 0.4323 Bemærk: Når der er interaktion, giver det ikke mening at tolke de marginale effekter, dvs. effekten af den ene kovariat, uden samtidig at angive hvad niveauet af den anden er. 34 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Altså: Vi kan ikke spørge: Hvor stor forskel er der på SAS-ansatte og økologer? uden samtidig at sige, hvilken abstinenstid, vi betragter. Først når (den insignifikante) interaktion er udeladt af modellen (fra s. 45), kan vi komme med et enkelt estimat for forskellen mellem SAS-ansatte og økologer. 35 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Output med interaktion, fortsat Parameter Intercept sas_ansat sas_ansat abstid abstid abstid sas_ansat*abstid sas_ansat*abstid sas_ansat*abstid sas_ansat*abstid sas_ansat*abstid sas_ansat*abstid 36 / 84 Standard Error Estimate ja nej 1 2 3 ja 1 ja 2 ja 3 nej 1 nej 2 nej 3 1.940623988 -0.214288035 0.000000000 -0.327004862 -0.106028838 0.000000000 0.205230452 -0.052366937 0.000000000 0.000000000 0.000000000 0.000000000 B B B B B B B B B B B B 0.09060587 0.10708469 . 0.15909868 0.14504016 . 0.19177988 0.16929581 . . . . t Value Pr > |t| 21.42 -2.00 . -2.06 -0.73 . 1.07 -0.31 . . . . <.0001 0.0469 . 0.0413 0.4657 . 0.2860 0.7574 . . . . university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Fortolkning af estimater For mænd med lang abstinenstid (niveau 3) har økologiske landmænd et niveau, der ligger 0.2143 over de SAS-ansattes. Hvordan ændres denne forskel, når vi ser på f.eks. “mellem abstinenstid” (niveau 2)? Den øges med 0.0524 til i alt 0.2143 + 0.0524 = 0.2667 Alt sammen på logaritmisk (log10) skala! 37 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Udregning af predikterede=fittede værdier erhverv sas-ansatte landmænd 38 / 84 1:kort 1.9406 -0.2143 -0.3270 +0.2052 = 1.6046 1.9406 -0.3270 = 1.6136 abstinenstid 2:mellem 3:lang 1.9406 1.9406 -0.2143 -0.2143 -0.1060 -0.0524 = 1.5679 = 1.7263 1.9406 1.9406 -0.1060 = 1.8346 reference university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Tilbagetransformation Outcome var jo logaritmetransformeret! Vi skal transformere tilbage: sas_ansat ja nej 39 / 84 abstid 1: kort 2: mellem 3: lang 1: kort 2: mellem 3: lang på log10 -skala 1.6046 1.5679 1.7263 1.6136 1.8346 1.9406 tilbagetransformeret 40.2 37.0 53.3 41.1 68.3 87.2 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Sådan ser de fittede værdier (ŷ) ud rent grafisk Log-skala 40 / 84 Original skala university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s SAS-udregning af forskelle for hver abstinenstid Udelad faktoren sas_ansat fra modelsætningen (men bibehold interaktionen). Dette ændrer ikke modellen, kun præsentationsmåden: Source abstid sas_ansat*abstid DF Type III SS Mean Square F Value Pr > F 2 3 1.25068088 1.67126130 0.62534044 0.55708710 3.05 2.71 0.0499 0.0463 Nu repræsenterer sas_ansat*abstid de 3 differenser mellem grupperne, dvs. effekten af sas_ansat samlet for de 3 abstinenstider. 41 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Output, fortsat og estimaterne for sas_ansat*abstid angiver nu effekten af sas_ansat for de enkelte værdier af abstid: Parameter Intercept abstid abstid abstid sas_ansat*abstid sas_ansat*abstid sas_ansat*abstid sas_ansat*abstid sas_ansat*abstid sas_ansat*abstid 42 / 84 Standard Error t Estimate 1 2 3 ja 1 ja 2 ja 3 nej 1 nej 2 nej 3 1.940623988 -0.327004862 -0.106028838 0.000000000 -0.009057584 -0.266654973 -0.214288035 0.000000000 0.000000000 0.000000000 B B B B B B B B B B 0.09060587 0.15909868 0.14504016 . 0.15909868 0.13112566 0.10708469 . . . Value Pr > |t| 21.42 -2.06 -0.73 . -0.06 -2.03 -2.00 . . . <.0001 0.0413 0.4657 . 0.9547 0.0434 0.0469 . . . university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Alternativ: Estimate-sætninger (svært at vænne sig til) proc glm data=oeko; class sas_ansat abstid; model lkonc=sas_ansat abstid sas_ansat*abstid estimate ’sas vs. oeko, abstid 1’ sas_ansat 1 estimate ’sas vs. oeko, abstid 2’ sas_ansat 1 estimate ’sas vs. oeko, abstid 3’ sas_ansat 1 run; / solution clparm; -1 sas_ansat*abstid 1 0 0 -1 0 0; -1 sas_ansat*abstid 0 1 0 0 -1 0; -1 sas_ansat*abstid 0 0 1 0 0 -1; Standard Error 0.15909868 0.13112566 0.10708469 Parameter sas vs. oeko, abstid 1 sas vs. oeko, abstid 2 sas vs. oeko, abstid 3 Estimate -0.00905758 -0.26665497 -0.21428804 Parameter sas vs. oeko, abstid 1 sas vs. oeko, abstid 2 sas vs. oeko, abstid 3 95% Confidence Limits -0.32297265 0.30485749 -0.52537693 -0.00793302 -0.42557514 -0.00300093 43 / 84 t Value -0.06 -2.03 -2.00 Pr > |t| 0.9547 0.0434 0.0469 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Tilbagetransformation På den oprindelige skala kan vi nu udregne effekten af at være SAS-ansat, for hver abstinenstid for sig, ved at benytte ovenstående estimater som potens med grundtal 10 (fordi vi oprindeligt tog 10-tals logaritmer): Niveau 1: 10−0.0091 = 0.98 Niveau 2: 10−0.2667 = 0.54 Niveau 3: 10−0.2143 = 0.61 altså svarende til en reduktion på hhv. 2, 46 og 39% for SAS-ansatte i forhold til økologiske landmænd. 44 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Tosidet variansanalyse uden interaktion i SAS Outcome er stadig "Sædkvalitet", efter transformation med 10-tals logaritmen: The GLM Procedure Class Level Information Class sas_ansat abstid Levels 2 3 Values ja nej 1 2 3 Number of Observations Used 188 Source sas_ansat abstid DF 1 2 Type I SS 1.31577345 1.25619157 Mean Square 1.31577345 0.62809578 F Value 6.42 3.07 Pr > F 0.0121 0.0490 Source sas_ansat abstid DF 1 2 Type III SS 1.32546710 1.25619157 Mean Square 1.32546710 0.62809578 F Value 6.47 3.07 Pr > F 0.0118 0.0490 45 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Output, fortsat Parameter Intercept sas_ansat sas_ansat abstid abstid abstid Estimate ja nej 1 2 3 Parameter Intercept sas_ansat sas_ansat abstid abstid abstid 46 / 84 1.921020681 -0.186905638 0.000000000 -0.187233951 -0.145921066 0.000000000 B B B B B B Standard Error t Value Pr > |t| 0.07138491 0.07348387 . 0.08873769 0.07473457 . 26.91 -2.54 . -2.11 -1.95 . <.0001 0.0118 . 0.0362 0.0524 . 95% Confidence Limits ja nej 1 2 3 1.780182489 2.061858873 -0.331884951 -0.041926325 . . -0.362308129 -0.012159772 -0.293367934 0.001525802 . . university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Fortolkning SAS-ansatte har en signifikant lavere sædkoncentration end økologer med samme abstinenstid. Forskellen på logaritmisk-skala er −0.187, svarende til at de SAS-ansattes sædkoncentration generelt kun udgør 10−0.187 = 0.65, dvs. 65% af økologernes koncentrationsniveau. 95% sikkerhedsintervallet for denne forskel er angivet af SAS til (−0.332, −0.042), og når dette tilbagetransformeres, fås: (10−0.332 , 10−0.042 ) = (47%; 91%) 47 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Fittede værdier (ŷ) i den additive model Log-skala 48 / 84 Original skala university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Simpel sammenligning af SAS-ansatte og økologiske landmænd, ved hjælp af T-test: The TTEST Procedure Variable: lkonc sas_ansat ja nej Diff (1-2) N 135 53 sas_ansat ja nej Diff (1-2) Diff (1-2) Method Mean 1.6486 1.8346 -0.1859 Pooled Satterthwaite Method Pooled Satterthwaite Variances Equal Unequal Std Dev 0.4715 0.4198 0.4576 Mean 1.6486 1.8346 -0.1859 -0.1859 DF 186 106.17 Std Err 0.0406 0.0577 0.0742 95% CL Mean 1.5684 1.7289 1.7189 1.9503 -0.3323 -0.0396 -0.3257 -0.0461 t Value -2.51 -2.64 Equality of Variances Method Folded F 49 / 84 Num DF 134 Den DF 52 F Value 1.26 Minimum -0.1249 0.7404 Pr > F 0.3414 Pr > |t| 0.0131 0.0096 Maximum 2.6042 2.5490 Std Dev 0.4715 0.4198 0.4576 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Kvantificeringer af effekt af økologi Metode T-test Tosidet variansanalyse Økologiske landmænd vs. SAS-ansatte LogaritmeTilbageUtransformeret transformerede transformeret til ratio 29.670 0.186 1.53 (5.464, 53.877) (0.040, 0.332) (1.10, 2.15) 29.640 0.187 1.54 (5.793, 53.487) (0.042, 0.332) (1.10, 2.15) Meget små forskelle på de to analysemetoder, da der ikke er meget confounding fra abstinenstiden. 50 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Normalfordelingsantagelsen var suspekt både på oprindelig skala og på logaritmisk skala. Hvad gør man så? I Man glæder sig over, at man (forhåbentlig) ikke er interesseret i at diagnosticere “lav sædkvalitet”, men kun er interesseret i forskningsmæssige aspekter, dvs. sammenligning af grupper I Man kan overveje at lave median regression (proc quantreg i SAS) I Da der er et rimeligt antal individer i de fleste grupper, betyder en mindre afvigelse fra normalfordelingen ikke så meget I Men hvilken skala skal man så vælge? 51 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Valg af skala er ikke altid oplagt.... Man kan lade det afhænge af, hvordan man helst vil præsentere sit resultat: I som en forskel i enheden antal/ml, eller I som en relativ forskel, i % Set fra et “normalfordelingssynspunkt”, er den optimale skala en kubikrodstranformation (f (konc) = konc 1/3 ). Konklusionerne ændres dog ikke. Til gengæld kan parametrene i den nye model ikke direkte fortolkes (forskellene kan ikke kvantificeres på en enkel måde). 52 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Kovariansanalyse - den simpleste GLM — er blot en (historisk betinget) betegnelse for en model med netop én kategorisk kovariat (gruppe, Class-variabel) og netop én kvantitativ kovariat. Formålet kan være (ganske som i tosidet ANOVA) at I Undersøge effekten af begge kovariater I fjerne bias, f.eks at korrigere for en evt. højdeforskel ved sammenligning af lungefunktion for rygere og ikke-rygere I øge styrken i en randomiseret klinisk undersøgelse ved at nedbringe den uforklarede del af variationen, f.eks. ved at inddrage alder som kovariat Men husk, at man derved besvarer et andet videnskabeligt spørgsmål 53 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Eksempel om lungekapacitet, TLC 32 patienter skal have foretaget hjerte/lunge transplantation TLC: Total Lung Capacity Er der forskel på mænd og kvinder? P=0.0009 54 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Kan højden forklare forskellen på mænd og kvinder? Køn @ @ R @ Lungekapacitet ? Højde I Eller er der tillige en ægte kønseffekt? 55 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Sammenligning af to grupper - som ikke er helt sammenlignelige, pga en confounder (x): En variabel, som I har en effekt på outcome I er relateret til gruppen (der er forskel på værdierne i de to grupper) Herved kan opstå bias. Gruppe/behandling @ @ R @ Outcome Confounder x 56 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Illustration af confounding og kovariansanalyse 57 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Men læg mærke til følgende: Selv om fordelingen af kovariaten er ens i de to grupper, kan det være af stor betydning at medtage den i analysen. Gruppe/behandling @ @ R @ Outcome Det giver større styrke! Kovariat 58 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Simuleret eksempel Uden x i modellen: Ingen særlig forskel på grupperne...? Med x i modellen: Tydelig forskel på grupperne (her den lodrette afstand mellem linierne) 59 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Metoder til at undgå bias Matchning. Dvs. udvælge individer, således at de er nogenlunde ens med hensyn til de vigtige forstyrrende kovariater. Husk at tage matchningsvariablen med som kovariat ellers kan man skabe bias pga umålte confoundere (men lad være med at fortolke dens effekt) Randomisering. Dvs. trække lod om behandling (gruppe) NB: Dette kan naturligvis kun lade sig gøre, hvis grupperne er noget, man selv bestemmer over. og det sikrer ikke ens fordelinger i den enkelte undersøgelse Korrektion Dvs. at medtage den (muligvis skævt fordelte) variabel som kovariat, også somme tider i randomiserede undersøgelser 60 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Metoder til at øge styrken I I I I flere observationer/personer benytte fornuftige inklusions- eller eksklusionskriterier inddrage vigtige forklarende variable (kovariater) udelade irrelevante kovariater Men pas på med at gå for meget på fisketur!! og husk at fortolkningen afhænger af modellen 61 / 84 university of copenhagen Relation mellem TLC og HEIGHT 62 / 84 d e pa rt m e n t o f b i o s tat i s t i c s university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Kovariansanalyse Sammenligning af parallelle regressionslinier: Model: ygi = αg + βxgi + gi g = 1, 2; i = 1, . . . , ng Og hvad er det så, der sker, hvis vi ‘glemmer’ x i modellen? 1. Bias: Hvis x̄1 6= x̄2 , bliver forskellen forkert vurderet. 2. Inefficiens: Selv om x̄1 = x̄2 , mister vi styrke (spredning for stor). 63 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Vekselvirkning=Interaktion Men skal linierne nødvendigvis være parallelle? Mere generel model: ygi = αg + βg xgi + gi g = 1, 2; i = 1, . . . , ng Når β1 6= β2 , siger vi, at der er vekselvirkning = interaktion. Det betyder: I Effekten af højde (x) afhænger af kønnet (g) I Forskellen på kønnene afhænger af højden Her kan man ikke udtale sig om en generel effekt af hverken højde eller køn. 64 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Transformation I forsøg på at skaffe varianshomogenitet, logaritmerer vi tlc ... men det bliver ikke rigtigt godt... 65 / 84 university of copenhagen Specifikation af model i SAS Model med vekselvirkning: proc glm data=tlc; classes sex; model ltlc=height sex sex*height / solution clparm; run; 66 / 84 d e pa rt m e n t o f b i o s tat i s t i c s university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Output Dependent Variable: ltlc Source Model Error Corrected Total DF 3 28 31 Sum of Squares 0.27230446 0.19478293 0.46708739 Mean Square 0.09076815 0.00695653 F Value 13.05 Pr > F <.0001 Source height sex height*sex DF 1 1 1 Type I SS 0.26109571 0.00968023 0.00152852 Mean Square 0.26109571 0.00968023 0.00152852 F Value 37.53 1.39 0.22 Pr > F <.0001 0.2481 0.6429 Source height sex height*sex DF 1 1 1 Type III SS 0.13597107 0.00210426 0.00152852 Mean Square 0.13597107 0.00210426 0.00152852 F Value 19.55 0.30 0.22 Pr > F 0.0001 0.5867 0.6429 67 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Output, fortsat: Parameter Intercept height sex sex height*sex height*sex Standard Error Estimate F M F M -.2190181620 0.0060473650 -.2810587157 0.0000000000 0.0014344422 0.0000000000 B B B B B B 0.35221658 0.00201996 0.51102682 . 0.00306016 . Interaktionsparameteren angiver forskellen på hældninger i de to grupper 68 / 84 t Value Pr > |t| -0.62 2.99 -0.55 . 0.47 . 0.5391 0.0057 0.5867 . 0.6429 . university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Omregning til de to linier: Linie for mænd: log10(Lung capacity) = −0.219 + 0.00605 × height Linie for kvinder: log10(Lung capacity) = −0.219 + (−0.281) + (0.00605 + 0.00143) × height = −0.500 + 0.00748 × height 69 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s SAS-udregning af de to linier proc glm data=tlc; classes sex; model ltlc=sex sex*height / noint solution clparm; run; Output: Dependent Variable: ltlc Source DF Sum of Squares Model Error Uncorrected Total 4 28 32 19.16369633 0.19478293 19.35847926 70 / 84 Mean Square F Value Pr > F 4.79092408 0.00695653 688.69 <.0001 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Output, fortsat: Source sex height*sex Parameter sex sex height*sex height*sex F M F M DF Type III SS Mean Square F Value Pr > F 2 2 0.01537968 0.13604143 0.00768984 0.06802071 1.11 9.78 0.3451 0.0006 Estimate Standard Error t Value Pr > |t| -.5000768777 -.2190181620 0.0074818072 0.0060473650 0.37025922 0.35221658 0.00229877 0.00201996 -1.35 -0.62 3.25 2.99 0.1876 0.5391 0.0030 0.0057 Her er der angivet to intercept-estimater og to hældningsestimater. 71 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Udregning med brug af Estimate-sætninger proc glm data=tlc; classes sex; model ltlc=sex height sex*height / solution clparm; estimate ’intercept, male’ intercept 1 sex 0 1; estimate ’intercept, female’ intercept 1 sex 1 0; estimate ’slope, male’ height 1 sex*height 0 1; estimate ’slope, female’ height 1 sex*height 1 0; run; Parameter intercept, male intercept, female slope, male slope, female 72 / 84 Estimate -0.21901816 -0.50007688 0.00604737 0.00748181 Standard Error 0.35221658 0.37025922 0.00201996 0.00229877 t Value -0.62 -1.35 2.99 3.25 Pr > |t| 0.5391 0.1876 0.0057 0.0030 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Modelreduktion Vi kunne ikke se nogen vekselvirkning og udelader den af modellen proc glm data=tlc; classes sex; model ltlc=sex height / solution clparm; run; Dependent Variable: ltlc Source Model Error Corrected Total R-Square 0.579712 Source sex height 73 / 84 DF 1 1 DF 2 29 31 Sum of Squares 0.27077594 0.19631145 0.46708739 Mean Square 0.13538797 0.00676936 C.V. 10.70821 Root MSE 0.08228 Type I SS 0.13626303 0.13451291 Mean Square 0.13626303 0.13451291 F Value 20.00 Pr > F 0.0001 LTLC Mean 0.76835 F Value 20.13 19.87 Pr > F 0.0001 0.0001 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Output, fortsat: Source sex height Parameter Intercept sex F sex M height DF 1 1 Type III SS 0.00968023 0.13451291 Estimate -.3278068826 B -.0421012632 B 0.0000000000 B 0.0066723630 Mean Square 0.00968023 0.13451291 Standard Error 0.26135206 0.03520676 . 0.00149683 F Value 1.43 19.87 t Value -1.25 -1.20 . 4.46 Bemærk: Nu er kønseffekten helt forsvundet! Højden kunne altså godt forklare den....måske 74 / 84 Pr > F 0.2415 0.0001 Pr > |t| 0.2198 0.2415 . 0.0001 university of copenhagen Ancova-fit (parallelle linier) 75 / 84 d e pa rt m e n t o f b i o s tat i s t i c s university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Er der så en kønseffekt eller ej? Ja for mænd og kvinder har jo ikke samme niveau af lungekapacitet men forskellen i niveau kan forklares udfra den højdeforskel, der generelt er mellem mænd og kvinder måske men vi kan ikke påvise forskel mellem en mand og en kvinde med samme højde Højde er en mellemkommende (intermediate) variabel for effekten af køn på lungekapacitet 76 / 84 university of copenhagen Husk modelkontrol: 77 / 84 d e pa rt m e n t o f b i o s tat i s t i c s university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Fortolkning I dette eksempel så vi I Den observerede forskel i (log10 ) lungekapacitet mellem mænd og kvinder kunne godt tilskrives højdeforskellen mellem kønnene. Der kan dog stadig være en kønsforskel op til 0.0421 ± 2.045 × 0.0352 = (−0.030, 0.114), svarende til intervallet (0.933, 1.300) for ratio’en, dvs. op til en 30% øget lungefunktion hos mænd 78 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Et typisk eksempel på et før-og-efter studie: Vickers, A.J. & Altman, D.G.: Analysing controlled clinical trials with baseline and follow-up measurements. British Medical Journal 2001; 323: 1123-24.: 52 patienter med skuldersmerter randomiseres til enten I Akupunktur (n=25) I Placebo (n=27) Smerte vurderes på en 100-trins skala både før og efter behandling Høje scorer er gode 79 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Baseline og Follow-up Behandling @ @ R @ Outcome Baseline måling Der er fokus på sammenligning af behandlingerne: Er placebo ligeså godt som akupunktur? Det lægger op til et simpelt T-test, men: Hvad nu, hvis de to grupper ikke er helt identiske fra start, selv om der er randomiseret? 80 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Resultater vedr. skuldersmerter Sammenligninger af de to grupper: Gennemsnitlig smertescore placebo akupunktur (n=27) (n=25) Baseline Behandlinseffekt differens (95% CI) P-value 53.9 (14.0) 60.4 (12.3) 6.5 0.09 62.3 (17.9) 79.6 (17.1) 17.3 (7.5; 27.1) 0.0008 8.4 (14.6) 19.2 (16.1) 10.8 (2.3; 19.4) 0.014 12.7 (4.1; 21.3) 0.005 Analyse: Follow-up Ændringer* Ancova * resultater publiceret i Kleinhenz et.al. Pain 1999; 83:235-41. 81 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Udvikling i smerter, faktisk og forventeligt 82 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Udlægning af resultater, I Baseline I Akupunktur gruppen ligger lidt højere end placebo Follow-up I Vi vil forvente, at akupunktur gruppen stadig ligger det samme stykke højere end placebo gruppen efter behandlingen, selv hvis behandlingen ikke virker (fuldt optrukket rød linie). I Det er derfor urimeligt blot at afgøre behandlingens effekt ved at sammenligne follow-up værdier (forskellen bliver for stor i dette tilfælde) 83 / 84 university of copenhagen d e pa rt m e n t o f b i o s tat i s t i c s Udlægning af resultater, II Differenser/ændringer I Lav baseline værdi giver forventning om stor positiv ændring (regression to the mean) I Derfor forventes placebogruppen at stige mest, og akupunkturgruppen lidt mindre (den stiplede røde linie) I og en direkte sammenligning af ændringer er derfor ikke rimelig (forskellen bliver for lille i dette tilfælde) Ancova I vurderer forskellen under hensyntagen til, at baseline forklarer noget, men ikke al forskellen ved follow-up: Vi sammenligner personer, der har fået forskellig behandling, men som starter samme sted. 84 / 84