Basal statistik - Logaritmer. Kovariansanalyse

Transcription

Basal statistik - Logaritmer. Kovariansanalyse
university of copenhagen
Faculty of Health Sciences
Basal statistik
Logaritmer. Kovariansanalyse
Lene Theil Skovgaard
29. september 2015
1 / 84
d e pa rt m e n t o f b i o s tat i s t i c s
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Logaritmer og kovariansanalyse
I
Parret sammenligning, målemetoder
med logaritmer
I
Tosidet variansanalyse
med logaritmer
I
Kovariansanalyse:
Eksempel om baseline og follow-up
I
Sammenligning af hældninger
Interaktion - igen
Hjemmesider: http://biostat.ku.dk/~lts/basal15_2
E-mail: [email protected]
2 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Nyt eksempel vedr. sammenligning af målemetoder
(jvf. eksemplet MF vs. SV fra første forelæsning)
To forskellige metoder til bestemmelse af glucosekoncentration.
Ref: R.G. Miller et.al. (eds): Biostatistics Casebook. Wiley, 1980
REFE:
Farvetest, der kan ’forurenes’ af
urinsyre
TEST:
Enzymatisk test, mere
specifikt for glucose.
3 / 84
nr.
1
2
3
.
.
.
44
45
46
X̄
SD
REFE
155
160
180
.
.
.
94
111
210
144.1
91.0
TEST
150
155
169
.
.
.
88
102
188
134.2
83.2
university of copenhagen
Scatter plot af de to metoder
Det ser jo pænt ud...., eller?
4 / 84
d e pa rt m e n t o f b i o s tat i s t i c s
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Parret sammenligning
Naturligt at se på differenser (dif)
I
Test om middelværdien kan være 0:
Systematisk forskel?
I
Kvantificer individuelle differenser:
Limits of agreement
The MEANS Procedure
Variable
N
Mean
Std Dev
t Value
Pr > |t|
--------------------------------------------------------------dif
46
9.8913043
9.7027562
6.91
<.0001
---------------------------------------------------------------
Med en P-værdi < 0.0001 er der stærk indikation af bias
5 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Limits of agreement
På basis af en normalfordelingsantagelse på differenserne finder vi
referenceintervallet (normalområdet):
9.89 ± 2 × 9.70 = (−9.51, 29.29)
med fortolkningen:
“Når vi måler med begge metoder på samme person, vil differensen
typisk ligge i intervallet (-9.5, 29.3)”
På tegningen ses, at dette er en dårlig beskrivelse, idet
I
differenserne stiger med niveauet
(repræsenteret ved gennemsnittet)
I
variationen stiger også med niveauet
6 / 84
university of copenhagen
Bland-Altman plot
Plot af differenser mod gennemsnit
(af de to målinger på samme person):
Store afvigelser ved høje målinger, dvs.
relative afvigelser
Så er det smart at se på logaritmer
7 / 84
d e pa rt m e n t o f b i o s tat i s t i c s
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Scatter plot
efter logaritmetransformation (her “den naturlige”)
8 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Bemærk
I
Det er de oprindelige målinger, der skal
logaritmetransformeres, ikke differenserne!
I
Det er ligegyldigt, hvilken logaritmefunktion, der vælges
(der er proportionalitet mellem alle logaritmer)
I
Efter logaritmering gentages proceduren med differenser og
konstruktion af limits of agreement
9 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Bland-Altman plot for logaritmer
Der er en tydelig outlier (den mindste observation)
10 / 84
university of copenhagen
Vi udelader en outlier....
og laver igen et Bland-Altman plot
som bliver acceptabelt....
11 / 84
d e pa rt m e n t o f b i o s tat i s t i c s
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
En slags konklusion
The MEANS Procedure
Variable
N
Mean
Std Dev
t Value
Pr > |t|
------------------------------------------------------------ldif
45
0.0657295
0.0419547
10.51
<.0001
-------------------------------------------------------------
Limits of agreement på logaritmisk skala:
0.066 ± 2 × 0.042 = (−0.018, 0.150)
Det betyder, at der i 95% af tilfældene vil gælde
REFE ) < 0.150
−0.018 < log(REFE) − log(TEST) = log( TEST
Men hvad kan vi bruge det til?
12 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Konklusion på brugbar facon
Vi kan tilbagetransformere med anti-logaritmen (her er det
eksponentialfunktionen exp()) og få
REFE < 1.162 = exp(0.150)
exp(−0.018) = 0.982 < TEST
’omvendt’
0.861 < TEST
REFE < 1.018
Det betyder:
TEST ligger typisk mellem
14% under
13 / 84
og
2% over
REFE.
eller
university of copenhagen
Limits of agreement
tilbagetransformeret til oprindelig skala
14 / 84
d e pa rt m e n t o f b i o s tat i s t i c s
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Regninger direkte på ratio-skala
refe får vi:
Med definitionen ratio = test
The MEANS Procedure
Variable
N
Mean
Std Dev
Std Error
-----------------------------------------------------------ratio
46
1.0688607
0.0451184
0.0067259
------------------------------------------------------------
svarende til limits of agreement:
1.069 ± 2 × 0.045 = (0.979, 1.159)
altså refe fra 2% under til 16% over test,
på 2 decimaler identisk med resultatet for logaritmerne
Dette er ikke altid tilfældet!!
15 / 84
university of copenhagen
Limits of agreement på ratio-skala
16 / 84
d e pa rt m e n t o f b i o s tat i s t i c s
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Terminologi
for kvantitativt outcome, f.eks. vitamin D
Regressionsanalyse: Kovariaterne er også kvantitative
I Simpel (lineær) regression:
kun en enkelt kovariat
I Multipel (lineær) regression:
to eller flere kovariater
Variansanalyse: Kovariaterne er kategoriske (grupper)
I Ensidet variansanalyse: kun en enkelt kovariat
I Tosidet variansanalyse: to kovariater
Generel lineær model GLM:
Begge typer kovariater i samme model
I Kovariansanalyse:
Netop en kvantitativ og en kategorisk kovariat
17 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Sammenligning af to grupper
- som ikke er helt sammenlignelige, pga en confounder:
En variabel, som
I
har en effekt på outcome
I
er relateret til gruppen
(dvs. der er forskel på værdierne i de to grupper)
Herved kan opstå bias.
Gruppe/behandling
@
@
R
@
Outcome
Confounder
18 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Eksempel: vægt blandt mænd og kvinder
Mulig confounder: Højde
To forskellige sammenligninger:
I
T-test:
Er der forskel på middel vægt blandt mænd og kvinder?
I
Kovariansanalyse:
Er der forskel på middel vægt for mænd og kvinder,
med samme højde?
Kønseffekten korrigeres for forskel i højde:
To forskellige videnskabelige spørgsmål
19 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Eksemplet om sædkvalitet fra øvelserne
To grupper skal sammenlignes:
SAS-ansatte vs. økologisk landmænd,
men abstinenstiden (1: kort, 2: mellem, 3:lang) er en mulig
confounder
20 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Repetition: Tosidet varians-analyse
To Class-variable (her sas_ansat og abstid) med hhv k1 og k2
niveauer (her 2 hhv. 3), dvs. k1 × k2 (her 6) grupper.
Default parametrisering:
I
Et niveau (intercept) for referencegruppen
(sidste niveau af samtlige indgående faktorer)
I
(k1 − 1) parametre, der beskriver forskelle til sidste niveau af
faktor nr. 1
I
(k2 − 1) parametre, der beskriver forskelle til sidste niveau af
faktor nr. 2
Faktorerne kan indgå additivt eller med interaktion
21 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Interaktion i eksemplet om sædkvalitet
Når interaktionen er med i modellen, tilføjes yderligere
(k1 − 1)(k2 − 1) = (2 − 1)(3 − 1) = 2 interaktionsparametre, der
beskriver:
I
hvordan effekten af den ene faktor modificeres, når vi går fra
referencegruppen for den anden faktor til et af de andre
niveauer
Interaktionen repræsenterer synergi-effekten
mellem kovariat 1 og 2, og er et symmetrisk begreb.
I epidemiologiske termer:
Kovariat 1 modificerer effekten af kovariat 2 (og vice versa)
og kaldes derfor også en effekt modifikator.
22 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Antal, gennemsnit og (spredning)
gruppe
Landmænd
SAS-ansatte
1:kort
12
59.0
(47.0)
25
67.0
(63.5)
abstinenstid
2:mellem
3:lang
16
25
80.5
134.2
(55.6) (105.5)
47
63
60.1
81.3
(67.7)
(75.4)
I
Valg af skala?
Se på variationen (og evt. fordeling)
I
Confounding?
Se på antallene
I
Interaktion?
23 / 84
Se på gennemsnittene
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Valg af skala?
Plot af spredninger mod gennemsnit:
Er der nogen sammenhæng her? svært at sige...
Man kan også efterfølgende se på modelkontrollen.
24 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Modelkontrol for sædkoncentration
i model med interaktion
På denne skala ser både normalfordelingsantagelse og
varianshomogenitet suspekte ud.
25 / 84
university of copenhagen
Logaritmetransformerede data
(her er brugt log10):
26 / 84
d e pa rt m e n t o f b i o s tat i s t i c s
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Modelkontrol på logaritmeskala
På denne skala ser antagelserne noget bedre ud, men med
tydelige tendenser til overtransformation.
27 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Mulig confounding (gruppe og abstinenstid)?
Er der samme fordeling af abstinenstider i de to grupper?
sas_ansat
abstid
Frequency|
Row Pct |
1|
2|
3|
---------+--------+--------+--------+
ja
|
25 |
47 |
63 |
| 18.52 | 34.81 | 46.67 |
---------+--------+--------+--------+
nej
|
12 |
16 |
25 |
| 22.64 | 30.19 | 47.17 |
---------+--------+--------+--------+
Total
37
63
88
Total
135
53
188
Statistic
DF
Value
Prob
-----------------------------------------------------Chi-Square
2
0.5738
0.7506
Næsten, dog lidt forskel på abstinenstid 1 og 2.
Svag confounding mulig, hvis der er effekt af abstinenstid.
28 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Interaktion?
Vi kan jo starte med at se på medianer:
Der kunne måske se ud til at være interaktion....
men vi kan jo ikke se spredningerne her
29 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Vekselvirkning (interaktion)
Tænkt eksempel:
I
To inddelingskriterier: køn og rygestatus
I
Outcome: FEV1
I
Effekten af rygning afhænger af køn
I
Forskellen på kønnene afhænger af rygestatus
30 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Mulige forklaringer
I
biologisk kønsforskel på effekt af rygning
– holder vist ikke i praksis,
men eksemplet er jo også blot ’tænkt’
I
måske ryger kvinderne ikke helt så meget
– antal pakkeår confounder for køn
I
måske virker rygningen som en relativ
(%-vis) nedsættelse af FEV1
– kunne undersøges ved en longitudinel undersøgelse
31 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Eksempel: Rygnings effekt på fødselsvægt
32 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Interaktion/vekselvirkning
mellem mængden og varigheden af rygningen
I
Der er effekt af mængden, men kun hvis man har røget længe.
I
Der er effekt af varigheden, og denne effekt øges med
mængden.
Effekten af mængden afhænger af....
og effekten af varigheden afhænger af....
33 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Analyse af log(sædkoncentration)
Model med interaktion:
Source
sas_ansat
abstid
sas_ansat*abstid
DF
Type III SS
Mean Square
F Value
Pr > F
1
2
2
0.91298917
1.25068088
0.34579420
0.91298917
0.62534044
0.17289710
4.45
3.05
0.84
0.0363
0.0499
0.4323
Bemærk: Når der er interaktion, giver det ikke mening at tolke de
marginale effekter, dvs. effekten af den ene kovariat, uden samtidig
at angive hvad niveauet af den anden er.
34 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Altså:
Vi kan ikke spørge:
Hvor stor forskel er der på SAS-ansatte og økologer?
uden samtidig at sige, hvilken abstinenstid, vi betragter.
Først når (den insignifikante) interaktion er udeladt af modellen
(fra s. 45), kan vi komme med et enkelt estimat for forskellen
mellem SAS-ansatte og økologer.
35 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Output med interaktion, fortsat
Parameter
Intercept
sas_ansat
sas_ansat
abstid
abstid
abstid
sas_ansat*abstid
sas_ansat*abstid
sas_ansat*abstid
sas_ansat*abstid
sas_ansat*abstid
sas_ansat*abstid
36 / 84
Standard
Error
Estimate
ja
nej
1
2
3
ja 1
ja 2
ja 3
nej 1
nej 2
nej 3
1.940623988
-0.214288035
0.000000000
-0.327004862
-0.106028838
0.000000000
0.205230452
-0.052366937
0.000000000
0.000000000
0.000000000
0.000000000
B
B
B
B
B
B
B
B
B
B
B
B
0.09060587
0.10708469
.
0.15909868
0.14504016
.
0.19177988
0.16929581
.
.
.
.
t Value Pr > |t|
21.42
-2.00
.
-2.06
-0.73
.
1.07
-0.31
.
.
.
.
<.0001
0.0469
.
0.0413
0.4657
.
0.2860
0.7574
.
.
.
.
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Fortolkning af estimater
For mænd med lang abstinenstid (niveau 3) har økologiske
landmænd et niveau, der ligger 0.2143 over de SAS-ansattes.
Hvordan ændres denne forskel, når vi ser på f.eks. “mellem
abstinenstid” (niveau 2)?
Den øges med 0.0524 til i alt 0.2143 + 0.0524 = 0.2667
Alt sammen på logaritmisk (log10) skala!
37 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Udregning af predikterede=fittede værdier
erhverv
sas-ansatte
landmænd
38 / 84
1:kort
1.9406
-0.2143
-0.3270
+0.2052
= 1.6046
1.9406
-0.3270
= 1.6136
abstinenstid
2:mellem
3:lang
1.9406
1.9406
-0.2143
-0.2143
-0.1060
-0.0524
= 1.5679 = 1.7263
1.9406
1.9406
-0.1060
= 1.8346 reference
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Tilbagetransformation
Outcome var jo logaritmetransformeret!
Vi skal transformere tilbage:
sas_ansat
ja
nej
39 / 84
abstid
1: kort
2: mellem
3: lang
1: kort
2: mellem
3: lang
på log10 -skala
1.6046
1.5679
1.7263
1.6136
1.8346
1.9406
tilbagetransformeret
40.2
37.0
53.3
41.1
68.3
87.2
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Sådan ser de fittede værdier (ŷ) ud rent grafisk
Log-skala
40 / 84
Original skala
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
SAS-udregning af forskelle for hver abstinenstid
Udelad faktoren sas_ansat fra modelsætningen
(men bibehold interaktionen).
Dette ændrer ikke modellen, kun præsentationsmåden:
Source
abstid
sas_ansat*abstid
DF
Type III SS
Mean Square
F Value
Pr > F
2
3
1.25068088
1.67126130
0.62534044
0.55708710
3.05
2.71
0.0499
0.0463
Nu repræsenterer sas_ansat*abstid de 3 differenser mellem
grupperne, dvs.
effekten af sas_ansat samlet for de 3 abstinenstider.
41 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Output, fortsat
og estimaterne for sas_ansat*abstid angiver nu effekten af
sas_ansat for de enkelte værdier af abstid:
Parameter
Intercept
abstid
abstid
abstid
sas_ansat*abstid
sas_ansat*abstid
sas_ansat*abstid
sas_ansat*abstid
sas_ansat*abstid
sas_ansat*abstid
42 / 84
Standard
Error t
Estimate
1
2
3
ja 1
ja 2
ja 3
nej 1
nej 2
nej 3
1.940623988
-0.327004862
-0.106028838
0.000000000
-0.009057584
-0.266654973
-0.214288035
0.000000000
0.000000000
0.000000000
B
B
B
B
B
B
B
B
B
B
0.09060587
0.15909868
0.14504016
.
0.15909868
0.13112566
0.10708469
.
.
.
Value Pr > |t|
21.42
-2.06
-0.73
.
-0.06
-2.03
-2.00
.
.
.
<.0001
0.0413
0.4657
.
0.9547
0.0434
0.0469
.
.
.
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Alternativ: Estimate-sætninger (svært at vænne sig til)
proc glm data=oeko;
class sas_ansat abstid;
model lkonc=sas_ansat abstid sas_ansat*abstid
estimate ’sas vs. oeko, abstid 1’ sas_ansat 1
estimate ’sas vs. oeko, abstid 2’ sas_ansat 1
estimate ’sas vs. oeko, abstid 3’ sas_ansat 1
run;
/ solution clparm;
-1 sas_ansat*abstid 1 0 0 -1 0 0;
-1 sas_ansat*abstid 0 1 0 0 -1 0;
-1 sas_ansat*abstid 0 0 1 0 0 -1;
Standard
Error
0.15909868
0.13112566
0.10708469
Parameter
sas vs. oeko, abstid 1
sas vs. oeko, abstid 2
sas vs. oeko, abstid 3
Estimate
-0.00905758
-0.26665497
-0.21428804
Parameter
sas vs. oeko, abstid 1
sas vs. oeko, abstid 2
sas vs. oeko, abstid 3
95% Confidence Limits
-0.32297265
0.30485749
-0.52537693 -0.00793302
-0.42557514 -0.00300093
43 / 84
t Value
-0.06
-2.03
-2.00
Pr > |t|
0.9547
0.0434
0.0469
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Tilbagetransformation
På den oprindelige skala kan vi nu udregne effekten af at være
SAS-ansat, for hver abstinenstid for sig, ved at benytte
ovenstående estimater som potens med grundtal 10
(fordi vi oprindeligt tog 10-tals logaritmer):
Niveau 1: 10−0.0091 = 0.98
Niveau 2: 10−0.2667 = 0.54
Niveau 3: 10−0.2143 = 0.61
altså svarende til en reduktion på hhv. 2, 46 og 39% for
SAS-ansatte i forhold til økologiske landmænd.
44 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Tosidet variansanalyse uden interaktion i SAS
Outcome er stadig "Sædkvalitet",
efter transformation med 10-tals logaritmen:
The GLM Procedure
Class Level Information
Class
sas_ansat
abstid
Levels
2
3
Values
ja nej
1 2 3
Number of Observations Used
188
Source
sas_ansat
abstid
DF
1
2
Type I SS
1.31577345
1.25619157
Mean Square
1.31577345
0.62809578
F Value
6.42
3.07
Pr > F
0.0121
0.0490
Source
sas_ansat
abstid
DF
1
2
Type III SS
1.32546710
1.25619157
Mean Square
1.32546710
0.62809578
F Value
6.47
3.07
Pr > F
0.0118
0.0490
45 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Output, fortsat
Parameter
Intercept
sas_ansat
sas_ansat
abstid
abstid
abstid
Estimate
ja
nej
1
2
3
Parameter
Intercept
sas_ansat
sas_ansat
abstid
abstid
abstid
46 / 84
1.921020681
-0.186905638
0.000000000
-0.187233951
-0.145921066
0.000000000
B
B
B
B
B
B
Standard
Error
t Value
Pr > |t|
0.07138491
0.07348387
.
0.08873769
0.07473457
.
26.91
-2.54
.
-2.11
-1.95
.
<.0001
0.0118
.
0.0362
0.0524
.
95% Confidence Limits
ja
nej
1
2
3
1.780182489 2.061858873
-0.331884951 -0.041926325
.
.
-0.362308129 -0.012159772
-0.293367934 0.001525802
.
.
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Fortolkning
SAS-ansatte har en signifikant lavere sædkoncentration end
økologer med samme abstinenstid.
Forskellen på logaritmisk-skala er −0.187, svarende til at de
SAS-ansattes sædkoncentration generelt kun udgør
10−0.187 = 0.65, dvs. 65% af økologernes koncentrationsniveau.
95% sikkerhedsintervallet for denne forskel er angivet af SAS til
(−0.332, −0.042), og når dette tilbagetransformeres, fås:
(10−0.332 , 10−0.042 ) = (47%; 91%)
47 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Fittede værdier (ŷ) i den additive model
Log-skala
48 / 84
Original skala
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Simpel sammenligning
af SAS-ansatte og økologiske landmænd,
ved hjælp af T-test:
The TTEST Procedure
Variable:
lkonc
sas_ansat
ja
nej
Diff (1-2)
N
135
53
sas_ansat
ja
nej
Diff (1-2)
Diff (1-2)
Method
Mean
1.6486
1.8346
-0.1859
Pooled
Satterthwaite
Method
Pooled
Satterthwaite
Variances
Equal
Unequal
Std Dev
0.4715
0.4198
0.4576
Mean
1.6486
1.8346
-0.1859
-0.1859
DF
186
106.17
Std Err
0.0406
0.0577
0.0742
95% CL Mean
1.5684
1.7289
1.7189
1.9503
-0.3323 -0.0396
-0.3257 -0.0461
t Value
-2.51
-2.64
Equality of Variances
Method
Folded F
49 / 84
Num DF
134
Den DF
52
F Value
1.26
Minimum
-0.1249
0.7404
Pr > F
0.3414
Pr > |t|
0.0131
0.0096
Maximum
2.6042
2.5490
Std Dev
0.4715
0.4198
0.4576
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Kvantificeringer af effekt af økologi
Metode
T-test
Tosidet
variansanalyse
Økologiske landmænd vs. SAS-ansatte
LogaritmeTilbageUtransformeret transformerede transformeret
til ratio
29.670
0.186
1.53
(5.464, 53.877)
(0.040, 0.332)
(1.10, 2.15)
29.640
0.187
1.54
(5.793, 53.487)
(0.042, 0.332)
(1.10, 2.15)
Meget små forskelle på de to analysemetoder, da der ikke er meget
confounding fra abstinenstiden.
50 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Normalfordelingsantagelsen var suspekt
både på oprindelig skala og på logaritmisk skala.
Hvad gør man så?
I
Man glæder sig over, at man (forhåbentlig) ikke er interesseret
i at diagnosticere “lav sædkvalitet”, men kun er interesseret i
forskningsmæssige aspekter, dvs. sammenligning af grupper
I
Man kan overveje at lave median regression
(proc quantreg i SAS)
I
Da der er et rimeligt antal individer i de fleste grupper, betyder
en mindre afvigelse fra normalfordelingen ikke så meget
I
Men hvilken skala skal man så vælge?
51 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Valg af skala
er ikke altid oplagt....
Man kan lade det afhænge af, hvordan man helst vil præsentere sit
resultat:
I
som en forskel i enheden antal/ml, eller
I
som en relativ forskel, i %
Set fra et “normalfordelingssynspunkt”, er den optimale skala en
kubikrodstranformation (f (konc) = konc 1/3 ).
Konklusionerne ændres dog ikke.
Til gengæld kan parametrene i den nye model ikke direkte fortolkes
(forskellene kan ikke kvantificeres på en enkel måde).
52 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Kovariansanalyse - den simpleste GLM
— er blot en (historisk betinget) betegnelse for en model med
netop én kategorisk kovariat (gruppe, Class-variabel) og
netop én kvantitativ kovariat.
Formålet kan være (ganske som i tosidet ANOVA) at
I
Undersøge effekten af begge kovariater
I
fjerne bias, f.eks at korrigere for en evt. højdeforskel ved
sammenligning af lungefunktion for rygere og ikke-rygere
I
øge styrken i en randomiseret klinisk undersøgelse ved at
nedbringe den uforklarede del af variationen, f.eks. ved at
inddrage alder som kovariat
Men husk, at man derved besvarer
et andet videnskabeligt spørgsmål
53 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Eksempel om lungekapacitet, TLC
32 patienter skal have foretaget hjerte/lunge transplantation
TLC: Total Lung Capacity
Er der forskel på mænd og kvinder?
P=0.0009
54 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Kan højden forklare forskellen på mænd og kvinder?
Køn
@
@
R
@
Lungekapacitet
?
Højde
I
Eller er der tillige en ægte kønseffekt?
55 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Sammenligning af to grupper
- som ikke er helt sammenlignelige, pga en confounder (x):
En variabel, som
I
har en effekt på outcome
I
er relateret til gruppen
(der er forskel på værdierne i de to grupper)
Herved kan opstå bias.
Gruppe/behandling
@
@
R
@
Outcome
Confounder
x
56 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Illustration af confounding og kovariansanalyse
57 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Men læg mærke til følgende:
Selv om fordelingen af kovariaten er ens i de to grupper, kan det
være af stor betydning at medtage den i analysen.
Gruppe/behandling
@
@
R
@
Outcome
Det giver større styrke!
Kovariat
58 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Simuleret eksempel
Uden x i modellen: Ingen særlig forskel på grupperne...?
Med x i modellen: Tydelig forskel på grupperne
(her den lodrette afstand mellem linierne)
59 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Metoder til at undgå bias
Matchning. Dvs. udvælge individer, således at de er nogenlunde
ens med hensyn til de vigtige forstyrrende kovariater.
Husk at tage matchningsvariablen med som kovariat
ellers kan man skabe bias pga umålte confoundere
(men lad være med at fortolke dens effekt)
Randomisering. Dvs. trække lod om behandling (gruppe)
NB: Dette kan naturligvis kun lade sig gøre, hvis
grupperne er noget, man selv bestemmer over.
og det sikrer ikke ens fordelinger i den enkelte
undersøgelse
Korrektion Dvs. at medtage den (muligvis skævt fordelte)
variabel som kovariat, også somme tider i
randomiserede undersøgelser
60 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Metoder til at øge styrken
I
I
I
I
flere observationer/personer
benytte fornuftige inklusions- eller eksklusionskriterier
inddrage vigtige forklarende variable (kovariater)
udelade irrelevante kovariater
Men pas på med at gå for meget på fisketur!!
og husk at fortolkningen afhænger af modellen
61 / 84
university of copenhagen
Relation mellem TLC og HEIGHT
62 / 84
d e pa rt m e n t o f b i o s tat i s t i c s
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Kovariansanalyse
Sammenligning af parallelle regressionslinier:
Model:
ygi = αg + βxgi + gi
g = 1, 2; i = 1, . . . , ng
Og hvad er det så, der sker, hvis vi ‘glemmer’ x i modellen?
1. Bias:
Hvis x̄1 6= x̄2 , bliver forskellen forkert vurderet.
2. Inefficiens:
Selv om x̄1 = x̄2 , mister vi styrke (spredning for stor).
63 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Vekselvirkning=Interaktion
Men skal linierne nødvendigvis være parallelle?
Mere generel model:
ygi = αg + βg xgi + gi
g = 1, 2; i = 1, . . . , ng
Når β1 6= β2 , siger vi, at der er
vekselvirkning = interaktion. Det betyder:
I
Effekten af højde (x) afhænger af kønnet (g)
I
Forskellen på kønnene afhænger af højden
Her kan man ikke udtale sig om
en generel effekt af hverken højde eller køn.
64 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Transformation
I forsøg på at skaffe varianshomogenitet, logaritmerer vi tlc
... men det bliver ikke rigtigt godt...
65 / 84
university of copenhagen
Specifikation af model i SAS
Model med vekselvirkning:
proc glm data=tlc;
classes sex;
model ltlc=height sex sex*height
/ solution clparm;
run;
66 / 84
d e pa rt m e n t o f b i o s tat i s t i c s
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Output
Dependent Variable: ltlc
Source
Model
Error
Corrected Total
DF
3
28
31
Sum of
Squares
0.27230446
0.19478293
0.46708739
Mean Square
0.09076815
0.00695653
F Value
13.05
Pr > F
<.0001
Source
height
sex
height*sex
DF
1
1
1
Type I SS
0.26109571
0.00968023
0.00152852
Mean Square
0.26109571
0.00968023
0.00152852
F Value
37.53
1.39
0.22
Pr > F
<.0001
0.2481
0.6429
Source
height
sex
height*sex
DF
1
1
1
Type III SS
0.13597107
0.00210426
0.00152852
Mean Square
0.13597107
0.00210426
0.00152852
F Value
19.55
0.30
0.22
Pr > F
0.0001
0.5867
0.6429
67 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Output, fortsat:
Parameter
Intercept
height
sex
sex
height*sex
height*sex
Standard
Error
Estimate
F
M
F
M
-.2190181620
0.0060473650
-.2810587157
0.0000000000
0.0014344422
0.0000000000
B
B
B
B
B
B
0.35221658
0.00201996
0.51102682
.
0.00306016
.
Interaktionsparameteren angiver
forskellen på hældninger i de to grupper
68 / 84
t Value
Pr > |t|
-0.62
2.99
-0.55
.
0.47
.
0.5391
0.0057
0.5867
.
0.6429
.
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Omregning til de to linier:
Linie for mænd:
log10(Lung capacity) = −0.219 + 0.00605 × height
Linie for kvinder:
log10(Lung capacity)
= −0.219 + (−0.281) + (0.00605 + 0.00143) × height
= −0.500 + 0.00748 × height
69 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
SAS-udregning af de to linier
proc glm data=tlc;
classes sex;
model ltlc=sex sex*height / noint solution clparm;
run;
Output:
Dependent Variable: ltlc
Source
DF
Sum of
Squares
Model
Error
Uncorrected Total
4
28
32
19.16369633
0.19478293
19.35847926
70 / 84
Mean Square
F Value Pr > F
4.79092408
0.00695653
688.69
<.0001
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Output, fortsat:
Source
sex
height*sex
Parameter
sex
sex
height*sex
height*sex
F
M
F
M
DF
Type III SS
Mean Square
F Value
Pr > F
2
2
0.01537968
0.13604143
0.00768984
0.06802071
1.11
9.78
0.3451
0.0006
Estimate
Standard
Error
t Value
Pr > |t|
-.5000768777
-.2190181620
0.0074818072
0.0060473650
0.37025922
0.35221658
0.00229877
0.00201996
-1.35
-0.62
3.25
2.99
0.1876
0.5391
0.0030
0.0057
Her er der angivet to intercept-estimater og to hældningsestimater.
71 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Udregning med brug af Estimate-sætninger
proc glm data=tlc;
classes sex;
model ltlc=sex height sex*height / solution clparm;
estimate ’intercept, male’ intercept 1 sex 0 1;
estimate ’intercept, female’ intercept 1 sex 1 0;
estimate ’slope, male’ height 1 sex*height 0 1;
estimate ’slope, female’ height 1 sex*height 1 0;
run;
Parameter
intercept, male
intercept, female
slope, male
slope, female
72 / 84
Estimate
-0.21901816
-0.50007688
0.00604737
0.00748181
Standard
Error
0.35221658
0.37025922
0.00201996
0.00229877
t Value
-0.62
-1.35
2.99
3.25
Pr > |t|
0.5391
0.1876
0.0057
0.0030
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Modelreduktion
Vi kunne ikke se nogen vekselvirkning og udelader den af modellen
proc glm data=tlc;
classes sex;
model ltlc=sex height / solution clparm;
run;
Dependent Variable: ltlc
Source
Model
Error
Corrected Total
R-Square
0.579712
Source
sex
height
73 / 84
DF
1
1
DF
2
29
31
Sum of
Squares
0.27077594
0.19631145
0.46708739
Mean
Square
0.13538797
0.00676936
C.V.
10.70821
Root MSE
0.08228
Type I SS
0.13626303
0.13451291
Mean Square
0.13626303
0.13451291
F Value
20.00
Pr > F
0.0001
LTLC Mean
0.76835
F Value
20.13
19.87
Pr > F
0.0001
0.0001
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Output, fortsat:
Source
sex
height
Parameter
Intercept
sex
F
sex
M
height
DF
1
1
Type III SS
0.00968023
0.13451291
Estimate
-.3278068826 B
-.0421012632 B
0.0000000000 B
0.0066723630
Mean Square
0.00968023
0.13451291
Standard
Error
0.26135206
0.03520676
.
0.00149683
F Value
1.43
19.87
t Value
-1.25
-1.20
.
4.46
Bemærk: Nu er kønseffekten helt forsvundet!
Højden kunne altså godt forklare den....måske
74 / 84
Pr > F
0.2415
0.0001
Pr > |t|
0.2198
0.2415
.
0.0001
university of copenhagen
Ancova-fit (parallelle linier)
75 / 84
d e pa rt m e n t o f b i o s tat i s t i c s
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Er der så en kønseffekt eller ej?
Ja for mænd og kvinder har jo ikke samme niveau af
lungekapacitet
men forskellen i niveau kan forklares udfra den
højdeforskel, der generelt er mellem mænd og kvinder
måske men vi kan ikke påvise forskel mellem en mand og en
kvinde med samme højde
Højde er en mellemkommende (intermediate) variabel
for effekten af køn på lungekapacitet
76 / 84
university of copenhagen
Husk modelkontrol:
77 / 84
d e pa rt m e n t o f b i o s tat i s t i c s
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Fortolkning
I dette eksempel så vi
I
Den observerede forskel i (log10 ) lungekapacitet mellem mænd
og kvinder kunne godt tilskrives højdeforskellen mellem
kønnene.
Der kan dog stadig være en kønsforskel op til
0.0421 ± 2.045 × 0.0352 = (−0.030, 0.114),
svarende til intervallet (0.933, 1.300) for ratio’en,
dvs. op til en 30% øget lungefunktion hos mænd
78 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Et typisk eksempel
på et før-og-efter studie:
Vickers, A.J. & Altman, D.G.: Analysing controlled clinical trials
with baseline and follow-up measurements.
British Medical Journal 2001; 323: 1123-24.:
52 patienter med skuldersmerter randomiseres til enten
I
Akupunktur (n=25)
I
Placebo (n=27)
Smerte vurderes på en 100-trins skala
både før og efter behandling
Høje scorer er gode
79 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Baseline og Follow-up
Behandling
@
@
R
@
Outcome
Baseline måling
Der er fokus på sammenligning af behandlingerne:
Er placebo ligeså godt som akupunktur?
Det lægger op til et simpelt T-test, men:
Hvad nu, hvis de to grupper ikke er helt identiske fra start,
selv om der er randomiseret?
80 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Resultater vedr. skuldersmerter
Sammenligninger af de to grupper:
Gennemsnitlig smertescore
placebo
akupunktur
(n=27)
(n=25)
Baseline
Behandlinseffekt
differens
(95% CI)
P-value
53.9 (14.0)
60.4 (12.3)
6.5
0.09
62.3 (17.9)
79.6 (17.1)
17.3 (7.5; 27.1)
0.0008
8.4 (14.6)
19.2 (16.1)
10.8 (2.3; 19.4)
0.014
12.7 (4.1; 21.3)
0.005
Analyse:
Follow-up
Ændringer*
Ancova
* resultater publiceret i Kleinhenz et.al. Pain 1999; 83:235-41.
81 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Udvikling i smerter, faktisk og forventeligt
82 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Udlægning af resultater, I
Baseline
I
Akupunktur gruppen ligger lidt højere end placebo
Follow-up
I
Vi vil forvente, at akupunktur gruppen stadig ligger det
samme stykke højere end placebo gruppen efter behandlingen,
selv hvis behandlingen ikke virker
(fuldt optrukket rød linie).
I
Det er derfor urimeligt blot at afgøre behandlingens effekt ved
at sammenligne follow-up værdier (forskellen bliver for stor i
dette tilfælde)
83 / 84
university of copenhagen
d e pa rt m e n t o f b i o s tat i s t i c s
Udlægning af resultater, II
Differenser/ændringer
I
Lav baseline værdi giver forventning om stor positiv ændring
(regression to the mean)
I
Derfor forventes placebogruppen at stige mest,
og akupunkturgruppen lidt mindre
(den stiplede røde linie)
I
og en direkte sammenligning af ændringer er derfor ikke
rimelig (forskellen bliver for lille i dette tilfælde)
Ancova
I
vurderer forskellen under hensyntagen til, at baseline forklarer
noget, men ikke al forskellen ved follow-up:
Vi sammenligner personer, der har fået forskellig behandling,
men som starter samme sted.
84 / 84