Genetische Assoziationsstudien

Transcription

Genetische Assoziationsstudien
Genetische Assoziationsstudien
Franziska Ideler
Fakultät Statistik
Technische Universität Dortmund
15. Oktober 2012
Franziska Ideler
1/62
Überblick
Einleitung
Grundlegende Begrie
Verschiedene Studientypen und Abgrenzungen
Statistische Methoden, Programmpakete und Befehle
Datenmaterial und Fragestellung
Statistische Auswertung
Zusammenfassung
Literaturverzeichnis
Franziska Ideler
2/62
Was sind Assoziationsstudien?
Sie überprüfen, ob ein Merkmal (wie zum Beispiel eine
Krankheit) von einer bestimmten Variation der Gene
innerhalb des menschlichen Genoms abhängt.
Gen:
"Ein Gen ist die physikalische und funktionelle Einheit der
Vererbung." (Wrba et al, S. 169)
Genom: "Das Genom des Menschen ist die genetische Gesamtinformation eines einzelnen Menschen" (Wrba et al, S. 168)
Franziska Ideler
Einleitung
3/62
Exkurs: Grundlegende Begrie der Genetik
Genotyp:
Der Genotyp umfasst die komplette genetische
Ausstattung. Dies ist der Satz von Genen, den die Zellen im
Zellkern tragen (vgl. Wrba et al, S. 169).
DNA: Ist die Abkürzung für Desoxyribonukleinsäuren, welche
aus Basenpaaren besteht. Diese macht den genetischen Code
aus (vgl. Murken at al, S. 3 ).
Basenpaare: Die vorkommenden Basenpaare sind Adenin (A),
Guanin (G), Thymin (T) und Cytosin (C).
Franziska Ideler
Einleitung
4/62
Exkurs: Grundlegende Begrie der Genetik
SNP:
Ist die Abkürzung für "Single Nucleotide Polymorphism"
(einzelner Nukleotid Polymorphismus) und bezeichnet den Unterschied von einzelnen Basenpaaren in einem DNA-Strang. Sie
lassen sich einfach bestimmen und sind somit bei der Verwendung in Assoziationsstudien gut geeignet (vgl. Wrba et al S.
151).
Franziska Ideler
Einleitung
5/62
Vier verschiedene Typen
Es gibt vier verschiedene Studientypen:
I
Kandidaten-Gen-Studien
I
Kandidaten-Polymorphismus-Studien
I
ne mapping studies
I
Genom-weite Assoziationsstudien (GWAS)
Franziska Ideler
Einleitung
6/62
Kandidaten-Polymorphismus-Studien
I
I
I
es besteht a priori Hypothese über Funktion des SNPs
baut auf vorherige wissenschaftliche Untersuchungen, die
andeuten, dass der oder die zu untersuchenden SNPs mit
einem Merkmal (einer Krankheit) zusammenhängen.
Ziel ist zu entscheiden, ob SNP Merkmal beeinusst.
(vgl. Foulkes (2009), S. 2)
Franziska Ideler
Einleitung
7/62
Kandidaten-Gen-Studien
I
I
I
I
Es werden einzelne SNPs innerhalb bestimmter Gene
betrachtet.
Auswahl der SNPs mit Hilfe des Linkage Disequilibrium (LD)
exakter Ort der zu untersuchenden Genvariation nicht bekannt,
also werden nahegelegene SNPs untersucht
Diese SNPs werden als Marker bezeichnet.
(vgl. Foulkes (2009), S. 2)
Franziska Ideler
Einleitung
8/62
ne mapping studies
I
I
unterscheiden sich von den beiden Kandidaten-Studien
Ziel ist es die exakte Lokalisation der Genvariante, welche das
Merkmal verursacht, zu bestimmen.
(vgl. Foulkes (2009), S. 3)
Franziska Ideler
Einleitung
9/62
Genom-weite Assoziationsstudien (GWAS)
I
I
I
I
ähneln Kandidaten-Gen-Studien
Unterschied: es wird eine wesentlich höhere Anzahl an SNPs
untersucht
sehr umfangreich; hoher Rechenaufwand
ersetzen Kandidaten-Gen-Studien aber nicht; diese liefern
genauere Ergebnisse
(vgl. Foulkes (2009), S. 3 f)
Franziska Ideler
Einleitung
10/62
Abgrenzungen
Genotyp und Genexpression
I
I
I
I
Wissenschaftliche Erkenntnisse über Genotyp und
Genexpression gehen in die selbe Richtung.
Aber: In Assoziationsstudien wird ausschlieÿlich der Genotyp
untersucht.
Genotyp: exakte genetische Ausstattung (vgl. Wrba et al, S.
169)
Genexpression: Vorgang durch den die in den Genen
vorliegende Information umgesetzt und wirksam wird (vgl.
Wrba et al, S. 72)
(vgl. Foulkes (2009), S. 4 f)
Franziska Ideler
Einleitung
11/62
Abgrenzugnen
Populations- und Familien-basierte Untersuchungen
I
I
I
Familien-basierte Untersuchungen: Gene der einzelnen
Individuen sind untereinander korreliert
Populations-basierte Untersuchungen: im Idealfall keine
Korrelation
Für Assoziationsstudien werden nur Populations-basierte
Untersuchungen verwendet.
(vgl. Foulkes (2009), S. 6 f)
Franziska Ideler
Einleitung
12/62
Abgrenzungen
Assoziationen und Populationsgenetik
I
I
Populationsgenetik beschäftigt sich mit der Veränderung des
Genpools einer Population.
Assoziationsstudien haben das Ziel Zusammenhänge
aufzudecken.
(vgl. Foulkes (2009), S. 7)
Franziska Ideler
Einleitung
13/62
Statistische Methoden, Programmpakete
und Befehle
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
14/62
Notationen
Gegeben sei ein Stichprobenumfang von n Individuen bei denen
Genotypen von p SNPs sowie m Covariablen untersucht wurden.
Dann
I
I
I
steht yi für das i te Individuum unter Beobachtung mit
i = 1, . . . , n .
ist xij die Ausprägung (des Genotyps) des i ten Individuums für
den j -ten SNP mit i = 1, . . . , n und j = 1, . . . , p .
wird mit zik die Ausprägung der k -ten Covariable für das i -te
Individuum angegeben, wobei i = 1, . . . , n und i = k , . . . , m.
(vgl. Foulkes (2009), S. 30)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
15/62
Notationen
I
Fettgedruckte römische Buchstaben stehen für Vektoren:
I
I
I
I
x = (x1 , . . . , xn )T
xj = (x1j , . . . , xnj )T
Groÿe römische Buchstaben drücken Matrizen aus:
n ×p .
X = (x1 , . . . , xp ) ∈ R
Griechische Buchstaben wie α, β, γ stehen für
Modellparameter bei einer Schätzung.
(vgl. Foulkes (2009), S. 30)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
16/62
Notationen für Genotypen
I
I
I
I
Der Genotyp des j -ten SNPs bei dem i ten Individuum ist
dargestellt durch xij .
Ein SNP wird durch ein Basenpaar (Basen: A, C, G, T)
repräsentiert.
Die seltenere Base wird einem kleinen Buchstaben zugeordnet,
die häugere einem groÿen.
Mögliche Ausprägungen des Genotyps: AA, Aa, aa
(vgl. Foulkes (2009), S. 30)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
17/62
Paket Genetics
I
Paket zum Umgang mit genetischem Datenmaterial
I
zu laden durch library(genetics)
I
einfaches Erzeugen von absoluten und relativen Häugkeiten
der Genotypen
I
dazu: genotype(daten, sep="")
I
daten: eindimensionaler Vektor mit Auistung von Genotypen
(vgl. Foulkes (2009), S. 22)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
18/62
Violinplot
I
Möglichkeit zur graphischen Darstellung univariater Daten
I
"Weiterentwicklung" eines Boxplots
I
nutzt die Dichtefunktion
I
Name: Form erinnert an Violine
I
in R laden durch: library("vioplot")
(vgl. Sarkar (2008), S. 47 sowie Kampstra (2008), S. 2)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
19/62
Einschub: Kerndichtefunktion
Figure : Kerndichtefunktion
set.seed(123)
BSP <- c(rnorm(15,0,5))
bsp <- c(15,BSP,rep(-5,3))
[1] 15.0000000 -2.8023782 -1.1508874 7.7935416
[9] -6.3253062 -3.4342643 -2.2283099 6.1204090
[17] -5.0000000 -5.0000000 -5.0000000
Franziska Ideler
0.3525420
1.7990691
0.6464387
2.0038573
8.5753249 2.3045810
0.5534136 -2.7792057
Statistische Methoden, Programmpakete und Befehle
20/62
Beispiel Violinplot
Figure : Beispiel Boxplot/Violinplot
Min. 1st Qu.
-6.3250 -3.1180
Franziska Ideler
Median
Mean 3rd Qu.
Max.
0.3525 0.6015 2.1540 15.0000
Statistische Methoden, Programmpakete und Befehle
21/62
Beanplot
I
Möglichkeit zur graphischen Darstellung univariater Daten
I
"Weiterentwicklung" eines Violinplots
I
nutzt Stripchart
I
Name: Form erinnert an Bohne
I
in R laden durch: library("beanplot")
(vgl. Kampstra (2008), S. 3 )
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
22/62
Einschub: Stripchart
Figure : Stripchart
[1] 15.0000000 -2.8023782 -1.1508874
[5] 0.3525420
0.6464387 8.5753249 2.3045810
[9] -6.3253062 -3.4342643 -2.2283099
[13] 1.7990691
7.7935416
6.1204090
2.0038573 0.5534136 -2.7792057
[17] -5.0000000 -5.0000000 -5.0000000
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
23/62
Beispiel Beanplot
Figure : Beispiel Boxplot/Beanplot
Min. 1st Qu.
Median
-6.3250 -3.1180
Franziska Ideler
Mean 3rd Qu.
Max.
0.3525 0.6015 2.1540 15.0000
Statistische Methoden, Programmpakete und Befehle
24/62
2 × 3 Kontingenztafel
aa
Ereignis (E + )
kein Ereignis (E − )
Genotyp
Aa
AA
n11
n12
n13
n1·
n21
n22
n23
n2·
n ·1
n·2
n·3
n
Table : Darstellung der Genotypen in einer 2 × 3 Kontingenztafel
(vgl. Foulkes (2009), S. 38)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
25/62
2 × 2 Kontingenztafel
Genotyp
aa oder Aa AA
Ereignis (E + )
kein Ereignis (E − )
n11
n12
n1·
n21
n22
n2·
n ·1
n ·2
n
Table : Darstellung der Genotypen in einer 2 × 2 Kontingenztafel
(vgl. Foulkes (2009), S. 39)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
26/62
Odds Ratio - Chancenverhältnis
I
Odds: die Chancen für ein Ereignis (E + ) unter der
Voraussetzung zu einer Gruppe G zu gehören
OG
I
= P (E + |G )/(1 − P (E + |G ))
Odds Ratio: das Verhältnis zwischen der Chance auf ein
Ereignis (E + ) unter der Voraussetzung zu der Gruppe A (GA )
zu gehören und der Chance auf ein Ereignis (E + ) unter der
Voraussetzung zu der Gruppe B (GB ) zu gehören
ORGA ,GB
=
OGA
OGB
=
P (E
+
A )/(1 − P (E |GA ))
B )/(1 − P (E + |GB ))
+ |G
P (E + |G
(vgl. Foulkes (2009), S. 38)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
27/62
Odds Ratio 2 × 3 Kontingenztafel
Genotyp
Ereignis (E )
+
kein Ereignis (E
−
)
aa
Aa
AA
n11
n21
n·1
n12
n22
n·2
n13
n23
n·3
n1·
n2·
n
Daraus ergibt sich exemplarisch für die Odds:
P (E
+ |aa)/(1
− P (E + |aa)) = (n11 /n·1 )/(n21 /n·1 )
Und somit für die Odds Ratios:
ORaa,AA
=
(n11 /n·1 )/(n21 /n·1 )
n11 n23
=
(n13 /n·3 )/(n23 /n·3 )
n21 n13
(vgl. Foulkes (2009), S. 22)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
28/62
Odds Ratio 2 × 2 Kontingenztafel
Genotyp
Ereignis (E )
+
kein Ereignis (E
−
)
aa oder Aa
AA
n11
n21
n·1
n12
n22
n·2
n1·
n2·
n
Alternativ mit 2 × 2 Kontingenztafel:
ˆ
OR
=
n11 n22
(n11 /n·1 )/(n21 /n·1 )
=
(n12 /n·2 )/(n22 /n·2 )
n21 n12
(vgl. Foulkes (2009), S. 38)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
29/62
Testverfahren
I
I
I
Franziska Ideler
Tests auf Unabhängigkeit
Qualitative Tests
I
χ2 -Test
I
exakter Test nach Fisher
Quantitative Tests
I
Zwei Stichproben t-Test
I
Wilcoxon-Rangsummentest
Statistische Methoden, Programmpakete und Befehle
30/62
χ2 -Test
I H0
I
: OR = 1 vs.
Teststatistik
X
H1
: OR 6= 1
2
2 = P (Oij − Eij ) ∼ χ2
(r −1)(c −1)
E
i ,j
ij
n n
mit Eij = i · ·j und Oij = nij
n
und c : Anzahl der Reihen und der Spalten der
Kontingenztafel.
Ablehnen von H0 bei X 2 > c
2
c :1 − α-Quantil der χ
(r −1)(c −1) -Verteilung
Befehl in R: chisq.test(X)
I r
I
I
I
(vgl. Foulkes (2009), S. 39 f)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
31/62
Exakter Test nach Fisher
I
nur bei 2 × 2-Tafeln anwendbar
I H0
: OR = 1 vs
H1
: OR 6= 1
I
Teststatistik: n11 ∼ Hyp (n, n1· , n·1 )
I
Ablehnen von H0 bei cα/2 ≥ n11 oder c1−α/2 ≤ n11
I cα/2
I
und c1−α/2 : Quantile der Hypergeometrischen Verteilung
Befehl in R: fisher.test()
(vgl. Hartung et al, S. 416)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
32/62
Zwei Stichproben t-Test
I H0
I
I
: µ1 6= µ2
und ȳ2 arith. Mittel der Gruppen
Ablehnen von H0 bei t < Tα/2,n1 +n2 −2 oder
t
I
H1
µ1 und µ2 sind die Mittelwerte zweier Gruppen
ȳ1 − ȳ2
∼ Tn1 +n2 −2
Teststatistik: t = q
sp2 [1/n1 + 1/n2 ]
I ȳ1
I
: µ1 = µ2 vs
> T1−α/2,n1 +n2 −2
Befehl in R: t.test()
(vgl. Foulkes (2009), S.44)
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
33/62
Wilcoxon Rangsummentest
I H0
: F (y1 ) = F (y2 ) vs.
H1
: F (y1 ) 6= F (y2 )
und F (y2 ): Verteilungen der beiden Gruppen
P P
Teststatistik: WN = 2i =j ni=1 R (yji )
R (yji ): Ränge der kombinierten Stichprobe
I F (y1 )
I
I
Pn
Pm
k =1 T (yji − yjk ) + k =1 T (yji − yjk ),
i = 1, ..., n , j = 1, 2

0 für U < 0
T (U ) =
1 für U ≥ 0.
I R (yji )
I
I
I
I
=
+ > w+
Ablehnen bei W + < w +
α oder W
1− α2
2
w ist Verteilung unter H0
Befehl in R: wilcox.test()
(vgl. Büning und Trenkler S. 131 )
Franziska Ideler
Statistische Methoden, Programmpakete und Befehle
34/62
Datenmaterial und Fragestellung
Franziska Ideler
Datenmaterial und Fragestellung
35/62
Datensätze
I
The Human Genome Diversity Project (HGDP)
I
The Virco Data
I
Franziska Ideler
The Functional SNPs Associated with Muscle Size and
Strenghth (FAMuSS)
Datenmaterial und Fragestellung
36/62
Datenmaterial 1: HGDP
Stichprobenumfang
I n
= 1064
Variablen
I
Identikationsnummer (ID)
I
Geschlecht (Gender)
I
ethnische Abstammung (Population)
I
Herkunftsland (Geographic.origin)
I
Allgemeinere Beschreibung der Herkunft(Geographic.area)
I
Ausprägung der Basen von vier SNPs (Bsp.: AKT1.C0756A)
Franziska Ideler
Datenmaterial und Fragestellung
37/62
Datenmaterial 1: HGDP
AKT1.
ID
Gender
Population
Geographic.origin
Geographic.area
C0756A
HGDP00980
F
Biaka Pygmies
Central African Republic
Central Africa
CA
HGDP01406
M
Bantu
Kenya
Central Africa
CA
HGDP01266
M
Mozabite
Algeria (Mzab)
Northern Africa
AA
HGDP01006
F
Karitiana
Brazil
South America
AA
HGDP01220
M
Daur
China
China
AA
HGDP01288
M
Han
China
China
AA
Table : Auszug aus dem HGDP-Datensatz
Franziska Ideler
Datenmaterial und Fragestellung
38/62
Datenmaterial 2: Virco
Stichprobenumfang
I n
= 1066 Virus-Isolate
Variablen
I
Sequenz-Identikation (SeqID)
I
Name des Virus-Isolats (IsolateName)
I
I
Franziska Ideler
Mediakmentenspezische Resistenz des Isolates (IDV.Fold)
Genotypinformation in zwei Formaten
I
Position der Amino-Säure
I
Mutationsliste
Datenmaterial und Fragestellung
39/62
Datenmaterial 2: Virco
SeqID
IsolateName
IDV.Fold
P10
P63
P71
P82
P90
CompMutList
3852
CA3176
14.2
I
P
-
-
M
L10I, M46I, L63P, G73CS,
3865
CA3191
13.5
I
P
V
T
M
L10I, R41K, K45R, M46I,
V77I, L90M, I93L
L63P, A71V, G73S, V77I,
V82T, I85V, L90M, I93L
7430
CA9998
16.7
I
P
V
A
M
L10I, I15V, K20M, E35D,
M36I, I54V, R57K, I62V,
L63P, A71V, G73S, V82A,
L90M
7459
Hertogs-Pt1
3.0
I
P
T
-
M
L10I, L19Q, E35D, G48V,
L63P, H69Y, A71T, L90M,
I93L
7460
Hertogs-Pt2
7.0
-
-
-
A
-
K14R, I15V, V32I, M36I,
7461
Hertogs-Pt3
21.0
I
P
V
A
M
L10I, K20R, M36I, N37D,
M46I, V82A
I54V, R57K, D60E, L63P,
A71V, I72V, V82A, L90M,
I93L
Table : Auszug aus dem Virco-Datensatz
Franziska Ideler
Datenmaterial und Fragestellung
40/62
Datenmaterial 3: FAMuSS
Stichprobenumfang
I n
= 1379 College Studenten, verschiedenen Geschlechts, Alters
und Abstammung
Franziska Ideler
Datenmaterial und Fragestellung
41/62
Variablen:
I
I
Identikationsnummer (fms.id)
Ausprägungen der Basen von 225 SNPs
(Bsp.: actn3_rs540874)
I
Semester (Term)
I
Geschlecht (Gender)
I
Alter (Age)
I
Abstammung (Race)
I
I
Franziska Ideler
prozentualer Zuwachs nicht dominanter (trainierter) Arm
(NDRM.CH)
prozentualer Zuwachs dominanter (nicht trainierter) Arm
(DRM.CH)
Datenmaterial und Fragestellung
42/62
Auswahl der SNP's
Figure : Screenshot von http://www.ncbi.nlm.nih.gov/ (12.10.2012)
Franziska Ideler
Datenmaterial und Fragestellung
43/62
Datenmaterial 3: FAMuSS
actn3_
Gender
Age
Race
NDRM.
DRM.
CH
CH
id
rs540874
Term
FA-1801
GG
02-1
Female
27
Caucasian
40
40
FA-1802
GA
02-1
Male
36
Caucasian
25
0
FA-1803
GA
02-1
Female
24
Caucasian
40
0
FA-1804
GA
02-1
Female
40
Caucasian
125
0
FA-1805
GG
02-1
Female
32
Caucasian
40
20
FA-1806
GA
02-1
Female
24
Hispanic
75
0
Table : Auszug aus dem FAMuSS-Datensatz
Franziska Ideler
Datenmaterial und Fragestellung
44/62
Fragestellung
Datensatz: FAMuSS
I
Franziska Ideler
Kann ein Zusammenhang zwischen einem der SNPs und einem
besonders groÿen Zuwachs an Muskeln festgestellt werden?
Datenmaterial und Fragestellung
45/62
Statistische Auswertung
Franziska Ideler
Statistische Auswertung
46/62
Daten einlesen
url <- "http://people.umass.edu/
foulkes/asg/data/FMS\_data.txt"
fms <- read.delim(url, header=T, sep="\t") \\
attach(fms)
Franziska Ideler
Statistische Auswertung
47/62
Daten vorbereiten
I
Dierenz der Arm-Zuwachse: new <- NDRM.CH - DRM.CH
I
Nur SNPs und Armdierenzen:
newfms <- cbind(fms[,(4:226)],new)
I
Entfernen der NA's bei den Dierenzen
hin <- which(new != "NA")
neu <- newfms[hin,]
Franziska Ideler
Statistische Auswertung
48/62
Funktion zur Erstellung von Kotingenztafeln
Konti <- function(i){
table(I(neu$new>mean(neu$new)), neu[,i])
}
I
neu: 225 Spalten SNPs
I
new: Armzuwachs-Werte
Franziska Ideler
Statistische Auswertung
49/62
Kontingenztafeln prüfen
ko <- numeric()
for(i in 1:221){
ko <- c(ko,dim(Konti(i))[2])
fehler <- which(ko > 3 | ko < 2)
}
neu <- neu[,-fehler]
Franziska Ideler
Statistische Auswertung
50/62
Funktion OR
OR <- function(x){....
return(na.omit(data.frame(
x,OddsRatio,Geno1,lok1,Geno2,lok2)))}
Konti(6)
CC CG
GG
FALSE 90 124 33
TRUE
77
79
35
OR(6)
x OddsRatio Geno1 lok1 Geno2 lok2
2 6 0.7446586
CC
1
CG
2
3 6 1.2396694
CC
1
GG
3
4 6 1.6647488
CG
2
GG
3
Franziska Ideler
Statistische Auswertung
51/62
Fisher-Test
Fisher <- data.frame(Liste[,1],fisher,Liste$Geno1,
Liste$lok1,Liste$Geno2,Liste$lok2)
Fisher[1:4,]
x fisher
Geno1
lok1 Geno2
lok2
1 0.02925794
CC
1
CT
2
1 0.05901945
CC
1
TT
3
1 0.92030576
CT
2
TT
3
2 0.79025583
AA
1
GA
2
Franziska Ideler
Statistische Auswertung
52/62
Grak OR und p-Werte
Figure : Plot der p-Werte des Fisher-Tests und ORs
Franziska Ideler
Statistische Auswertung
53/62
Graphische Dartstellungen
Figure : Boxplots
Franziska Ideler
Statistische Auswertung
54/62
Graphische Dartstellungen
Figure : Violinplots
Franziska Ideler
Statistische Auswertung
55/62
Graphische Dartstellungen
Figure : Beanplots
Franziska Ideler
Statistische Auswertung
56/62
Kontingenztafeln
"il6_g572c"
"akt2_2304186"
GG
CC GC GG
GT TT
FALSE 182 242 133
FALSE
4 13 67
TRUE
TRUE
3
112 221
65
3 62
OddsRatio Geno1 Geno2
OddsRatio Geno1 Geno2
1.4839876
GG
GT
0.3076923
CC
GC
0.7941729
GG
TT
1.2338308
CC
GG
0.5351614
GT
TT
4.0099502
GC
GG
p-Wert
Geno1
Geno2
Geno1
Geno2
0.0106095975
GG
GT
p-Wert
0.3184939
CC
GC
0.2510705645
GG
TT
1.0000000
CC
GG
0.0004318704
GT
TT
0.0327063
GC
GG
FALSE: kleiner als arith Mittel TRUE: gröÿer als arith. Mittel
Franziska Ideler
Statistische Auswertung
57/62
Kontingenztafeln
"il6_g572c"
"akt2_2304186"
GG/TT
CC/GG
GT
GC
FALSE
315
247
FALSE
71
13
TRUE
177
221
TRUE
65
3
FALSE: kleiner als arith Mittel TRUE: gröÿer als arith. Mittel
OR
Fisher
χ2
t-Test
Wilcoxon
akt2 1.592 2.38·10−4 2.98·10−4 2.09·10−5 3.03·10−5
il6
0.252
0.0334
0.0519
0.2316
0.1129
Table : ORs und p-Werte für die SNPs akt2_2304186 und il6_g572cc
Franziska Ideler
Statistische Auswertung
58/62
Zusammenfassung
SNP akt2_2304186:
I
I
I
bei homozygoter Ausprägung Chance für kleine Armdierenzen
1.59 mal so hoch
Umkehrschluss: heterozygote Ausprägung bedeutet höheren
Muskelzuwachs
Bestätigung durch signikante Testergebnisse
il6_g572c:
I
bei homozygoter Ausprägung Chance auf kleine
Armdierenzen nur 0.252 mal so hoch.
I
homozygote Ausprägung höherer Muskelzuwachs.
I
keine Bestätigung durch Tests
Franziska Ideler
Zusammenfassung
59/62
Ausblick
I
Tests mit Messungen verschiedener Muskeln
I
Geschlechterunterschied betrachten
Franziska Ideler
Zusammenfassung
60/62
Literatur
I
I
I
I
I
Franziska Ideler
Büning, H., Trenkler, G. (1994) Nichtparametrische
statistische Methoden. 2.Auage, Walter de Gruyter, Berlin.
Foulkes, A.S. (2009) Applied Statistical Genetics with R: For
Population-based Association Studies. Springer
Science+Business Media, New York.
Hartung, J., Elpelt, B. und Klösener, K.-H. (1991) Statistik.
Lehr- und Handbuch der angewandten Statistik. 8.Auage,
Oldenbourg Verlag, München.
Murken, J., Grimm, T. und Holinski-Feder, E. (2006)
Taschenlehrbuch Humangenetik. 2.Auage, Georg Thieme
Verlag, Stuttgart.
Sarkar D., (2008) Lattice. Multivariate Data Visualisation with
R. Springer Science+Business Media, New York.
Literaturverzeichnis
61/62
Literatur
I
I
Franziska Ideler
R Development Core Team (2009). R: A language and
environment for statistical computing. R Foundation for
Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0,
URL http://www.R-project.org.
Wrba, F., Dolznig, H. und Mannhalter, C. (2007) Genetik
verstehen. Grundlagen der molekularen Biologie. Facultas
Verlags- und Buchhandels AG, Wien.
Literaturverzeichnis
62/62

Similar documents