MATRIˇCNI ZAPIS MODELA IN OSNOVE MATRIˇCNE OPERACIJE

Comments

Transcription

MATRIˇCNI ZAPIS MODELA IN OSNOVE MATRIˇCNE OPERACIJE
1
Biometrija
Poglavje 1
MATRIČNI ZAPIS MODELA IN OSNOVE MATRIČNE
OPERACIJE
1.1
Skalar
Skalar je matrika reda 1 x 1. Skalarji so označeni z malimi ali velikimi navadnimi (neodebeljene) črkami
kot npr. yi j (odvisna slučajna spremenljivka), ai jk (vpliv živali kot naključni vpliv), βi (eden od nivojev pri
sistematskemu vplivu), b (regresijski koeficient), xi jk (neodvisna spremenljivka), xi j (element v matriki
X) ali c (konstanta). V oklepaju je omenjena ena od možnosti, ki jih bomo srečali pri biometriji. Oznaka
skalarja ni dovolj, da bi vedno prepoznali njegovo vlogo. Pomembno je, da so uporabljene oznake
obrazložene v vsakem primeru posebej, čeprav lahko pri običajnih, pogostih primerih o pomenu skoraj
zanesljivo sklepamo.
1.2
Vektor
Definicija: Vektor je polje števil ali simbolov urejenih samo v eno vrstico in en stolpec.
Vektorji so matrike, ki imajo eno samo vrstico (vrstični vektorji) oziroma en stolpec (stolpični vektor).
Pisali jih bomo z malimi odebeljenimi črkami npr. y, u, a, x ali β. Tako bomo označili stolpične vektorje.
Vrstični vektorji so pravzaprav transponirani stolpični vektorji (glej tudi 1.3.1) in jih bomo označili y0 ,
u0 , a0 , x0 ali β0 ali yT , uT , aT , xT ali βT . Tam, kjer ne moremo uporabiti odebeljenih črk, uporabljamo
lahko navadno pisavo, vektor pa podčrtamo z znakom ~, npr. y.
1.3
Matrika
Definicija: Matrika je polje števil ali simbolov urejenih v vrstice in stolpce.
Označevali jih bomo z velikimi, odebeljenimi črkami kot npr. X (matrika dogodkov za sistematske
vplive), Q (matrika kvadratne oblike), A (matrika sorodstva), V fenotipskih matrika varianc in kovarianc.
To je le nekaj matrik, ki bodo imele pri biometriji poseben pomen. Z oznakami A, B ali X pa lahko
enostavno mislimo samo na matrike brey posebnega pomena. Tako kot pri vektorjih je tudi pri matrikah
pomemben opis, kaj matrika predstavlja. Tam, kjer ne moremo uporabiti odebeljenih črk, uporabljamo
lahko navadno pisavo, oznako za matriko pa podčrtamo z znakom ~.
Matrika A na sliki 1.1 ima dve vrstici in štiri stolpce. Vsebuje torej osem elementov. Matrika ima svoje
elemente razvrščene v stolpce in vrstice.



C=


c11 c12 · · · c1c
c21 c22 · · · c2c 

..
.. . .
.. 
. . 
.
.
cr1 cr2 · · · crc
B=
b11 b12 b13 b14
b21 b22 b23 b24
[1.1]
Matrika C ima r vrstic in c stolpcev (primer 1.1). Število vrstic in stolpcev določata red matrike. Red
matrike C je r x c. Red matrike B je 2 x 4. Če želimo red matrike, ga navedemo v indeksu matrike (1.2).
A2x4 , Crxc , B2x4
[1.2]
2
Biometrija
A
é2 3 5 1 ù
= ê1 1 9 7 ú
ë
û
stolpci
vrstici
element matrike
2
3
Biometrija
Pri kvadratnih matrikah (glej 1.3.1) lahko navedemo samo eno vrednost. Matrika V (1.3) je matrika
fenotipskih varianc in kovarianc, zato je kvadratna. Ima 10 vrstic in 10 stolpcev.
V10
[1.3]
Posamezna
števila ali simboli so elementi matrike. Elemente matrike bomo poimenovali z malimi črkami
bi j . Indeksa i in j določata vrstico in stolpec, katerima element pripada. Prvi indeks označuje vrstico,
drugi stolpec brez ozira na črko.
Pri matrikah določamo tudi rang matrike: število neodvisnih vrstic in stolpcev.
1.3.1
Posebne matrike
a) Kvadratne matrike
(primer 1.4) imajo toliko vrstic kot stolpcev.


5 1 2
 3 8 4 
0 2 7
[1.4]
b) Simetrične matrike
(primer 1.5) so kvadratne matrike, za katere velja ai j = a ji .


5 1 2
 1 8 4 
2 4 7
[1.5]
c) Diagonalne matrike (primer 1.6) so simetrične matrike, ki imajo od 0 različne elemente samo na
diagonali. Vsi nediagonalni elementi enake 0.

5 0 0
D= 0 8 0 
0 0 7

[1.6]
Diagonalno matriko lahko zapišemo tudi v obliki iz enačbe 1.7.
D = {dii }
[1.7]
č) Identična matrika (primer 1.8) je diagonalna matrika, pri kateri so vsi diagonalni elementi enaki 1.
Označimo jo z I, praviloma moramo omeniti oziroma določiti tudi red matrike.


1 0 0
I= 0 1 0 
0 0 1
[1.8]
d) Ničelna matrika ima vse elemente enake 0. Označimo jo z 0, praviloma moramo določiti tudi red
matrike.
0=
0 0 0 0
0 0 0 0
[1.9]
3
4
Biometrija
e) Blok-diagonalna matrika je matrika, ki imajo vzdolž diagonale nanizane matrike. Poglejmo si matriko R iz enačbe 1.10. Na diagonali imamo varianci za dve lastnosti, ki se izmenično izmenjujeta. Večina
nediagonalnih elementov je enaka 0, samo med dvema zaporednima vrsticama je nakazana kovarianca
za ostanek med obema lastnostima (σe1 e2 ). V nadaljevanju bomo nekoliko poenostavili poimenovanje za
kovarianco (σe12 ). Obe oznaki jo zadostno opišeta.
σ2e1
 σe1 e2




R=




σe1 e2
σ2e2


σ2e1
σe1 e2
σ2e2
σe1 e2
..
.
σ2e1
σe1 e2
σe1 e2
σ2e2





=




[1.10]
Zamenjajmo torej zaradi enostavnosti oznako in poudarimo diagonalne matrike. Mala diagonalna matrika ima dve vrstici in dva stolpca. Je kvadratna in simetrična. Vsebuje 3 komponente kovariance.
Matriko bomo poimenovali R0 . Vsebuje varianco za prv0 in drugo lastnost ter kovarianco, če sta meritvi
opravljeni na isti živali.
 




=




σ2e1
σe12
σe12
σ2e2

σ2e1
R↑0 →
σe12
σe12
σ2e2
←↓ R0
..
.
σ2e1
σe12
σe12
σ2e2










[1.11]
Zaradi preglednosti lahko matriko 1.12 prepišemo tako, da namesto diagonalnih blokov navedemo kar
matriko R0 .



=


R0
R0
..




.
[1.12]
R0
f) Transponirana matrika A0 (1.13) ima za stolpce vrstice iz matrike A. Za oznako transponirano
uporabljamo tudi črko T v eksponentu (AT ).

2 3 5 1
1 1 9 7
T
2
 3
=
 5
1

1
1 

9 
7
[1.13]
g) Idempotentna matrika M je kvadratna in za njo velja M2 = M. Idepotentne matrike bomo omenjali pri kvadratnih oblikah, ki nam predstavlljajo vsote kvadratov.
4
5
Biometrija
h) Delne matrike (ang. submatrix). Matriko razcepimo na manjše matrike. Običajno to naredimo
glede na strukturo matrik. Kasneje bomo spoznali zanimive matrike, kamor urejujemo informacije iz
podatkov in porekla. Delitev matrik lahko nakažemo s pikčastimi črtami.
A B
C D
[1.14]
Kot primer navajamo matriko koeficientov (1.15) iz enačb mešanega modela. V zgornjem levem kotu so
zbrane informacije o sistematskem delu modela (X0 X), v spodnjem desnem kotu bom našli naključni del
(Z0 Z + Iσ2e σa−2 ), nediagonalna dela (X0 Z in Z0 X) pa povezujeta sistematski in naključni del. Pri našem
delu bomo razčlenitev opravili predvsem zaradi preglednosti, čeprav je bolj pomembna pri izpeljavi
posameznih enačb ali pri dokazih.
X0 X
Z0 X
X0 Z
0
Z Z + Iσ2e σ−2
a
[1.15]
i) Trikotna matrika je kvadratna in ima od nič različne nediagonalne elemente samo nad ali pod
diagonalo. Tako ločimo spodnjo trikotno matriko (ang. lower triangular matrix, 1.16) in zgornjo trikotno
matriko (ang. upper triangular matrix, 1.17).


2
 1 1

−1 2 3
[1.16]

2 1 −1

1 2 
3
[1.17]

j) Pozitivno definitne matrike so kvadratne, simetrične in imajo dominantno diagonalo. S Cholesky
razčlevitvijo (ang. Cholesky decomposition) najdemo tako spodnjo trikotno matriko L, da je njen produkt s transponirano mariko L0 pozitivno definitna matrika A (ang. positive definit matrix). Diagonalni
elementi v matriki L so pozitivni in večji od nič.
A = LL0
[1.18]

 


4 2 −2
2
2 1 −1
 2 2 1 = 1 1

1 2 
−2 1 14
−1 2 3
3
[1.19]
Vse matrike varianc in kovarianc morajo biti pozitivno definitne. Na diagonali so variance, na nediagonalnih elementih pa kovariance. Vzemimo, da je matrika A reda 1 x 1, torej je le skalar. V tem primeru
je edini element v matriki A varianca σ2 , element v matriki L pa standardni odklon σ.
k) Semi-pozitivno definitne matrike so zelo podobne pozitivno definitnim matrikam, le v matriki L
je na diagonali dovoljena tudi vrednost 0.

 


4 2 −2
2
2 1 −1
 2 2 1 = 1 1

1 2 
−2 1 5
−1 2 0
0
5
[1.20]
6
Biometrija
1.4
Seštevanje matrik in vektorjev
Definicija:
A pxq + B pxq = C pxq
[1.21]
ci j = ai j + bi j
[1.22]
Matrike, ki jih seštevamo, morajo imeti isto število vrstic in isto število stolpcev. Vsoto matrik dobimo
tako, da seštevamo istoležne elemente. Rezultat je istega reda kot matrike, ki jih seštevamo.

 
 
 
5 0
1+4 0+0
4
0
1 0
 −1 2  +  2
1  =  −1 + 2 2 + 1  =  1 3 
1 3
3−2 4−1
−2 −1
3 4

[1.23]
Osnovna pravila
1.5
MNOŽENJE MATRIK
Definicija:
A pxq ∗ Bqxr = C pxr
[1.24]
Matriki A in B iz enačbe pomnožimo tako, da pomnožimo i-to vrstico matrike A z j-ti stolpcem matrike
B ter produkte posameznih parov seštejemo. Tako dobimo vrednost elementa na presečišču i-te vrstice
in j-tega stolpca matrike C.
cik =
q
X
ai j ∗ b jk
[1.25]
j=1
Prva matrika mora zato imeti toliko v stolpcev kot druga matrika vrstic



2 0 −1 2
1 0
2 0 −1 2
 −1 2  ∗
=  −4 6 1 2 
−1 3 0 2 2x4
2 12 −3 14 3x4
3 4 3x2

[1.26]
Osnovna pravila
1.6
OPIS MODELA V MATRIČNI OBLIKI
Modele v matrični obliki bomo srečali v literaturi, ki opisuje obdelavo podatkov pri selekciji živali in
uravnavanju reje. Kot bomo kasneje videli, so zeli splošni in povedo sami zase brez dobrega dodatnega
opisa zelo malo o strukturi podatkov. Lahko so dodatno opremljeni z modelom v skalarni obliki. Ker pa
so splošni, so zelo primerni za prikaz metod, uporabljenih za reševanje sistemov enačb. Model v matrični
obliki si oglejmo najprej kar na primeru.
PRIMER: Vzemimo podatke iz tabele ?? in uporabimo naslednja modela v skalarni obliki in sicer za
dnevni prirast (1.27) in debelino hrbtne slanine (1.28):
yi jkl = µ + Pi + M j + Fk + ai jkl + ei jkl
[1.27]
yi jklm = µ + Pi + M j + Fk + bi xi jkl − x̄ + ai jkl + ei jklm
[1.28]
6
7
Biometrija
Model za dnevni prirast smo predstavili v enačbah1.29 in 1.30. Če bi obravnavali le eno lastnost, potem
je lahko enačba povsem brez indeksov. Ker pa sta si modela za dnevni prirast in debelino tako zelo
podobna, pa jih moramo ločiti z dodatnimi indeksi. Za indeks lahko uporabimo številko ali črko.
y1 = X1 β1 + Z1 u1 + e1
[1.29]
yD = XD βD + ZD uD + eD
[1.30]
kjer pomeni:
y1 , y D
- vektor opazovanj ali meritev (ang. observations) za dnevni prirast
X1 , XD
- matrike dogodkov (ang. incidence matrix) za sistematske vplive (ang. fixed effects)
Z1 , ZD
- matrika dogodkov za naključne vplive (ang. random effects)
β1 , βD
- vektor parametrov za sistematske vplive (ang. vector of parameters)
u1 , uD
- vektor naključnih vplivov
e1 , e D -
vektor ostankov (residual).
Sedaj ne bo težko napisati model še za debelino hrbtne slanine. V enačbi 1.31 smo za indeks uporabili
številko 2, ki bo opozoril, da gre za drugo lastnost. Da bi se spomnili, da delamo s slanino, pa smo v
enačbi 1.32 raje uporabili črko S.
y2 = X2 β2 + Z2 u2 + e2
[1.31]
yS = XS βS + ZS uS + eS
[1.32]
kjer pomeni:
y2 , yS
- vektor opazovanj ali meritev za debelino hrbtne slanine
X2 , XS
- matrike dogodkov za sistematske vplive
Z2 , ZS
- matrika dogodkov za naključne vplive
β2 , βS
- vektor parametrov za sistematskih vplivov
u2 , uS
- vektor naključnih vplivov
e2 , eS -
vektor ostankov.
Do sedaj smo obdelali posebej dnevni prirast in nato še debelino hrbtne slanine. Uporabili smo enolastnostno analizo. Kot vir informacij smo uporabili samo moreritve za lastnost in poreklo. Nismo pa
upoštevali, da sta lastnosti sicer povezani.
Z večlastnostnimi analizami se ne bomo preveč ukvarjali. Omenili jih bomo le toliko, da bomo vedeli,
da obstajajo in se predstavljali, kaj se pri njih dogaja. Proces pri reševanju sistemov enačb je povsem
enak procesu, ko delamo z eno lastnostjo.
Oba modela lahko sestavimo na način prikazan v (1.33) in zapišemo poenostavljeno kar v obliki prikazani v (1.34). Slednja oblika je praktična za izpeljavo metode, ne pove pa dosti o poizkusu. Tudi, ko
7
8
Biometrija
se odločimo za matrično obliko zapisa modela, moramo navajati skalarno obliko enačb. Pričakovane
vrednosti, strukturo varianc in kovarianc ter morebitne predpostavke pa prikažemo kar z matrikami.
y=
y1
y2
=
X1 β1
0
0
X2 β2
+
Z1 u1
0
0
Z2 u2
+
e1
e2
y = Xβ + Zu + e
[1.33]
[1.34]
kjer pomeni:
y
- vektor opazovanj ali meritev za obe lastnosti
X
- matrike dogodkov (ang. incidence matrix) za sistematske vplive (ang. fixed effects)
Z
- matrika dogodkov za naključne vplive (ang. random effects)
β
- vektor parametrov za sistematskih vplivov
u
- vektor naključnih vplivov (žival)
e
- vektor ostankov (residual)
Seznanimo se najprej z vsebino matrik in vektorjev v modelih.
1.6.1
Vektorji opazovanj in vektorji parametrov
Vektor opazovanj je stolpični vektor, ki ima toliko vrstic, kot smo opravili meritev za opazovano lastnost.
Kot primer bomo obdelali podatke o preizkusu mladic v pogojih reje iz tabele ??. V našem primeru smo
za dnevni prirast opravili 11 meritev in jih uvrstili v vektor y1 (ali yD ), pri debelini hrbtne slanine pa
22. Vrstni red navajanja podatkov je poljuben, vendar pa, ko ga enkrat izberemo, je sistem definiran in
ga ne smemo v naslednjih postopkih menjati. Vektorja y2 in y∗2 (oziroma yS in y∗S ) za debelino hrbtne
slanine vsebujeta iste meritve razporejene različno. Kljub temu, da vektorja nista enaka, pričakujemo
8
9
Biometrija
iste rešitve. Razporeditev rešitev pa bo odvisna od vrstnega reda parametrov.



506

 550 




 532 




 577 




 512 










499 


12
12

 466 



 15 
 13 







545



 15 
 15 







549



 14 
 14 







600



 19 
 15 







610



 23 
 16 










 12 
506
 26 
 14 





 550 





15


 25 
 12 





 532 





15 


 21 
 19 




 577 



 14 


 22 
 17 












19
512











 23  ∗  23 
∗


y1 =  499  y2 = 
 y2 = 
 y =  23  y = 



 13 
 24 

 26 


 466 







 14 
 26 

 25 


 545 







 16 
 24 





 549 


21





 12 
 25 







 600 
22



 17 
 27 







23
610



 24 
 21 







13



 24 
 19 







14



 27 
 22 







16



 19 
 23 










12
 23 
 23 




 17 



15
15

 24 




 24 




 27 




 19 




 23 
15
506
12
13
550
15
14
532
15
16
577
14
12
512
19
17
499
23
24
466
26
24
545
25
27
549
21
19
600
22
23
610
23
15
































































[1.35]
Zadnja dva vektorja y in y∗vključujeta vse meritve za obe lastnosti. Oba vektorja imata natanko 33
opazovanj, razlikujeta pa se le v vrstnem redu opazovanj.
Vektorji β1 , β2 , βD , βS in β vključujejo vse sistematske vplive. Ker sta modela za dnevni prirast in
debelino hrbtne slanine podobna, je seznam parametrov podoben, le pri slanini je dodana neodvisna
spremenljivka masa in odgovarjajoči regresijski koeficient bi kot parameter.
Vektor parametrov za sistematske vplive pri dnevnem prirastu lahko predstavljata bodisi enačba 1.36
bodisi enačba 1.37.
h
i
β01 = µ1 ... P11 P12 P13 ... M11 M12 ... F11 F12 F13
[1.36]
h
i
β0D = µD ... PD1 PD2 PD3 ... MD1 MD2 ... F D1 F D2 F D3
[1.37]
Sedaj pa sestavimo še vektor parametrov za debelino hrbtne slanine. Tudi tu lahko izberemo varianto, ko
lastnost označimo s številko (enačba 1.38) ali črko (enačba 1.39). Praviloma se odločimo samo za eno
varianto in se je vseskozi tudi držimo.
h
i
β02 = µ2 ... P21 P22 P23 ... M21 M22 ... F21 F22 F23 ... b21 b22 b23
[1.38]
9
10
β0S =
Biometrija
h
µS
..
.
. PS 1 PS 2 PS 3 .. MS 1
MS 2
..
.
. FS 1 FS 2 FS 3 .. bS 1 bS 2 bS 3
i
[1.39]
Parametri niso isti pri različnih lastnostih, saj pričakujemo pri vsaki lastnosti drugačne rešitve (ocene
oz. napovedi). Ne glede na to, ali sta modela enaka ali različna, potrebujemo za vsako lastnost druge
parametre. Vzemimo za primer samo srednjo vrednost µ. Izračunati moramo dve srednji vrednosti: eno
za srednjo vrednost za dnevni prirast µD in eno za debelino hrbtne slanine µS . Skupen rezultat ne bi imel
nobenega pomena, sicer pa tako in tako ne moramo šestevati vrednosti za dnevni prirast (v g/dan) in
vrednosti za debelino hrbtne slanine (v mm).
Ponovitve pri debelini slanine smo opravljali le z namenom, da izboljšamo zanesljivost meritev, saj
meritev slanine z ultrazvokom ni dovolj zanesljiva. Ponovitve tako ne vplivajo na število parametrov, ki
jih želimo oceniti. Seveda pa to velja za ponovitve, ki jih lahko razglasimo kot paralelke.
Drugače je v primeru, ko so meritve na isti živali (ali drugi opazovani enoti) opravljene v različnih časovnih razmikih, včasih tudi v različnem okolju. Kot primer naj navedemo analizo vzorcev mleka pri
posameznih kontrolah, v različnih laktacijah, velikost gnezda pri posameznih kotitvah, tehtanja odraslih živali v različnih časovnih razmikih, lahko pa so to tudi rezultati kemičnih analiz, ko proučujemo
zanesljivost metode. Tudi meritve debeline hrbtne slanine, merjene pri različnih masah, bi sodile v ta
sklop. Meritve niso paralelke in enakovredne. Pri takih meritvah nas zanima ponovljivost, zato v model
vključimo dodatni vpliv, ki ocenjuje skupno okolje, ki je meritvam na eni živali oz. kaki drugi opazovani
enoti skupen. Število nivojev pri takem vplivu je običajno veliko, za vsako žival vsaj eno. V primeru
meritev lastnosti mleka pa ločimo dve skupni okolji. Najprej je eno okolje, ki je skupno vsem meritvam
pri samici (kravi, ovci, kozi...), in ga imenujemo kar permanentno okolje, saj traja vse življenje. Drugi
del skupnega okolja pa je vezan na eno laktacijo: meritve znotraj laktacije so bolj primerljive, podobne,
kot meritve med laktacijami. Imenujemo ga kar skupno okolje (v laktaciji). Nivojev pri tem vplivu pa je
celo več: pri vsaki živali za vsako laktacijo eden. Torej jih je za eno žival toliko, kot ima žival laktacij.
Pri speciesih z več mladiči v gnezdu (drobnica, prašiči, kunci...) predstavlja skupno okolje za velikost
gnezda pri samici okolje, ki ga samica nudi vsem svojim potomcem. Lastnosti, ki bi podrobno opisovale
to okolje, praviloma ne moremo zmeriti. Predstavljajo pa tako imenovane materinske lastnosti, kot npr.
mlečnost pri samicah, obnašanje matere (agresivnost, nerodnost, požrtvovalnost....), pa tudi nekatere
železne navade rejca, ki povzročajo razlike med samicami. Trajne posledice za plodnost pa imajo le tisti
vplivi, ki so kreirali razvoj samice, torej okolje iz njene mladosti. Če so bili pogoji v mladosti optimalni,
bodo tudi proizvodni rezultati lahko optimalni. Na te, materinske lastnosti vpliva lahko tako genotip
(maternalni genetski vplivi) kot okolje (permanentno okolje).
V vektorjih naključnih vplivov u1 (1.40), uD (1.41), u2 (1.42), uS (1.43) in u(1.44) so nanizani naključni
vplivi, kot npr. aditivni genetski vpliv, pogosto imenovan kar preprosto “žival”. Tako smo posamene
elemente vektorjev označili kar s črkami a, ki nas spominjajo na aditivni genetski vpliv. Meritve smo
opravili na enajstih živalih, sorodstva pa pri njih nismo poznali.
u01 = a11 a12 a13 a14 a15 a16 a17 a18 a19 a110 a111
[1.40]
u0D = aD1 aD2 aD3 aD4 aD5 aD6 aD7 aD8 aD9 aD10 aD11
[1.41]
u02 = a21 a22 a23 a24 a25 a26 a27 a28 a29 a210 a211
[1.42]
u0B = aB1 aB2 aB3 aB4 aB5 aB6 aB7 aB8 aB9 aB10 aB11
[1.43]
[1.44]
u0 = u01 u02
V primeru, da imamo še dodatne živali iz porekla, za katere bi tudi radi napovedali plemensko vrednost
(aditivni genetski vpliv), živali vstavimo v vektor. V našem primeru bomo 4 prednike živali v poskusu
dodali na konec vektorja. Prikazali bomo le vektor u01 (1.45), ostali se prav tako ustrezno podaljšajo.
u01 = a11 a12 a13 a14 a15 a16 a17 a18 a19 a110 a111 a112 a113 a114 a115 [1.45]
10
11
Biometrija
1.6.2
Matrike dogodkov
Z matrikami dogodkov poskus natanko opišemo.
Vse živali pripadajo celotnemu vzorcu in bodo pri oceni “enakopravno” sodelovale.
Za sistematske vplive
Matriko dogodkov za sistematske vplive X1 za dnevni prirast nastavimo tako, da pred matriko nastavimo
vektor opazovanj y1 , da si s tem pomagamo pri nastavljanju vrstic. Nad stolpce pa si lahko napišemo
vektor parametrov β01 . Če parameter, ki označuje stolpec, prisostvuje pri meritvi, ki jo v dani vrstici
opisujemo, napišemo vrednost 1, v obratnem primeru pa 0.
0
 β1
506
 550

 532

 577


 512
y1 → 
 499

 466

 545

 549

 600
610
 →


















µ1  P11 P12
1
1
 1
1

 1
1

 1
1


1
0


0
 1

0
 1

 1
0

 1
0

 1
0
1
0
P13
0 0
0 0
0 0
0 0
1 0
1 0
1 0
0 1
0 1
0 1
0 1
M11
1
1
0
0
1
0
0
1
1
0
0
M12
0
0
1
1
0
1
1
0
0
1
1
F11 F12  F13
1 0 0
0 1 0 

0 0 1 

1 0 0 


0 1 0 

0 1 0 

0 0 1 

1 0 0 

0 0 1 

0 0 1 
0 1 0
← X1
[1.46]
Tudi pri debelini hrbtne slanine ravnamo enako. Le pri regresijskih koeficientih vpišemo vrednost neodvisne spremenljivke x. Če model tako zahteva, jo korigiramo na konstantno vrednost ali povprečje.

µ
2
















































































β02





















y2 → 



















→
12
15
15
14
19
23
26
25
21
22
23
13
14
16
12
17
24
24
27
19
23
15
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
P21 P22
1 0
1 0
1 0
1 0
0 1
0 1
0 1
0 0
0 0
0 0
0 0
1 0
1 0
1 0
1 0
0 1
0 1
0 1
0 0
0 0
0 0
0 0
P23
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
1
1
1
1
11
M21 M22
1 0
1
1 0
0
0 1
0
0 1
1
1 0
0
0 1
0
0 1
0
1 0
1
1 0
0
0 1
0
0 1
0
1 0
1
1 0
0
0 1
0
0 1
1
1 0
0
0 1
0
0 1
0
1 0
1
1 0
0
0 1
0
0 1
0
F21 F22 F23
b21 b22 b23

0 0
2.
0
0
1 0
−2. 0
0 

0 1
5.
0
0 

0 0
3.
0
0 

1 0
0 −4. 0 

1 0
0
1.
0 

0 1
0
3.
0 

0 0
0
0 −1. 

0 1
0
0
0. 

0 1
0
0 −3. 


1 0
0
0
2. 
 ← X2
0 0
2.
0
0 

1 0
−2. 0
0 

0 1
5.
0
0 

0 0
3.
0
0 

1 0
0 −4. 0 

1 0
0
1.
0 

0 1
0
3.
0 

0 0
0
0 −1. 

0 1
0
0
0. 

0 1
0
0 −3. 
1 0
0
0
2.
[1.47]
12
Biometrija
y→
y1
y2
β0 → β01 β02 X1 0
←X
0 X2
33x1
[1.48]
Za naključne vplive
0
 u1 → 
506
 550 


 532 


 577 




 512 
y1 → 

 499 


 466 


 545 


 549 


 600 
610




















y2 → 




















y→
u02 →
12
15
15
14
19
23
26
25
21
22
23
13
14
16
12
17
24
24
27
19
23
15
y1
y2
33x1
a11 a12
1
 0

 0

 0


 0

 0

 0

 0

 0

 0
0









































a13 a14 a15 a16 a17
0 0 0 0 0 0
1 0 0 0 0 0
0 1 0 0 0 0
0 0 1 0 0 0
0 0 0 1 0 0
0 0 0 0 1 0
0 0 0 0 0 1
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
a21 a22

1
 0

 0

 0

 0

 0

 0

 0

 0

 0


 0

 1

 0

 0

 0

 0

 0

 0

 0

 0

 0
0
a18
0
0
0
0
0
0
0
1
0
0
0
a23 a24 a25 a26 a27
0 0 0 0 0 0
1 0 0 0 0 0
0 1 0 0 0 0
0 0 1 0 0 0
0 0 0 1 0 0
0 0 0 0 1 0
0 0 0 0 0 1
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
1 0 0 0 0 0
0 1 0 0 0 0
0 0 1 0 0 0
0 0 0 1 0 0
0 0 0 0 1 0
0 0 0 0 0 1
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
0 0 0 0 0 0
u0 → u01 u02 Z1 0
←Z
0 Z2
a19 a110
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
1 0
0
0 1
0
0 0
1
a28
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
a111



















a29 a210 a211

0 0
0
0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

1 0
0 

0 1
0 


0 0
1 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

0 0
0 

1 0
0 

0 1
0 
0 0
1
← Z1
[1.49]
← Z2 [1.50]
[1.51]
12
13
Biometrija
1.6.3
Matrike varianc in kovarianc
Izpeljimo strukturo varianc in kovarianc za dnevni prirast y1 (fenotipske variance in kovariance).
V1 =
var (y1 ) =
var X1 β1 + Z1 u1 + e1 =
= cov X1 β1 , β01 X01
+ cov Z1 u1 , β01 X01 +
cov e1 , β01 X01 + cov X1 β1 , u01 Z01 +
|
{z
}
|
{z
}
|
{z
}
|
{z
}
0
0
0
0
[1.52]
+cov Z1 u1 , u01 Z01
+cov e1, u01 Z01 +
cov X1 β1 , e01 +
cov Z1 u1 , e01
| {z }
| {z }
| {z }
0
0
0
+cov e1 , e01
= Z1 var (u1 ) Z01 +
var (e1 )
= Z1 G1 Z01 + R1
Matrika varianc in kovarianc za ostanek (R) je pogosto enostavna (1.53) na diagonali so variance za
ostanek, nediagonalni elementi, ki predstavljajo kovariance med dvema meritvama, pa so enake nič.
0
 e1 → 
e11
 e 
 12 
 e 
 13 
 e 
 14 


 e15 
e1 → 

 e16 


 e17 


 e18 


 e19 


 e110 
e111
 e11 e12 e13 e14 e15 e16 e17 e18 e19 e110 e111 
σ2e1
0
0
0
0
0
0
0
0
0
0
 0 σ2
0
0
0
0
0
0
0
0
0 


e1
 0

2
0
σ
0
0
0
0
0
0
0
0


e1
 0
2
0
0
0
0
0
0 
0
0 σe1 0




0
0
0 σ2e1 0
0
0
0
0
0 
 0

 ← R1 = Iσ2e1 [1.53]
0
0
0
0 σ2e1 0
0
0
0
0 
 0


0
0
0
0
0 σ2e1 0
0
0
0 
 0


 0
0
0
0
0
0
0 σ2e1 0
0
0 


 0
0
0
0
0
0
0
0 σ2e1 0
0 


 0
0
0
0
0
0
0
0
0 σ2e1 0 
0
0
0
0
0
0
0
0
0
0 σ2e1
V izjemnem primeru, ko merimo na isti živali samo eno meritev in živali med seboj niso sorodne, je tudi
matrika varianc in kovarianc za naključne vplive (G1 ) enostavna (1.54). Vedeti pa moramo, da je to prej
izjema kot pravilo!
0
 u1 → 
a11
 a 
 12 
 a 
 13 
 a 
 14 


 a 
u1 →  15 
 a16 


 a17 


 a18 


 a19 


 a110 
a111
 a11 a12 a13 a14 a15 a16 a17 a18 a19 a110 a111 
σ2a1
0
0
0
0
0
0
0
0
0
0
 0 σ2
0
0
0
0
0
0
0
0
0 


a1
 0
0 σ2a1 0
0
0
0
0
0
0
0 


 0
0
0 σ2a1 0
0
0
0
0
0
0 




2
0
0
0
0
σ
0
0
0
0
0
0


a1

 ← G1 = Iσ2a1 [1.54]
0
0
0
0 σ2a1 0
0
0
0
0 
 0


0
0
0
0
0 σ2a1 0
0
0
0 
 0


 0
0
0
0
0
0
0 σ2a1 0
0
0 


 0
0
0
0
0
0
0
0 σ2a1 0
0 


 0
0
0
0
0
0
0
0
0 σ2a1 0 
0
0
0
0
0
0
0
0
0
0 σ2a1
V tem izjemnem primeru je tudi matrika fenotipskih varianc in kovarianc V diagonalna matrika, posamezni diagonalni elementi pa so vsota okoliške (σ2e1 ) in genetske (σ2a1 ) komponente variance.
V1 = Z1 G1 Z01 + R1 = I σ2a1 + σ2e1 = diag σ2a1 + σ2e1
[1.55]
Za debelino hrbtne slanine imamo dvakrat toliko opazovanj: na vsaki živali po dve. Ker smo merili
z istim aparatom, delo je opravljal isti delavec..., so meritve identično porazdeljene (imamo samo eno
13
14
Biometrija
varianco za ostanek). Vendar pa meritvi na isti živali praviloma nista neodvisni - žival smo pitali pod
istimi pogoji, zato je tudi okolje v enaki meri ponagajalo. Če se je žival zaradi tega bolj zredila, kot bi se
pod strogimi pogoji testa, bomo namerili tudi debelejšo slanino pri obeh ponovitvah. Med ponovitvama
na isti živali torej obstaja podobnost - kovarianca. Oblika matrike varianc in kovarianc za ostanek je
odvisna od razporedive meritev v vekorju y. Če razvrstimo meritve tako, da najprej nanizamo prve
meritve na vseh živalih in nato dodamo še druge meritve (prvi vektor za debelino hrbtne slanine v enačbah
(1.31), dobimo matriko iz enačbe (1.42). Ko pa razvrstimo ponovitvi po parih - znotraj živali (drugi
vektor za debelino hrbtne slanine v enačbah (1.31)), pa dobimo matriko iz enačbe (1.43) in (1.44).
R2 =
Iσ2e2
Iσe22
Iσe22
Iσ2e2
22x22
=
σ2e2
σe22
σe22
σ2e2
⊗ I11 = R0 ⊗ I11
2x2
14
[1.56]
e21 1
e22 1
e23 1
..
.







 e29 1

 e2101


e2 →  e2111
 ···

 e21 2

 e22 2

 e
 23 2

..

.

 e
 29 2
 e
2102
e2112

e02 →




























h
e21 1 e22 1 e23 1 · · · e29 1 e2101 e2111
2
 σe2


σ2e2



σ2e2


..

.



σ2e2


σ2e2



σ2e2



 ··· ··· ··· ··· ··· ··· ···

 σ
 e22


σe22



σe22


..

.



σe22



σe22

σe22
..
. e21 2 e22 2 e23 2
..
. σe22
..
.
σe22
..
.
σe22
..
.
..
.
..
.
..
.
..
. ··· ··· ···
..
. σ2e2
..
.
σ2e2
..
.
σ2e2
..
.
..
.
..
.
..
.
.
..
.
···
..
σ2e2
···
σe22
σ2e2
···
σe22

















σe22 


··· 


















2
σe2
· · · e29 2 e2102 e2112
i
← R2
[1.57]
Biometrija
15
15



















e2 → 



















e211
e212
······
e22 1
e22 2
······
e23 1
e23 2
······
..
.
..
.
······
e29 1
e29 2
······
e2101
e2102
······
e2111
e2112
e02 →





























































































h
16
···
···
···
···
···
···
···
···
···
···
···
···
σe22
σe22
σ2e1
σ2e1
e211 e212
..
.
. e22 1 e22 2 .. e23 1
..
..
.
.
..
..
.
.
..
.
. · · · · · · .. · · ·
..
.
. σ2e1 σe22 ..
..
.
. σe22 σ2e1 ..
..
.
. · · · · · · .. · · ·
..
..
.
. σ2e1
..
..
.
. σe22
..
.
. · · · · · · .. · · ·
..
..
.
.
..
..
.
.
..
.
. · · · · · · .. · · ·
..
..
.
.
..
..
.
.
..
.
. · · · · · · .. · · ·
..
..
.
.
..
..
.
.
..
.
. · · · · · · .. · · ·
..
..
.
.
..
..
.
.
..
.
.e23 2 .. · · · · · ·
..
..
.
.
..
..
.
.
..
.
· · · . · · · · · · ..
..
..
.
.
..
..
.
.
..
..
··· . ··· ··· .
.
..
σe22 ..
.
..
..
2
σe1 .
.
..
.
· · · . · · · · · · ..
.. . .
..
.
.
.
..
. . ..
. .
.
..
.
· · · . · · · · · · ..
..
..
.
.
..
..
.
.
..
.
· · · . · · · · · · ..
..
..
.
.
..
..
.
.
..
.
· · · . · · · · · · ..
..
..
.
.
..
..
.
.
..
. e29 1 e29 2
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
.
σ2e1 σe22 ..
.
σe22 σ2e1 ..
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
..
. e2101 e2102
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
..
.
..
.
.
· · · · · · ..
.
σ2e1 σe22 ..
.
σe22 σ2e1 ..
.
· · · · · · ..
..
.
..
.
···
σe22
σ2e1
σ2e1
σe22
···
···
···
···
···
···
···
···
···
···
···
i


























 ← R2


























..
. e2111 e2112

[1.58]
16
Biometrija
17
Biometrija
R2 = I11 ⊗
σ2e2
σe22
σe22
σ2e2
= I11 ⊗ R0
[1.59]
2x2
Ker so živali nesorodne, za debelino hrbtne slanine pa želimo samo eno plemensko vrednost, je matrika
varianc in kovarianc za direktni aditivni vpliv enostavna, kot jo prikazujemo v (1.60).
G2 = I11 σ2a2
[1.60]
Sedaj pa izračunajmo še matriko fenotipskih varianc in kovarianc V2 . Vzemimo primer, ko so nanizane
najprej prve meritve in nato še ponovitve. Rezultat (1.61) je izjemoma, zaradi že omenjenih predpostavk,
blokdiagonalna matrika.
V2 =
2
σa2
=
σ2a2
+ R2 =
σ2a2
⊗ I11 +
σ2a2
Z2 G2 Z02
I11
I11
I11 σ2a2
σ2e2
σe22
σe22
σ2e2
I11 I11
I11 I11 + R0 ⊗ I11 =
σ2a2 + R0 ⊗ I11 =
I
I
11
11
2
[1.61]
σa2 + σ2e2 σ2a2 + σe22
⊗ I11 =
⊗ I11 = V0 ⊗ I11
σ2a2 + σe22 σ2a2 + σ2e2
Sedaj pa za vajo ponovimo še izračun kovariance med meritvami za dnevni prirast y1 in ostanki e1 ter
med meritvami y1 in slučajnim vplivom u1 .
cov y1 , e01 = cov X1 β1 + Z1 u1 + e1 , e01 = Z1 cov u1 , e01 + var (e1 ) = R1
[1.62]
cov y1 , u01 = cov X1 β1 + Z1 u1 + e1 , u01 = cov X1 β1 , u01 + cov Z1 u1 , u01 + cov e1 , u01
[1.63]
= Z1 cov u1 , u01 = Z1 var (u1 ) = Z1 G1 = C1
Pričakovane vrednosti ter variance in kovariance za slučajne vplive so pogosto predstavljene v združeni
obliki. V nasednjih enačbah smo prikazali model (1.34) z obema lastnostima.

 

u1
0
E  e1  =  0 
y1
X1 β1

 
u1
G1
var  e1  =  0
y1
G1 Z01
[1.64]
0
R1
R1

G1

R1
0
Z1 G1 Z1 + R1
[1.65]
Vajo ponovite še za debelino hrbtne slanine in za model z obema lastnostima skupaj! Potrebovali bomo še
rezultate iz naslednje razpredelnice. Pripišite rezultate, da jih ne bomo kasneje iskali! Nato pa sestavite
enačbo za pričakovane vrednosti po zgledu (1.62) in prikažite strukturo varianc in kovarianc po zgledu
(1.63).
cov y2 , e02 =
cov y2 , u02 =
cov (y, e0 )=
cov (y, u0 )=
cov y, e02 =
cov y1 , u02 =
cov y2 , e01 =
cov y2 , u01 =
cov y1 , y02 =
cov y2 , y01 =
17
18
Biometrija
Pri dvolastnostnem modelu splošno obliko enačb še razčlenite, da bodo vidne povezave med lastnostima.
Izpopolnite naslednji dve enačbi!




u1
···············
 u2 

 

 e1   · · · · · · · · · · · · · · · 

 
E
 e2  =  · · · · · · · · · · · · · · · 
  ··············· 

 y1 
···············
y2


..
..
..
..
..
.
.
.
.
.


..
..
..
..
..


 ······ . ······ . ······ . ······ . ······ . ······ 


..
..
..
..
..




.
.
.
.
.


..
..
..
..
..

 

 ······ . ······ . ······ . ······ . ······ . ······ 
u1


..
..
..
..
..

 u2  
.
.
.
.
.
 



 e1  
.
.
.
.
.
 

var 
 e2  =  · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · 
 


..
..
..
..
..

 y1  
.
.
.
.
.




.
.
.
.
.
y2
 · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · 




..
..
..
..
..


.
.
.
.
.




 · · · · · · ... · · · · · · ... · · · · · · ... · · · · · · ... · · · · · · ... · · · · · · 


..
..
..
..
..
.
.
.
.
.
1.7
Determinanta
1.8
Inverzna matrika
1.9
Splošna inverza
Vzemimo, da imamo sistem enačb Ax = r. Rešitev za vektor neznanih parametrov x dobimo tako, da od
spredaj množimo z A−1 , kar lahko storimo ob pogoju, da ima matrika A poln rang. Vendar pa obstajajo
številni primeri, ko to ne drži: rang matrike A je manjši od reda matrike, determinanta matrike je enaka
nič. Sistem enačb v tem primeru nima ene same rešitve. Če ima rešitev, jih ima neskončno mnogo. Eno,
izbrano rešitev pa lahko dobimo tako, da uporabimo splošno inverzo. Označili jo bomo z A− . Izbrali pa
bomo tisto, pri kateri velja: AA− A = A. Praviloma pa niti AA− niti A− A nista enaka identični matriki I.
Matrika A ima neskončno mnogo splošnih inverz, če ima vsaj eno. Pri vsaki možni rešitvi sistema
uporabimo drugo splošno inverzo. Poglejmo pa si enostaven postopek, da najdemo prvo splošno inverzo.

  
2
3 −2 1
x1
 −2 0 1   x2  =  1 
1 −2 2
x3
3

[1.66]
• v matriki A poiščite vse odvisne vrstice, jih napolnite z ničlami. Z ničlami napolnimo tudi stolpec.
Pri simetričnih matrikah izberemo isto vrstico in isti stolpec.










3 −2 0
3 0 1
0 0 0
0 −2 1
3 0 1
 −2 0 0  ali  0 0 0  ali  0 0 1  ali  0 0 1  ali  −2 0 1  . . .[1.67]
0
0 0
1 0 2
0 −2 2
0 0 0
0 0 0
• ostane vam samo toliko neodvisnih vrstic in stolpcev, kot je rang sistema
18
19
Biometrija
• iz neodvisnih vrstic in stolpcev nastavite podmatriko in poiščite njeno inverzo
3 −2
3 1
0
1
−2 1
3 1
...
−2 3
1 3
−2 −2
0 1
−2 1
1
−
4
0 2
2 3
1
5
2 −1
−1 3
1
2
−2 −1
2
0
1
−
2
1 −1
0 −2
1
5
1 −1
2 3
[1.68]
...
[1.69]
• inverzi dodajte izpuščene vrstice in stolpce, ki so polni samih ničel










0 2 0
2 0 −1
0 0 0
0 1 −1
1 0 −1
1
1
1
1
1
0 0 0 
0 2 −1 
0 0 −2 
2 0 3  . . .[1.70]
−  2 3 0 
4
5
2
2
5
0 0 0
−1 0 3
0 2 3
0 0 0
0 0 0
Tako pripravljene inverze lahko uporabimo pri reševanju sistema enačb. Rešitev lahko dobimo neskončno
mnogo, objavili pa bomo le tisto, kar je enako pri vseh rešitvah - ocenljive funkcije.
1.10
Direktna vsota
A 0
A⊕B=
0 B
[1.71]
Možni so različni zapisi.

k


Σ⊕i Xi = Σ+i Xi = ⊕ Xi = Xi ⊕ Xi ⊕ · · · ⊕ Xi = 

i

Xi 0 · · · 0
0 Xi · · · 0
..
.. . .
.
. ..
.
.
0 0 · · · Xi




[1.72]
Za vključene matrike sploh ni potrebno, da bi bile istega ranga.

x0 0 0
x0 ⊕ X ⊕ z =  0 X 0 
0 0 z

[1.73]
Za matrike odgovarjajočega ranga drži
(A ⊕ B) + (C ⊕ D) =
A 0
0 B
+
C 0
0 D
=
A+C
0
0
B+D
=A+C⊕B+D
[1.74]
Če je Ai polnega ranga, velja naslednje:

⊕ −1 

Σi Ai
=

Ai 0 · · · 0
0 Ai · · · 0
..
.. . .
.
. ..
.
.
0 0 · · · Ai
−1







=

A−1
0 ··· 0
i
0 A−1
··· 0
i
..
..
..
..
.
.
.
.
0
0 · · · A−1
i



 = Σ⊕i A−1
i

[1.75]
Za determinanto pa velja:
k
⊕ Y
Σ Ai =
|Ai |
[1.76]
i
i=1
19
20
Biometrija
1.11
Kronecker produkt
Vzemimo primer, kjer imamo dve lastnosti (y in z) za vsako od dveh živali. Če lahko zapise opišemo z
linearnim modelom, imamo
 
µy
y1
 z2   µz
 

 y3  =  µy
µz
z4

 
ey1
uy1
  uz1   ez1
 
+
  uy2  +  ey2
ez2
uz2






[1.77]
 
σa12
a12 σ2a1 a12 σa12
σ2a1
uy1
2
 uz1   σa12
a12 σa12 a12 σ2a2
σa2
=
var 
 uy2   a12 σ2
σa12
a12 σa12
σ2a1
a1
2
a12 σa12 a12 σa2
σa12
σ2a2
uz2





2

σa1 σa12
σ2a1 σa12
a
 1
1G0 a12 G0
σa12 σ2a2 12 σa12 σ2a2 


= A ⊗ G0
=
 = a12 G0 1G0
σ2a1 σa12
σ2a1 σa12
1
a12
σa12 σ2a2
σa12 σ2a2
[1.78]

[1.79]
Matrika A predstavlja matriko sorodstva. Element a12 je koeficient sorodstva med obema živalima. Matrika G0 vsebuje genetske variance in kovariance med lastnostima, merjenima na isti živali.
Poglejmo sedaj še varianco za ostanek (1.80)! Lastnosti merjene na isti živali so med se
  2
ey1
σe1 σe12
0
0
 ez1   σe12 σ2
0
0
e2
 
var 
 ey2  =  0
0
σ2e1 σe12
ez2
0
0
σe12 σ2e2

σ2e1 σe12
0
 1 σe12 σ2
e2 2
=

σe1 σe12
1
0
σe12 σ2e2





[1.80]

σ2e1 σe12
1R
0R
σe12 σ2e2 
0
0
=
= I ⊗ R0 = R
σ2e1 σe12 
0R0 1R0
σe12 σ2e2
[1.81]
Navedimo še nekaj lastnosti Kronecker produkta. Vzemimo matriki A pxq in Bmxn .
A ⊗ B = C pm×qn
[1.82]
(A ⊗ B)0 = A0 ⊗ B0
[1.83]
x0 ⊗ y = yx0 = x0 ⊗ x0
[1.84]
k ⊗ A = kA = A ⊗ k
[1.85]
A1 A2
A⊗
⊗B=
A1 ⊗ B A2 ⊗ B
[1.86]
A ⊗ B1 A ⊗ B2
[1.87]
B1 B2
,
Če obstajajo produkti, velja:
(A ⊗ B) (X ⊗ Y) = AX ⊗ BY
[1.88]
20
21
Biometrija
(A ⊗ B)−1 = A−1 ⊗ B−1
[1.89]
rang (A ⊗ B) = rang (A) • rang (B)
[1.90]
tr (A ⊗ B) = tr (A) • tr (B)
[1.91]
|Mm×m ⊗ Nn×n | = |M|m |N|n
[1.92]
Lastna_vrednost (A ⊗ B) = Lastna_vrednost (A) • Lastna_vrednost (B)
[1.93]
(A ⊗ B) ⊗ C = A ⊗ (B ⊗ C)
[1.94]
kA ⊗ B = A ⊗ kB = k (A ⊗ B)
[1.95]
(A + B) ⊗ C = (A ⊗ C) + (B ⊗ C)
[1.96]
1.12
Odvajanje matrik
Pri odvajanju uporabimo splošni model (1.97), poljubno vrstico i pa bomo prikazovali na dva načina, kot
(1.98) ali (1.99).
y = Xβ + Zu + e
[1.97]
y1 = x0i β + z0i u + e0i
[1.98]
yi =
p
X
xi j β j +
j=1
1.12.1
q
X
zi j u j + ei
[1.99]
j=1
Odvod matrike po skalarju
Vzemimo matriko Y reda m × n, katere elementi so funkcije skalarja z. Potem je:
∂Y
=
∂z
1.12.2
∂yi j
∂z
red (Y) = m × n
red (z) = 1 × 1
red (A) = m × n
=A
[1.100]
Odvod skalarja po matriki
Naj bo skalar h (X) funkcija matrike X.

∂h (X)




∂x11

∂h (X) 
.
..
=

∂X


∂h (X)



∂xm1
···
···
∂h (X)
∂h (X)
..
.
∂x1n
∂xmn
red (X) = m × n
red (h (X)) = 1 × 1
red (A) = m × n







=A
[1.101]






[1.102]
21
22
Biometrija
1.12.3
Odvod vektorja po vektorju
.
.
. i
∂y h ∂y
∂y
∂y
·
·
·
=
=
∂z1
∂z2
∂zn
∂z0
. 
.
.

∂y
∂y1
∂y1
1
···
.∂z1
.∂z2
.∂zn 

 ∂y2

∂y2
∂y
2
···


∂z1
∂z2
∂zn 
=


..
..
..
..


.
.
.
.

. 
.
.
∂yk
∂yk
∂z1
∂z2
···
[1.103]
[1.104]
∂yk
∂zn
k×n
red (z0 ) = 1 × n
red (y) = k × 1
red (A) = k × n
[1.105]
Vzemimo sedaj model (1.97) in odvajajmo y najprej na β0 in nato še na β.
.
.
.
∂y
∂y
∂y
∂y
·
·
·
=
=
∂β p
∂β1
∂β2
∂β0
.
.
.


∂y1
∂y1
∂y
1
···


∂β1

x11 x12 · · · x1p
.∂β2
.∂β p 
 ∂y2 .

∂y2

  x21 x22 · · · x2p 
· · · ∂y2


∂β1
∂β2
∂β p  = 

  ..
=X
.
.
.
.
.
.
.
.
.
..

  .
.
.
. 
..
..
..
.


.
.
.


xn1 xn2 · · · xnp
∂yn
∂yn
· · · ∂yn
∂β1
∂β2
[1.107]
∂β p
red (y) = n × 1
red β0 = 1 × p
red (X) = n × p
[1.108]
Poglejmo si tipični element matrike odvodov (1.109) in nato še primer za
parameter v modelu (1.110).
P
Pq
p
∂
x
β
+
z
u
+
e
i
j
j
i
j
j
i
j=1
j=1
∂yi
=
= xik
∂βk
∂βk
P
Pq
p
∂
x
β
+
z
u
+
e
1
j=1 1 j j
j=1 1 j j
∂yi
=
= x12
∂β2
∂β2

 .
 
.
.
.
∂y1
∂y2
∂y
· · · ∂yn

 .∂β1  
∂β
∂β
x11 x12
.∂β1 

  ∂y1 . 1 ∂y2 . 1
 ∂y
∂yn





·
·
·
x21 x22
∂y 
∂β2
∂β2
∂β2  = 
∂β2  = 
=
  ..
 
..
.
.
.
.
..
  .
 
∂β 
..
..
..
.
.

 ...
 
.
.

 ∂y
  ∂y .
x p1 x p2
∂y2
1
· · · ∂yn
∂β p
[1.106]
∂β p
∂β p
prvo opazovanje in drugi
[1.109]
[1.110]

· · · x1n
· · · x2n 

0
..  = X [1.111]
..
.
. 
· · · x pn
∂β p
red (y) = n × 1
red (β) = p × 1
red (X0 ) = n × p
[1.112]
∂Zu
= Z0
∂u
[1.113]
22
23
Biometrija
1.12.4
Odvajanje produkta matrik
V skalarni algebri velja
∂uv
=
∂x
∂u
∂x
v+u
∂v
∂x
[1.114]
V skalarni algebri velja isto pravilo najdemo tudi v matrični algebri (1.115). Matrika U je reda m × n ter
matrika V reda n × q. Elementi matrik so funkcije skalarne spremenljivke x.
∂UV
=
∂x
∂U
∂x
V+U
∂V
∂x
[1.115]
PRIMER:
V sistemu normalnih enačb pri metodi najmanjših kvadratov (1.116) dobimo vsoto kvadratov za model
z izrazom (1.117).
b = X0 y
X0 Xβ
[1.116]
b0 X0 Xβ
b
β
[1.117]
Odvajajmo vsoto kvadratov za model na eno izmed ocen (npr. βi ):
b0 X0 Xβ
b ∂β
b0 X0
b
∂β
b+β
b0 X0 ∂Xβ
=
Xβ
∂β̂i
∂β̂i
∂β̂i
[1.118]
Poskusimo sedaj rešiti samo košček problema:


x1i

b 
∂Xβ
red (ti ) = n
 x2i 
=  .  = ti
.
i = 1, 2, . . . , p
 . 
∂β̂i
x4i
[1.119]
Sedaj bo pa že šlo:
∂β0 XXβ
=
∂βi
b +β
b0 X0 ti = 2t0 Xβ
b
t0i Xβ
i
| {z }
= | {z }
skalar skalar
[1.120]
Še malo posplošimo:


0 Xβ
b
2t
1
b X0 Xβ
b 
∂β


..
=
 = 2
.
b
∂β
b
2t0 Xβ
0

p

t01
..  Xβ
0 b
.  b = 2X Xβ
t0p
23
[1.121]
24
Biometrija
PRIMER:
Skupno vsota kvadratov (total sum of square, TSS) za opazovanja lahko odvajamo na dva načina. TSS
je skalar, vektor opazovanj y pa stolpični vektor reda n × 1, zato bo rezultat tudi stolpični vektor istega
reda. Ker vemo, da je TSS vsota kvadratov za opazovanja, lahko uberemo naslednjo pot.
 P .

∂ y21


 P .∂y1 
2y1
 ∂ y2

  2y2 
2
∂y0 y 



∂y2 
=
[1.122]
 =  ..  = 2y
.

  . 
∂y
..


 P 2.

2yn
∂ yn
∂yn
Po postopku za odvajanje produkta matrik po sklarju, moramo odvod najprej razbiti tako, da dobimo v
imenovalcu skalarje (1.123). Nato vsako vrstico odvajamo, kot to prikazuje (1.124). Pri tem si pomagamo še z enačbo (1.125). Dobljene vrednosti za posamezne vrstice vstavljamo nazaj v enačbo (1.123).
Rezultat je podoben kot pri skalarni algebri.




∂y0 y 

=

∂y



∂y0 y
∂y1
∂y0 y
∂y2
..
.
∂y0 y
∂yi
..
.
∂y0 y
∂yn


2y1
2y2
..
.

 

 

 

 

 
 = 2y
=
  2yi 
  . 
  . 
. 

2yn
[1.123]
∂y
∂y0 y ∂y0
=
y + y0
= t0i y + y0 ti = yi + yi = 2yi
∂yi
∂yi
∂yi
[1.124]
∂y0 = 0 0 · · · 1i · · · 0 = t0i
∂yi
[1.125]
1.12.5
Odvajanje inverze
Vzemimo matriko M s polnim rangom in inverzno matriko M−1 . Hitro lahko ugotovimo, da velja (1.126),
saj identična matrika ni funkcija skalarne spremenljivke z.
∂MM−1 ∂I
=
=0
∂z
∂z
[1.126]
Če bi zadevo poskusili rešiti na način, ki smo ga obdelali v prejšnjem poglavju (1.127), nam ostane
neznanka prav odvod inverzne matrike M−1 po skalarni spremenljivki z. Rezultat pa itak že poznamo.
∂MM−1 ∂M −1
∂M−1
=
M +M
=0
∂z
∂z
∂z
[1.127]
Sedaj pa nam ostane samo, da uganemo neznani odvod. Pravzaprav bomo (1.128) samo preoblikovali:
poznani prvi člen bomo prenesli na drugo stran enačbe (pridobimo negativen predznak) in obe strani od
spredaj množili z inverzno matriko M−1 .
∂M−1
∂M −1
= −M−1
M
∂z
∂z
[1.128]
24
25
Biometrija
1.12.6
Odvajanje splošne inverze
Splošna inverza je vsaka matrika G, ki zadovolji:
AGA = A
[1.129]
Matrika A je lahko katerakoli matrika, lahko je torej tudi vrstični ali stolpični vektor. Naj bosta matriki
A in G funkciji skalarja x. Sedaj pa poiščimo odvod matrike A po x-u.
∂A
∂AGA ∂A
∂GA ∂A
∂G
∂A
=−
=
GA + A
=
GA + A
A + AG
∂x
∂x
∂x
∂x
∂x
∂x
∂x
[1.130]
Poskusimo sedaj množiti od spredaj z AG in od zadaj z GA.
AG
∂A
∂A
∂G
∂A
GA − AG GA = A
A + AG GA
∂x
∂x
∂x
∂x
0=A
A
[1.131]
∂G
∂A
A + AG GA
∂x
∂x
[1.132]
∂G
∂A
A = −AG GA
∂x
∂x
[1.133]
Rezultat je podoben kot (1.128), če je G = A−1 .
1.12.7
Odvajanje funkcije determinante
Za matriko A s polnim rangom velja (Searle,1982)
−1
∂ |A|
= |A| A0
∂A
[1.134]
−1
∂ln |A|
1 ∂ |A| |A| (A0 )−1
=
•
=
= A0
∂A
|A| ∂A
|A|
[1.135]
∂ln |V|
∂ln|V|
= tr ∂x = tr ∂ln|V|
∂V •
∂x
| {z }
∂V
∂x
= tr V−1 ∂V
∂x
[1.136]
skalar
1.12.8
1.13
Chain-ovo pravilo
Sled matrike
Definicija: Sled matrike (ang. trace) je vsota diagonalnih elementov matrike.
X
A = ai j ⇒ tr (A) =
ai j
[1.137]
Zakon ciklične komutativnosti
tr A pxn Bnxm Cmxp = tr Cmxp A pxn Bnxm = tr Bnxm Cmxp A pxn
25
[1.138]
26
Biometrija
Sled skalarja je skalar.
tr σ2e = σ2e
[1.139]
Sled vsote matrik
tr (A + B) = tr (A) + tr (B)
[1.140]
Sled produkta matrike s skalarjem
tr (R) = tr I4 σ2e = σ2e tr (I4 ) = 4σ2e
[1.141]
Matematično upanje in sled matrike
E (tr (A)) = tr (E (A))
[1.142]
tr (B) = V sota lastnih vrednosti (eigenvalues) matrike B
[1.143]
P
∂tr (B) ∂ ni=1 bii
=
=I
∂B
∂B
[1.144]
∂tr (AB) ∂tr (BA)
=
= A,
∂B
∂B
[1.145]
∂tr (ABC) ∂tr (BCA)
=
= A, C,
∂B
∂B
[1.146]
∂tr (B, AB)
= BA + A, B
∂B
[1.147]
A = A, ⇒
∂tr (B, AB)
= 2AB
∂B
Etr (X) = E
n
X
i=1
!
xii
=
n
X
[1.148]
E (xii ) = trE (X)
[1.149]
i=1
26
27
Biometrija
PRIMER: Opravili smo dve meritvi na dveh nesorodnih živalih. Rezultati so v naslednji tabeli. Nastavimo matriko varianc in kovarianc za aditivni genetski vpliv (G), ostanek (R) in opazovanja (V)! Pri tem
predpostavimo naslednji model. Izračunajmo tudi sledi matrik G, R in V!
a1 a2
y11 y21
y12 y22
yi j = µ + ai + ei j
ai ∼ IID 0; σ2a ; ei j ∼ IID 0; σ2e
  2
σe
e11
 e12  
σ2e
 
R = Var 
 e21  = 
σ2e
σ2e
e22

G = Var
a1
a2
=
σ2a




σ2a
  2
y11
σe + σ2a
σ2a
2
2



y12  
σe + σ2a
σa
V = R + ZGZ, = Var (y) = Var 
=
 y21  
σ2e + σ2a
σ2a
y22
σ2a
σ2e + σ2a

tr (R) = tr I4 σ2e = σ2e tr (I4 ) = 4σ2e
tr (G) =
X
tr (V) =
X
σ2a = 2σ2a
σ2e + σ2a = 4 σ2e + σ2a
Slednje lahko izračunamo tudi po naslednjem postopku.
tr (V) = tr (R + ZGZ, ) = tr (R) + tr (ZGZ, ) = 4σ2e + tr Z, ZI2 σ2a = 4σ2e + 4σ2a
27




28
Biometrija
PRIMER:
y = Xβ + Zu + e
E (yi ) = xi β
Var (yi ) = σ2e + σ2u
Po definiciji je
V = E (yy, ) − E (y) E (y, )
E (yy, ) = V + E (y) E (y, )
E (yy, ) = E (tr (yy, )) = E tr (yy, ) = tr E (yy, ) =
!
β, X, Xβ
, ,
= tr (V + Xββ X ) = tr (V) + tr | {z }
skalar
P
= n σ2e + σ2u + β, X, Xβ = n σ2e + σ2u + β, X, Xβ
E (yy, ) = E (Xβ+Zu + e) (Xβ+Zu + e), = E (Xβ+Zu + e) (β, X, + u, Z, + e, )
= E (Xββ, X, ) + E (Zuβ, X, ) + E (eβ, X) + E (Xβu, Z, ) + E (Zuu, Z, ) +
+E (eu, Z, ) + E (Xβe, ) + E (Zue, ) + E (ee, )
= ZGZ, +R + Xββ, X, = V + Xββ, X,
1.14
KVADRATNE OBLIKE (QUADRATIC FORM)
Splošna oblika kvadratne oblike (quadratic form) je y, Qy. Matriko Q imenujemo matriko kvadratne
oblike. Predpostavimo lahko, da je simetrična. V primeru, da Q ni simetrična, lahko poiščemo drugo
matriko kvadratne oblike po enačbi (1.150).
Q + Q,
2
[1.150]
Za odvisne spremenljivke (opazovanja) v vektorju y naj velja, da so porazdeljene po naslednjem porazdelitvenem zakonu:
y ∼ (Xβ, V)
[1.151]
Pripravimo si še nekaj enačb
V = var (y) = var (y − Xβ) = E (y − Xβ) (y − Xβ), =
= E (yy, −yβ, X, −Xβy, + Xββ, X, ) = yy, − (Ey) β, X, − Xβ (Ey, ) + Xββ, X, =
= yy, −Xββ, X, −Xββ, X, +Xββ, X, = yy, −Xββ, X,
[1.152]
yy, = V + Xββ, X,
[1.153]
E (yy, ) = E (V + Xββ, X, ) = E (V) + E (Xββ, X, ) = V + Xββ, X,
[1.154]
V statistiki kvadratne oblike predstavljajo matrični zapis za vsote kvadratov. Da ocenimo posamezne
komponente variance, vsoto kvadratov izenačimo s pričakovano vrednostjo za vsoto kvadratov, zato si
28
29
Biometrija
oglejmo, kako dobimo pričakovane vrednosti.
E (y, Qy)
| {z }
skalar
= E tr (y, Qy) = E tr (Qyy, ) = tr E (Qyy, ) = tr QE (yy, ) =
= tr Q (V + Xββ, X, ) = tr (QV) + tr (QXββ, X, ) =
(β, X, QXβ)
= tr (QV) + tr | {z } = tr (QV) + β, X, QXβ
skalar
[1.155]
To velja ne glede na to, ali je porazdelitev normalna. Če pa je porazdelitev normalna, pa velja tudi
naslednje.
1.
var (y, Qy)
| {z }
skalar
2.
PRIMER:
yi = µ + ei
• Vsota kvadratov opazovanj
X
y2i = yy,
Q = I;
rank(Q) = n
• Vsota kvadratov za model
P 2
P 2
yi
yi
1
1
nȳ = n
=
= y, 1 • 1, y = y, Jn y
n
n
n
n
2
Q=
Jn
;
n
rank(Q) = 1
• Nepristranska ocena variance:
P
(yi − ȳ)2
=
n−1
1
Q=
n−1
P
J
I−
n
y2i − ( yi )
n−1
P
;
n
y, y − 1n y, Jn y
1 ,
J
=
=
y I−
y
n−1
n−1
n
rank(Q) = n − 1
29
30
Biometrija
PRIMER:
yi j = µ + A i + ei j ;
i = 1, A; j = 1, N; n = NA
y, = y,1 y,2 · · · y,A
Vir variabilnosti
µ
Vpliv A
Ostanek
Skupaj
Stopinje prostosti (d.f.)
1
A-1
A(N-1)
AN
Vsota kvadratov (SS)
CF - za povprečje
CBSS - med skupinami
ESS - za ostanek
TSS - skupna
Povprečni kvadrat (SS/d.f.)
CF/1
CBSS/(A-1)
ESS/(A(n-1))
• Skupna vsota kvadratov
TS S =
XX
i
y2ji = y, y
j
Q = I;
rank(Q) = AN
• Vsota kvadratov za “povprečje”
CF =
Q=
1 ,
y JNA y
AN
JAN
;
AN
rank(Q) = 1
• Vsota kvadratov UBSS:
=
U BS S
=
=
P A P N
1
N
1
N
i
= y,
Q=
i
N
j
2
=
1
N
P
N
j y1 j
2
2
N
y
+
j 2j
y,A 1N · 1,N yA
+
P
,
y1 1N · 1,N y1 + y,2 1N ·1,N y2 + · · · +
1N · 1,N

1N · 1,N
,
,
, 
y1 y2 · · · yA 

1
N
⊕
X
JN
yi j
P
⊕ JN
i N
..
.
··· +
P
N
j yA j

1N · 1,N




y1
y2
..
.
2 




yA
y
!
rank(Q) = A
;
• Vsota kvadratov CBSS:
CBS S = U BS S − CF = y,
⊕
X
JN
i
Q=
⊕
1 X
1
JN −
JAN
N
AN
N
!
1 ,
y−
y JAN y = y,
AN
!
;
rank(Q) = A − 1
i
• Vsota kvadratov za ostanek
ES S = T S S − MS S
30
⊕
1 X
1
JN −
JAN
N
AN
i
!
y
31
Biometrija
1.15
CHOLESKY DEKOMPOZICIJA (KVADRATNI KOREN)
31