Neliömuodoista, matriisin ominaisarvoista ja avaruuden kierroista

Transcription

Neliömuodoista, matriisin ominaisarvoista ja avaruuden kierroista
Neliömuodoista, matriisin ominaisarvoista ja avaruuden kierroista
Marko Moisio
1. Neliömuodoista ja matriisin ominaisarvoista
Tarkastellaan toisen asteen tasokäyrän määräävää yhtälöä
a, b, c, d
ax2 + by 2 + 2cxy = d,
missä
ovat vakioita. Tässä vasemmalla puolella esiintyvää polynomia kutsutaan neli-
ömuodoksi. Pyrimme sopivalla tason kierrolla saattamaan tämän yhtälön diagonaalimuo-
αu2 + βv 2 = d.
2
2
Yhtälö ax + by + 2cxy = d
toon
voidaan kirjoittaa matriisimuodossa
x
(x y)A
=d
y
(1)
missä
ac
A=
.
cb
Havaitaan, että
Olkoon
A
on symmetrinen ts.
P = (P1 P2 )
A = AT .
2 × 2-matriisi
x
u
=P
y
v
reaalinen ja säännöllinen
ja sijoitetaan yhtälöön (1)
jolloin yhtälön (1) vasen puoli on muotoa
T
u
u
u
T
AP
= (u v)(P AP )
.
P
v
v
v
P jolle P T AP = D,
α0
D=
, α, β ∈ R.
0β
Tavoitteena on siis löytää sellainen matriisi
missä
Tällöin (1) saadaan diagonaalimuotoon
αu2 + βv 2 = d.
(2)
P kuvauksena f : R2 → R2 , f (X) = P X , joka kuvaa
ax2 + by 2 + 2cxy = d. Mikäli f on tason kierto, niin käyrä
Voimme siis ajatella matriisia
käyrän
2
αx2 + βy 2 = d
2
ax + by + 2cxy = d
käyräksi
voidaan ajatella käyräksi, joka saadaan kun käyrää
kierretään origon suhteen kuvauksen
P
αx2 + βy 2 = d
määräämän kulman verran. Käsittelemme kiertoja
tarkemmin luvussa 2.
Kysymystä neliömuodon diagonalisoimisesta voidaan tarkastella yleisemminkin. Jatkossa samaistamme
n
R
.
n×1-matriisin X = (x1 x2 . . . xn )T
ja koordinaattivektorin
(x1 , . . . , xn ) ∈
2
Olkoon
h(x1 , . . . xn )
neliömuoto eli homogeeninen astetta kaksi oleva polynomi ts.
n
X
h(x1 , . . . xn ) =
aij xi xj = (x1 x2 . . . xn )A(x1 x2 . . . xn )T ,
i,j=1
missä
a11 a12 · · ·
 a21 a22 · · ·
A=
.
..
 ...
.
.
.

an1 an2 · · ·
on symmetrinen ts.
A = AT .
λ1 0 · · ·
 0 λ2 · · ·
D=
.
..
 ...
.
.
.
0
···
0
P
jolle
P T AP = D,
missä

0
0 

. .
.
.
λn
(x1 x2 . . . xn )T = P (u1 u2 . . . un )T
Tällöin nimittäin muuttujan vaihdolla
h(x1 , . . . , xn )
ann
Tavoitteena on löytää matriisi

neliömuoto

a1n
a2n 

.

.
.
saadaan
diagonaaliseksi neliömuodoksi
h(u1 , . . . , un ) = λ1 u21 + · · · + λn u2n .
Miten
ts.
P
tulisi valita? Oletetaan, että
P T P = I.
P
Tällöin
P = (P1 P2 . . . Pn ) on ortonormaali n×n-matriisi
on säännöllinen,
P −1 = P T
ja
P T AP = D ⇐⇒ P −1 AP = D ⇐⇒ AP = DP ⇐⇒ AP1 = λ1 P1 , . . . , APn = λn Pn .
Täten on voimassa seuraava tulos:
Lemma 1. Jos
yhtälöiden
P P T = I,
niin
P T AP = D
AX = λ1 X, . . . , AX = λn X
jos ja vain jos
λi
ja vektorit
Pi
ovat vastaavasti
jotkin ratkaisut joillakin reaaliluvuilla
Osoittautuu, että myös käänteinen tulos pätee ts. jos
massa reaaliluvut
P1 , . . . , P n
joille
APi = λi Pi
A
kaikilla
λ1 , . . . , λn .
on symmetrinen, niin on ole-
i = 1, . . . , n
ja
PPT = I
kun
P = (P1 P2 . . . Pn ).
Miten luvut
λ ja niitä vastaavat vektorit Xλ voidaan löytää? Kysymys on niin keskeinen,
että asetamme seuraavan yleisen määritelmän.
Määritelmä. Olkoon
BX = λX
B
n × n-matriisi ja λ ∈ C. Jos yhtälöllä
ratkaisu Xλ , sanotaan lukua λ matriisin B
kompleksilukukertoiminen
on jokin nollavektorista eroava
ominaisarvoksi ja vektoria
Xλ
siihen kuuluvaksi ominaisvektoriksi.
Edellinen kysymys voidaankin asettaa yleisemmässä muodossa: miten matriisin
B
omi-
naisarvot ja niihin liittyvät ominaisvektorit voidaan löytää? Vastaus on (ainakin periaatteessa) helppo: koska
X 6= 0,
niin
BX = λX ⇐⇒ (B − λI)X = 0 ⇐⇒ det(B − λI) = 0.
3
n-asteisen
Täten ominaisarvot ovat
naisarvoyhtälön) ratkaisut ja ominaisarvoon
(B − λI)X = 0
t=λ
Rajoitutaan nyt (hetkeksi) tapaukseen, missä
A=
A
(eli
B :n
omi-
kuuluvat ominaisvektorit ovat yhtälön
X ∈ R2 \ {0̄}.
ratkaisut
Lause 2. Matriisin
det(B − tI) = 0
polynomiyhtälön
ac
,
cb
A on reaalinen symmetrinen 2×2-matriisi
c 6= 0.
ominaisarvot ovat reaaliset ja erisuuret, ja niitä vastaavat ominais-
vektorit ovat toisiaan vasten kohtisuorassa.
Todistus. Nyt
det(A − tI) = 0 ⇔ (a − t)(b − t) − c2 = 0 ⇔ t2 − (a + b)t + ab − c2 = 0.
c 6= 0,
Koska
niin tämän yhtälön juuret
α=
a+b+
p
(a − b)2 + 4c2
2
ja
ovat reaaliset ja erisuuret. Koska matriisin
on
A:n
β=
A − λI
a+b−
p
(a − b)2 + 4c2
2
rivit ovat lineaarisesti riippuvat jos
λ
ominaisarvo, niin
c
(A − λI)Xλ = 0 ⇐⇒ (a − λ)x1 + cx2 = 0 ⇐⇒ Xλ = s
λ−a
∀s ∈ R.
Täten
Xα · Xβ = 0 ⇐⇒ c2 + (α − a)(β − a) = 0 ⇐⇒ c2 + αβ − (α + β)a + a2 = 0.
α+β =a+b
Koska
ja
αβ = ab − c2 ,
niin väite seuraa.
Lemman 1 ja Lauseen 2 nojalla saamme menetelmän matriisin
P
konstruoimiseksi ja
näin menetelmän yhtälön (1) diagonalisoimiseksi eli saattamiseksi muotoon (2):
α ja β ominaisarvoyhtälön det(A − tI) = 0 ratkaisut.
Olkoot Xα ja Xβ yhtälöryhmien (A − αI)X = 0 ja (A − βI)X = 0 nollavektorista
(5) Olkoot
(6)
eroavia ratkaisuja.
(7)
P = (P1 P2 ),
missä
P1 =
Xα
ja
||Xα ||
P2 =
Xβ
.
||Xβ ||
Yhtälöistä (6) riittää ratkaista vain toinen. Nimittäin, jos esim.
vektorien
Xα
ja
Xβ
kohtisuoruuden nojalla voidaan valita
Xα = (x1 x2 )T ,
T
Xβ = (−x2 x1 )
T
niin
.
(−x2 x1 ) on välttämättä ominaisarvoon β kuuluva ominaisvektori, sillä (−x2 x1 )T
2
kuuluu Xα :n virittämän R :n aliavaruuden ortogonaalikomplementtiin, joka puolestaan on
Nyt
Xβ :n
virittämä.
Voidaan siis valita (ks. Lauseen 2 todistus):
Xα =
√
missä
α=
a+b+
(a−b)2 +4c2
ts.
2
1
α−a
c
ja
Xβ =
− α−a
c
,
1
4
1
√
|c|
s + c s2 + 1
Xα =
missä
s=
ja
Xβ =
−s −
|c|
c
√
s2 + 1
1
,
b−a
.
2c
Täten yhtälön (1) diagonalisoiva matriisi
1
P =
||Xα ||
jota vastaava lineaarikuvaus
ī + (s +
|c|
c
√
s2 + 1)j̄
s+
f
1
√
|c|
c
kiertää
suuntainen ja
A=
√
s2 + 1
,
1
|c|
c
s2 + 1
xy -tason uv -tasoksi,
v -akseli on vektorin −(s +
Esimerkki 1. Diagonalisoidaan yhtälö
Tämän yhtälön matriisi
−s −
u-akseli on vektorin
√
2
s + 1)ī + j̄ suuntainen.
missä
|c|
c
5x2 + 4xy + 2y 2 = 1 ja tarkastellaan sen kuvaajaa.
2
5
, jonka ominaisarvot
2 2
α
ja
β
ovat yhtälön
det(A − tI) = (5 − t)(2 − t) − 4 = 0
juuret ts.
α =
7+5
2
= 6, β =
2
Koska nyt
s=
suuntainen ja
v -akseli
= 1.
6u + v = 1
koordinaatistossa muotoa
2−5
4
7−5
2
2
= −3/4,
niin
on vektorin
Täten yhtälö
− 12 ī + j̄
on vektorin
jonka ominaisarvot
α
ja
β
ī +
(− 43
+
q
9
16
+ 1)j̄ = ī + 12 j̄
arctan(1/2) ≈ 26.57◦
x2 − 12xy + 6y 2 + x + y = 2
x2 − 12xy + 6y 2
A=
uv -
suuntainen.
Kyseessä on siis tason kierto vastapäivään kulman
kuvaajaa. Nyt neliömuodon
on
ja vastaava tasokäyrä on siis ellipsi.
u-akseli
Esimerkki 2. Diagonalisoidaan yhtälö
5x2 + 4xy + 2y 2 = 1
matriisi on
1 −6
−6
6
,
ovat yhtälön
det(A − tI) = (1 − t)(6 − t) − 36 = 0
verran.
ja tarkastellaan sen
5
juuret ts.
5
− 12
−
13
12
α =
7+13
2
= 10, β =
= − 18
= − 23 ,
12
7−13
2
= −3.
Nyt
s =
b−a
2c
5
= − 12
ja
s+
|c|
c
√
1 + s2 =
joten
Xα =
1
−3/2
ja
3/2
Xβ =
1
ja
2
P =√
13
joka vastaa tason kiertoa kulman
Täten yhtälö
1
=√
13
arctan(3/2) ≈ 56.31◦
1
3/2
−3/2 1
2 3
−3 2
,
verran myötäpäivään. Lisäksi
x
u
1
2u + 3v
=P
=√
.
y
v
13 −3u + 2v
x2 − 12xy + 6y 2 + 3x + 2y = 2 on uv -koordinaatistossa
3
2
10u2 − 3v 2 + √ (2u + 3v) + √ (−3u + 2v) = 2
13
13
13
⇐⇒ 10u2 − 3v 2 + √ v = 2
13
!
√
13
⇐⇒ 10u2 − 3 v 2 −
v =2
3
√ !2
13
11
13
=2−
=
⇐⇒ 10u2 − 3 v −
6
12
12
√ !2
120 2 36
13
⇐⇒
u −
v−
=1
11
11
6
muotoa
Tätä yhtälöä vastaava käyrä on hyperbeli, jonka symmetriapisteen koordinaatit ovat
√
(u, v) = (0, 13/6)
eli
(x, y) = (1/2, 1/3).
Palataan sitten yleiseen tapaukseen missä
A
on reaalinen ja symmetrinen
n × n-matriisi.
6
Jos
n > 2,
niin suurin muutos tapaukseen
naisarvoyhtälöllä voi olla vähemmän kuin
n
n=2
verrattuna on se, että nyt
A:n
omi-
erisuurta juurta. Toisaalta Lause 2 yleistyy
Lauseiksi 3 ja 4:
Lause 3. Matriisin
Todistus. Olkoon
vektorin
X
A
ominaisarvot ovat reaaliset.
λ ∈ C A:n
ominaisarvo ts.
kompleksikonjugaatti ts.
AX = λX
X · X = ||X||2 .
jollakin
X ∈ Cn \ {0̄}.
Olkoon
X
Koska
X · AX = X · λX = λX · X = λ||X||2
ja toisaalta
T
X · AX = X AX = (AT X)T X = AT X · X = AX · X = λ̄X · X = λ̄||X||2 ,
niin
(λ − λ̄)||X||2 = 0.
Lause 4. Matriisin
A
Koska
X 6= 0,
niin
λ = λ̄
λ ∈ R.
ts.
eri ominaisarvoihin liittyvät ominaisvektorit ovat toisiaan vastaan
kohtisuorassa.
Todistus. Olkoot
α
ja
β A:n
ominaisarvoja,
α 6= β .
Koska
AT = A,
niin
βXα · Xβ = Xα · βXβ = Xα · AXβ = AXα · Xβ = αXα · Xβ
ja näin ollen
(α − β)Xα · Xβ = 0.
Seuraus. Matriisin
A:n
Koska
α 6= β ,
niin
Xα · Xβ = 0.
A ominaisvektoreista voidaan muodostaa Rn :n ortonormali kanta, jos
ominaisarvot ovat pareittain erisuuret.
Todistus. Algebran peruslauseen nojalla
A:lla
on
n
ominaisarvoa. Lauseen 3 nojalla ne
ovat kaikki reaalisia ja oletuksen ja Lauseen 4 nojalla niitä vastaavat ominaisvektorit ovat
pareittain toisiaan vastaan kohtisuorassa ja täten lineaarisesti riippumattomia.
−2x2 + 11y 2 + 5z 2 − 12xy + 12xz = 1.
−2x2 + 11y 2 + 5z 2 − 12xy + 12xz matriisi


−2 −6 6
A =  −6 11 0  ,
6
0 5
Esimerkki 3. Diagononalisoidaan yhtälö
ömuodon
Neli-
jonka ominaisarvoyhtälö on


−2 − t −6
6
−6 6 + (5 − t) −2 − t −6
11 − t
0  = 6 0 = (A − tI) =  −6
−6
11 − t 0 11 − t
6
0
5−t
= −t3 + 14t2 + 49t − 686.
Täten matriisin
ominaisvektorit:
A
ominaisarvot ovat
α = −7, β = 7, γ = 14.
Lasketaan vastaavat
7


  




5 −6 6
x1
0
x1
6
(A−αI)X = 0 ⇐⇒  −6 18 0   x2  =  0  ⇐⇒  x2  = t  2  , t ∈ R.
6
0 12
x3
0
x3
−3


  


 
−9 −6 6
x1
0
x1
2









−6 4
0
x2
0
x2
(A−βI)X = 0 ⇐⇒
=
⇐⇒
= t 3  , t ∈ R,
6
0 −2
x3
0
x3
6


  




−16 −6 6
x1
0
x1
−3
(A−γI)X = 0 ⇐⇒  −6 −3 0   x2  =  0  ⇐⇒  x2  = t  6  , t ∈ R,
6
0 −9
x3
0
x3
−2
Täten neliömuodon diagonalisoivaksi matriisiksi
P
voidaan valita (ks. Lemma 2) esim.


6 2 3
1
P =  2 3 −6  .
7
−3 6 2
−2x2 + 11y 2 + 5z 2 − 12xy + 12xz = 1 määräämä pinta on hyperboloidin
−7x2 + 7y 2 + 14z 2 = 1 kuva kuvauksessa f : R3 −→ R3 , f (X) = P (X). Luvussa 2
Siispä yhtälön
näemme, että kuvaus
ympäri kulman
f
vastaa avaruuden
◦
arccos(2/7) ≈ 73.4
2
2
R3
kiertoa (vektorin
2ī + j̄
suuntaisen suoran
verran vastapäivään).
2
−2x +11y +5z −12xy+12xz = 1 määräämä pinta on uvw-koordinaatiston
2
2
2
hyperboloidi −7u +7v +14w = 1, kun u-akseli on vektorin 6ī+2j̄ −3k̄ , v -akseli vektorin
Täten yhtälön
2ī + 3j̄ + 6k̄
ja
w-akseli
vektorin
3ī − 6j̄ + 2k̄
Tarkastellaan sitten yleistä tapausta, missä
suuntainen.
A:n ominaisarvot eivät olekaan välttämättä
pareittain erisuuria. Silloinkin pätee seuraava tulos:
Lause 5. Matriisin
A
ominaisvektoreista voidaan muodostaa
Rn :n
ortonormali kanta.
Tämä on melko syvällinen tulos ja sen todistamiseksi kehittelemme vielä hivenen lineaarialgebran koneistoa.
Olkoon
V
vektoriavaruuden
jokin kanta. Olkoon
suhteen ts.
f
Rn m-dimensioinen
lineaarikuvaus
f : V −→ V
aliavaruus ja
ja
Mf
V = {v̄1 , . . . , v̄m }
kuvauksen
f
sen
matriisi kannan
V
8
f (v̄i ) = a1i v̄1 + a2i v̄2 + · · · + ami v̄m , i = 1, . . . , m,
jos
a11
 a21
Mf = 
 ...
···
···
a12
a22


a1m
a2m 
.
.

.
.
.
.
.
am1 am2 · · ·
Jos nyt
f : V → V
lineaarikuvaus ja
on jokin nollavektorista eroava ratkaisu
ominaisarvoksi ja vektoria
vain jos
amm
x̄ = x1 v̄1 +· · ·+xm v̄m ∈ V , niin selvästi f (x̄) = Mf X , missä X = (x1 x2 . . . xm )T .
Määritelmä. Olkoon
Koska
niin
x̄λ
x̄λ ∈ V ,
λ ∈ R.
Jos yhtälöllä
sanotaan lukua
λ
f (x̄) = λx̄
lineaarikuvauksen
f
siihen kuuluvaksi ominaisvektoriksi.
f (x̄) = Mf X , niin vektori x̄ on reaalilukuun λ kuuluva f :n ominaisvektori jos ja
X on λ:aan kuuluva Mf :n ominaisvektori.
Määritelmä. Lineaarikuvaus
f :V →V
on symmetrinen jos
f (x̄) · ȳ = x̄ · f (ȳ)
kaikilla
x̄, ȳ ∈ V .
Lemma 2. Olkoon
kannan
V
f :V →V
suhteen. Tällöin
Todistus. Koska
V
f
lineaarikuvaus ja
Mf
sen matriisi jonkin ortonormaalin
on symmetrinen jos ja vain jos
on ortonormaali, niin
x̄ · ȳ = X · Y
Mf
kaikilla
on symmetrinen.
x̄, ȳ ∈ V .
Täten
f (x̄) · ȳ = x̄ · f (ȳ) ∀x̄, ȳ ∈ V
⇐⇒ Mf X · Y = X · Mf Y
∀X, Y ∈ Rm .
⇐⇒ (Mf X)T Y = X T Mf Y
∀X, Y ∈ Rm
⇐⇒ X T MtT Y = X T Mf Y
∀X, Y ∈ Rm
⇐⇒ X · MfT Y = X · Mf Y
∀X, Y ∈ Rm
⇐⇒ X · (MfT Y − Mf Y ) = 0 ∀X, Y ∈ Rm .
MfT Y − Mf Y = 0
Täten
kaikilla
Y ∈ Rm
eli
(MfT − Mf )Y = 0
kaikilla
Y ∈ Rm .
Siispä
MfT = Mf .
Lause 4'. Olkoon
sella
f
on
m
symmetrinen lineaarikuvaus, missä
Mf
kuvauksen
F
ominaisarvoa. Lemman 2 nojalla
f :n
Mf
m,
niin algebran peruslauseen nojalla sillä on
m
Mf :n
ja
on symmetrinen, joten Lauseen 4 nojalla
ominaisarvot ovat reaalisia.
Lauseen 5 todistus. Olkoon
AX .
Kuvauk-
matriisi jonkin ortonormaalin kannan suhteen. Koska
ominaisarvopolynomin aste on
täten
dim V = m.
ominaisarvoa (eivät välttämättä erisuuria) ja ne ovat reaalisia.
Todistus. Olkoon
Mf :n
f : V −→ V
f A:n
määräämä lineaarikuvaus ts.
Lemman 2 ja Lauseen 4' nojalla
f :llä
on
n
f : Rn −→ Rn , f (X) =
reaalista ominaisarvoa.
9
Olkoon
ruus. Nyt
U1 ominaisarvoon λ1 kuuluvan f :n ominaisvektorin ū1 virittämä Rn :n aliavaRn voidaan hajottaa suoraksi summaksi Rn = U1 ⊕ U1⊥ ja sille saadaan kanta
{ū1 , v̄2 , . . . , v̄n }
missä
Osoitetaan, että
v̄2 , . . . , v̄n ∈ U1⊥ .
f (U1⊥ ) ⊆ U1⊥ .
Olkoon
v̄ ∈ U1⊥ .
Nyt
f :n
symmetrisyyden nojalla
ū1 · f (v̄) = f (ū1 ) · v̄ = λ1 ū1 · v̄ = 0,
joten
f (U1⊥ ) ⊆ U1⊥ .
dim U1⊥ = n − 1
Koska
nojalla sillä (ja siis
f
ja
on symmetrinen myös rajoitettuna
U1⊥ :lle,
niin Lauseen 4'
A:lla) on n − 1 reaalista ominaisarvoa joihin kuuluvat ominaisvektorit
∈ U1⊥ .
Olkoon
Nyt
U2
ominaisarvoon
λ2
kuuluvan ominaisvektorin
⊥
n
R = U1 ⊕ U2 ⊕ (U1 + U2 )
⊥
(U1 + U2 ) . Lisäksi f :n
U2 )T ) ⊆ (U1 + U2 )T .
ja sillä on kanta
ū2
virittämä
{ū1 , ū2 , v̄3 , . . . , v̄n },
U1⊥ :n
missä
aliavaruus.
v̄3 , . . . , v̄n ∈
lineaarisuuteen nojautuen nähdään kuten edellä, että
Jatkamalla prosessia saadaan
Rn :lle
lopulta
A:n
ominaisvektoreista
f ((U1 +
ū1 , ū2 , . . . , ūn
orto-
gonaalinen kanta.
Esimerkki 4. Diagononalisoidaan yhtälö
Neliömuodon
58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz = 1.
58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz matriisi


58 −18 6
A =  −18 85 −12  ,
6 −12 53
jonka ominaisarvoyhtälö on

58 − t −18
6
0 = (A − tI) =  −18 85 − t −12  = t3 − 196t2 + 12005t − 235298
6
−12 53 − t

= (t − 49)2 (t − 98).
Täten matriisin
A
ominaisarvot ovat
α = 49, β = 49, γ = 98.
Lasketaan vastaavat omi-
naisvektorit käyttäen Lauseen 5 todistuksessa käytettyä menetelmää (vaikka ne voitaisiin
toki laskea ilmankin sitä). Ensinnäkin


  


 
11 −18 6
x1
0
x1
2
(A−αI)X = 0 ⇐⇒  −18 36 −12   x2  =  0  ⇐⇒  x2  = t  3  , t ∈ R.
6 −12 4
x3
0
x3
6
Valitaan
ū1 = 2ī + 3j̄ + 6k̄ .
Jos
kannaksi voidaan valita esim.
f (X) = AX ,
rajoitetaan se
U
U1
on tämän vektorin virittämä aliavaruus, niin
{v̄2 , v̄3 },
⊥
missä
v̄2 = 3ī − 2j̄
ja
v3 = 3ī − k̄ .
:lle ja lasketaan tämän rajoittuman matriisi
= 210ī − 224j̄ + 42k̄ = 112v̄2 − 42v̄3
Olkoon nyt
Mf .
f (v̄2 ) = 3f (ī) − 2f (j̄) = 3(58ī − 18j̄ + 6k̄) − 2(−18ī + 85j̄ − 12k̄)
U1⊥ :n
Koska
10
ja
f (v̄3 ) = 3f (ī) − f (k̄) = 3(58ī − 18j̄ + 6k̄) − (6ī − 12j̄ + 53k̄)
niin
Mf =
U ⊥:
koska
= 168ī − 42j̄ − 35k̄ = 21v̄2 + 35v̄3 ,
112 21
. Lasketaan ominaisarvoon β = 49
−42 35
(Mf − 49I)X = 0 ⇐⇒
63
21
−42 −14
x1
x2
=
0
0
liittyvä ominaisvekori
⇐⇒
x1
x2
=t
(U +
,
ū2 = −v̄2 + 3v̄3 = 6ī + 2j̄ − 3k̄ . Lopuksi valitsemme vektorin
T ⊥
U ) , joten voidaan valita ū3 = 3ī − 6j̄ + 2k̄ .
niin voidaan valita
avaruudesta
−1
3
ū2 ∈
P

Näin ollen neliömuodon diagonalisoivaksi matriisiksi

P =
ū3
voidaan valita
6 2 3
1
2 3 −6  ,
7
−3 6 2
joka sattuu olemaan täsmälleen sama matriisi kuin edellisessä esimerkissä.
Täten yhtälön
58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz = 1
uvw-koordinaatiston
ellipsoidi
6ī + 2j̄ − 3k̄ , v -akseli
vektorin
2
2
2
49u + 49v + 98w = 1,
missä jälleen
2ī + 3j̄ + 6k̄
vektorin
ja
w-akseli
määräämä pinta on
u-akseli
on vektorin
3ī − 6j̄ + 2k̄
suuntainen.
11
2. Avaruuden
Rn
kierroista
n × n-matriisit vastaavat avaruuden R kiertoja, kun n = 2, 3. Mitä on vaadittava esimerkiksi 2 × 2-matriisilta P , että
Edellisessä luvussa väitimme, että tietyt ortonormaalit
n
R2
sitä vastaava lineaarikuvaus olisi tason
kierto? Ainakin sen on säilytettävä vektorien
pituudet ja niiden väliset kulmat.
n positivinen kokonaisluku, P n×n-matriisi ja f : Rn −→ Rn , f (X) =
kuvauksia f jotka toteuttavat seuraavat ehdot:
Yleisemmin: olkoon
P X.
Tarkastellaan
||P X|| = ||X|| ∀X ∈ Rn ,
n
kulmat ts. ] P X, P Y = ](X, Y ) ∀X, Y ∈ R .
(1)
f
säilyttää vektorien pituudet ts.
(2)
f
säilyttää vektorien väliset
Osoittautuu, että ehdot (1) ja (2) toteutuvat jos ja vain jos matriisi
ts. pystyrivit
P1 , . . . , P n
muodostavat ortonormaalin joukon ts.
T
T
2
det(P P ) = det(P ) det(P ) = det(P )
matriisin determinantti on aina
Lause 1. Olkoon
PX
P
P P T = I.
Koska
P i · Pj = 0
Koska
1 =
, niin ehdot (1) ja (2) toteuttavan kuvauksen
f
±1.
P = (P1 P2 . . . Pn ) n×n-matriisi. Lineaarikuvaus f : Rn −→ Rn , f (X) =
säilyttää vektorien pituudet ja niiden väliset kulmat jos ja vain jos
Todistus. Olkoot
on ortonormaali
X, Y ∈ Rn ,
jos
i 6= j ,
jolloin
P X = x 1 P1 + · · · + x n P n
ja
P P T = I.
P Y = y1 P1 + · · · + yn Pn .
niin
=1
=1
z }| {
z }| {
||P X||2 = P X · P X = x21 ||P1 ||2 + · · · + x2n ||Pn ||2 = ||X||2
f
eli
säilyttää pituuden.
Osoitetaan, että
f
säilyttää pistetulon:
P :n
ortonormaalisuuden nojalla
P X · P Y = (x1 P1 + · · · + xn Pn ) · (y1 P1 + · · · + yn Pn ) = x1 y1 + · · · + xn yn = X · Y.
Nyt
](P X, P Y ) =
f
eli
säilyttää kulman.
Oletetaan sitten, että
f
PX · PY
X ·Y
=
= ](X, Y )
||P X|| ||P Y ||
||X|| ||Y ||
f
säilyttää vektorien pituudet ja niiden väliset kulmat. Tällöin
säilyttää pistetulon, joten
X · Y = P X · P Y = (P X)T P Y = X T P T P Y = X · P T P Y
∀X, Y ∈ Rn
ekvivalentisti
X · (Y − P T P Y ) = 0 ∀X, Y ∈ Rn .
Täten
T
Y − PTPY = 0
P P =I
eli
P
f (ū) = cū,
Y ∈ Rn
eli
(I − P T P )Y = 0
kaikilla
Y ∈ Rn
f : Rn+1 → Rn+1
joillakin
ū ∈ R
n+1
ja näin ollen
on ortogonaalinen.
Lemma 1. Olkoon
Jos
kaikilla
lineaarikuvaus, jonka matriisi
\ {0̄}
ja
c ∈ R,
niin on olemassa
P
on ortonormaali.
n+1
R
:n kanta jonka
12
suhteen
f :n
Q
matriisi
on muotoa
c 0 ···
 0 a11 · · ·
Q=
..
 ... ...
.

0 an1 · · ·

0
a1n 
,
.

.
.
ann
missä

A=
a11 · · ·
.
.
.
..
.
an1 · · ·
a1n

.
.
.

ann
on ortonormaali.
Todistus. Täydennetään joukko
{ū} avaruuden Rn+1 ortonormaaliksi kannaksi V = {ū, ū1 , . . . , ūn }.
Nyt
f (ū) = cū + 0 · ū1 + · · · + 0 · ūn
f (ū1 ) = u1 ū + a11 ū2 + · · · + an1 ūn
.
.
.
f (ūn ) = un ū + a1n ū2 + · · · + ann ūn
cuk = f (ū) · f (ūk ) = 0, kaikilla k = 1, . . . , n. Koska
välttämättä c 6= 0, niin nyt u1 = · · · = un = 0. Nyt myös 0 = f (ūi ) · f (ūj ) = a1i a1j + · · · +
Koska
f
ani anj
kaikilla
i 6= j ,
Täten
Q
ovat väitettyä muotoa.
säilyttää kulmat, niin
ja
A
Oletetaan että
ja
n = 2,
1 = ||f (ūj )|| = ||(a1j , . . . , anj )||
olkoon
f
koska
f
säilyttää myös pituudet.
ehdot (1) ja (2) täyttävä lineaarikuvaus ja
P =
sen matriisi luonnollisen kannan
a c
b d
{ī, j̄} suhteen. Koska P
on ortogonaalinen, niin
ac + bd =
0.
Jotta
(3)
f
f
olisi tason kierto, vaadimme ehtojen (1) ja (2) lisäksi, että pätee ehto:
säilyttää
x-
Esimerkki 1. Jos
ja
y -akselien
P =
0 1
, niin sitä vastaava kuvaus
1 0
muttei ehtoa (3), sillä se vaihtaa
peilaus suoran
y=x
keskinäisen järjestyksen.
x-akselin y -akseliksi
ja
f
toteuttaa ehdot (1) ja (2)
y -akselin x-akseliksi
kiertoa kiertona avaruudessa
ja
f (j̄)
f
on
suhteen.
Jotta saisimme laskennallisen kriteerin joka vastaa ehtoa (3), niin ajatellaan
f (ī)
eli
ja vektori
k̄
R3 : xy -tasoa
kierretään
z -akselin
xy -tason
ympäri niin, että vektorit
muodostavat oikeankätisen systeemin ts. vektorien
f (ī)
ja
f (j̄)
13
ristitulon on oltava vektorin
k̄
ī j̄ k̄
f (ī) × f (j̄) = a b 0
c d 0
f
Täten
vain jos
Täten
f (ī) = aī + bj̄ ja f (j̄) = cī + dj̄ ,
= (ad − bc)k̄ = det(P )k̄.
suuntainen. Koska
f (ī) × f (j̄)
det(P ) = 1.
toteuttaa ehdon (3) jos ja vain jos
det(P ) > 0
f
on
jos ja vain jos
xy -tason
P =
a2 + b2 = 1.
a = cos α
Koska tällöin
b = sin α
ja
1
0
P
=
P =
f
suuntainen jos ja
a −b
b a
a
, niin
b
P
on muotoa
,
f
kiertää tasoa kulman
α
verran missä
ts.
Entäpä jos
k̄
kierto eli toteuttaa ehdot (1), (2) ja (3) jos ja vain
missä
on vektorin
niin
cos α − sin α
sin α cos α
.
toteuttaa ehdot (1) ja (2) muttei ehtoa (3) ts.
det(P ) = −1?
Nyt
P
on
−1, joten se on muotoa
a b
1 0
a −b
P =
=
,
b −a
0 −1
b a
ortogonaalinen ja sen determinantti on
missä
a2 + b2 = 1.
xy -tasoa kulman arccos(a) verran ja sitten peilaa
sen x-akselin suhteen. Osoittautuu, kuitenkin että f voidaan ajatella pelkkänä peilauksena
Täten
suoran
`
f
on kuvaus, joka ensin kiertää
suhteen, jonka yhtälö seuraavassa määritetään.
Osoitetaan ensin, että
f (ū) = ū
jollakin
ū ∈ R2
ts.
PX = X
jollakin
X ∈ R2 .
Ensinnä-
kin
P X = X ⇐⇒ (P − I)X = 0 ⇐⇒
Koska
det(P − I) = −(a2 − 1) − b2 = 0,
riippuvat, ja täten on olemassa
x
ja
y
toteuttavat suoran
`
`:
kanta
{ū, v̄}
f
ū ∈ R
y=0
(a − 1)x + by = 0
on peilaus suoran
jonka suhteen
(P − I):n
f (ū) = ū.
jolle
f :n
A=
det(A) = det(P ) = −1,
Täten on todistettu seuraava:
`
jos
jos
vaakarivit ovat lineaarisesti
Lisäksi
P
x
y
=
x
y
jos ja vain jos
niin
c = −1.
a = 1,
a 6= 1.
suhteen. Lemman 1 nojalla on olemassa
matriisi
Koska
niin
x
0
=
.
y
0
yhtälön, kun
Osoitetaan sitten, että
2
a−1
b
b
−a − 1
1 0
0 c
.
14
f : R2 → R2
Lause 2. Olkoon
lineaarinen kuvaus joka toteuttaa ehdot (1) ja (2),
P
sen
λ = det(P ). Tällöin
a −b
1 0
cos α − sin α
=
.
b a
0 λ
sin α cos α
matriisi luonnollisen kannan suhteen ja
1 0
0 λ
P =
(a) Jos
λ = 1,
(b) Jos
λ = −1,
niin
f
toteuttaa ehdon (3) ja on
niin
f
xy -tason
ei toteuta ehtoa (3) ja on
kun
`:
y=0
(a − 1)x + by = 0
kierto kulman
xy -tason
jos
jos
α
verran.
peilaus suoran
`
suhteen,
a = 1,
a 6= 1.
xy -tasoa ensin kulman β verkulman α + β verran. Olkoon
Tarkastellaan vielä kahta peräkkäistä kiertoa: kierretään
ran ja sitten kulman
fα , fβ
ja
fα+β
α
verran, jolloin tasoa on kierretty
ko. kiertoja vastaavat lineaarikuvaukset. Koska
fα+β = fα ◦ fβ ,
niin nyt
Lauseen 2 nojalla
cos(α + β) − sin(α + β)
sin(α + β) cos(α + β)
=
cos α − sin α
sin α cos α
cos β − sin β
sin β cos β
.
Täten saamme seuraavat tutut kosinin ja sinin yhteenlaskukaavat:
cos(α + β) = cos α cos β − sin α sin β
sin(α + β) = sin α cos β + cos α sin β.
Oletetaan sitten, että
Lemma 2. Olkoon
jollakin
2
P
X ∈ R \ {0̄}
n = 3.
ortonormaali
ts.
3 × 3-matriisi.
f (ū) = det(P )ū,
Yhtälö
2
u∈R
jollakin
P X = det(P )X
on ratkeava
.
λ = det(P ) = ±1. Riittää osoittaa, että det(P − λI) = 0. Ensinnäkin
P (P − λI) = I − λP T = λ(λI − P T ) = λ(λI − P )T . Koska λ det(P T ) =
Todistus. Olkoon
havaitaan, että
T
λ det(P ) = λ2 = 1,
niin
det(P − λI) = λ det(P T ) det(P − λI) = λ det(P T (P − λI))
= λ det(λ(λI − P )T ) = λ4 det((λI − P )T )
= det(λI − P ) = −(P − λI),
ja näin ollen
Avaruuden
det(P − λI) = 0.
R3
kierrolla tarkoitamme kuvausta
origon kautta kulkevan suoran eli kiertoakselin
tainen vektori ja
a c
b d
joka kiertää avaruuden
ympäri ts. jos
ū
R3
jonkin
on kiertoakselin suun-
V = {ū, v̄, w̄} on jokin oikeakätinen ortonormaali joukko, niin f :n matriisi
tämän kannan suhteen on
missä
u
f,
vastaa
vw-tason


1 0 0
Q =  0 a c ,
0 b d
kiertoa.
15
Oletetaan, että
olemassa
3
ū ∈ R
f
joukko. Jotta
f
on ehdot (1) ja (2) täyttävä lineaarikuvaus ja oletetaan, että on
jolle
f (ū) = ū.
Olkoon
R3
olisi avaruuden
V = {ū, v̄, w̄}
jokin oikeakätinen ortonormaali
kierto, vaadimme nyt että ehtojen (1) ja (2) lisäksi
pätee ehto:
(3')
f
säilyttää joukon
V
oikeakätisyyden ts.
Lemman 1 nojalla kuvauksen
f
Q

matriisi
{f (ū), f (v̄), f (w̄)}
kannan
V suhteen

on oikeakätinen.
on muotoa
1 0 0

0 a c ,
Q=
0 b d
missä
A=
a c
b d
,
on ortonormaali.
Koska
{f (ū), f (v̄), f (w̄)}
on oikeakätinen, niin ristitulon
f (v̄) × f (w̄) = (ad − bc)ū =
det(A)ū on oltava vektorin f (ū) = ū suuntainen. Täten ehdon f (ū) = ū täyttävä lineaarikuvaus täyttää ehdon (3') jos ja vain jos
det(A) = 1
jos ja vain jos
det(P ) = det(Q) = 1.
Toisaalta Lemman 2 ja Lauseen 1 nojalla jokaisella ehdot (1) ja (2) täyttävällä lineaarikuvauksella
f : R3 −→ R3
f
Entäpä jos
on kiertoakseli ts. sellainen vektori
että
toteuttaa ehdot (1) ja (2) muttei ehtoa (3')? Nyt
mojen 1 ja 2 nojalla on olemassa ortonormaali kanta
Q
ū
{ū, v̄, w̄}
f (ū) = ū.
det(P ) = −1
ja Lem-
f :n
matriisi
jonka suhteen
on muotoa:


 
1 0 0
−1 0 0
−1 0 0
Q =  0 a c  =  0 0 0  0 a c ,
0 b d
0 0 0
0 b d

missä
A=
a c
b d
on ortonormaali ja
det(A) = 1.
Täten on todistettu seuraava:
Lause 3. Olkoon
koon
missä
3
ja
ū ∈ R
lineaarinen kuvaus joka toteuttaa ehdot (1) ja (2), ol-
f (ū) = λū. Olkoon V = {ū, v̄, w̄}
joukko. Silloin kannan V suhteen f :n matriisi on:

 

λ 0 0
λ
0
0
Q =  0 a −b  =  0 cos α − sin α  ,
0 b a
0 sin α cos α
λ = det(P )
ortonormaali
f : R3 → R3
, jolle
jokin oikeakätinen
f (v̄) = av̄ + bw̄.
λ = 1, niin f toteuttaa myös ehdon (3') ja f
ympäri kulman α verran.
(a) Jos
(b) Jos
λ = −1,
niin
f
ei toteuta ehtoa (3') ja
(u, v, w) 7→ (−u, v, w)
yhdistetty kuvaus.
f
on avaruuden
R3
kierto
u-akselin
on (a)-kohdan kierron ja peilauksen
16
Esimerkki 2. Esimerkin 1 peilausta voidaan ajatella avaruuden
f,
f (k̄) = −k̄ .
Täten kierron
f
√1 (ī
2
ū =
missä kiertoakseli on vektorin
matriisi
P
+ j̄)
suuntainen ts.
luonnollisen kannan

R3 180 asteen kiertona
f (ī) = j̄ , f (j̄) = ī ja
{ī, j̄, k̄}
suhteen on

0 1 0

1 0 0 .
P =
0 0 −1
Valitaan sitten
v̄ =
√1 (ī
2
− j̄)
ortogonnormaali, ja lasketaan
ja
f :n
w̄ = k̄ ,
matriisi
jolloin joukko
Q
V = {ū, v̄, w̄}
oikeakätinen ja
tämän kannan suhteen. Koska
f (ū) = ū,
1
1
1 f (v̄) = √ f (ī − j̄) = √ f (ī) − f (j̄) = √ j̄ − ī = −v̄,
2
2
2
niin


1 0
0
A =  0 −1 0  ,
0 0 −1
joka tosiaankin vastaa avaruuden
R3
180 asteen kiertoa vektorin
u
suuntaisen suoran
ympäri.
Esimerkki 3. Olkoon

6 2 3
1
P =  2 3 −6 
7
−3 6 2

ja tarkastellaan sen määräämää lineaarikuvausta
1,
joten
PX = X
jollakin
X ∈ R3 .
f : R3 → R3 , f (X) = P X . Nyt det(P ) =
Nyt
   

 
 
−1 2
3
x
x
6 2 3
0
x











0 ,
y
2 −4 −6
y
2 3 −6
⇐⇒
=7 y
P X = X ⇐⇒
=
−3 6 −5
z
0
−3 6 2
z
z
1
1
ja täten voidaan valita (x, y, z) = (2, 1, 0) ts. ū = √ 2ī+ j̄ . Valitaan lisäksi v̄ = √ ī−2j̄
5
5

ja
w̄ = −k ,
Q
tämän kannan suhteen.
jolloin
V = {ū, v̄, w̄}
on ortonormaali ja oikeakätinen. Lasketaan
f :n
Koska
7
1
7f (v̄) = √ f (ī) − 2f (j̄) = √ (6ī + 2j̄ − 3k̄) − (4ī + 6j̄ + 12k̄)
5
5
1
= √ (2ī − 4j̄ − 15k̄),
5
niin
1
1
7f (v̄) = cv̄ + dw̄ ⇐⇒ √ (2ī − 4j̄ − 15k̄) = c √ (i − 2j̄) − dk̄
5
5
√
⇐⇒ c = 2 ja d = 3 5,
matriisi
17
ja näin ollen
f (v̄) = 72 v̄ +
√
3 5
w̄. Siispä
7

1
0
0
√
2/7 −3 5/7  .
Q= 0 √
2/7
0 3 5/7

Täten
kulman
f
◦
arccos(5/14) ≈ 69.1
Olkoon
ts.
on kierto, joka kiertää avaruuden
R3
vektorin
ū
suuntaisen suoran ympäri
verran vastapäivään.
S avaruuden R3 toisen asteen pinta, jonka määräävä yhtälö on diagonaalimuotoa
S : ax2 + by 2 + cz 2 = 1,
S : X T DX = 1,


a 0 0
D =  0 b 0 .
0 0 c
ekvivalentisti
missä
X = (x y z)
ja
Havainnollistetaan animaatioiden avulla tällaisten pintojen kiertoa jonkin kiertoakselin
ympäri.
Olkoon siis
ū ∈ R3
ja
fα
avaruuden
kiertoakselin ympäri. Olkoon
R3
{ū, v̄, w̄},
kierto kulman
α
verran vektorin
ū
suuntaisen
jokin ortonormaali oikeakätinen joukko. Tämän
fα matriisi on


1
0
0
Qα =  0 cos α − sin α  .
0 sin α cos α
kannan suhteen lineaarikuvauksen
Olkoon
M
kannavaihdon
ū = M (0, 0, 1)T .
Koska
M
{ī, j̄, k̄} → {ū, v̄, w̄} matriisi ts. ū = M (1, 0, 0)T , v̄ = M (0, 1, 0)T ,
on nyt ortonormaali, niin
{ī, j̄, k̄}
luonnollisen kannan
M −1 = M T
ja kierron
fα
matriisi
suhteen on
Pα = M Q α M T .
U = Pα X jos ja vain jos X = PαT U , joten X T DX = 1 jos ja vain jos U T Pα DPαT U =
1. Täten fα on R3 :n kierto, joka kuvaa pinnan S pinnaksi
Nyt
Rα : X T Pα DPαT X = 1.
Esimerkki 4. Olkoon vaikkapa
√ 1 (11ī
266
ū =
√1 (ī
14
+ 2j̄ + 3k̄), v̄ =
− 3j̄ + k̄)
α
S : x2 − 3y 2 + 5z 2 = 1
w̄ =
kierretään
ū suuntaisen kiertoakselin ympäri, kun −2 ≤ x, y, z ≤ 2
arvosta 0 arvoon 6.2 ≈ 2π askelpituudella 0.1.
verran vektorin
kulkee (toistuvasti)
Tässä animaatiossa puolestaan kierretään kaksivaippaista hypeboloidia
5z 2 = 1
ja
+ 8j̄ − 9k̄).
Tässä animaatiossa yksivaippaista hypeboloidia
kulman
√1 (3ī
19
ja
α
S : x2 − 3y 2 −
saman kiertoakselin ympräri.
Tässä animaatiossa taasen kierrettävä objekti on ellipsoidi
−2 ≤ x, y, z ≤ 2
ja kiertoakseli on edelleen sama kuin edellä.
S : 2x2 + 3y 2 + 5z 2 = 1, kun