Neliömuodoista, matriisin ominaisarvoista ja avaruuden kierroista
Transcription
Neliömuodoista, matriisin ominaisarvoista ja avaruuden kierroista
Neliömuodoista, matriisin ominaisarvoista ja avaruuden kierroista Marko Moisio 1. Neliömuodoista ja matriisin ominaisarvoista Tarkastellaan toisen asteen tasokäyrän määräävää yhtälöä a, b, c, d ax2 + by 2 + 2cxy = d, missä ovat vakioita. Tässä vasemmalla puolella esiintyvää polynomia kutsutaan neli- ömuodoksi. Pyrimme sopivalla tason kierrolla saattamaan tämän yhtälön diagonaalimuo- αu2 + βv 2 = d. 2 2 Yhtälö ax + by + 2cxy = d toon voidaan kirjoittaa matriisimuodossa x (x y)A =d y (1) missä ac A= . cb Havaitaan, että Olkoon A on symmetrinen ts. P = (P1 P2 ) A = AT . 2 × 2-matriisi x u =P y v reaalinen ja säännöllinen ja sijoitetaan yhtälöön (1) jolloin yhtälön (1) vasen puoli on muotoa T u u u T AP = (u v)(P AP ) . P v v v P jolle P T AP = D, α0 D= , α, β ∈ R. 0β Tavoitteena on siis löytää sellainen matriisi missä Tällöin (1) saadaan diagonaalimuotoon αu2 + βv 2 = d. (2) P kuvauksena f : R2 → R2 , f (X) = P X , joka kuvaa ax2 + by 2 + 2cxy = d. Mikäli f on tason kierto, niin käyrä Voimme siis ajatella matriisia käyrän 2 αx2 + βy 2 = d 2 ax + by + 2cxy = d käyräksi voidaan ajatella käyräksi, joka saadaan kun käyrää kierretään origon suhteen kuvauksen P αx2 + βy 2 = d määräämän kulman verran. Käsittelemme kiertoja tarkemmin luvussa 2. Kysymystä neliömuodon diagonalisoimisesta voidaan tarkastella yleisemminkin. Jatkossa samaistamme n R . n×1-matriisin X = (x1 x2 . . . xn )T ja koordinaattivektorin (x1 , . . . , xn ) ∈ 2 Olkoon h(x1 , . . . xn ) neliömuoto eli homogeeninen astetta kaksi oleva polynomi ts. n X h(x1 , . . . xn ) = aij xi xj = (x1 x2 . . . xn )A(x1 x2 . . . xn )T , i,j=1 missä a11 a12 · · · a21 a22 · · · A= . .. ... . . . an1 an2 · · · on symmetrinen ts. A = AT . λ1 0 · · · 0 λ2 · · · D= . .. ... . . . 0 ··· 0 P jolle P T AP = D, missä 0 0 . . . . λn (x1 x2 . . . xn )T = P (u1 u2 . . . un )T Tällöin nimittäin muuttujan vaihdolla h(x1 , . . . , xn ) ann Tavoitteena on löytää matriisi neliömuoto a1n a2n . . . saadaan diagonaaliseksi neliömuodoksi h(u1 , . . . , un ) = λ1 u21 + · · · + λn u2n . Miten ts. P tulisi valita? Oletetaan, että P T P = I. P Tällöin P = (P1 P2 . . . Pn ) on ortonormaali n×n-matriisi on säännöllinen, P −1 = P T ja P T AP = D ⇐⇒ P −1 AP = D ⇐⇒ AP = DP ⇐⇒ AP1 = λ1 P1 , . . . , APn = λn Pn . Täten on voimassa seuraava tulos: Lemma 1. Jos yhtälöiden P P T = I, niin P T AP = D AX = λ1 X, . . . , AX = λn X jos ja vain jos λi ja vektorit Pi ovat vastaavasti jotkin ratkaisut joillakin reaaliluvuilla Osoittautuu, että myös käänteinen tulos pätee ts. jos massa reaaliluvut P1 , . . . , P n joille APi = λi Pi A kaikilla λ1 , . . . , λn . on symmetrinen, niin on ole- i = 1, . . . , n ja PPT = I kun P = (P1 P2 . . . Pn ). Miten luvut λ ja niitä vastaavat vektorit Xλ voidaan löytää? Kysymys on niin keskeinen, että asetamme seuraavan yleisen määritelmän. Määritelmä. Olkoon BX = λX B n × n-matriisi ja λ ∈ C. Jos yhtälöllä ratkaisu Xλ , sanotaan lukua λ matriisin B kompleksilukukertoiminen on jokin nollavektorista eroava ominaisarvoksi ja vektoria Xλ siihen kuuluvaksi ominaisvektoriksi. Edellinen kysymys voidaankin asettaa yleisemmässä muodossa: miten matriisin B omi- naisarvot ja niihin liittyvät ominaisvektorit voidaan löytää? Vastaus on (ainakin periaatteessa) helppo: koska X 6= 0, niin BX = λX ⇐⇒ (B − λI)X = 0 ⇐⇒ det(B − λI) = 0. 3 n-asteisen Täten ominaisarvot ovat naisarvoyhtälön) ratkaisut ja ominaisarvoon (B − λI)X = 0 t=λ Rajoitutaan nyt (hetkeksi) tapaukseen, missä A= A (eli B :n omi- kuuluvat ominaisvektorit ovat yhtälön X ∈ R2 \ {0̄}. ratkaisut Lause 2. Matriisin det(B − tI) = 0 polynomiyhtälön ac , cb A on reaalinen symmetrinen 2×2-matriisi c 6= 0. ominaisarvot ovat reaaliset ja erisuuret, ja niitä vastaavat ominais- vektorit ovat toisiaan vasten kohtisuorassa. Todistus. Nyt det(A − tI) = 0 ⇔ (a − t)(b − t) − c2 = 0 ⇔ t2 − (a + b)t + ab − c2 = 0. c 6= 0, Koska niin tämän yhtälön juuret α= a+b+ p (a − b)2 + 4c2 2 ja ovat reaaliset ja erisuuret. Koska matriisin on A:n β= A − λI a+b− p (a − b)2 + 4c2 2 rivit ovat lineaarisesti riippuvat jos λ ominaisarvo, niin c (A − λI)Xλ = 0 ⇐⇒ (a − λ)x1 + cx2 = 0 ⇐⇒ Xλ = s λ−a ∀s ∈ R. Täten Xα · Xβ = 0 ⇐⇒ c2 + (α − a)(β − a) = 0 ⇐⇒ c2 + αβ − (α + β)a + a2 = 0. α+β =a+b Koska ja αβ = ab − c2 , niin väite seuraa. Lemman 1 ja Lauseen 2 nojalla saamme menetelmän matriisin P konstruoimiseksi ja näin menetelmän yhtälön (1) diagonalisoimiseksi eli saattamiseksi muotoon (2): α ja β ominaisarvoyhtälön det(A − tI) = 0 ratkaisut. Olkoot Xα ja Xβ yhtälöryhmien (A − αI)X = 0 ja (A − βI)X = 0 nollavektorista (5) Olkoot (6) eroavia ratkaisuja. (7) P = (P1 P2 ), missä P1 = Xα ja ||Xα || P2 = Xβ . ||Xβ || Yhtälöistä (6) riittää ratkaista vain toinen. Nimittäin, jos esim. vektorien Xα ja Xβ kohtisuoruuden nojalla voidaan valita Xα = (x1 x2 )T , T Xβ = (−x2 x1 ) T niin . (−x2 x1 ) on välttämättä ominaisarvoon β kuuluva ominaisvektori, sillä (−x2 x1 )T 2 kuuluu Xα :n virittämän R :n aliavaruuden ortogonaalikomplementtiin, joka puolestaan on Nyt Xβ :n virittämä. Voidaan siis valita (ks. Lauseen 2 todistus): Xα = √ missä α= a+b+ (a−b)2 +4c2 ts. 2 1 α−a c ja Xβ = − α−a c , 1 4 1 √ |c| s + c s2 + 1 Xα = missä s= ja Xβ = −s − |c| c √ s2 + 1 1 , b−a . 2c Täten yhtälön (1) diagonalisoiva matriisi 1 P = ||Xα || jota vastaava lineaarikuvaus ī + (s + |c| c √ s2 + 1)j̄ s+ f 1 √ |c| c kiertää suuntainen ja A= √ s2 + 1 , 1 |c| c s2 + 1 xy -tason uv -tasoksi, v -akseli on vektorin −(s + Esimerkki 1. Diagonalisoidaan yhtälö Tämän yhtälön matriisi −s − u-akseli on vektorin √ 2 s + 1)ī + j̄ suuntainen. missä |c| c 5x2 + 4xy + 2y 2 = 1 ja tarkastellaan sen kuvaajaa. 2 5 , jonka ominaisarvot 2 2 α ja β ovat yhtälön det(A − tI) = (5 − t)(2 − t) − 4 = 0 juuret ts. α = 7+5 2 = 6, β = 2 Koska nyt s= suuntainen ja v -akseli = 1. 6u + v = 1 koordinaatistossa muotoa 2−5 4 7−5 2 2 = −3/4, niin on vektorin Täten yhtälö − 12 ī + j̄ on vektorin jonka ominaisarvot α ja β ī + (− 43 + q 9 16 + 1)j̄ = ī + 12 j̄ arctan(1/2) ≈ 26.57◦ x2 − 12xy + 6y 2 + x + y = 2 x2 − 12xy + 6y 2 A= uv - suuntainen. Kyseessä on siis tason kierto vastapäivään kulman kuvaajaa. Nyt neliömuodon on ja vastaava tasokäyrä on siis ellipsi. u-akseli Esimerkki 2. Diagonalisoidaan yhtälö 5x2 + 4xy + 2y 2 = 1 matriisi on 1 −6 −6 6 , ovat yhtälön det(A − tI) = (1 − t)(6 − t) − 36 = 0 verran. ja tarkastellaan sen 5 juuret ts. 5 − 12 − 13 12 α = 7+13 2 = 10, β = = − 18 = − 23 , 12 7−13 2 = −3. Nyt s = b−a 2c 5 = − 12 ja s+ |c| c √ 1 + s2 = joten Xα = 1 −3/2 ja 3/2 Xβ = 1 ja 2 P =√ 13 joka vastaa tason kiertoa kulman Täten yhtälö 1 =√ 13 arctan(3/2) ≈ 56.31◦ 1 3/2 −3/2 1 2 3 −3 2 , verran myötäpäivään. Lisäksi x u 1 2u + 3v =P =√ . y v 13 −3u + 2v x2 − 12xy + 6y 2 + 3x + 2y = 2 on uv -koordinaatistossa 3 2 10u2 − 3v 2 + √ (2u + 3v) + √ (−3u + 2v) = 2 13 13 13 ⇐⇒ 10u2 − 3v 2 + √ v = 2 13 ! √ 13 ⇐⇒ 10u2 − 3 v 2 − v =2 3 √ !2 13 11 13 =2− = ⇐⇒ 10u2 − 3 v − 6 12 12 √ !2 120 2 36 13 ⇐⇒ u − v− =1 11 11 6 muotoa Tätä yhtälöä vastaava käyrä on hyperbeli, jonka symmetriapisteen koordinaatit ovat √ (u, v) = (0, 13/6) eli (x, y) = (1/2, 1/3). Palataan sitten yleiseen tapaukseen missä A on reaalinen ja symmetrinen n × n-matriisi. 6 Jos n > 2, niin suurin muutos tapaukseen naisarvoyhtälöllä voi olla vähemmän kuin n n=2 verrattuna on se, että nyt A:n omi- erisuurta juurta. Toisaalta Lause 2 yleistyy Lauseiksi 3 ja 4: Lause 3. Matriisin Todistus. Olkoon vektorin X A ominaisarvot ovat reaaliset. λ ∈ C A:n ominaisarvo ts. kompleksikonjugaatti ts. AX = λX X · X = ||X||2 . jollakin X ∈ Cn \ {0̄}. Olkoon X Koska X · AX = X · λX = λX · X = λ||X||2 ja toisaalta T X · AX = X AX = (AT X)T X = AT X · X = AX · X = λ̄X · X = λ̄||X||2 , niin (λ − λ̄)||X||2 = 0. Lause 4. Matriisin A Koska X 6= 0, niin λ = λ̄ λ ∈ R. ts. eri ominaisarvoihin liittyvät ominaisvektorit ovat toisiaan vastaan kohtisuorassa. Todistus. Olkoot α ja β A:n ominaisarvoja, α 6= β . Koska AT = A, niin βXα · Xβ = Xα · βXβ = Xα · AXβ = AXα · Xβ = αXα · Xβ ja näin ollen (α − β)Xα · Xβ = 0. Seuraus. Matriisin A:n Koska α 6= β , niin Xα · Xβ = 0. A ominaisvektoreista voidaan muodostaa Rn :n ortonormali kanta, jos ominaisarvot ovat pareittain erisuuret. Todistus. Algebran peruslauseen nojalla A:lla on n ominaisarvoa. Lauseen 3 nojalla ne ovat kaikki reaalisia ja oletuksen ja Lauseen 4 nojalla niitä vastaavat ominaisvektorit ovat pareittain toisiaan vastaan kohtisuorassa ja täten lineaarisesti riippumattomia. −2x2 + 11y 2 + 5z 2 − 12xy + 12xz = 1. −2x2 + 11y 2 + 5z 2 − 12xy + 12xz matriisi −2 −6 6 A = −6 11 0 , 6 0 5 Esimerkki 3. Diagononalisoidaan yhtälö ömuodon Neli- jonka ominaisarvoyhtälö on −2 − t −6 6 −6 6 + (5 − t) −2 − t −6 11 − t 0 = 6 0 = (A − tI) = −6 −6 11 − t 0 11 − t 6 0 5−t = −t3 + 14t2 + 49t − 686. Täten matriisin ominaisvektorit: A ominaisarvot ovat α = −7, β = 7, γ = 14. Lasketaan vastaavat 7 5 −6 6 x1 0 x1 6 (A−αI)X = 0 ⇐⇒ −6 18 0 x2 = 0 ⇐⇒ x2 = t 2 , t ∈ R. 6 0 12 x3 0 x3 −3 −9 −6 6 x1 0 x1 2 −6 4 0 x2 0 x2 (A−βI)X = 0 ⇐⇒ = ⇐⇒ = t 3 , t ∈ R, 6 0 −2 x3 0 x3 6 −16 −6 6 x1 0 x1 −3 (A−γI)X = 0 ⇐⇒ −6 −3 0 x2 = 0 ⇐⇒ x2 = t 6 , t ∈ R, 6 0 −9 x3 0 x3 −2 Täten neliömuodon diagonalisoivaksi matriisiksi P voidaan valita (ks. Lemma 2) esim. 6 2 3 1 P = 2 3 −6 . 7 −3 6 2 −2x2 + 11y 2 + 5z 2 − 12xy + 12xz = 1 määräämä pinta on hyperboloidin −7x2 + 7y 2 + 14z 2 = 1 kuva kuvauksessa f : R3 −→ R3 , f (X) = P (X). Luvussa 2 Siispä yhtälön näemme, että kuvaus ympäri kulman f vastaa avaruuden ◦ arccos(2/7) ≈ 73.4 2 2 R3 kiertoa (vektorin 2ī + j̄ suuntaisen suoran verran vastapäivään). 2 −2x +11y +5z −12xy+12xz = 1 määräämä pinta on uvw-koordinaatiston 2 2 2 hyperboloidi −7u +7v +14w = 1, kun u-akseli on vektorin 6ī+2j̄ −3k̄ , v -akseli vektorin Täten yhtälön 2ī + 3j̄ + 6k̄ ja w-akseli vektorin 3ī − 6j̄ + 2k̄ Tarkastellaan sitten yleistä tapausta, missä suuntainen. A:n ominaisarvot eivät olekaan välttämättä pareittain erisuuria. Silloinkin pätee seuraava tulos: Lause 5. Matriisin A ominaisvektoreista voidaan muodostaa Rn :n ortonormali kanta. Tämä on melko syvällinen tulos ja sen todistamiseksi kehittelemme vielä hivenen lineaarialgebran koneistoa. Olkoon V vektoriavaruuden jokin kanta. Olkoon suhteen ts. f Rn m-dimensioinen lineaarikuvaus f : V −→ V aliavaruus ja ja Mf V = {v̄1 , . . . , v̄m } kuvauksen f sen matriisi kannan V 8 f (v̄i ) = a1i v̄1 + a2i v̄2 + · · · + ami v̄m , i = 1, . . . , m, jos a11 a21 Mf = ... ··· ··· a12 a22 a1m a2m . . . . . . . am1 am2 · · · Jos nyt f : V → V lineaarikuvaus ja on jokin nollavektorista eroava ratkaisu ominaisarvoksi ja vektoria vain jos amm x̄ = x1 v̄1 +· · ·+xm v̄m ∈ V , niin selvästi f (x̄) = Mf X , missä X = (x1 x2 . . . xm )T . Määritelmä. Olkoon Koska niin x̄λ x̄λ ∈ V , λ ∈ R. Jos yhtälöllä sanotaan lukua λ f (x̄) = λx̄ lineaarikuvauksen f siihen kuuluvaksi ominaisvektoriksi. f (x̄) = Mf X , niin vektori x̄ on reaalilukuun λ kuuluva f :n ominaisvektori jos ja X on λ:aan kuuluva Mf :n ominaisvektori. Määritelmä. Lineaarikuvaus f :V →V on symmetrinen jos f (x̄) · ȳ = x̄ · f (ȳ) kaikilla x̄, ȳ ∈ V . Lemma 2. Olkoon kannan V f :V →V suhteen. Tällöin Todistus. Koska V f lineaarikuvaus ja Mf sen matriisi jonkin ortonormaalin on symmetrinen jos ja vain jos on ortonormaali, niin x̄ · ȳ = X · Y Mf kaikilla on symmetrinen. x̄, ȳ ∈ V . Täten f (x̄) · ȳ = x̄ · f (ȳ) ∀x̄, ȳ ∈ V ⇐⇒ Mf X · Y = X · Mf Y ∀X, Y ∈ Rm . ⇐⇒ (Mf X)T Y = X T Mf Y ∀X, Y ∈ Rm ⇐⇒ X T MtT Y = X T Mf Y ∀X, Y ∈ Rm ⇐⇒ X · MfT Y = X · Mf Y ∀X, Y ∈ Rm ⇐⇒ X · (MfT Y − Mf Y ) = 0 ∀X, Y ∈ Rm . MfT Y − Mf Y = 0 Täten kaikilla Y ∈ Rm eli (MfT − Mf )Y = 0 kaikilla Y ∈ Rm . Siispä MfT = Mf . Lause 4'. Olkoon sella f on m symmetrinen lineaarikuvaus, missä Mf kuvauksen F ominaisarvoa. Lemman 2 nojalla f :n Mf m, niin algebran peruslauseen nojalla sillä on m Mf :n ja on symmetrinen, joten Lauseen 4 nojalla ominaisarvot ovat reaalisia. Lauseen 5 todistus. Olkoon AX . Kuvauk- matriisi jonkin ortonormaalin kannan suhteen. Koska ominaisarvopolynomin aste on täten dim V = m. ominaisarvoa (eivät välttämättä erisuuria) ja ne ovat reaalisia. Todistus. Olkoon Mf :n f : V −→ V f A:n määräämä lineaarikuvaus ts. Lemman 2 ja Lauseen 4' nojalla f :llä on n f : Rn −→ Rn , f (X) = reaalista ominaisarvoa. 9 Olkoon ruus. Nyt U1 ominaisarvoon λ1 kuuluvan f :n ominaisvektorin ū1 virittämä Rn :n aliavaRn voidaan hajottaa suoraksi summaksi Rn = U1 ⊕ U1⊥ ja sille saadaan kanta {ū1 , v̄2 , . . . , v̄n } missä Osoitetaan, että v̄2 , . . . , v̄n ∈ U1⊥ . f (U1⊥ ) ⊆ U1⊥ . Olkoon v̄ ∈ U1⊥ . Nyt f :n symmetrisyyden nojalla ū1 · f (v̄) = f (ū1 ) · v̄ = λ1 ū1 · v̄ = 0, joten f (U1⊥ ) ⊆ U1⊥ . dim U1⊥ = n − 1 Koska nojalla sillä (ja siis f ja on symmetrinen myös rajoitettuna U1⊥ :lle, niin Lauseen 4' A:lla) on n − 1 reaalista ominaisarvoa joihin kuuluvat ominaisvektorit ∈ U1⊥ . Olkoon Nyt U2 ominaisarvoon λ2 kuuluvan ominaisvektorin ⊥ n R = U1 ⊕ U2 ⊕ (U1 + U2 ) ⊥ (U1 + U2 ) . Lisäksi f :n U2 )T ) ⊆ (U1 + U2 )T . ja sillä on kanta ū2 virittämä {ū1 , ū2 , v̄3 , . . . , v̄n }, U1⊥ :n missä aliavaruus. v̄3 , . . . , v̄n ∈ lineaarisuuteen nojautuen nähdään kuten edellä, että Jatkamalla prosessia saadaan Rn :lle lopulta A:n ominaisvektoreista f ((U1 + ū1 , ū2 , . . . , ūn orto- gonaalinen kanta. Esimerkki 4. Diagononalisoidaan yhtälö Neliömuodon 58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz = 1. 58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz matriisi 58 −18 6 A = −18 85 −12 , 6 −12 53 jonka ominaisarvoyhtälö on 58 − t −18 6 0 = (A − tI) = −18 85 − t −12 = t3 − 196t2 + 12005t − 235298 6 −12 53 − t = (t − 49)2 (t − 98). Täten matriisin A ominaisarvot ovat α = 49, β = 49, γ = 98. Lasketaan vastaavat omi- naisvektorit käyttäen Lauseen 5 todistuksessa käytettyä menetelmää (vaikka ne voitaisiin toki laskea ilmankin sitä). Ensinnäkin 11 −18 6 x1 0 x1 2 (A−αI)X = 0 ⇐⇒ −18 36 −12 x2 = 0 ⇐⇒ x2 = t 3 , t ∈ R. 6 −12 4 x3 0 x3 6 Valitaan ū1 = 2ī + 3j̄ + 6k̄ . Jos kannaksi voidaan valita esim. f (X) = AX , rajoitetaan se U U1 on tämän vektorin virittämä aliavaruus, niin {v̄2 , v̄3 }, ⊥ missä v̄2 = 3ī − 2j̄ ja v3 = 3ī − k̄ . :lle ja lasketaan tämän rajoittuman matriisi = 210ī − 224j̄ + 42k̄ = 112v̄2 − 42v̄3 Olkoon nyt Mf . f (v̄2 ) = 3f (ī) − 2f (j̄) = 3(58ī − 18j̄ + 6k̄) − 2(−18ī + 85j̄ − 12k̄) U1⊥ :n Koska 10 ja f (v̄3 ) = 3f (ī) − f (k̄) = 3(58ī − 18j̄ + 6k̄) − (6ī − 12j̄ + 53k̄) niin Mf = U ⊥: koska = 168ī − 42j̄ − 35k̄ = 21v̄2 + 35v̄3 , 112 21 . Lasketaan ominaisarvoon β = 49 −42 35 (Mf − 49I)X = 0 ⇐⇒ 63 21 −42 −14 x1 x2 = 0 0 liittyvä ominaisvekori ⇐⇒ x1 x2 =t (U + , ū2 = −v̄2 + 3v̄3 = 6ī + 2j̄ − 3k̄ . Lopuksi valitsemme vektorin T ⊥ U ) , joten voidaan valita ū3 = 3ī − 6j̄ + 2k̄ . niin voidaan valita avaruudesta −1 3 ū2 ∈ P Näin ollen neliömuodon diagonalisoivaksi matriisiksi P = ū3 voidaan valita 6 2 3 1 2 3 −6 , 7 −3 6 2 joka sattuu olemaan täsmälleen sama matriisi kuin edellisessä esimerkissä. Täten yhtälön 58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz = 1 uvw-koordinaatiston ellipsoidi 6ī + 2j̄ − 3k̄ , v -akseli vektorin 2 2 2 49u + 49v + 98w = 1, missä jälleen 2ī + 3j̄ + 6k̄ vektorin ja w-akseli määräämä pinta on u-akseli on vektorin 3ī − 6j̄ + 2k̄ suuntainen. 11 2. Avaruuden Rn kierroista n × n-matriisit vastaavat avaruuden R kiertoja, kun n = 2, 3. Mitä on vaadittava esimerkiksi 2 × 2-matriisilta P , että Edellisessä luvussa väitimme, että tietyt ortonormaalit n R2 sitä vastaava lineaarikuvaus olisi tason kierto? Ainakin sen on säilytettävä vektorien pituudet ja niiden väliset kulmat. n positivinen kokonaisluku, P n×n-matriisi ja f : Rn −→ Rn , f (X) = kuvauksia f jotka toteuttavat seuraavat ehdot: Yleisemmin: olkoon P X. Tarkastellaan ||P X|| = ||X|| ∀X ∈ Rn , n kulmat ts. ] P X, P Y = ](X, Y ) ∀X, Y ∈ R . (1) f säilyttää vektorien pituudet ts. (2) f säilyttää vektorien väliset Osoittautuu, että ehdot (1) ja (2) toteutuvat jos ja vain jos matriisi ts. pystyrivit P1 , . . . , P n muodostavat ortonormaalin joukon ts. T T 2 det(P P ) = det(P ) det(P ) = det(P ) matriisin determinantti on aina Lause 1. Olkoon PX P P P T = I. Koska P i · Pj = 0 Koska 1 = , niin ehdot (1) ja (2) toteuttavan kuvauksen f ±1. P = (P1 P2 . . . Pn ) n×n-matriisi. Lineaarikuvaus f : Rn −→ Rn , f (X) = säilyttää vektorien pituudet ja niiden väliset kulmat jos ja vain jos Todistus. Olkoot on ortonormaali X, Y ∈ Rn , jos i 6= j , jolloin P X = x 1 P1 + · · · + x n P n ja P P T = I. P Y = y1 P1 + · · · + yn Pn . niin =1 =1 z }| { z }| { ||P X||2 = P X · P X = x21 ||P1 ||2 + · · · + x2n ||Pn ||2 = ||X||2 f eli säilyttää pituuden. Osoitetaan, että f säilyttää pistetulon: P :n ortonormaalisuuden nojalla P X · P Y = (x1 P1 + · · · + xn Pn ) · (y1 P1 + · · · + yn Pn ) = x1 y1 + · · · + xn yn = X · Y. Nyt ](P X, P Y ) = f eli säilyttää kulman. Oletetaan sitten, että f PX · PY X ·Y = = ](X, Y ) ||P X|| ||P Y || ||X|| ||Y || f säilyttää vektorien pituudet ja niiden väliset kulmat. Tällöin säilyttää pistetulon, joten X · Y = P X · P Y = (P X)T P Y = X T P T P Y = X · P T P Y ∀X, Y ∈ Rn ekvivalentisti X · (Y − P T P Y ) = 0 ∀X, Y ∈ Rn . Täten T Y − PTPY = 0 P P =I eli P f (ū) = cū, Y ∈ Rn eli (I − P T P )Y = 0 kaikilla Y ∈ Rn f : Rn+1 → Rn+1 joillakin ū ∈ R n+1 ja näin ollen on ortogonaalinen. Lemma 1. Olkoon Jos kaikilla lineaarikuvaus, jonka matriisi \ {0̄} ja c ∈ R, niin on olemassa P on ortonormaali. n+1 R :n kanta jonka 12 suhteen f :n Q matriisi on muotoa c 0 ··· 0 a11 · · · Q= .. ... ... . 0 an1 · · · 0 a1n , . . . ann missä A= a11 · · · . . . .. . an1 · · · a1n . . . ann on ortonormaali. Todistus. Täydennetään joukko {ū} avaruuden Rn+1 ortonormaaliksi kannaksi V = {ū, ū1 , . . . , ūn }. Nyt f (ū) = cū + 0 · ū1 + · · · + 0 · ūn f (ū1 ) = u1 ū + a11 ū2 + · · · + an1 ūn . . . f (ūn ) = un ū + a1n ū2 + · · · + ann ūn cuk = f (ū) · f (ūk ) = 0, kaikilla k = 1, . . . , n. Koska välttämättä c 6= 0, niin nyt u1 = · · · = un = 0. Nyt myös 0 = f (ūi ) · f (ūj ) = a1i a1j + · · · + Koska f ani anj kaikilla i 6= j , Täten Q ovat väitettyä muotoa. säilyttää kulmat, niin ja A Oletetaan että ja n = 2, 1 = ||f (ūj )|| = ||(a1j , . . . , anj )|| olkoon f koska f säilyttää myös pituudet. ehdot (1) ja (2) täyttävä lineaarikuvaus ja P = sen matriisi luonnollisen kannan a c b d {ī, j̄} suhteen. Koska P on ortogonaalinen, niin ac + bd = 0. Jotta (3) f f olisi tason kierto, vaadimme ehtojen (1) ja (2) lisäksi, että pätee ehto: säilyttää x- Esimerkki 1. Jos ja y -akselien P = 0 1 , niin sitä vastaava kuvaus 1 0 muttei ehtoa (3), sillä se vaihtaa peilaus suoran y=x keskinäisen järjestyksen. x-akselin y -akseliksi ja f toteuttaa ehdot (1) ja (2) y -akselin x-akseliksi kiertoa kiertona avaruudessa ja f (j̄) f on suhteen. Jotta saisimme laskennallisen kriteerin joka vastaa ehtoa (3), niin ajatellaan f (ī) eli ja vektori k̄ R3 : xy -tasoa kierretään z -akselin xy -tason ympäri niin, että vektorit muodostavat oikeankätisen systeemin ts. vektorien f (ī) ja f (j̄) 13 ristitulon on oltava vektorin k̄ ī j̄ k̄ f (ī) × f (j̄) = a b 0 c d 0 f Täten vain jos Täten f (ī) = aī + bj̄ ja f (j̄) = cī + dj̄ , = (ad − bc)k̄ = det(P )k̄. suuntainen. Koska f (ī) × f (j̄) det(P ) = 1. toteuttaa ehdon (3) jos ja vain jos det(P ) > 0 f on jos ja vain jos xy -tason P = a2 + b2 = 1. a = cos α Koska tällöin b = sin α ja 1 0 P = P = f suuntainen jos ja a −b b a a , niin b P on muotoa , f kiertää tasoa kulman α verran missä ts. Entäpä jos k̄ kierto eli toteuttaa ehdot (1), (2) ja (3) jos ja vain missä on vektorin niin cos α − sin α sin α cos α . toteuttaa ehdot (1) ja (2) muttei ehtoa (3) ts. det(P ) = −1? Nyt P on −1, joten se on muotoa a b 1 0 a −b P = = , b −a 0 −1 b a ortogonaalinen ja sen determinantti on missä a2 + b2 = 1. xy -tasoa kulman arccos(a) verran ja sitten peilaa sen x-akselin suhteen. Osoittautuu, kuitenkin että f voidaan ajatella pelkkänä peilauksena Täten suoran ` f on kuvaus, joka ensin kiertää suhteen, jonka yhtälö seuraavassa määritetään. Osoitetaan ensin, että f (ū) = ū jollakin ū ∈ R2 ts. PX = X jollakin X ∈ R2 . Ensinnä- kin P X = X ⇐⇒ (P − I)X = 0 ⇐⇒ Koska det(P − I) = −(a2 − 1) − b2 = 0, riippuvat, ja täten on olemassa x ja y toteuttavat suoran ` `: kanta {ū, v̄} f ū ∈ R y=0 (a − 1)x + by = 0 on peilaus suoran jonka suhteen (P − I):n f (ū) = ū. jolle f :n A= det(A) = det(P ) = −1, Täten on todistettu seuraava: ` jos jos vaakarivit ovat lineaarisesti Lisäksi P x y = x y jos ja vain jos niin c = −1. a = 1, a 6= 1. suhteen. Lemman 1 nojalla on olemassa matriisi Koska niin x 0 = . y 0 yhtälön, kun Osoitetaan sitten, että 2 a−1 b b −a − 1 1 0 0 c . 14 f : R2 → R2 Lause 2. Olkoon lineaarinen kuvaus joka toteuttaa ehdot (1) ja (2), P sen λ = det(P ). Tällöin a −b 1 0 cos α − sin α = . b a 0 λ sin α cos α matriisi luonnollisen kannan suhteen ja 1 0 0 λ P = (a) Jos λ = 1, (b) Jos λ = −1, niin f toteuttaa ehdon (3) ja on niin f xy -tason ei toteuta ehtoa (3) ja on kun `: y=0 (a − 1)x + by = 0 kierto kulman xy -tason jos jos α verran. peilaus suoran ` suhteen, a = 1, a 6= 1. xy -tasoa ensin kulman β verkulman α + β verran. Olkoon Tarkastellaan vielä kahta peräkkäistä kiertoa: kierretään ran ja sitten kulman fα , fβ ja fα+β α verran, jolloin tasoa on kierretty ko. kiertoja vastaavat lineaarikuvaukset. Koska fα+β = fα ◦ fβ , niin nyt Lauseen 2 nojalla cos(α + β) − sin(α + β) sin(α + β) cos(α + β) = cos α − sin α sin α cos α cos β − sin β sin β cos β . Täten saamme seuraavat tutut kosinin ja sinin yhteenlaskukaavat: cos(α + β) = cos α cos β − sin α sin β sin(α + β) = sin α cos β + cos α sin β. Oletetaan sitten, että Lemma 2. Olkoon jollakin 2 P X ∈ R \ {0̄} n = 3. ortonormaali ts. 3 × 3-matriisi. f (ū) = det(P )ū, Yhtälö 2 u∈R jollakin P X = det(P )X on ratkeava . λ = det(P ) = ±1. Riittää osoittaa, että det(P − λI) = 0. Ensinnäkin P (P − λI) = I − λP T = λ(λI − P T ) = λ(λI − P )T . Koska λ det(P T ) = Todistus. Olkoon havaitaan, että T λ det(P ) = λ2 = 1, niin det(P − λI) = λ det(P T ) det(P − λI) = λ det(P T (P − λI)) = λ det(λ(λI − P )T ) = λ4 det((λI − P )T ) = det(λI − P ) = −(P − λI), ja näin ollen Avaruuden det(P − λI) = 0. R3 kierrolla tarkoitamme kuvausta origon kautta kulkevan suoran eli kiertoakselin tainen vektori ja a c b d joka kiertää avaruuden ympäri ts. jos ū R3 jonkin on kiertoakselin suun- V = {ū, v̄, w̄} on jokin oikeakätinen ortonormaali joukko, niin f :n matriisi tämän kannan suhteen on missä u f, vastaa vw-tason 1 0 0 Q = 0 a c , 0 b d kiertoa. 15 Oletetaan, että olemassa 3 ū ∈ R f joukko. Jotta f on ehdot (1) ja (2) täyttävä lineaarikuvaus ja oletetaan, että on jolle f (ū) = ū. Olkoon R3 olisi avaruuden V = {ū, v̄, w̄} jokin oikeakätinen ortonormaali kierto, vaadimme nyt että ehtojen (1) ja (2) lisäksi pätee ehto: (3') f säilyttää joukon V oikeakätisyyden ts. Lemman 1 nojalla kuvauksen f Q matriisi {f (ū), f (v̄), f (w̄)} kannan V suhteen on oikeakätinen. on muotoa 1 0 0 0 a c , Q= 0 b d missä A= a c b d , on ortonormaali. Koska {f (ū), f (v̄), f (w̄)} on oikeakätinen, niin ristitulon f (v̄) × f (w̄) = (ad − bc)ū = det(A)ū on oltava vektorin f (ū) = ū suuntainen. Täten ehdon f (ū) = ū täyttävä lineaarikuvaus täyttää ehdon (3') jos ja vain jos det(A) = 1 jos ja vain jos det(P ) = det(Q) = 1. Toisaalta Lemman 2 ja Lauseen 1 nojalla jokaisella ehdot (1) ja (2) täyttävällä lineaarikuvauksella f : R3 −→ R3 f Entäpä jos on kiertoakseli ts. sellainen vektori että toteuttaa ehdot (1) ja (2) muttei ehtoa (3')? Nyt mojen 1 ja 2 nojalla on olemassa ortonormaali kanta Q ū {ū, v̄, w̄} f (ū) = ū. det(P ) = −1 ja Lem- f :n matriisi jonka suhteen on muotoa: 1 0 0 −1 0 0 −1 0 0 Q = 0 a c = 0 0 0 0 a c , 0 b d 0 0 0 0 b d missä A= a c b d on ortonormaali ja det(A) = 1. Täten on todistettu seuraava: Lause 3. Olkoon koon missä 3 ja ū ∈ R lineaarinen kuvaus joka toteuttaa ehdot (1) ja (2), ol- f (ū) = λū. Olkoon V = {ū, v̄, w̄} joukko. Silloin kannan V suhteen f :n matriisi on: λ 0 0 λ 0 0 Q = 0 a −b = 0 cos α − sin α , 0 b a 0 sin α cos α λ = det(P ) ortonormaali f : R3 → R3 , jolle jokin oikeakätinen f (v̄) = av̄ + bw̄. λ = 1, niin f toteuttaa myös ehdon (3') ja f ympäri kulman α verran. (a) Jos (b) Jos λ = −1, niin f ei toteuta ehtoa (3') ja (u, v, w) 7→ (−u, v, w) yhdistetty kuvaus. f on avaruuden R3 kierto u-akselin on (a)-kohdan kierron ja peilauksen 16 Esimerkki 2. Esimerkin 1 peilausta voidaan ajatella avaruuden f, f (k̄) = −k̄ . Täten kierron f √1 (ī 2 ū = missä kiertoakseli on vektorin matriisi P + j̄) suuntainen ts. luonnollisen kannan R3 180 asteen kiertona f (ī) = j̄ , f (j̄) = ī ja {ī, j̄, k̄} suhteen on 0 1 0 1 0 0 . P = 0 0 −1 Valitaan sitten v̄ = √1 (ī 2 − j̄) ortogonnormaali, ja lasketaan ja f :n w̄ = k̄ , matriisi jolloin joukko Q V = {ū, v̄, w̄} oikeakätinen ja tämän kannan suhteen. Koska f (ū) = ū, 1 1 1 f (v̄) = √ f (ī − j̄) = √ f (ī) − f (j̄) = √ j̄ − ī = −v̄, 2 2 2 niin 1 0 0 A = 0 −1 0 , 0 0 −1 joka tosiaankin vastaa avaruuden R3 180 asteen kiertoa vektorin u suuntaisen suoran ympäri. Esimerkki 3. Olkoon 6 2 3 1 P = 2 3 −6 7 −3 6 2 ja tarkastellaan sen määräämää lineaarikuvausta 1, joten PX = X jollakin X ∈ R3 . f : R3 → R3 , f (X) = P X . Nyt det(P ) = Nyt −1 2 3 x x 6 2 3 0 x 0 , y 2 −4 −6 y 2 3 −6 ⇐⇒ =7 y P X = X ⇐⇒ = −3 6 −5 z 0 −3 6 2 z z 1 1 ja täten voidaan valita (x, y, z) = (2, 1, 0) ts. ū = √ 2ī+ j̄ . Valitaan lisäksi v̄ = √ ī−2j̄ 5 5 ja w̄ = −k , Q tämän kannan suhteen. jolloin V = {ū, v̄, w̄} on ortonormaali ja oikeakätinen. Lasketaan f :n Koska 7 1 7f (v̄) = √ f (ī) − 2f (j̄) = √ (6ī + 2j̄ − 3k̄) − (4ī + 6j̄ + 12k̄) 5 5 1 = √ (2ī − 4j̄ − 15k̄), 5 niin 1 1 7f (v̄) = cv̄ + dw̄ ⇐⇒ √ (2ī − 4j̄ − 15k̄) = c √ (i − 2j̄) − dk̄ 5 5 √ ⇐⇒ c = 2 ja d = 3 5, matriisi 17 ja näin ollen f (v̄) = 72 v̄ + √ 3 5 w̄. Siispä 7 1 0 0 √ 2/7 −3 5/7 . Q= 0 √ 2/7 0 3 5/7 Täten kulman f ◦ arccos(5/14) ≈ 69.1 Olkoon ts. on kierto, joka kiertää avaruuden R3 vektorin ū suuntaisen suoran ympäri verran vastapäivään. S avaruuden R3 toisen asteen pinta, jonka määräävä yhtälö on diagonaalimuotoa S : ax2 + by 2 + cz 2 = 1, S : X T DX = 1, a 0 0 D = 0 b 0 . 0 0 c ekvivalentisti missä X = (x y z) ja Havainnollistetaan animaatioiden avulla tällaisten pintojen kiertoa jonkin kiertoakselin ympäri. Olkoon siis ū ∈ R3 ja fα avaruuden kiertoakselin ympäri. Olkoon R3 {ū, v̄, w̄}, kierto kulman α verran vektorin ū suuntaisen jokin ortonormaali oikeakätinen joukko. Tämän fα matriisi on 1 0 0 Qα = 0 cos α − sin α . 0 sin α cos α kannan suhteen lineaarikuvauksen Olkoon M kannavaihdon ū = M (0, 0, 1)T . Koska M {ī, j̄, k̄} → {ū, v̄, w̄} matriisi ts. ū = M (1, 0, 0)T , v̄ = M (0, 1, 0)T , on nyt ortonormaali, niin {ī, j̄, k̄} luonnollisen kannan M −1 = M T ja kierron fα matriisi suhteen on Pα = M Q α M T . U = Pα X jos ja vain jos X = PαT U , joten X T DX = 1 jos ja vain jos U T Pα DPαT U = 1. Täten fα on R3 :n kierto, joka kuvaa pinnan S pinnaksi Nyt Rα : X T Pα DPαT X = 1. Esimerkki 4. Olkoon vaikkapa √ 1 (11ī 266 ū = √1 (ī 14 + 2j̄ + 3k̄), v̄ = − 3j̄ + k̄) α S : x2 − 3y 2 + 5z 2 = 1 w̄ = kierretään ū suuntaisen kiertoakselin ympäri, kun −2 ≤ x, y, z ≤ 2 arvosta 0 arvoon 6.2 ≈ 2π askelpituudella 0.1. verran vektorin kulkee (toistuvasti) Tässä animaatiossa puolestaan kierretään kaksivaippaista hypeboloidia 5z 2 = 1 ja + 8j̄ − 9k̄). Tässä animaatiossa yksivaippaista hypeboloidia kulman √1 (3ī 19 ja α S : x2 − 3y 2 − saman kiertoakselin ympräri. Tässä animaatiossa taasen kierrettävä objekti on ellipsoidi −2 ≤ x, y, z ≤ 2 ja kiertoakseli on edelleen sama kuin edellä. S : 2x2 + 3y 2 + 5z 2 = 1, kun