M5 - Jyväskylän yliopiston Koppa
Transcription
M5 - Jyväskylän yliopiston Koppa
M5 0.0. M5: Lineaarialgebra 1/76 M5 M5: Lineaarialgebra Lineaarisella yht¨al¨ oryhm¨all¨a joko ei ole yht¨a¨an ratkaisua, on t¨asm¨alleen yksi ratkaisu tai on ¨a¨arett¨ om¨an monta ratkaisua. Luennot Juha Merikoski 8.9.–29.10.2014 ma&ke 12-14 (FYS3) Laskuharjoitukset 7 kertaa, ke, max 12 p (voimassa vuoden) 1. tentti Perjantaina 31.10.2014, max 48 p 2. tentti Perjantaina 21.11.2014 Yleinen tenttip¨aiv¨a 30.1.2015 Pieni¨a yht¨al¨ oryhmi¨a olemme koulussa oppineet ratkaisemaan eliminointimentelm¨all¨a. Se helpottuu huomattavasti (paperilla ja tietokoneessa, kts. §2) ottamalla k¨aytt¨ o¨ on matriisit. Esimerkiksi yht¨al¨ oryhm¨a x1 − 2x2 + x3 = 0 (3) 2x2 − 8x3 = 8 −4x1 + 5x2 + 9x3 = −9 Oletetut esitiedot Fysp111 ja Fysp112 Avuksi my¨os Lineaarinen algebra ja geometria (matem) Kirjallisuutta Adams&Essex: Calculus s. 600-609 (ei kattava) Fysiikan matemaattisten menetelmien kirjat, esim. Arfken, Boas, Lay, Riley&Hobson&Bence Taulukkokirjat Alan Jeffrey s. 50-66 voidaan esitt¨a¨a t¨aydent¨am¨all¨a yht¨al¨ oryhm¨an kerroinmatriisi A ns. t¨aydennetyksi matriisiksi B 0 1 −2 1 1 −2 1 2 −8 8 2 −8 A= 0 B= 0 (4) −4 5 9 −9 −4 5 9 P¨aivitetty luentorunko ja uusimmat teht¨av¨at suoraan Kopasta: https://koppa.jyu.fi/kurssit/168997/materiaali/Luennot.pdf https://koppa.jyu.fi/kurssit/168997/harjoitukset/Tehtavat.pdf Muu materiaali (malliratkaisuja yms) Kopassa salasanan takana. 0.1. Kurssin tavoitteet 2/76 M5 0.1. Kurssin tavoitteet 5/76 Yleisesti m×n–matriisilla A tarkoitetaan kaari- tai hakasulkujen sis¨all¨a olevaa lukukaaviota, jossa on m rivi¨a (vaakarivi¨a) ja n saraketta (pystyrivi¨a) alkiot (matriisielementit) aij , i = 1, ..., m ja j = 1, ...n eli a11 a12 · · · a1n a21 a22 · · · a2n A= . (5) .. .. , .. . . am1 am2 · · · amn miss¨a alkiot aij ∈ R tai aij ∈ C. K¨ayt¨amme my¨ os merkint¨oj¨a A = (aij ) Kurssin asiat k¨asitell¨a¨an p¨a¨aosin (ja tarkoin todistuksin) my¨ os matematiikan kursseilla Lineaarinen algebra ja geometria 1&2. N¨am¨a luentokalvot ovat verrattain tiiviit ja rakentuvat p¨a¨aosin Jouni Suhosen tekem¨an luentomonisteen (2012) mukaisesti. Aihetta k¨asitell¨a¨an my¨os Markku Lehdon monisteessa (2001). [A]ij = aij . (6) Sanomme, ett¨a n×n–matriisi = neli¨ omatriisi (jolle siis m = n) 1×n–matriisi = vaakavektori = rivivektori = rivimatriisi m×1–matriisi = pystyvektori = sarakevektori = sarakematriisi 1.1. Lineaariset yht¨ al¨ oryhm¨ at ja matriisit 3/76 1. Matriisit ja matriisioperaatiot 1.1. Lineaariset yht¨al¨oryhm¨at ja matriisit M5 1.1. Lineaariset yht¨ al¨ oryhm¨ at ja matriisit m×n–matriisin A = (aij ) transpoosi AT (1) olevaa yht¨al¨o¨a muuttujille x1 , . . . , xn , miss¨a ai ja b ovat vakioita. Lineaarinen yht¨al¨oryhm¨a on useamman sellaisen lineaarisen yht¨al¨ on ryhm¨a, joissa on samat tuntemattomat muuttujat xi , i = 1, . . . , n. Esimerkiksi kahden muuttujan (n = 2) yht¨al¨oryhm¨a on ( a11 x1 + a12 x2 = b1 (2) a21 x1 + a22 x2 = b2 ja vakioista aij ja bi riippuen t¨all¨a yht¨al¨oryhm¨all¨a joko ei ole yht¨a¨an ratkaisua, on t¨asm¨alleen yksi ratkaisu (yksi piste) tai ¨a¨arett¨ om¨an monta ratkaisua (suora). Esim Esimerkit kustakin em. tapauksesta kahden yht¨al¨on ryhm¨alle. eli matriisin (5) transpoosi (transponoitu matriisi) on a11 a21 · · · am1 a12 a22 · · · am2 AT = . .. .. . .. . . a1n a2n · · · amn Esim Vaakavektorin transpoosi on pystyvektori: a ! T b a b c d = c d Huom (x1 , x2 , x3 ) ∈ R3 6/76 on n×m-matriisi, jolle [AT ]ij = [A]ji ∀i, j Lineaariseksi yht¨al¨oksi kutsumme muotoa a 1 x 1 + a 2 x 2 + . . . + a n xn = b 1.1. Lineaariset yht¨ al¨ oryhm¨ at ja matriisit M¨a¨aritelm¨a Kurssi sis¨alt¨a¨a seuraavia asioita: ◦ lineaariset yht¨al¨oryhm¨at ◦ matriisit ja matriisioperaatiot ◦ determinantti ja k¨a¨anteismatriisi ◦ vektoriavaruudet ja lineaarikuvaukset ◦ matriisin ominaisarvot ja -vektorit ◦ diagonalisointi ja neli¨ omuodot ◦ kompleksiset vektoriavaruudet Kurssin vaativuustaso on asetettu siten, ett¨a kurssin antamilla tiedoilla (n¨ailt¨a osin) voi esim. suorittaa Mekaniikan kurssin ja aloittaa Kvanttimekaniikan kurssin. M5 4/76 Useammankin kuin kahden muuttujan yht¨al¨ oryhm¨alle p¨atee Lause: Fysa115 (3 op) Syksy 2014, Fysiikan laitos, Jyv¨askyl¨an yliopisto M5 1.1. Lineaariset yht¨ al¨ oryhm¨ at ja matriisit x1 tarkoittaa joskus pystyvektoria x2 . x3 (7) (8) M5 1.1. Lineaariset yht¨ al¨ oryhm¨ at ja matriisit 7/76 Neli¨omatriisi A = (aij ) on symmetrinen, jos eli aij = aji ∀i, j. δij = 1, kun i = j 0, kun i 6= j Olkoon annetut m×p−matriisi A = (aij ) ja p×n−matriisi B = (bij ). Niiden tulomatriisi on m×n−matriisi C = (cij ), jonka alkiot ovat (9) C = AB ⇔ cij = on Kroneckerin delta. Diagonaalimatriisille k¨aytet¨a¨an merkint¨a¨a a11 0 · · · 0 0 a22 · · · 0 (10) A= . .. = diag(a11 , a22 , . . . , ann ). . . .. .. .. . 0 0 · · · ann 1.2. Matriisien yhteenlasku ja skalaarilla kertominen 8/76 M5 1.3. Matriisikertolasku (11) (24) Jos [A, B] = 0, niin sanomme, ett¨a A ja B kommutoivat. Yleens¨a BA 6= AB eli A ja B eiv¨at kommutoi, jolloin niiden kommutaattori on nollasta poikkeava (kiinnostavakin) matriisi. Erityisen hy¨ odyllinen on n×n−yksikk¨ omatriisi 1 0 ··· 0 1 · · · I = diag(1, 1, ..., 1) = . . . .. .. .. (13) Merkinn¨all¨a −A tarkoitamme matriisia, joka saadaan kun c = −1: 0 0 ··· −A = (−1)A ⇔ [−A]ij = −[A]ij ∀i = 1, ..., m, j = 1, ..., n. (14) 0 0 .. . . (25) 1 Neli¨ omatriisille A m¨a¨aritell¨a¨an my¨ os sen k:s potenssi (k ≥ 0) Huom N¨am¨a m¨a¨arittelyt yleistyv¨at sellaisinaan my¨os kompleksiseen tapaukseen, jossa matriisien alkiot tai skalaari ovat kompleksisia. A0 = I 9/76 M¨a¨aritelm¨at edell¨a tuottavat matriisien yhteenlaskulle ja skalaarilla kertomiselle laskus¨a¨ann¨ot1 11/76 [A, B] = AB − BA. (12) 1.2. Matriisien yhteenlasku ja skalaarilla kertominen (23) Neli¨ omatriiseista Jos A ja B ovat kumpikin n×n−matriiseja, niin sek¨a AB ett¨a BA ovat n×n−matriiseja. Fysiikassa on k¨aytt¨ o¨a kommutaattorille Skalaarilla kertominen Kertomalla m×n–matriisi A = (aij ) vakiolla c ∈ R (tai c ∈ C) saadaan m×n–matriisi B = (bij ) M5 k=1 Jos m 6= n, niin k¨a¨anteinen tulo BA ei ole m¨a¨aritelty. Yhteenlasku m×n–matriisien A = (aij ) ja B = (bij ) summa on m×n–matriisi C = (cij ) , jolle B = cA = Ac ⇔ bij = caij ∀i = 1, ..., m, j = 1, ..., n. j = 1, . . . , n Jos yll¨a m = n, voidaan laskea my¨ os BA, joka on p×p−matriisi. Yht¨asuuruus m×n–matriisit A = (aij ) ja B = (bij ) ovat samat,jos C = A + B ⇔ cij = aij + bij ∀i = 1, ..., m, j = 1, ..., n. i = 1, . . . , m aik bkj Oleellista: A:ssa yht¨a monta saraketta kuin rivej¨a B:ssa (p kpl). 1.2. Matriisien yhteenlasku ja skalaarilla kertominen A = B ⇔ aij = bij ∀i = 1, ..., m, j = 1, ..., n. p X Siis C:n alkio cij on A:n i:nnen rivin ja B:n j:nnen sarakkeen vastinalkioiden tulojen summa. Huom Matriisin diagonaalisuus viittaa nimenomaan vasemmasta yl¨akulmasta oikeaan alakulmaan kulkevaan diagonaaliin ja sen symmetrisyys peilisymmetrisyyteen kyseisen diagonaalin suhteen. M5 10/76 Matriiseille voi m¨a¨aritell¨a useammankinlaisia tuloja; nyt k¨asitell¨a¨an niist¨a sit¨a, jota tavallisimmin kutsutaan matriisikertolaskuksi. Neli¨omatriisi A = (aij ) on diagonaalinen, jos aij = aij δij , miss¨a ( 1.3. Matriisikertolasku 1.3. Matriisikertolasku Neli¨omatriisin (n×n) transpoosi on neli¨omatriisi (n×n). A = AT M5 M5 A1 = A A2 = AA Ak = AA · · · A. (26) 1.4. Matriisikertolaskun ja transpoosin ominaisuuksia 12/76 1.4. Matriisikertolaskun ja transpoosin ominaisuuksia Olettaen matriisien dimensiot ja luvut j, k sellaisiksi, ett¨a kaikki tulot ja summat ovat m¨a¨ariteltyj¨a (c on mv. skalaari), p¨atee A+B = B+A (15) (A + B) + C = A + (B + C) (16) A(BC) = (AB)C (27) (17) A(B + C) = AB + AC (28) (18) (A + B)C = AC + BC (29) (19) c(AB) = A(cB) (30) ∃ 0, jolle A + 0 = A ∀ A ∀ A ∃ − A siten, ett¨a A + (−A) = 0 (c1 c2 )A = c1 (c2 A) 1A = A (20) AI = A = IA (31) c(A + B) = cA + cB (21) A0 = 0 = 0A (32) (c1 + c2 )A = c1 A + c2 A, (22) miss¨a esiintyv¨at c, c1 , c2 ovat skalaareja ja kaikki matriisit ovat m×n−matriiseja, mukaanlukien nollamatriisi: [0]ij = 0 ∀i, j. 1 Todistukset menev¨ at alkioittain ja huomaten, ett¨ a alkioille p¨ atev¨ at samat ass¨ a muodossaan laskus¨ a¨ ann¨ ot kuin muillekin skalaareille eli c:lle ja ci :lle. T¨ ’laskus¨ a¨ ann¨ ot’ vastaavat vektoriavaruudelle (kts. my¨ oh.) annettuja ehtoja. ja erityisesti neli¨ omatriiseille Aj Ak = Aj+k (33) (Aj )k = Ajk . (34) Huom Matriisin potenssin kautta voidaan m¨a¨aritell¨a esimerkiksi e A = I + A + 12 A2 + 16 A3 + . . . M5 1.4. Matriisikertolaskun ja transpoosin ominaisuuksia 13/76 M5 (AB)T = BT AT (35) (A + B)T = AT + BT (36) (cA)T = cAT (37) (AT )T = A (38) IT = I. (39) Ratkaistessamme yht¨al¨ oryhm¨a¨a sellaisenaan olemme tottuneet k¨aytt¨am¨a¨an seuraavia operaatioita: yht¨al¨ on kertominen vakiolla, yht¨al¨ on lis¨a¨aminen toiseen, yht¨al¨ oiden j¨arjestyksen vaihtaminen.3 N¨aiden operaatioiden tarkoituksena on saattaa yht¨al¨oryhm¨a yksinkertaisemmaksi, ratkaisultaan ekvivalentiksi yht¨al¨oryhm¨aksi, kunnes ratkaisu lopulta l¨ oytyy. N¨am¨a operaatiot ovat suoraan siirrett¨aviss¨a t¨aydennetyn matriisin k¨asittelyyn – kutsumme seuraavia alkeisrivitoimituksiksi: Viel¨a m¨a¨aritell¨a¨an n×n−neli¨omatriisin A = (aij ) j¨alki (trace) sen diagonaalialkioiden summana n X aii , 16/76 2.2. Alkeisrivitoimitukset Matriisin transpoosille p¨atee asianmukaisin oletuksin: Tr(A) = 2.2. Alkeisrivitoimitukset 1) Lis¨a¨a riviin VAKIO × jokin toinen rivi 2) Vaihda kaksi rivi¨a kesken¨a¨an 3) Kerro rivi nollasta poikkeavalla vakiolla (40) i=1 jolle p¨atee matriisitulon tapauksessa syklinen permutaatio Tr(AB) = Tr(BA) Tr(ABC) = Tr(CAB) = Tr(BCA), (41) 3 Lis¨ aksi olemme ehk¨ a k¨ aytt¨ aneet yhdest¨ a yht¨ al¨ ost¨ a ratkaistun muuttujan sijoittamista toiseen yht¨ al¨ o¨ on silloin kun se on n¨ aytt¨ anyt toimivan. Pyrimme nyt kuitenkin algoritmiin, joka on helposti toteutettavissa matriisien avulla. kunhan kaikki matriisitulot ovat neli¨omatriiseja. M5 2.1. Yht¨ al¨ oryhm¨ an matriisiesitys 14/76 M5 2. Yht¨al¨oryhmien ratkaiseminen eliminointimenetelm¨all¨a 2.1. Yht¨al¨oryhm¨an matriisiesitys Pyrit¨a¨an ensin ratkaisemaan x3 ja sit¨a k¨aytt¨aen sitten x2 jne. Lis¨at¨a¨an Y3:een 4·Y1 (Ym = m:s yht¨al¨ o) eli Y3→Y3+4·Y1: 0 1 −2 1 x1 − 2x2 + x3 = 0 0 2 −8 8 ⇔ 2x2 − 8x3 = 8 0 −3 13 −9 −3x2 + 13x3 = −9 Se voidaan esitt¨a¨a (m×n)−kerroinmatriisin A = (aij ) sek¨a sarakevektoreiden x = (x1 x2 . . . xn )T ja b = (b1 b2 . . . bm )T avulla kompaktisti: Ax = b, (43) Seuraavaksi Y2→ 12 Y2 ja Y3→Y3+3·Y2 (j¨arjestys oleellinen): 1 −2 1 0 x1 − 2x2 + x3 = 0 ⇔ 0 1 −4 4 x2 − 4x3 = 4 0 0 1 3 x3 = 3 miss¨a x on ratkaistava tuntematon vektori ja A ja b tunnetaan. Yht¨al¨oryhm¨a on homogeeninen, jos b = 0. 2.1. Yht¨ al¨ oryhm¨ an matriisiesitys Auki kirjoitettuna (43) on a11 a12 · · · a21 a22 · · · .. .. . . am1 am2 · · · 15/76 a1n b1 x1 a12 x2 b 2 .. .. = .. . . . xn amn ja vastaava t¨aydennetty matriisi a11 a12 a21 a22 (A|b) = . .. .. . ··· ··· am1 am2 · · · a1n a12 .. . (44) bm b1 b2 .. . amn bm . (45) Yht¨al¨oryhm¨a¨a vastaava t¨aydennetty matriisi (A|b) sis¨alt¨a¨a kaiken informaation ratkaistavasta ongelmasta ja pyrimmekin seuraavassa k¨aytt¨am¨a¨an sit¨a yht¨al¨oryhm¨an ratkaisemiseen.2 2 T¨ aydennetty matriisi voidaan esitt¨ a¨ a my¨ os muodossa (A b). 17/76 Esim Vasemmalla on matriisi (3) yht¨al¨ oryhm¨an muodossa, oikealla t¨aydennettyn¨a matriisina B = (A|b). 1 −2 1 0 x1 − 2x2 + x3 = 0 2 −8 8 ⇔ 0 2x2 − 8x3 = 8 −4 5 9 −9 −4x1 + 5x2 + 9x3 = −9 Yleinen m lineaarisen n tuntemattoman yht¨al¨on ryhm¨a on muotoa a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 (42) .. .. .. .. . . . . am1 x1 +am2 x2 +. . .+ amn xn = bm M5 2.2. Alkeisrivitoimitukset M5 2.2. Alkeisrivitoimitukset N¨ain saatiin kerroinmatriisi A on yl¨akolmiomuotoon eli muotoon ⋆ ⋆ ⋆ ⋆ ⋆ ⋆ ⋆ 0 ⋆ ⋆ ⋆ , B= A= 0 ⋆ ⋆ 0 0 ⋆ 0 0 ⋆ ⋆ miss¨a ⋆ on mik¨a tahansa luku, oli v¨alitavoitteemme. Palaten esimerkkiin, seuraavaksi Y2→Y2+4·Y3 ja Y1→Y1−1·Y3: 1 −2 0 −3 x1 − 2x2 = −3 ⇔ 0 1 0 16 x2 = 16 0 0 1 3 x3 = 3 Viel¨a kerroinmatriisi yksikk¨ omatriisiksi operaatiolla Y1→Y1+2·Y2: 1 0 0 29 x1 = 29 ⇔ 0 1 0 16 , x2 = 16 0 0 1 3 x3 = 3 jolloin A = diag(1,1,1) ja esimerkkiyht¨al¨ oryhm¨a on ratkaistu. 18/76 M5 2.2. Alkeisrivitoimitukset 19/76 M5 22/76 2.4. Yht¨al¨oryhm¨an ratkaiseminen porrasmatriiseilla M¨a¨aritelm¨a Matriisit B ja B′ ovat riviekvivalentit, mik¨ali ne saadaan toisistaan alkeisrivitoimituksin. T¨all¨oin merkit¨a¨an B ∼ B′ . Seuraavassa esitet¨a¨an kaksi algoritmia lineaarisen yht¨al¨oryhm¨an Ax = b ratkaisemiseksi. T¨aydennetty matriisi olkoon B = (A|b). Lause Gaussin eliminointi 1) Etsit¨a¨an B:n kanssa riviekvivalentti porrasmatriisi B′ = (A′ |b′ ). 2) Ratkaistaan yht¨al¨ oryhm¨a A′ x = b′ takaisinsjoituksin. Jos kahden yht¨al¨oryhm¨an t¨aydennetyt matriisit ovat riviekvivalentit, niin yht¨al¨oryhmill¨a on samat ratkaisut. Gaussin-Jordanin eliminointi Huom Alkeisrivitoimitusten kannalta t¨aydennetty¨a matriisia (A|b) kirjoittettaessa edell¨a k¨aytetty pystyviiva on ep¨aoleellinen, se vain muistuttaa viimeisen sarakkeen erityismerkityksest¨a yht¨al¨oryhmi¨a ratkaistaessa. Tarvittavat alkeisrivitoimitukset m¨a¨ar¨a¨a matriisi A. 1) Etsit¨a¨an B:n kanssa riviekvivalentti redusoitu porrasmatriisi B′′ = (A′′ |b′′ ). 2) Luetaan suoraan yht¨al¨ oryhm¨an A′′ x = b′′ ratkaisut. Huom Edellisten sivujen esimerkiss¨a yht¨al¨oit¨a oli yht¨a monta kuin tuntemattomia. T¨all¨oin kerroinmatriisi A on neli¨omatriisi ja se on mahdollista saattaa yl¨akolmiomuotoon ja lopulta diagonaaliseksi. Huom Kummassakin algoritmissa vaihe 2) edellytt¨a¨a, ett¨a ratkaisuja on. Niiden olemassaoloon palataan tuotapikaa. Huom Mik¨ali yht¨al¨ oryhm¨all¨a on t¨asm¨alleen yksi ratkaisu, vaihe 2) on helppo. Jos ratkaisuja on ¨a¨arett¨ om¨an paljon, esimerkiksi jos ne muodostavat suoran tai tason, saadaan parametrisoitu ratkaisu. Yleisess¨a tapauksessa yht¨al¨oiden ja tuntemattomien m¨a¨ar¨a ei v¨altt¨am¨att¨a ole sama, jolloin kannattaa m¨a¨aritell¨a... M5 2.3. Porrasmatriisit 20/76 2.3. Porrasmatriisit M5 2.5. Lineaarinen riippumattomuus ja matriisin ranki 23/76 2.5. Lineaarinen riippumattomuus ja matriisin ranki Vektoreiden a1 , a2 , . . . , am lineaarikombinaatio on M¨a¨aritelm¨a m×n−matriisi B porrasmatriisi, jos 1) matriisin mahdolliset nollarivit ovat alimpana, 2) jokaisen nollasta eroavan rivin ensimm¨ainen eli johtava alkio on 1 ja 3) alemman rivin johtava alkio sijaitsee aina ylemm¨an rivin johtavan alkion oikealla puolella c1 a1 + c2 a2 + . . . + cm am , c1 a1 + c2 a2 + . . . + cm am = 0 Lineaarisen yht¨al¨ oryhm¨an tapauksessa sen rivivektorien lineaarinen riippuvuus tarkoittaa sit¨a, ett¨a yht¨al¨ oit¨a on tarpeettoman monta. Yksinkertaisimmillaan n¨ain k¨ay, jos kaksi yht¨al¨ o¨a ovat samat. Jokainen m×n−matriisi on riviekvivalentti jonkin (yksik¨asitteisen) redusoidun porrasmatriisin kanssa. Esim Porrasmatriisi (⋆ mik¨a tahansa 0 1 ⋆ ⋆ 0 0 0 1 0 0 0 0 0 0 0 0 Esim Redusoitu porrasmatriisi: 0 0 0 0 1 0 0 0 ⋆ 0 0 0 0 1 0 0 0 0 1 0 Esim Alkeisrivitoimituksin n¨ahd¨a¨an, ett¨a ⋆ ⋆ ⋆ 0 1 0 −2 3 0 −24 0 3 −6 6 4 −5 3 −7 8 −5 8 9 ∼ 0 1 −2 2 0 −7 0 0 0 0 1 4 3 −9 12 −9 6 15 Yht¨al¨ oryhm¨ass¨a voi olla my¨ os kesken¨a¨an ristiriitaan johtavia rivej¨a. 21/76 luku): ⋆ ⋆ ⋆ ⋆ 1 ⋆ 0 0 (47) Jos (47) toteutuu siten, ett¨a kaikki ci :t eiv¨at ole nollia, sanomme vektoreiden a1 , a2 , . . . , am olevan lineaarisesti riippuvia (LD) ja ainakin yksi niist¨a voidaan esitt¨a¨a muiden lineaarikombinaationa. Lause 2.3. Porrasmatriisit (46) vain kun c1 = c2 = · · · = cm = 0. Porrasmatriisi B on redusoitu, jos lis¨aksi 4) jokaisen rivin johtava alkio on sarakkeensa ainoa nollasta poikkeava alkio. M5 ci ∈ R. Vektorit a1 , a2 , . . . , am ovat lineaarisesti riippumattomia (LI), jos M¨a¨aritelm¨a 2.4. Yht¨ al¨ oryhm¨ an ratkaiseminen porrasmatriiseilla M5 2.5. Lineaarinen riippumattomuus ja matriisin ranki M¨a¨aritelm¨a Matriisin A ranki r(A) on sen LI rivivektoreiden maksimilukum¨a¨ar¨a. Lause Riviekvivalenteille matriiseille A ∼ B on r(A) = r(B). Seuraus Ranki r(A) on A:ta vastaavan porrasmatriisin nollasta poikkeavien rivien lukum¨a¨ar¨a. Otetaan m kappaletta n-komponenttisia vektoreita ja muoLause dostetaan niit¨a rivivektoreina k¨aytt¨aen m ×n−matriisi A. Vektorit ovat LI, jos r(A) = m, ja LD, jos r(A) < m. Lause r(A) on A:n LI sarakevektoreiden maksimilukum¨a¨ar¨a. Seuraus Transpoosille p¨atee r(AT ) = r(A). Lause Olkoon annettu m kappaletta n-komponenttisia vektoreita. Jos m > n, niin vektorit ovat LD. 24/76 M5 2.6. Yht¨ al¨ oryhm¨ an ratkaisujen olemassaolo 25/76 2.6. Yht¨al¨oryhm¨an ratkaisujen olemassaolo M5 Tutkitaan n tuntemattoman, m yht¨al¨on lineaarista yht¨al¨oryhm¨a¨a Ax = b, miss¨a A on m×n−matriisi ja yht¨al¨oryhm¨a¨a vastaava t¨aydennetty matriisi B = (A|b) on m×(n+1)−matriisi. Tapauksessa n = 1 determinantti on triviaalisti Lause: ratkaisujen olemassaolo miss¨a pystyviivat eiv¨at ole itseisarvomerkkej¨a vaan determinantin merkint¨atapa. Determinantin ominaisuuksiin alamme p¨a¨ast¨a kiinni tapauksessa n = 2, jossa m¨a¨arittelemme: a a D (2) = 11 12 = a11 a22 − a12 a21 . (53) a21 a22 D (1) = |a11 | = a11 , Lause: ratkaisujen yksik¨asitteisyys Yht¨al¨ oryhm¨all¨a on t¨asm¨alleen yksi ratkaisu ⇔ r(A) = r(B) = n. Jos r(A) = r(B) = r < n, on yht¨al¨oryhm¨all¨a ¨a¨arett¨om¨an monta ratkaisua. T¨all¨oin voidaan l¨oyt¨a¨a r kappaletta riippumattomia tuntemattomia xi , jotka voidaan ilmaista j¨aljelle j¨a¨avien n − r tuntemattoman xj = tj avulla (tj ∈ R) → parametrisointi. D (2) = (−1)1+1 a11 |a22 | + (−1)1+2 a12 |a21 | eli kuljetaan pitkin ylemp¨a¨a vaakarivi¨a ja kerrotaan sen kullakin alkiolla vastaava alideterminantti4 ja summataan etumerkki¨a vuorotellen. T¨ast¨a p¨a¨asemme eteenp¨ain: Mik¨ali yht¨al¨oryhm¨all¨a on ratkaisuja, saadaan ne kaikki Gaussin tai Gaussin-Jordanin eliminoinnilla. 3.1. Lineaarinen yht¨ al¨ oryhm¨ a ja determinantit 26/76 M5 3. Determinantit 3.1. Lineaarinen yht¨al¨oryhm¨a ja determinantit a = (−1)1+1 a11 22 a32 a21 a23 1+2 + (−1) a 12 a33 a31 4 Poistettu alkuper¨ aisest¨ a determinantista rivi i ja sarake j. Seuraa Cramerin s¨ a¨ ant¨ o ja paljon muuta hyv¨ a¨ a (fysiikkaankin). 6 Kuin ven¨ al¨ aiset sis¨ akk¨ aiset maatuska-puunuket avataan isoimmasta alkaen paitsi ett¨ a nyt n-nuken sis¨ all¨ a on n sit¨ a v¨ alitt¨ om¨ asti pienemp¨ a¨ a nukkea. 5 27/76 M5 3.2. Determinanttien laskeminen 30/76 Saamme aiheen m¨a¨aritell¨a kutakin (n+1)×(n+1)−determinantin alkiota aij vastaavan kofaktorin cofn (aij ) = (−1)i+j D (n) (aij ). (55) Sen avulla voimme kirjoittaa suhteellisen kompaktisti yleisen kaavan (kehityss¨a¨ann¨ on) n×n−determinantille D1) Jos D 6= 0, niin yht¨al¨oryhm¨an Ax = b yksik¨asitteinen ratkaisu on x1 = D1 /D, x2 = D2 /D, . . . , xn = Dn /D. (51) Esim Yll¨aolevat tulokset on helppo todistaa entuudestaan tutuille 2×2-determinanteille eli tapaukselle n = 2. Lasketaan... a22 a32 Osoittautuu, ett¨a juuri t¨am¨a on oikea5 tapa m¨a¨aritell¨a isommat determinantit pienempien determinanttien kautta.6 Lause: Cramerin s¨a¨ant¨o Lis¨aksi: Homogeeniselle yht¨al¨oryhm¨alle Ax = 0 (ja siis b = 0) p¨atee: D 6= 0 ⇒ triviaaliratkaisu x = 0 D = 0 ⇒ ¨a¨arett¨om¨an monta ratkaisua a21 a23 1+3 + (−1) a 13 a33 a31 miss¨a D (2) (aij ) on alkiota aij vastaava 2×2−alideterminantti.4 Yll¨a 3×3−determinantti on ’kehitetty 1. rivins¨a suhteen’. joka on yksi reaaliluku (reaaliselle A eli kun aij ∈ R). joissa Di saatiin D:st¨a korvaamalla sarake i luvuilla b1 , . . . , bn . 29/76 = (−1)1+1 a11 D (2) (a11 ) + (−1)1+2 a12 D (2) (a12 ) + (−1)1+3 a13 D (2) (a13 ), matriisein ilmaistuna Ax = b, miss¨a kerroinmatriisi A = (aij ) on (n×n)−neli¨omatriisi. Sit¨a vastaa (kerroin)determinantti a11 a12 · · · a1n a21 a22 · · · a2n (49) D = det(A) = . .. .. , .. . . an1 an2 · · · ann Yht¨al¨oryhm¨a¨an Ax = b liittyen m¨a¨arittelemme my¨os determinantit a11 a12 · · · b1 b1 a12 · · · a1n a21 a22 · · · b2 b2 a22 · · · a2n D1 = . .. .. .. , . . . , Dn = .. .. , (50) .. . . . . . bn an2 · · · ann an1 an2 · · · bn 3.2. Determinanttien laskeminen Kun n = 3, otamme (nyt aluksi) l¨aht¨ okohdaksi ylimm¨an rivin: a11 a12 a13 D (3) = a21 a22 a23 (54) a31 a32 a33 Determinanteille kuten matriiseillekin on monenmoista k¨aytt¨ o¨a, mutta haetaan motivaatiota edelleen yht¨al¨oryhmist¨a, nyt n×n: a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 , (48) .. .. .. .. . . . . an1 x1 + an2 x2 + . . . + ann xn = bn 3.1. Lineaarinen yht¨ al¨ oryhm¨ a ja determinantit (52) T¨am¨an lausekkeen voi ajatella muodostuvan seuraavasti: Lause: ratkaisujen l¨oyt¨aminen M5 28/76 3.2. Determinanttien laskeminen Yht¨al¨ oryhm¨all¨a on ratkaisuja ⇔ r(A) = r(B). M5 3.2. Determinanttien laskeminen D (n) = n X j=1 akj cofn−1 (akj ) = n X ail cofn−1 (ail ), (56) i=1 miss¨a ensimm¨aisess¨a summassa on kehitetty determinantti k:nnen rivin ja j¨alkimm¨aisess¨a l:nnen sarakkeen suhteen. K¨ayt¨ann¨oss¨a se kannattaa tehd¨a sen rivin/sarakkeen suhteen, jossa on eniten nollia. Huom Muistutetaan itse¨amme viel¨a siit¨a, ett¨a D (n) on jokin luku,7 joka nyt on laskettavissa8 kaavoista (55-56). 7 8 Determinantin voi ajatella kuvauksena matriisien avaruudelta reaaliluvuille. Mutta laskutoimitusten m¨ a¨ ar¨ a kasvaa nopeasti n:n kasvaessa. M5 3.2. Determinanttien laskeminen 31/76 M5 D2) D (n) vaihtaa merkki¨a, kun sen kaksi rivi¨a tai kaksi saraketta vaihdetaan kesken¨a¨an. Olkoot A ja C n×n–neli¨ omatriiseja ja I n×n–yksikk¨omatriisi. D3) Kertomalla D (n) :n mik¨a tahansa rivi tai sarake vakiolla c saadaan determinantti, jonka arvo on cD (n) . VAKIO× toinen M¨a¨aritelm¨a Jos on olemassa n×n–neli¨ omatriisi B, jolle AB = I, niin B on A:n k¨a¨anteismatriisi, merkit¨a¨an B = A−1 . rivi/sarake, D5) D (n) :n arvo ei muutu jos sen jollekin riville/sarakkeelle lis¨at¨a¨an muiden rivien/sarakkeiden lineaarikombinaatio. Determinanteille p¨atee: D6) Kaksi determinanttia, joilla vain yksi rivi/sarake ovat erilaiset, voidaan laskea yhteen. N¨ain saadaan determinantti, joka on muuten sama kuin alkuper¨aiset, mutta sanottu rivi/sarake on alkuper¨aisten rivien/sarakkeiden summa. Lause D7) Transpoosille p¨atee det(AT ) = det(A). Lause 3.3. Determinantit ja matriisiranki det(AC) = det(A)det(C). det(A) 6= 0 ⇔ ∃ yksik¨asitteinen A−1 . 32/76 M5 4.1. K¨ a¨ anteismatriisin ominaisuuksia 35/76 Edelleen (57) ja (59) ⇒ Olkoon A m×n−matriisi. Silloin voidaan osoittaa seuraavat: r(A) = n ⇔ ∃ A−1 . Lause Lause (60) Olkoon B = A−1 olemassa. T¨all¨ oin det(B) = 1/det(A) 6= 0 ja on olemassa B−1 ja BA = BABB−1 = BIB−1 = BB−1 = I, joten r(A) = r0 ≥ 1 ⇔ A:n suurin alimatriisi, jota vastaava determinantti on nollasta poikkeava, on r0 ×r0 −matriisi. AA−1 = A−1 A = I. Lause Lause (61) Olettaen A ja C s¨a¨ann¨ ollisiksi n×n−matriiseiksi (c 6= 0 skalaari) on Jos r(A) = r0 ≥ 1, niin A:n kaikkien sellaisten alimatriisien, joiden ranki > r0 , determinantit ovat nollia. (AC)−1 = C−1 A−1 (cA) Lis¨aksi n×n−neli¨omatriisille A p¨atee: −1 = c −1 A (62) −1 (63) (A−1 )−1 = A Lause 3.4. Determinanteista viel¨ a 3.4. Determinanteista viel¨a Johdattelimme n×n−determinanttiin formaalia ja j¨alkiviisasta reitti¨a. Yleisesti determinantti on sarakkeidensa n-lineaarikuvaus (tarkastelemme tavallisia lineaarikuvauksia my¨ohemmin). T¨am¨a ominaisuus takaa sen geometrisen tulkinnan, ett¨a useammassakin kuin kahdessa ja kolmessa ulottuvuudessa determinantilla on tulkinta sarakkeidensa m¨a¨ar¨a¨amien vektoreiden viritt¨am¨an suunnikkaan/s¨armi¨on ’tilavuutena’. T¨all¨a geometrisella tulkinnalla on ilmeist¨a, miksi determinantti tulee kerrotuksi samalla luvulla kuin mill¨a yksi sen sarake kerrotaan, kts. luvun §3.2 kolmas laskus¨a¨ant¨o. Samaten on ilmeist¨a, ett¨a kuudes laskus¨a¨ant¨o p¨atee. Jos determinantin kaksi saraketta ovat samat, niin mainittu tilavuus on nolla, kuten determinanttikin, kts. nelj¨as s¨a¨ant¨o. Determinantin alternoivuus eli kertoimet (−1)i+j seuraa kolmesta mainitusta s¨a¨ann¨ost¨a. T¨aten tapamme m¨a¨aritell¨a determinanti ei ole suinkaan mielivaltainen, vaan lopulta ainoa mahdollinen. (64) (A−1 )T = (AT )−1 (57) (65) ja merkitsemme Huom Tuloksista yll¨a heijastuu lineaarisen riippumattomuuden yhteys lineaarisen yht¨al¨oryhm¨an ratkaisuihin ja determinantin nollasta poikkeavuuteen. Todistusten ideaa kannattaa mietti¨a. M5 (59) Jos ∃ A−1 , niin A on s¨a¨ann¨ ollinen eli ei-singulaarinen matriisi. Jos det(A) = 0, niin A on singulaarinen. 3.3. Determinantit ja matriisiranki r(A) = n ⇔ det(A) 6= 0. (58) Jos nyt on AB = I, niin det(AB) = det(A)det(B) = det(I) = 1, joten det(B) = 1/det(A). T¨aten olletinkin Huom Operaatioilla (2,5) voidaan determinantti saattaa yl¨a- tai alakolmiomuotoon, joilloin sen arvo on diagonaalielementtien tulo. M5 34/76 4. Neli¨omatriisin k¨a¨anteismatriisi 4.1. K¨a¨anteismatriisin ominaisuuksia Determinanttien k¨asittelyss¨a ovat avuksi my¨os seuraavat: D4) Jos D (n) :n jokin rivi/sarake on niin D (n) = 0. 4.1. K¨ a¨ anteismatriisin ominaisuuksia A−p = (A−1 )p p = 1, 2, 3, .... (66) N¨aill¨a ev¨aill¨a kertolaskut k¨a¨anteismatriisilla sujuvat. 33/76 M5 4.2. K¨ a¨ anteismatriisi ja yht¨ al¨ oryhm¨ a 36/76 4.2. K¨a¨anteismatriisi ja yht¨al¨oryhm¨a Tarkastellaan yht¨al¨ oryhm¨a¨a a11 x1 + a12 x2 + . . . + a1n xn = b1 a21 x1 + a22 x2 + . . . + a2n xn = b2 Ax = b ⇔ . .. .. .. .. . . . an1 x1 + an2 x2 + . . . + ann xn = bn . (67) Jos ∃ A−1 ja b tunnetaan, (67):n muodollinen ratkaisu saadaan kertomalla puolittain A−1 :ll¨a eli A−1 Ax = A−1 b ⇒ x = A−1 b. (68) A−1 saadaan (67):st¨a ratkaisemalla Toisaalta yll¨aoleva kertoo, ett¨a xi :t tuntemattomien bj :den lineaarikombinaationa, jolloin A−1 on n¨ain saatava b:n kerroinmatriisi. Huom K¨a¨anteismatriisin A−1 laskeminen on yleisesti ty¨ol¨ast¨a, mutta kun se on kerran laskettu, yht¨al¨ oryhm¨an Ax = b ratkaisu kaikilla annetuilla b saadaan matriisitulona x = A−1 b. M5 4.3. K¨ a¨ anteismatriisi adjungoidun matriisin kautta 37/76 4.3. K¨a¨anteismatriisi adjungoidun matriisin kautta 5.1. Vektoriavaruus Joukko olioita (esimerkiksi tavalliset Rn :n vektorit) v1 , v2 , v3 , ... muodostaa vektoriavaruuden V, jos niiden joukossa on m¨a¨aritelty yhteenlasku ja skalaarilla kertominen (skalaarit c, c1 , c2 ), joille (69) miss¨a cof(A) on A:n kofaktorimatriisi v1 + v2 = v ∈ V cofn−1 (a11 ) cofn−1 (a12 ) · · · cofn−1 (a1n ) cofn−1 (a21 ) cofn−1 (a22 ) · · · cofn−1 (a12 ) cof(A) = , .. .. .. . . . cv1 = v ∈ V (70) cofn−1 (an1 ) cofn−1 (an2 ) · · · cofn−1 (ann ) A 9 = adj(A)/det(A). (71) Varo: T¨ all¨ a termill¨ a on lineaarialgebrassa muutakin k¨ aytt¨ o¨ a. M5 4.4. K¨ a¨ anteismatriisi alkeisrivitoimitusten kautta 38/76 M5 4.4. K¨a¨anteismatriisi alkeisrivitoimitusten kautta 0 0 1 0 1 R(1, 2) = 1 0 0 0 (81) c(v1 + v2 ) = cv1 + cv2 (82) (c1 + c2 )v = c1 v + c2 v (83) 5.1. Vektoriavaruus 41/76 (84) c1 v1 + c2 v2 + . . . + cm vm = 0 ⇔ ci = 0 ∀ i (85) M¨a¨aritelm¨a Vektoriavaruus V on n-ulotteinen, jos siit¨a l¨ oytyy korkeintaan n kpl LI vektoreita. T¨am¨a n vektorin joukko viritt¨a¨a V:n ja on V:n kanta. Joukon vektorit ovat kantavektoreita. 1 R(k3) = 0 0 0 0 1 0 0 k Vektoriavaruuden kanta ei ole yksik¨asitteinen. My¨ os (¨a¨arett¨om¨an) moni muu n vektorin joukko voi olla LI ja toimia kantana. Mik¨a tahansa vektori v ∈ V voidaan ilmaista valitussa kannassa vi , i = 1, 2, . . . , n, kantavektoreiden lineaarikombinaationa v = c1 v1 + c2 v2 + . . . + cn vn . 4.4. K¨ a¨ anteismatriisi alkeisrivitoimitusten kautta 39/76 Edellisen perusteella l¨oytyy alkeisrivitoimitukset eli alkeismatriisit R1 , R2 , . . . , RN , joiden tulo R = RN · · · R2 R1 siten, ett¨a RA = I. T¨aten A = R−1 ⇒ A−1 = RI. Siis RN · · · R2 R1 A = RA = I RN · · · R2 R1 I = RI = A 1v = v Jos ci ∈ R (C), niin on V reaalinen (kompleksinen) vektoriavaruus. Oletetaan nyt A s¨a¨ann¨olliseksi n×n–matriisiksi. T¨all¨oin p¨atee: A ∼ B, miss¨a B on redusoitu porrasmatriisi. S¨a¨ann¨ollisyys & neli¨omatriisi ⇒ A ∼ I. M5 (79) (80) Vektorijoukko vi ∈ V, i = 1, 2, ..., m, on LI mik¨ali (muutoi LD) Esimerkiksi 3×3–matriiseille seuraavat alkeisrivitoimitukset R saadaan kertomalla A vastaavalla R-matriisilla: (78) c1 (c2 v) = (c1 c2 )v c1 v1 + c2 v2 + . . . + cm vm ∈ V ∀ ci . 1) R(i1 + ki2 ) ↔ lis¨a¨a riviin i1 rivi i2 kerrottuna k:lla 2) R(i1 , i2 ) ↔ vaihda rivit i1 ja i2 3) R(ki) ↔ kerro rivi i luvulla k 6= 0. 0 0 1 k 0 1 (76) (77) Vektoreiden vi ∈ V mielivaltainen lineaarikombinaatio kuuluu V:hen: K¨ayt¨ann¨oss¨a (71):ssa pit¨a¨a laskea A:n alideterminantteja kaikissa kertaluvuissa, joten menetelm¨a ei ole tehokas suurille matriiseille. Haetaan nyt ratkaisua alkeisrivitoimituksin (vrt. §2.2), jotka matriisikertolaskuja varten esit¨amme alkeismatriiseina: 1 R(2+k3) = 0 0 (75) (v1 + v2 ) + v3 = v1 + (v2 + v3 ) ∀ v ∈ V ∃ − v ∈ V, jolle v + (−v) = 0 Nyt voidaan kirjoittaa ’k¨a¨anteismatriisin kaava’ (74) v1 + v2 = v2 + v1 ∃ 0 ∈ V siten, ett¨a v + 0 = v ∀ v ∈ V miss¨a kofaktorit eli luvut cofn−1 (aij ) m¨a¨ariteltiin (55):ssa. −1 40/76 5. Vektoriavaruudet ja lineaarikuvaukset 5.1. Vektoriavaruus M¨a¨aritelm¨a S¨a¨ann¨ollisen n×n−matriisin adjungoitu matriisi9 on adj(A) = [cof(A)]T , M5 −1 (72) (73) N¨am¨a yht¨al¨ot voidaan tulkita algoritmiksi: Otetaan l¨aht¨okohdaksi t¨aydennetty matriisi (A|I). Valitaan R1 , R2 , . . . , RN siten, ett¨a A muuntuu I:ksi. T¨all¨oin I muuntuu A−1 :ksi. = Gaussin-Jordanin menetelm¨a k¨a¨anteismatriisin laskemiseksi! Huom Meill¨a on nyt kaava determinantille (56), sen kautta k¨a¨anteismatriisille (71), ja edelleen yht¨al¨oryhm¨an ratkaisulle (68). Kun n on suuri, on silti aihetta turvautua alkeisrivitoimituksiin perustuviin algoritmeihin. Numeriikkaa varten on kehitetty lis¨aksi approksimatiivisia menetelmi¨a (kts. M7: Numeeriset menetelm¨at). M5 (86) 5.2. Sis¨ atuloavaruus 42/76 5.2. Sis¨atuloavaruus M¨a¨aritelmi¨a Olkoon V reaalinen vektoriavaruus. T¨all¨oin V on reaalinen sis¨atuloavaruus, jos kaikilla v1 , v2 ∈ V on olemassa v1 :n ja v2 :n sis¨atulo (v1 , v2 ) ∈ R, jolle kaikilla v, vi ∈ V ja ci ∈ R on: (v1 , v2 ) = (v2 , v1 ) (c1 v1 + c2 v2 , v3 ) = c1 (v1 , v3 ) + c2 (v2 , v3 ) (v, v) ≥ 0 ja: (v, v) = 0 ⇔ v = 0. (87) (88) (89) Vektorit v1 , v2 ∈ V ovat kohtisuorassa toisiaan vastaan eli ne ovat ortogonaaliset, jos (v1 , v2 ) = 0. Vektorin v ∈ V pituus eli normi on p ||v|| = (v, v) ≥ 0. Nollasta poikkeava v ∈ V voidaan normittaa yksikk¨ovektoriksi: ˆ v = v/||v|| ⇒ ||ˆ v|| = 1. T¨all¨ oin ˆ v:n sanotaan olevan normitettu. (90) (91) M5 5.2. Sis¨ atuloavaruus 43/76 M5 Lauseita Kaikille v1 , v2 ∈ V p¨atev¨at Cauchyn-Schwartzin ep¨ayht¨al¨ o |(v1 , v2 )| ≤ ||v1 || ||v2 ||, (92) ||(v1 + v2 )|| ≤ ||v1 || + ||v2 || (93) 5.3. Lineaarikuvaus ja sit¨ a vastaava matriisi Lineaarikuvauksen matriisiesityksen F (v) = Av saamme tarkastelemalla kantavektorien10 kuvia: w(k) = F (ˆik ) = Aˆik kolmioep¨ayht¨al¨o ||(v1 + v2 )||2 + ||(v1 − v2 )||2 = 2(||v1 ||2 + ||v2 ||2 ) (94) Huom M¨a¨aritelm¨at ja lauseet yll¨a tuntuvat j¨arkeenk¨ayp¨aisilt¨a, kun ajatelemme avaruuksia Rn pienill¨a n. Ne p¨atev¨at kuitenkin kaikissa Rn sek¨a muunkinlaisille vektoriavaruuksille, joita ovat esimerkiksi: (1) F = {f | f on funktio R → R} (k) (k) (k) a1k = w1 , a21 = w2 , . . . , amk = wm Mn×m = {A | A on n×m–matriisi} 10 Sis¨atulon keksiminen n¨aille avaruuksille saa(ttaa) mietitytt¨a¨a viel¨a. 5.3. Lineaarikuvaus ja sit¨ a vastaava matriisi 44/76 M5 F on lineaarikuvaus, mik¨ali ∀ v, v1 , v2 ∈ V ja ∀ c ∈ R p¨atee 47/76 Rm Kun vektorit ˆik olivat kantavektoreita ja kun esitimme niiden kuvat w(k) kannassa ˆjk , on (103) matriisin A esitys kannoissa {ˆik } ja {ˆjl }. (95) F (cv) = cF (v) (96) N¨ain saamme Lauseen: Lineaarikuvauksilla on mukavia ominaisuuksia, mm. F (0V ) = 0W , Jokaista lineaarikuvausta F : Rn → Rm vastaa yksik¨asitteinen muotoa (103) oleva matriisi A siten, ett¨a F (v) = Av ∀ v ∈ Rn . (97) miss¨a teemme eron l¨aht¨o- ja maalipuolen nollavektorien v¨alill¨a, ja F (c1 v1 + c2 v2 ) = c1 F (v1 ) + c2 F (v2 ) T¨am¨a vastaavuus on yksik¨asitteinen niin kauan kun pid¨amme kannat samoina. Palaamme my¨ ohemmin kantojen vaihtoon neli¨ omatriisien tapauksessa; todettakoon determinantin ja j¨aljen sellaisessa toimituksessa tietyin ehdoin s¨ailyv¨an. (98) jotka on helppo todistaa lineaarikuvauksen m¨a¨aritelm¨ast¨a l¨ahtien. 5.3. Lineaarikuvaus ja sit¨ a vastaava matriisi 45/76 Rn 5.3. Lineaarikuvaus ja sit¨ a vastaava matriisi Lineaarikuvausta F : → vastaava matriisi A saadaan siis asettamalla kantavektoreiden ˆik kuvat A:n sarakkeiksi: (1) (2) (n) w1 · · · w1 w1 (1) (2) (n) w 2 w2 · · · w2 (103) A= .. .. .. . . . (1) (2) (n) wm wm · · · wm M¨a¨aritelmi¨a Olkoot V ja W vektoriavaruuksia sek¨a v ∈ V ja w ∈ W. Kuvauksessa (muunnoksessa) F : V → W l¨aht¨ojoukon vektori v kuvautuu maalijoukon vektoriksi w, merkit¨a¨an v 7→ w tai w = F (v). T¨all¨oin sanomme, ett¨a vektori w on vektorin v kuva kuvauksessa F . F (v1 + v2 ) = F (v1 ) + F (v2 ) (102) Matriisin A alkiot aij riippuvat valituista kannoista ja my¨ os kantavektoreiden j¨ arjestyksest¨ a. Rn 5.3. Lineaarikuvaus ja sit¨a vastaava matriisi Tarkastellaan seuraavaksi lineaarikuvauksia F : (1) Nyt alkiot ai1 ovat ratkaistavissa: a11 = w1 , . . . , am1 = wm ja samaan tapaan kaikilla k = 1, . . . , n on Pn = {p | p on polynomi R → R astetta ≤ n} M5 (101) Esimerkiksi l¨aht¨ opuolen kantavektorin ˆi1 (tapaus k=1) kuva on (1) w a11 a11 a12 · · · a1n 1 1(1) w2 a21 a22 · · · a12 0 a21 w(1) = .. .. = .. .. .. .. = . . . . . . (1) a am1 0 a · · · a m1 m2 mn wm sek¨a suunnikass¨a¨ant¨o M5 46/76 → Rm . N¨am¨a kannat ovat ortonormitettuja eli kantavektorit ovat kesken¨a¨an ortogonaaliset ja kunkin kantavektorin pituus on 1, sis¨atulona tuttu pistetulo (x, y) = x1 y1 + x2 y2 + . . . + xn yn . 5.4. Matriisi k¨ a¨ anteiskuvaukselle ja yhdistetylle kuvaukselle 48/76 5.4. Matriisi k¨a¨anteiskuvaukselle ja yhdistetylle kuvaukselle Lineaarikuvaus voidaan esitt¨a¨a matriisina, kunhan valitsemme avaruuksille V = Rn ja W = Rm kantavektorit. Valitaan niille nyt luonnolliset kannat eli standardikannat 1 0 0 0 1 0 ˆi1 = 0 ˆi2 = 0 · · · ˆin = 0 .. .. .. . . . 0 0 1 0 0 1 1 0 0 ˆj1 = 0 ˆj2 = 0 · · · ˆjm = 0 .. .. .. . . . 1 0 0 M5 Jos nyt lineaarikuvausta F : Rn → Rn vastaava neli¨omatriisi A on s¨a¨ann¨ ollinen, niin on olemassa A−1 , joka vastaa k¨a¨anteiskuvausta −1 F : Rn → Rn . Siten my¨ os F −1 on lineaarikuvaus ja (99) w = Av ⇔ v = A−1 w (104) Jos taasen F : Rp → Rm ja G : Rn → Rp , ja n¨ait¨a kuvauksia vastaavat matriisit ovat A (s.e. Av = w) ja B (s.e. By = v), niin yhdistetty¨a kuvausta F ◦ G : Rn → Rm vastaa matriisi C siten ett¨a (100) w = Av = A(By) = ABy = Cy. (105) Siis yhdistetty¨a kuvausta vastaa tulomatriisi C = AB ja t¨aten kahden lineaarikuvauksen yhdistetty kuvaus on lineaarikuvaus.11 11 T¨ am¨ a p¨ atee yleisemminkin. Oleellista on, ett¨ a ’keskimm¨ aiselle’ avaruudelle k¨ aytet¨ a¨ an samaa kantaa kummassakin kuvauksessa. Lis¨ aksi olemme jo oppineet, ett¨ a neli¨ omatriisien tapauksessa p¨ atee det(C) = det(A)det(B). M5 6.1. Ominaisarvo-ongelma 49/76 M5 Johdannoksi: Ominaisarvo-ongelma12 n¨aytt¨a¨a ¨akkip¨a¨at¨a¨an kaukaa haetulta mutta – kuten tulemme n¨akem¨a¨an – se antaa avaimen siihen mit¨a annettu matriisi (tai sit¨a vastaava lineaarikuvaus) ’tekee’. Lis¨aksi sille on monta suoraa k¨aytt¨okohdetta fysiikassa (mm. ominaistaajuudet, ominaistilat). Kysymyksenasettelu kuuluu: Annetulle neli¨omatriisille A jossain kannassa mitk¨a vektorit x vain ’venyv¨at’ ja kuinka paljon, kun niihin operoidaan ko. matriisilla? Osoittautuu, ett¨a jos l¨oyd¨amme kyseiset ns. ominaisvektorit, saamme niiden kautta vektoriavaruudelle kannan, jossa A on yksinkertaisimmassa muodossaan. Pn (λ) = (−1)n (λ − λ1 )m1 (λ − λ2 )m2 · · · (λ − λl )ml , on Pn (λ) = 0 erisuuret juuret, miss¨a λ1 , λ2 , ..., λl ovat yht¨al¨ mi on λi :n (algebrallinen) multiplisiteetti ja m1 + . . . +ml = n. Ominaisarvo-ongelma ratkeaa siis seuraavin askelin: 1) Muodosta polynomi Pn (λ) = det(A − λI) 2) Hae yht¨al¨ on Pn (λ) = 0 juuret λ1 (m1 ), λ2 (m2 ), . . . , λl (ml ) 3) Etsi yht¨al¨ oryhm¨an (A − λi I)x = 0 ratkaisujoukko {x}i eli ominaisvektorit kullekin i = 1, 2, . . . , l. M¨a¨aritelm¨a Olkoon A n×n−matriisi. Vektori x 6= 0 on A:n ominaisvektori, jos Ax = λx, miss¨a λ on jokin luku (skalaari ∈ R tai ∈ C). T¨all¨oin x on ominaisarvoon λ kuuluva ominaisvektori. M5 Huom Karakteristisen yht¨al¨ on ratkaiseminen ei yleisess¨a tapauksessa ole helppoa; ratkaisukaavatkin ovat olemassa vain 4. asteen yht¨al¨ o¨ on saakka. Fysiikassa voidaan kuitenkin usein hy¨ odynt¨a¨a symmetrioita ongelman pilkkomisessa paloihin, mink¨a lis¨aksi monissa tilanteissa A on harva eli sis¨alt¨a¨a paljon nollia. On muitakin kuin matriisin ominaisarvo-ongelmia... 6.1. Ominaisarvo-ongelma 50/76 Tutkimme siis ominaisarvo-yht¨al¨on Ax = λx M5 53/76 Olkoon A edelleen n×n−matriisi. Sen ominaisarvoille p¨atee: Lause Jos A on yl¨akolmio- tai alakolmio- tai diagonaalimatriisi, det(A − λI) = (a11 − λ)(a22 − λ) · · · (ann − λ) eli t¨all¨ oin ominaisarvot ovat A:n diagonaalialkiot. Eri ominaisarvoja vastaavat ominaisvektorit ovat LI. Siis: Lause Jos λ1 , λ2 , . . . , λp , ovat eri ominaisarvoja ja x1 , x,2 , ..., xp vastaavat ominaisvektorit, niin x1 , x,2 , ..., xp ovat LI. Huom Jos xi on ominaisvektori, niin my¨os esim. 5xi on samaan ominaisarvoon kuuluva ominaisvektori, mutta n¨am¨a ovat LD. Kirjoitetaanpa (106) toisin k¨aytt¨aen n×n−yksikk¨omatriisia I: T¨am¨a on n lineaarisen yht¨al¨on homogeeninen yht¨al¨oryhm¨a (a11 − λ)x1 + a12 x2 + . . . + a1n xn = 0 a21 x1 + (a22 − λ)x2 + . . . + a2n xn = 0 .. .. .. .. . . . . . 6.2. Joitakin tuloksia ominaisarvoille 6.2. Joitakin tuloksia ominaisarvoille (106) mahdollisia ei-triviaaleja ratkaisuja. Jos esim. on Axi = λi xi eli on l¨ oydetty ominaisarvo λi ja siihen kuuluva (sit¨a vastaava) ominaisvektori xi , voi olla muitakin ominaisvektoreita kuin xi , jotka kuuluvat samaan ominaisarvoon. Jos ominaisarvoon λi kuuluu k kpl LI ominais- vektoreita, λi on k−kertaisesti degeneroitunut. (A − λI)x = 0 52/76 Algebran peruslauseen nojalla Pn (λ):lla on (kompleksitasossa) n nollakohtaa ja se voidaan (periaatteessa) saattaa muotoon 6. Reaalisen neli¨omatriisin ominaisarvo-ongelma 6.1. Ominaisarvo-ongelma 12 6.1. Ominaisarvo-ongelma Olkoon ominaisarvon λ multiplisiteetti m. Olkoon k kpl siihen kuuluvia LI ominaisvektoreita, miss¨a 1 ≤ k ≤ m. Lause T¨aten λ:aa vastaavan kyseisten ominaisvektoreiden viritt¨am¨an ominaisavaruuden dimensio on k. Sanomme, ett¨a λ:n degeneraatio (geometrinen multiplisiteetti) on k. (107) (108) Lause Matriiseilla A ja AT on samat ominaisarvot. an1 x1 + an2 x2 + . . . + (ann − λ)xn = 0 M5 6.1. Ominaisarvo-ongelma 51/76 Yht¨al¨oryhm¨an homogeenisuus antaa meille ratkaisevan askeleen: Muistamme (§3.1), ett¨a homogeenisella yht¨al¨oryhm¨all¨a on ei-triviaaleja ratkaisuja, jos kerroindeterminantti on nolla. Vaadimme siis, ett¨a det(A − λI) = 0 eli a11 −λ a12 ··· a1n a21 a22 −λ · · · a12 Pn (λ) = . . .. = 0 .. .. . an1 an2 · · · ann −λ Ratkaistuamme ominaisarvot λi sy¨ot¨amme ne yksi kerrallaan (108):een ja ratkaisemme niihin kuuluvat ominaisvektorit. Helppoa siis periaatteessa... 6.2. Joitakin tuloksia ominaisarvoille Lause λi ovat A:n ominaisarvot ⇒ cλi ovat cA:n ominaisarvot, miss¨a c ∈ R. cA:n ominaisvektorit = A:n ominaisvektorit. Lause X λi mi = Tr(A). Y i λm i = det(A). i (109) Selv¨asti Pn (λ) = det(A − λI) on λ:n n:nnen asteen polynomi, A:n (ominaisarvo-ongelman) ns. karakteristinen polynomi. Yht¨al¨o¨a Pn (λ) = 0 kutsumme A:n karakteristiseksi yht¨al¨oksi, jonka ratkaisuina saamme A:n ominaisarvot λ1 , λ2 , ... M5 Lause i Seuraus Karakteristisen polynomin Pn (λ) vakiotermi on det(A) eli edellisess¨a lauseessa oleva ominaisarvojen tulo. Viimeisi¨a kahta lausetta ja seurausta voi hy¨ odynt¨a¨a esim. saadun ratkaisun (ominaisarvot) tarkistamisessa. Esim Luentoesimerkkej¨a: 2 −3 1 1 2 1 −2 1 3 2 1 −3 2 1 −4 −1 −4 2 0 5 −4 −1 1 −2 3 −1 4 −1 6 54/76 M5 6.3. Kompleksisista ominaisarvoista 55/76 6.3. Kompleksisista ominaisarvoista λ∗k = a − bi, a, b ∈ R. ⇒ A∗ x∗k = λ∗k x∗k , Neli¨ omatriisit A ja B ovat similaariset, jos on olemassa neli¨ omatriisi U siten, ett¨a (110) B = U−1 AU. T¨at¨a kutsutaan similariteettimuunnokseksi. det(B − λI) = det(U−1 AU − λU−1 IU) = det(U−1 (A − λI)U) = det(U−1 )det(A − λI)det(U) = det(A − λI), koska det(U−1 ) = 1/det(U). T¨aten similaarisilla matriiseilla on sama karakteristinen polynomi, joten saadaan (112) Lause joten A:n ominaisarvoa λ∗k vastaa ominaisvektori x∗k . M5 6.4. Erityisist¨ a reaalisista matriisesista 56/76 6.4. Erityisist¨a reaalisista matriisesista matriisi A on symmetrinen, jos 59/76 Seuraavassa A, U ja D ovat n×n−matriiseja. M¨a¨aritelm¨a: Neli¨ omatriisi A on diagonalisoituva, jos on olemassa s¨a¨ann¨ollinen neli¨ omatriisi U siten, ett¨a = A. U−1 AU = diag(d1 , d2 , ..., dn ). det(D − λI) = 0 ⇔ (d1 − λ)(d2 − λ) · · · (dn − λ) = 0, Antisymmetrisen matriisin A diagonaalialkioille aii = −aii , joten aii = 0. joten (117) ⇒ D:n ja A:n ominaisarvot ovat d1 , d2 , ..., dn . (113) Jos nyt B on mielivaltainen n×n−matriisi, niin B = S + A, Huom (114) Similariteettimuunnoksen matriisi U sis¨alt¨a¨a sarakkeinaan A:n LI ominaisvektorit (oltava LI jotta det(U) 6= 0). Lause A on diagonalisoituva ⇔ A:lla on n LI ominaisvektoria. miss¨a S on symmetrinen ja A on antisymmetrinen ja A = 12 (B − BT ). (118) Diagonaalimatriisille D ≡ diag(d1 , d2 , ..., dn ) p¨atee matriisi A on ortogonaalinen, jos AT = A−1 . M5 7.2. Matriisin diagonalisointi 7.2. Matriisin diagonalisointi matriisi A on antisymmetrinen, jos AT = −A. S = 21 (B + BT ) Similaarisilla matriiseilla on samat ominaisarvot. (117) M5 Olkoon lineaarikuvausta F : Rn → Rn vastaava n×n−matriisi A = (aij ) edelleen reaalinen eli A = A∗ . T¨all¨oin AT (116) Similaaristen matriisien karakteristisille polynomeille p¨atee (111) miss¨a matriisin A = (aij ) kompleksikonjugaatti on A∗ = (aij∗ ). Nyt A oli kuitenkin reaalinen, joten A = A∗ ⇒ Ax∗k = λ∗k x∗k , 58/76 Seuraavassa A, B ja U ovat n×n−matriiseja. M¨a¨arittelemme: Siten jos λk on ominaisarvo, jolle b 6= 0, niin my¨os λ∗k on. T¨all¨oin jos λk on ominaisvektoria xk vastaava ominaisarvo, niin Axk = λk xk 7.1. Similaariset matriisit 7. Neli¨omatriisin diagonalisointi ja neli¨omuodot 7.1. Similaariset matriisit Olkoon A = (aij ) n×n−neli¨omatriisi, jossa aij ∈ R ∀ i, j. T¨all¨ oin karakteristinen polynomi Pn (λ) on reaalilukukertoiminen ja siten algebran peruslauseen mukaan ominaisarvot λ ovat reaalisia ja/tai esiintyv¨at kompleksilukupareina λk = a + bi, M5 Seuraus A:lla on n eri ominaisarvoa ⇒ A on diagonalisoituva. (115) 6.4. Erityisist¨ a reaalisista matriisesista Symmetrisen n × n−matriisin ominaisarvot ovat reaaliset ja sen ominaisvektoreista voidaan muodostaa Rn :n Lause ortonormitettu kanta. Eri ominaisarvoja vastaavat ominaisvektorit ovat ortogonaaliset. Antisymmetrisen n × n−matriisin ominaisarvot ovat joko Lause nolla tai t¨aysin imaginaarisia (±bi) ja sen ominaisvektoreista voidaan muodostaa Rn :n ortonormitettu kanta. Olkoon A sitten ortogonaalinen. T¨all¨oin p¨atev¨at Lauseet: 1) A s¨ailytt¨a¨a sis¨atulon eli u = Aa ja v = Ab ⇒ u · v = a · b, miss¨a a · b = (a, b) = aT b. A s¨ailytt¨a¨a my¨os normin ||a||. 2) Olkoon a1 , a2 , . . . , an matriisin A sarakevektorit. A on ortogonaalinen ⇔ (ai , aj ) = δij . Sama p¨atee rivivektoreille. 57/76 M5 7.2. Matriisin diagonalisointi 60/76 Huom Diagonalisoiminen ↔ ominaisarvo-ongelma ratkaiseminen. Koska oli D = U−1 AU = diag(d1 , d2 , . . . , dn ), saamme my¨os AU = UD (119) mill¨a voi helposti (vain matriisituloja) tarkistaa saamansa tuloksen. Esim Luvun §6.2 ensimm¨aiselle esimerkkimatriisille on 2 1 1 1 1 U= 3 ja U−1 = . 3 5 2 −1 2 −1 Reaalisten matriisien teorian keskeinen tulos on spektraalilause: Lause A:n diagonalisoi ortogonaalimatriisi U ⇔ A on symmetrinen. 3) A:n determinantti on det(A) = ±1. Todistus suuntaan ⇒ on helppo, suuntaan ⇐ k¨aytet¨a¨an luvun §6.4 ensimm¨aist¨a lausetta symmetriselle matriiseille. 5) A:n ominaisvektoreista voidaan muodostaa Rn :n ortonormitettu kanta. Symmetriset matriisit tulevat fysiikassa vastaan usein; niill¨a oli sekin t¨arke¨a ominaisuus, ett¨a niiden ominaisarvot ovat reaaliset. 4) A:n ominaisarvot λ ∈ R ja/tai λ = a ± ib. Lis¨aksi |λ| = 1. M5 7.3. Neli¨ omuodot 61/76 M5 7.3. Neli¨omuodot 7.4. Neli¨ omuodot ja tasok¨ ayr¨ at T¨am¨an j¨alkeen mahdollinen ratkaisu on (yksi piste, suora tai) yksi nelj¨ast¨a standardikartioleikkauksesta: M¨a¨aritelm¨a Funktio q : Rn → R on neli¨omuoto, jos q(x1 , x2 , . . . , xn ) = xT A x, 1) Ympyr¨a (s¨ade r ): y12 + y22 = r 2 x1 x2 x = . , .. 2) Ellipsi (puoliakselit a ja b): (120) y12 y22 + 2 =1 a2 b 3) Hyperbeli (puoliakselien pituudet c ja d): xn miss¨a kerroinmatriisi A on symmetrinen n×n−neli¨omatriisi. y2 y22 y2 y12 − 22 = 1 tai − 12 = 1 2 2 c d c d 4) Paraabeli (et¨aisyys k¨arjest¨a polttopisteeseen e): Similariteettimuunnoksen (U on ortogonaalimatriisi: U−1 = UT ) D = U−1 AU = diag(d1 , d2 , . . . , dn ), y12 = ey2 tuottamat uudet koordinaatit ovat T y = U x, joten T x = Uy, T T T 7.3. Neli¨ omuodot 62/76 M5 i=1 λi yi2 ≡ Q(y1 , y2 , . . . , yn ). (121) Siit¨a saadaan kompleksinen sis¨atuloavaruus, jos on olemassa v1 :n ja v2 :n sis¨atulo (v1 , v2 ) ∈ C, jolle kaikilla v, vi ∈ V ja ci ∈ C on: miss¨a λi :t ovat alkuper¨aisen kerroinmatriisin A ominaisarvot. (v1 , v2 ) = (v2 , v1 )∗ Esim Tarkastellaan funktiota (huomaa A-matriisin symmetrisointi) 4 2 ! x1 q(x1 , x2 ) = 4x12 + 4x1 x2 + 7x22 = x1 x2 . 2 7 x2 1 2 1 Nyt diagonalisoivaksi matriisiksi saadaan U = √ , miss¨a 5 −1 2 etutekij¨a takaa sarakkeiden normituksen, ja p¨a¨aakselimuodoksi 3 0 ! y1 = 3y12 + 8y22 . Q(y1 , y2 ) = y1 y2 y2 0 8 M5 7.4. Neli¨ omuodot ja tasok¨ ayr¨ at (123) (c1 v1 + c2 v2 , v3 ) = c1∗ (v1 , v3 ) + c2∗ (v2 , v3 ) (v, v) ≥ 0 ja: (v, v) = 0 ⇔ v = 0. (124) (125) Nytkin sanotaan v1 :n ja v2 :n olevan ortogonaaliset, jos (v1 , v2 ) = 0. Lis¨aksi yo. sis¨atulon m¨a¨aritelm¨ast¨a seuraa, ett¨a ∀ c ∈ C (v1 , cv2 ) = (cv2 , v1 )∗ = [c ∗ (v2 , v1 )]∗ = c(v2 , v1 )∗ = c(v1 , v2 ). (126) 63/76 M5 8.1. Kompleksinen sis¨ atuloavaruus 66/76 (cv1 , v2 ) = c ∗ (v1 , v2 ) 7.4. Neli¨omuodot ja tasok¨ayr¨at Esim Jatketaan esimerkki¨a edell¨a kirjoittamalla q(x1 , x2 ) = 24, mik¨a m¨a¨arittelee (x1 , x2 )-tasossa k¨ayr¨an, jonka yht¨al¨o on 4x12 + 4x1 x2 + 7x22 = 24. Se on 1. argumentin suhteen antilineaarinen: ja 2. argumentin suhteen lineaarinen: (v1 , cv2 ) = c(v1 , v2 ). Sis¨atulo kokonaisuutena on seskilineaarinen. Olkoon A n×n−matriisi. M¨a¨aritelm¨a: Matriisin A Hermiten konjugaatti13 A† on matriisi Edellisen esimerkin perusteella t¨am¨an p¨a¨aakselimuoto on A† = (A∗ )T y2 y2 √1 + = 24 ⇔ + √2 = 1, (2 2)2 ( 3)2 mink¨a tunnistamme ellipsin yht¨al¨oksi, mik¨a oli vaikea n¨ahd¨a alkuper¨aisest¨a yht¨al¨ost¨a: (x1 , x2 )-tasossa vinossa oleva ellipsi. 8y22 Yleinen toisen asteen tasok¨ayr¨a (kartioleikkaus) on muotoa q(x1 , x2 ) = ax12 + bx1 x2 + cx22 + dx1 + ex2 + f = 0. 65/76 Olkoon V vektoriavaruus siten, ett¨a luvun §5.1 ehdot t¨ayttyv¨at, mutta skalaarilla kertominen tapahtuu kompleksiluvulla. Kyseess¨a on t¨all¨ oin kompleksinen vektoriavaruus. i=1 j=1 n X 8.1. Kompleksinen sis¨ atuloavaruus 8. Kompleksiset vektoriavaruudet 8.1. Kompleksinen sis¨atuloavaruus T¨aten olemme saaneet neli¨omuodon p¨a¨aakseliesityksen eli kanonisen muodon n X n X q(x1 , x2 , . . . , xn ) = xi aij xj = y22 = ey1 Huom Tapauksessa n = 3 neli¨ omuodot viev¨at toisen asteen pintoihin (joskus yhdeksi pisteeksi, suoraksi tai tasoksi). = λ1 y12 + λ2 y22 + . . . + λn yn2 . M5 tai Huom T¨ass¨a a, b, c, d, e, r eiv¨at ole (122):ss¨a olevia vakiota. T q(x1 , x2 , . . . , xn ) = x Ax = (Uy) AUy = y U AUy = y Dy 3y12 64/76 (122) Kolme ensimm¨aist¨a termi¨a ovat neli¨omuoto, jonka p¨a¨aakseliesitys on diagonaalinen. Ne m¨a¨ar¨a¨av¨at koordinaatiston kierron. Termit dx1 ja ex2 muunnetaan uusiin koordinaatteihin samalla kierrolla. (127) Olkoon sitten avaruus, jossa liikumme, Cn . Sen mielivaltaisille vektoreille a, b sis¨atuloksi kelpaa b1 b2 ! (a, b) = a† b = a1∗ a2∗ · · · an∗ . = a1∗ b1 + a2∗ b2 + . . . + an∗ bn , .. bn jolloin vektorin a normi on q p ||a|| = (a, a) = |a1 |2 + |a2 |2 + . . . + |an |2 ≥ 0. 13 Terminologiaa: T¨ at¨ a(kin) kutsutaan my¨ os adjungaatiksi. (128) (129) M5 8.2. Kompleksialkioisia matriiseja 67/76 M5 8.2. Kompleksialkioisia matriiseja 8.3. Kompleksialkioisten matriisien ominaisuuksia Jos B on mielivaltainen n×n−matriisi, niin Olkoon A = (aij ), aij ∈ C, kompleksialkioinen matriisi. T¨all¨oin R = (rij ), S = (sij ), A = R + iS, B = H + A, (130) A∗ = R − iS. H = 12 (B + B† ) (131) Kompleksialkioisille matriiseille A ja B p¨atee (c ∈ C) † (AB) = B A † (134) (A† )† = A (135) Lause (136) 8.2. Kompleksialkioisia matriiseja Lause 68/76 M5 matriisi A on unitaarinen, jos A† = A−1 . Unitaariselle matriisille A on AA† = I = A† A. (138) Hermiten konjugaatin determinantti on Similariteettimuunnoksen (U on unitaarimatriisi: U−1 = U† ) ∗ det(A ) = [det(A)] . (139) D = U−1 AU = diag(λ1 , λ2 , . . . , λn ), Huom Nyt n¨ahd¨a¨an vastaavuudet aiempaan (vrt. §6.4): Reaalialkioiselle matriisille on A = A∗ , joten reaalinen... tuottamat uudet koordinaatit ovat ...hermiittinen matriisi on symmetrinen eli AT = A. joten ...antihermiittinen matriisi on antisymmetrinen eli AT = −A. 8.3. Kompleksialkioisten matriisien ominaisuuksia 8.3. Kompleksialkioisten matriisien ominaisuuksia Seuraavassa kaikki matriisit ovat n×n−neli¨omatriiseja. Lause Hermiittisen matriisin ominaisarvot ovat reaaliset: λi ∈ R. Antihermiittisen matriisin ominaisarvot ovat joko nolla tai t¨aysin imaginaarisia: λi = ±bi. Unitaarisen matriisin ominaisarvot ovat joko reaalisia tai kompleksisia mutta aina ykk¨osen pituisia: |λi | = 1 ∀ i. Olkoon A sitten unitaarinen. T¨all¨oin p¨atev¨at Lauseet: 1) A s¨ailytt¨a¨a sis¨atulon eli u = Aa ja v = Ab ⇒ (u, v) = (a, b) ⇔ u† v = a† b. Siten A s¨ailytt¨a¨a my¨os normin ||a||. 2) Olkoon a1 , a2 , . . . , an matriisin A sarakevektorit. A on unitaarinen ⇔ (ai , aj ) = δij . Sama p¨atee rivivektoreille. 3) A:n determinantti on det(A) = ±1. y = U† x, x = Uy, q(x1 , x2 , . . . , xn ) = x† Ax = (Uy)† AUy = y† U† AUy = y† Dy ...unitaarinen matriisi on ortogonaalinen AT = A−1 . Lause 71/76 Funktio q : Cn → C on hermiittinen neli¨ omuoto, jos x1 x2 X xi∗ aij xj , x = . , (142) q(x1 , x2 , . . . , xn ) = x† A x = .. ij xn miss¨a kerroinmatriisi A on hermiittinen n×n−neli¨omatriisi. matriisi A on antihermiitttinen, jos A† = −A. Lause 8.4. Hermiittiset neli¨ omuodot M¨a¨aritelm¨a matriisi A on hermiittinen, jos A† = A. M5 A:n diagonalisoi unitaarinen matriisi U ⇔ A on hermiittinen. 8.4. Hermiittiset neli¨omuodot Olkoon A n×n−neli¨omatriisi. T¨all¨oin † Hermiittisen ja antihermiittisen matriisin eri ominaisarvoihin kuuluvat ominaisvektorit ovat ortogonaaliset. Spektraalilause saa nyt muodon Neli¨omatriisille eli n×n−matriisille A, jos sen k¨a¨anteismatriisi on olemassa, p¨atee (A−1 )† = (A† )−1 (137) M5 (141) Hermiittisen, antihermiittisen ja unitaarisen n×n−matriisin Lause ominaisvektoreista xi , i = 1, 2, . . . , n voidaan muodostaa Cn :n ortonormitettu kanta, jolle (xi , xj ) = δij . (133) (cA)† = c ∗ A† I† = I A = 12 (B − B† ). Lis¨aksi voidaan osoittaa, ett¨a: (132) (A + B)† = A† + B† (140) miss¨a H on hermiittinen ja A on antihermiittinen ja miss¨a rij , sij ∈ R. Matriisin A kompleksikonjugaatti on † 70/76 = λ1 |y1 |2 + λ2 |y2 |2 + . . . + λn |yn |2 . 69/76 M5 8.4. Hermiittiset neli¨ omuodot 72/76 T¨aten olemme saaneet hermiittisen neli¨ omuodon p¨a¨aakseliesityksen eli kanonisen muodon n n X X q(x1 , x2 , . . . , xn ) = xi∗ aij xj i=1 j=1 = n X i=1 λi |yi |2 ≡ Q(y1 , y2 , . . . , yn ). (143) miss¨a λi :t ovat alkuper¨aisen kerroinmatriisin A ominaisarvot. P¨a¨aakselimuodosta, muistaen hermiittisen matriisin ominaisarvot reaalisiksi, seuraa, ett¨a q(x1 , x2 , . . . , xn ) ∈ R. Huom Neli¨ omuodot ovat hyv¨a esimerkki siit¨a, ett¨a ominaisarvot ja ominaisvektorit tavoittavat jotain A:lle ja sit¨a vastaavalle lineaarikuvaukselle ominaista/karakteristista. Huom Hermiittisten matriisien ominaisarvojen reaalisuus on oleellista kvanttimekaniikassa: Hermiittisi¨a operaattoreita vastaavat fysikaaliset observaabelit ovat reaalisia. M5 9.1. Funktioavaruus ja funktioiden sis¨ atulo 73/76 9. Ortogonaalisista funktiojoukoista 9.1. Funktioavaruus ja funktioiden sis¨atulo n X ci ϕi (x), (144) N¨am¨a ovat ortonormitettuja: Z ∗ (θ, φ)Yl ′ m′ (θ, φ)dθdφ = δll ′ δmm′ , Ylm i=1 miss¨a kertoimet ci ∈ C. Selv¨astikin t¨am¨an joukon asukit f , g , h ∈ V toteuttavat luvun §5.1 vaatimukset, esimerkiksi f (x) + g (x) ∈ V f (x) + g (x) = g (x) + f (x) L2 Ylm = ~2 l(l + 1)Ylm (f (x) + g (x)) + h(x) = f (x) + (g (x) + h(x)) .. . 74/76 T¨aten V on vektoriavaruus, jonka dimensio on n. T¨all¨oin Z b f ∗ (x)g (x)w (x)dx, (145) a miss¨a w (x) on valittu painofunktio [esim. w (x) = 1], toteuttaa luvun §8.1 kompleksisen sis¨atulon vaatimukset. Kantafunktiojoukko {ϕi } on ortogonaalinen, jos (ϕi , ϕj ) = 0, kun i 6= j. (146) p Jos t¨am¨an lis¨aksi ∀ i ||ϕi || = 1, miss¨a normi ||f || = (f , f ), on se ortonormitettu: (147) (ϕi , ϕj ) = δij . Huom Sovelluksesta riippuen on tarpeen rajata funktioiden ominaisuuksia esim. v¨alin [a, b] p¨a¨atepisteiss¨a (tai v¨ali voi olla my¨os [−∞, ∞]) siten, niill¨a on p¨a¨atepisteiss¨a tietyt arvot ja/tai varmistaa, ett¨a tarvittavat integraalit suppenevat. M5 9.2. Joitakin ortogonaalisia funktiojoukkoja 75/76 9.2. Joitakin ortogonaalisia funktiojoukkoja Suuri harppaus: On uskottavaa (ei triviaalia), ett¨a edell¨aoleva on yleistett¨aviss¨a ¨a¨aret¨onulotteiseen tapaukseen. Lis¨aksi funktiot ϕi (ja siten f ) voivat olla kahden tai useamman muuttujan funktioita. Sen osoittaminen, ett¨a jokin funktiojoukko todella viritt¨a¨a esim. kaikkien neli¨ointegroituvien funktioiden muodostaman avaruuden (t¨aydellisyys), j¨a¨a seuraavalle kurssille. T¨all¨a kurssilla kuitenkin kuuluu esitell¨a joitakin ortogonaalisia funktiojoukkoja: Trigonometriset funktiot (alla n, m = 1, 2, 3, ...) Z π Z π π π cos nx cos mx = δnm sin nx sin mx = δnm (148) 2 2 0 0 Legendren polynomit P0 (x) = 1, P1 (x) = x, P2 (x) = 12 (3x 2 − 1) (149) Pn+1 (x) = 2xPn (x) − Pn−1 (x) − [xPn (x) − Pn−1 (x)]/(n + 1) ovat ortogonaalisia, integroimisv¨alin¨a [−1, 1]. (151) Lz Ylm = ~mYlm , (152) mist¨a ominaisarvot voidaan suoraan lukea (ks. fysa106 ja fysa235). 9.1. Funktioavaruus ja funktioiden sis¨ atulo (f , g ) = 76/76 miss¨a integroidaan yli t¨ayden avaruuskulman 4π. Funktiot Ylm ovat py¨ orimism¨a¨ar¨aoperaattorin ominaisfunktioita seuraavasti: cf (x) ∈ V M5 9.2. Joitakin ortogonaalisia funktiojoukkoja Harmoniset pallofunktiot Py¨ orimism¨a¨ar¨an L kvanttimekaaninen tarkastelu pallokoordinaateissa johtaa funktioihin, joiden yleinen lauseke voitaisiin kirjoittaa Legendren polynomien Pn (x) avulla; t¨ass¨a niist¨a muutama (lis¨a¨a taulukkokirjoissa ja ehk¨a harjoituksissa): p √ Y10 (θ, φ) = 3/4π cos θ, (150) Y00 (θ, φ) = 1/ 4π, p ±iφ Y1,±1 (θ, φ) = ∓ 3/8π sin θ e , . . . Olkoon aluksi annettu n funktiota ϕ1 (x), ϕ2 (x), . . . , ϕn (x), joiden m¨a¨arittelyjoukko on R:n v¨ali, ϕi : [a, b] → C. Oletetaan funktiot ϕi lineaarisesti riippumattomiksi, jolloin ne muodostavat kannan joukolle V, jonka ’vektorit’ f (x) ovat lineaarikombinaatioita f (x) = M5