BM20A5800 Funktiot, vektorit ja lineaarialgebra

Transcription

BM20A5800 Funktiot, vektorit ja lineaarialgebra
BM20A5800 Funktiot, vektorit ja lineaarialgebra
Jouni Sampo
29. syyskuuta 2015
Sisältö
1 Yhden muuttujan funktiot
1.1 Lukujoukot ja lukuvälit . . . . . . . .
1.2 Funktioista yleisesti . . . . . . . . . .
1.3 Perusfunktiot . . . . . . . . . . . . .
1.3.1 Polynomit . . . . . . . . . . .
1.3.2 Rationaalilausekkeet . . . . .
1.3.3 Trigonometriset funktiot . . .
1.3.4 Logaritmifunktiot . . . . . . .
1.3.5 Potenssifunktiot . . . . . . . .
1.3.6 Hyperboliset funktiot . . . . .
1.3.7 Itseisarvo . . . . . . . . . . .
1.4 Yhdistetyt funktiot . . . . . . . . . .
1.5 Injektio, surjektio ja bijektio . . . . .
1.6 Käänteisfunktiot . . . . . . . . . . .
1.7 Yhtälöt, epäyhtälöt ja yhtälöryhmät
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2 Vektorit ja usean muuttujan funktiot
2.1 Vektoreiden peruskäsitteet . . . . . . . . . . .
2.1.1 Standardikantavektorit . . . . . . . . .
2.1.2 Vektoreiden välinen kulma ja pistetulo
2.2 Suorat ja tasot vektorien avulla esitettynä . .
2.2.1 Tasot . . . . . . . . . . . . . . . . . . .
2.3 Vaihtoehtoisia ilmaisutapoja vektoreille . . . .
2.4 Usean muuttujan reaaliarvoiset funktiot . . .
2.5 Vektoriarvoiset funktiot . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
2
3
5
5
6
7
10
11
12
13
13
14
16
18
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20
20
21
22
23
26
28
28
29
3 Matriisit
3.1 Matriiseihin liittyvät peruskäsitteet . . . . . . . . . . .
3.2 Matriisien laskutoimitukset . . . . . . . . . . . . . . .
3.2.1 Matriisien yhteenlasku ja kertominen skalaarilla
3.2.2 Matriisien kertolasku . . . . . . . . . . . . . . .
3.3 Lineaariset yhtälöryhmät . . . . . . . . . . . . . . . . .
3.3.1 Gaussin eliminointi . . . . . . . . . . . . . . . .
3.3.2 Lineaarinen riippumattomuus . . . . . . . . . .
3.3.3 Ratkaisujen yleisiä ominaisuuksia . . . . . . . .
3.4 Käänteismatriisi . . . . . . . . . . . . . . . . . . . . . .
3.5 Determinantit . . . . . . . . . . . . . . . . . . . . . . .
3.5.1 Determinantin määritelmä . . . . . . . . . . . .
3.5.2 Determinanttien perusominaisuuksia . . . . . .
3.5.3 Cramerin sääntö . . . . . . . . . . . . . . . . .
3.6 Ominaisarvot ja ominaisvektorit . . . . . . . . . . . . .
3.6.1 Määritelmä ja laskenta . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
30
30
32
32
33
34
35
38
39
40
42
42
43
44
45
45
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
Yhden muuttujan funktiot
1.1
Lukujoukot ja lukuvälit
Erilaisia lukujoukkoja:
• Luonnolliset luvut: N = {0, 1, 2, 3, . . . }
• Kokonaisluvut: Z = {. . . , −2, −1, 0, 1, 2, . . . }
• Rationaaliluvut (jaksolliset desimaaliluvut): Q = {m/n | m, n ∈ Z, n 6= 0}
• Irrationaaliluvut eli jaksottomat desimaaliluvut
• Reaaliluvut eli kaikki rationaaliluvut ja irrationaaliluvut yhdessä. Merk. R
Avoimet ja puoliavoimet välit:
• Suljettu väli:
[a, b] := {x ∈ R | a ≤ x ≤ b}
• Vasemmalta puoliavoin väli:
• Oikealta puoliavoin väli:
]a, b] := {x ∈ R | a < x ≤ b}
[a, b[:= {x ∈ R | a ≤ x < b}
• Avoin väli: ]a, b[:= {x ∈ R | a < x < b}
Lukujoukkojen A ja B välisiä operaatioita:
• Yhdiste: A ∪ B = {x | x ∈ A tai x ∈ B}
• Leikkaus: A ∩ B = {x | x ∈ A ja x ∈ B}
• Erotus: A \ B = {x | x ∈ A ja x ∈
/ B}
Esimerkki 1.1.
• Avoimia ja puoliavoimia välejä: [2, 4[, ] − 1, 2[, ] − ∞, 4]
• Suljettuja välejä: [4, 7], [−10, 8]
• Yhdisteitä: [4, 6] ∪ [5, 7[= [4, 7[, {7} ∪ [5, 7[= [5, 7]
• Leikkauksia: [4, 6] ∩ [5, 7[= [5, 6], [4, 6[∩[5, 7[= [5, 6[, N ∩ [3.4, 6[= {4, 5}
• Erotuksia: [4, 6] \ {6} = [4, 6[, [4, 6]\]5, 8] = [4, 5]
Hakasulkujen sijaan voidaan käyttää merkintänä myös normaaleja aaltosulkuja kun tarkoitetaan avointa tai puoliavointa väliä, eli esimerkiksi ]3, 6] voitaisiin merkitä (3, 6].
2
1.2
Funktioista yleisesti
Sääntöä f : D(f ) → B, joka liittää jokaiseen pisteeseen x ∈ D(f ) täsmälleen yhden pisteen
f (x) ∈ B, sanotaan funktioksi f .
B
D(f )
R(f )
x
f (x)
Kuva 1: Määrittely-, maali- ja arvojoukko.
Edellisessä joukkoa D(f ) kutsutaan määrittelyjoukoksi, joukkoa B maalijoukoksi ja joukkoa
R(f ) := {f (x) | x ∈ D(f )} arvojoukoksi.
Yllä esitetyt käsitteet ovat yleisiä, tässä kappaleessa keskitytään kuitenkin vain yhden reaalimuuttujan reaaliarvoisiin funktioihin, eli oletetaan että D(f ) ⊂ R ja R(f ) ⊂ R.
Pisteiden (x, f (x)) muodostamaa käyrää kutsutaan funktion kuvaajaksi eli graafiksi.
Määrittelyjoukon etsintä:
• a∈
/ D(f ) jos jotain lausekkeessa f (x) esiintyvää välitulosta ei voida laskea kun x = a,
esim. tapahtuu nollalla jakaminen.
• Edellinen pätee vaikka raja-arvo limx→a f (x) voitaisiin laskea, tai esim. sopivasti supistamalla vältyttäisiin nollalla jakamiselta.
• Käytännössä voidaan siis aina kysyä "Osaako yksinkertainen taskulaskin laskea tämän
vai antaako virheen".
Esimerkki 1.2. Etsi funktioiden a) f (x) =
joukot.
q
1−
1
x
b) g(x) =
x
x−1
Ratkaisu:
a)
r
f (x) =
1−
1
x
f : D(f ) → R
1
≥ 0}
x
R(f ) = [0, 1[∪]1, ∞[= [0, ∞[\{1}
D(f ) = {x ∈ R | x 6= 0, 1 −
3
−
2x−1
x−1
arvo- ja määrittely
b)
x
2x − 1
−
x−1
x−1
g : D(g) → R
D(g) = {x ∈ R|x 6= 1, x 6= 1} = \{1}
g(x) =
Mitäs jos oltaisiin sievennelty?
g(x) =
2x − 1
x − (2x − 1)
−x + 1
−1(x − 1)
x
−
=
=
=
= −1
x−1
x−1
x−1
x−1
x−1
y
x
0
1
−1
g:n kuvaaja
R(g) = {−1}
Kuva 2
Esimerkki 1.3. xy-tason käyrä y = x2 on funktion f (x) = x2 kuvaaja eli graafi (katso kuva
3). Määrittelyjoukko D(f ) = R ja arvojoukko R(f ) = [0, ∞[= R+ ∪ {0}.
y
y = x2
x
Kuva 3: Graafi.
4
1.3
1.3.1
Perusfunktiot
Polynomit
Polynomit ovat funktioita jotka voidaan kirjoittaa muodossa
f (x) = a0 + a1 x + a2 x2 + · · · + an xn =
n
X
ai x i ,
(1)
i=0
missä kertoimet ai ∈ R ja n ∈ N. Luku n on polynomin asteluku (olettaen että an 6= 0)
Esimerkki 1.4. Olkoon f (x) = 4x3 +6 ja g(x) = 6x4 −x3 +x2 Määritä polynomien f (x)+g(x)
ja f (x)g(x) kertoimet ja asteluvut.
Edellä esitetty muoto (1) polynomille ei ole aina käytännöllisin: usein polynomit ilmaistaan
nollakohtiensa avulla seuraavan lauseen mukaisesti.
Lause 1.1. Polynomilla on enintään astelukunsa verran reaalisianollakohtia (poikkeuksena triviaalitapaus f (x) = 0). Jos polynomilla f (x), jonka asteluku on n, on reaaliset nollakohdat xi ,
i = 1, ..., m niin se voidaan kirjoittaa muodossa
m
Y
f (x) = g(x)(x − x1 )(x − x2 ) · · · (x − xm ) = g(x) (x − xi ) ,
i=1
missä g(x) on polynomi jonka asteluku on n − m.
5
(2)
y
y
y = −2x3 + x
y=
x3
x
x
(a)
(b)
y
y
y = x4
x
x
y = 4x4 − 3x2 +
1
4
(c)
(d)
Kuva 4: Polynomifunktioiden nollakohtia.
Yleisesti korkean asteen polynomin nollakohtien analyyttinen etsintä on hankalaa, jopa mahdotonta. Kuitenkin jos tunnetaan valmiiksi muutama nollakohta niin voidaan esim. jakokulmassa
laskemalla etsiä e.m. polynomi g(x), jonka nollakohdat löydetään helposti jos n − m ≤ 2.
Esimerkki 1.5. Laske polynomin f (x) = x4 − 4x3 + 2x2 + 4x − 3 nollakohdat kun tiedetään
että f (1) = f (−1) = 0.
Esimerkki 1.6. Ratkaise epäyhtälö x4 − 4x3 > −2x2 − 4x + 3.
1.3.2
Rationaalilausekkeet
• Rationaalilausekkeet ovat muotoa
P (x)
Q(x)
jossa P (x) ja Q(x) ovat polynomeja.
• Rationaalilausekkeet eivät ole määriteltyjä pisteissä joissa Q(x) = 0.
6
• Näidenkin lausekkeiden sieventämisessä pätevät normaalit laskusäännöt, eli voidaan supistaa ja laventaa kuten reaaliluvuilla laskettaessa yleensäkin.
Esimerkki 1.7. Missä pisteissä lauseke on määritelty? Sievennä lauseke a)
2
x+1
ab−b2
2a2 +ab
c) xx+3
e) xyy2−x : xy+x
2 −1 − x2 −x d) 4a2 −b2 ·
b−a
y
x2 −1
x+1
b)
x3 −6x2 +9x
5x2 −15x
Rationaalilausekkeita sisältävät epäyhtälöt on helppoa ratkaista mikäli esiintyvien polynomien
nollakohdat saadaan ratkaistua. Mikäli lauseke ei ole valmiiksi sopivassa muodossa tai usempia
termejä (oikea puoli 0), niin turvallinen tapa on siirtää kaikki termit vasemmalle puolelle ja laventaa sopivasti. Tämä tosin voi johtaa korkeamman asteen polynomien nollakohtien etsimiseen.
Esimerkki 1.8. Ratkaise epäyhtälöt
1.3.3
(x−1)2 (x+1)
x−3
≥ 0 ja
1
x−2
>
x
x+1
Trigonometriset funktiot
Funktiot sin ja cos määritellään yksikköympyrän avulla (katso kuva 5).
y
Pπ/2
Pt = (cos t, sin t)
kaaren pituus t
t (radiaaneja)
A = (1, 0)
Pπ
O
x2 + y 2 = 1
C
P−π/2
Kuva 5: Ympyrä.
Muutamia muita määritelmästä suoraan seuraavia hyädyllisiä ominaisuuksia:
7
x
•
cos2 t + sin2 t = 1
• 2π-jaksollisuus eli
cos(t + 2π) = cos(t), sin(t + 2π) = sin(t)
• cos on parillinen ja sin pariton funktio eli
cos(−t) = cos(t), sin(−t) = − sin(t)
• Arvojen vaihteluväli [−1, 1] eli cos(t) ∈ [−1, 1] ja sin(t) ∈ [−1, 1].
Funktioiden cos(t) ja sin(t) avulla voidaan määritellä muita trigonometrisia funktioita joista
tärkein on tangentti
(3)
tan(t) := sin(t)/ cos(t)
8
y
− π2
1
π
2
−π
π
π/4
x
y = tan x
(a)
y
y = sin x
π 3π/2
1
−π −π/2
−3π/2
x
π/2
−1
(b)
y
1 y = cos x
π/2
π
−π
−2π
2π
−π/2
x
−1
(c)
Kuva 6: Käyrät y = tan t (a), y = sin t (b) ja y = cos t (c)
Määritelmistä suoraan seuraavat suorakulmaisen kolmion (katso kuva 7) ominaisuudet on myös
hyvä muistaa
a
a
b
sin t = , tan t = , cos t =
(4)
c
b
c
c
a
t
b
Kuva 7: Kolmio.
9
0 < t < 90◦
1.3.4
Logaritmifunktiot
Kuten trigonometriset funktiot, luonnollinen logaritmi ln(t) voidaan myös määritellä graafisesti.
Olkoon t piste positiivisella x-akselilla xy-koordinaatistossa ja At on se pinta-ala joka jää suorien
x = t ja x = 1, x-akselin ja käyrän y = 1/x väliin.
y
y = 1/x
At
t
1
x
Kuva 8: Luonnollinen logaritmi graafisesti määriteltynä.
ln(t) =
At
, t≥1
−At , 0 < t < 1
Luonnollisen logaritmifunktion f (t) = ln(t) ominaisuuksia:
• Määrittelyjoukko D(f ) =]0, ∞[.
• Arvojoukko R(f ) =] − ∞, ∞[ (Tämän osoittamiseksi tarvitsisimme määrätyn integraalin
käsitettä.)
• Aidosti kasvava koko määrittelyjoukossaan (⇒
f 0 (t) > 0 kaikilla t ∈ D(f ))
• ln(1) = 0
Yleinen (a-kantainen) logaritmi voidaan määritellä luonnollisen logaritmin avulla
loga (t) :=
ln(t)
.
ln(a)
(5)
Logaritmien laskusääntöjä. Olkoon a > 0, b > 0, x > 0, y > 0, a 6= 1 ja b 6= 1. Tällöin
i) loga 1 = 0
ii) loga (xy) = loga (x) + loga (y)
1
iii) loga x = − loga (x) iv) loga (x/y) = loga (x) − loga (y)
b (x)
v) loga (xy ) = y loga (x) vi) loga (x) = log
log (a)
b
10
(6)
y
log2 (x)
ln(x)
log10 (x)
x
log0,1 (x)
1
log0,5 (x)
Kuva 9: Erikantaisia logaritmifunktioita.
1.3.5
Potenssifunktiot
Määrittelemme ensin funktion f (x) = exp(x) tai f (x) = ex . Tämä voidaan tehdä yksinkertaisesti vaihtamalla luonnollisen logaritmifunktion muuttujan ja funktion arvon roolit päinvastaisiksi:
(7)
y = ex ⇔ ln(y) = x
Funktiot exp ja ln ovat itseasiassa toistensa käänteisfunktoita (joita käsittelemme yleisemmin
myöhemmin). Funktion f (x) = ex ominaisuuksia:
• Määrittelyjoukko D(f ) =] − ∞, ∞[.
• Arvojoukko R(f ) =]0, ∞[
• Aidosti kasvava koko määrittelyjoukossaan (⇒
f 0 (x) > 0 kaikilla x ∈ D(f ))
• e1 = e = limn→∞ (1 + 1/n)n = 2.721828 . . .
• eln(x) = x kaikille x ≥ 0 ja ln(ex ) = x kaikille x ∈ R.
Yleinen potenssifunktio voidaan määritellä vastaavasti yleisen logaritmin avulla:
y = ax
⇔
loga (y) = x ,
eli
loga (x) =
ln(x)
.
ln(a)
Potenssifunktion ominaisuuksia. Jos a > 0 ja b > 0 niin
i) a0 = 1
ii) ax+y = ax ay
x
iii) a−x = 1/ax iv) ax−y = aay
v) (ax )y = axy vi) (ab)x = ax bx
11
(8)
y
y = ln(x)
y = ex
1
x
1
Kuva 10: Eksponentti- ja logaritmifunktio.
Esimerkki 1.9. a) Laske limx→∞ log1/2 (x). b) Mitä on x jos log2 (x0.7 ) = 10?
Esimerkki 1.10. Sievennä lausekkeet:
√
a) loga (x4 + 3x2 + 2) + loga (x4 + 5x2 + 6) − 4 loga x2 + 2
b) log
√ π (1 − cos√x) + logπ√(1 + cos x) − 2 logπ (sin x)
c) ( 32 )4 , d) ( x)2 , e) x2
1.3.6
Hyperboliset funktiot
Hyperboliset funktiot cosh(x) ja sinh(x) voidaan määritellään kaavoilla
ex + e−x
,
2
• Laskukaavoja on esim. Beta pullollaan.
cosh(x) =
sinh(x) =
ex − e−x
2
y
y = cosh(x)
x
y = sinh(x)
Kuva 11: Hyperboliset funktiot.
12
Esimerkki 1.11. Osoita että cosh2 (x) − sinh2 (x) = 1
1.3.7
Itseisarvo
|x| =
x, x ≥ 0
−x, x < 0
(9)
Katso kuva 12.
|x|
−x
|x|
x
0
|y − x| = |x − y|
x
y
Kuva 12: Itseisarvo.
Huomaa että määritelmän kaavassa (9) voidaan x:n tilalle myös sijoittaa suurempi lauseke.
Esimerkki 1.12.
|(x + 3)(x − 4)| =
(x + 3)(x − 4) , (x + 3)(x − 4) ≥ 0
−(x + 3)(x − 4) , (x + 3)(x − 4) < 0
Esimerkki 1.13. Ratkaise | 2x + 5 |= 3.
• Jos itseisarvoja on useampia, pahimmassa tapauksessa jokainen täytyy käsitellä erikseen
ja tarkasteltavien vaihtoehtojen määrä lisääntyy
Esimerkki 1.14.




f (x) + g(x)
−f (x) + g(x)
|f (x)| + |g(x)| =
f (x) − g(x)



−f (x) − g(x)
1.4
,
,
,
,
f (x) ≥ 0 ja g(x) ≥ 0
f (x) < 0 ja g(x) ≥ 0
f (x) ≥ 0 ja g(x) < 0
f (x) < 0 ja g(x) < 0
Yhdistetyt funktiot
Käytännön toteutuksen ja suunnittelun monimutkaisuuden välttämiseksi jaetaan prosessit usein
pienempiin, toisiaan seuraaviin, vaiheisiin. Siis ensin x:lle tehdään operaatio f ja sitten lopputulokselle operaatio g. Matemaattisesti tämä tarkoittaa arvon g(f (x)) laskentaa. Luonnollisesti
kaikkien välivaiheiden laskennan täytyisi onnistua, eli myös funktion g(f (x)) määrittelyjoukko
13
kiinnostaa.
Olkoon f ja g funktioita. Yhdistetyn funktion
(g ◦ f )(x) = g ◦ f (x) = g(f (x))
määrittelyjoukko on
D(g ◦ f ) = {x | x ∈ D(f ) ja f (x) ∈ D(g)}
(10)
Esimerkki 1.15. Olkoon f (x) = x + 5 ja g(x) = x2 − 3. Laske f ◦ g(0) ja g ◦ f (−5).
Esimerkki 1.16. Määritä f ◦ g, g ◦ f sekä näiden määrittely- ja arvojoukot kun f (x) =
g(x) = x + 1.
Esimerkki 1.17. Määritä f ◦ f , D(f ◦ f ) ja R(f ◦ f ) kun f (x) =
1−x
.
1+x
Esimerkki 1.18. Määritä D(h ◦ (g ◦ f )) ja D((h ◦ g) ◦ f ) kun f (x) =
ja h(x) = 1/x.
1.5
√
x ja
√
x + 2, g(x) =
√
x−1
Injektio, surjektio ja bijektio
Matemaattinen määritelmä: Funktio f on injektio jos ja vain jos
f (x1 ) = f (x2 )
⇒
x1 = x2
∀x1 , x2 ∈ D(f ).
Määritelmästä seuraa että jatkuva funktio on injektio jos ja vain jos se on joko aidosti kasvava
tai aidosti vähenevä.
Yhtälöitä käsitellessä on suhteellisen turvallista ottaa puolittain funktio joka on injektiivinen:
huolta täytyy kantaa lähinnä määrittelyjoukosta. Epäyhtälöiden yhteydessä puolittain funktioita otettaessa vain aidosti kasvavat tai aidosti vähenevät funktiot ovat helppoja soveltaa,
muiden kanssa täytyy olla todella tarkkana.
14
A
B
A
(a) Surjektio.
B
A
(b) Injektio.
y
(c) Bijektio.
y
y
y∈B
y∈B
y∈B
x
x∈A
f :A→B
(d) Surjektiivinen funktio.
B
x
x
x∈A
f :A→B
x∈A
f :A→B
(e) Injektiivinen funktio.
(f) Bijektiivinen funktio.
Kuva 13: Surjektio, injektio ja bijektio.
Esimerkki 1.19. Piirrä esimerkkejä funktion kuvaajista sellaisille funktioille jotka a) ovat
injektioita, b) eivät ole injektioita.
Esimerkki 1.20. Tutki onko f injektio koko määrittelyjoukossaan. Jollei ole, kuinka määrittelyjoukkoa pitäisi rajoittaa jotta f olisi injektio?
p
a) f (x) = (x − 1)3
b) f (x) = x2 − 2 |x|
Esimerkki 1.21. Olkoon f ja g injektioita. Osoita että f ◦ g on injektio.
Injektio, surjektio ja bijektio voidaan voidaan ajatella myös yhtälöiden ratkaisujen kautta:
• Jos f : D(f ) → B on injektio ja a ∈ B niin yhtälöllä f (x) = a on korkeintaan yksi
ratkaisu.
• Jos f : D(f ) → B on surjektio ja a ∈ B niin yhtälöllä f (x) = a on aina vähintään yksi
ratkaisu.
• Jos f : D(f ) → B on bijektio ja a ∈ B niin yhtälöllä f (x) = a on täsmälleen yksi ratkaisu.
Esimerkki 1.22. Ovatko funktiot cos(x), sin(x) ,logb (x), xn ja ex injektioita, surjektioita tai
bijektioita kun maalijoukko B on a) B = R, b) B = R(f )?
15
1.6
Käänteisfunktiot
Käänteisfunktio f −1 voidaan määritellä kaikille funktioille f jotka ovat injektioita seuraavasti:
f (x) = y
⇔
x = f −1 (y)
(11)
Käänteisfunktiolla pätee siis seuraavat ominaisuudet:
• D(f −1 ) = R(f )
• R(f −1 ) = D(f )
• f (f −1 (x)) = x
• f −1 (f (x)) = x
• (f −1 )
−1
(x) = f (x)
f
f (x)
x
f −1
Kuva 14: Käänteisfunktio.
Mikäli käänteisfunktio on annettu, voidaan ratkaista mitä on x: arvo jos tunnetaan yhteys
y = f (x) (eli tunnetaan f ) ja arvo y:lle. Tämä tapahtuu yksinkertaisesti ottamalla funktio f −1
puolittain yhtälöstä y = f (x). Vaikka käänteisfunktiota ei tunnettaisikaan, on usein tärkeä tietää onko sellainen edes olemassa, jotta ongelman ratkaisemiseksi osataan valita oikea algoritmi
(tämä korostuu kun funktion lähtö- ja maalijoukot ovat monimutkaisempia kuin R.
Graafisesti f (x) ja f −1 voidaan piirtää samaan koordinaatistoon peilaamalla f (x) suoran y = x
suhteen.
16
y
y
y=x
x = cos y
y = x2
y = cos x
x
x
x = y2
y=x
(a) Kosinifunktiolla ei ole käänteisfunktiota, kun
D(f ) = R.
(b) Parillisella polynomifunktiolla ei ole käänteisfunktiota, kun D(f ) = R.
y
y
x=
√
y
y=
x = ln y
x
√
x
x
y = ln x
y=x
y=x
(c) Eksponenttifunktio on logaritmifunktion käänteisfunktio.
(d) Neliöjuurifunktiolla on käänteisfunktio.
Kuva 15: Funktioita ja käänteisfunktioita.
Käänteisfunktion lausekkeen määrittäminen voi olla hyvin haastavaa, joskus jopa mahdotonta:
Täytyisi ratkaista y lausekkesta x = f (y).
Esimerkki 1.23. Ratkaise käänteisfunktio f −1 (x) kun f (x) on
a) 4x + 1
b) (x − 1)3
c) ex + e−x
Jos funktio ei ole injektio, täytyy määrittelyjoukkkoa (eli käänteisfunktion arvojoukkoa) rajoittaa mikäli käänteisfunktio tahdotaan määrittää. Näin menetellään esimerkiksi trigonometristen funktioiden kohdalla: R(cos−1 ) = [0, π], R(sin−1 ) = [−π/2, π/2], R(tan−1 ) =] − π/2, π/2[.
Esimerkki 1.24. Sievennä
a) sin (cos−1 (−1/3)) b) sin sin−1 (0.6) c) tan−1 (−1)
Ratkaisu:
a)
17
{
1
Trigonometristen funktioiden käänteisfunktioiden määritelmän perusteella sin(cos (− ) ∈ [0, π]).
|
{z3
}
z
}|
−1
≥0
Toisaalta trigonometristen funktioiden määritelmästä (yksikköympyrä)
(sin α)2 + (cos α)2 = 1
⇒ (sin α)2 =p1 − (cos α)2
⇒ sin α = ± 1 − (cos α)2
Voimme siis päätellä että muutettaessa sin neliöjuurilausekkeeksi täytyy meidän valita nimeomaan negatiivinen neliöjuuri.
s
2
1
1
−1
= 1 − cos cos−1 −
⇒ sin cos
−
3
3
s
2
1
= 1− −
3
r
r
1
8
= 1− =
9
9
√
2 2
=
.
3
1.7
Yhtälöt, epäyhtälöt ja yhtälöryhmät
Yhden muuttujan yhtälöt voidaan kirjoittaa muotoon g(x) = f (x), missa f ja g ovat siis x:n
funktioita.
Epäyhtälöt voidaan kirjoittaa samoin muotoon g(x) < f (x), g(x) > f (x), g(x) ≤ (x) tai
g(x) ≥ f (x).
Luonteeltaan erilaisia ratkaisutyyppejä:
• Tarkka (analyyttinen) ratkaisu.
– Usein paras jos tarvitaan täsmällinen ratkaisu tai lausekkeet sisältävät vapaita parametreja
– Ei aina mahdollinen eikä käyttökelpoisin
– 1. vuoden kursseissa yleensä käytetty
• Numeerinen ratkaisu
– Tiettyjen reunaehtojen vallitessa helpohko
– Tuloksien luotettavuus kyseenalainen jollei tiedetä täsmälleen mitä ja miten ollaan
tekemässä
– Jos yhtälöllä useampia ratkaisuja niin usein hankalaa löytää kaikki ratkaisut
– Ratkaisut ovat likimääräisiä (mutta laskenta-aikaa lisäämällä oikeita desimaaleja
yleensä voidaan saada kuinka paljon vain tarvitaan)
– Ei juuri käsitellä 1. vuoden kursseissa
18
• Graafinen ratkaisu
– Suoraviivainen ratkaisutapa
– Ratkaisut ovat likimääräisiä, mutta voidaan tarkentaa ("zoomaamalla"ratkaisun ympäristöön).
– Hankalille lausekkeille käyrien piirtäminen ei triviaalia. Laskutarkkuudesta virheitä.
– Salliin jossain määrin vapaita parametreja
– Ei yleisty hyvin useamman muuttujan funktioille (joita käsitellään 1. vuoden kevään
kursseissa)
Esimerkki 1.25. Hae seuraaville yhtälöille graafinen ratkaisu. Jos mahdollista, etsi myös tarkka ratkaisu.
a) x2 − 2x = a
√
b) cos(x) = 1/ 2
c) sin(x) =
2x
5π
Esimerkki 1.26. Hae seuraaville
ratkaisu ja/tai tarkka ratkaisu.
√ epäyhtälöille graafinen
x+1
1
2x
2
> x−1
a) x − 2x < a b) cos(x) ≥ 1/ 2 c) sin(x) > 5π d) 6x−10
Yhtälöryhmien erittäin lyhyt oppimäärä:
• Yhtälöryhmät muodostavat useammista yhtälöstä joilla on useampia muuttujia.
• Yhtälörymien ratkaisemisesta (tarkka-, graafinen- ja numeerineratkaisu) voidaan todeta
samat asiat mitä todettiin edellä yhtälöiden ratkaisuista.
• Yksittäinen kahdenmuuttujan yhtälö esittää tasokäyrää.
• Kahden muuttujan ja kahden yhtälön yhtälöryhmän ratkaisuja ovat tasokäyrien leikkauspisteet.
• Kolmen muuttujan yhtälöryhmän ratkaisut ovat tasopintojen leikkauspisteitä (joita voi
olla myäs ääretän määrä).
Esimerkki
1.27. Etsi
ratkaisu ja/tai tarkka ratkaisu.
seuraaville yhtälöryhmille
graafinen
2
2
2
y=x
cos(y) = (cos(x))
(x − 1) + y 2 + z 2 = 2
a)
b)
c)
x = y2
(sin(y))2 = 1 − x
(x + 1)2 + y 2 + z 2 = 2
Yhtälöryhmiä muodostuu oleellisesti kun sanallinen informaatio puetaan matemaattiseen
muotoon:
Esimerkki 1.28. Määritä sen toisen asteen polynomin kertoimet joka kulkee (x, y) pisteiden
(1, 0), (2, 4) ja (3, 16) kautta.
Esimerkki 1.29. Kännykän etäisyys pisteessä (0, 10) sijaitsevasta tukiasemasta on 4km ja pisteessä (5,0) sijaitsevasta tukiasemasta etäisyys on 8 km. Millainen yhtälöryhmä on ratkaistava
jos tahdotaan tietää missä pisteessä kännykkä on? Saadaanko kännykän koordinaatti selville
yksikäsitteisesti?
19
2
Vektorit ja usean muuttujan funktiot
Alkuun muutama sana avaruuksista R2 ja R3 joissa pääasiassa pyörimme tässä kappaleessa.
Kolmiulotteisessa avaruudessa pisteen paikan määrää kolme lukua. Nämä luvut ilmoitetaan
yleensä etäisyyksinä origosta, mitattuna kolmen toisiaan vastaan kohtisuoran akselin suunnassa.
Näitä akseleita kutsutaan x–, y– ja z–akseleiksi, ja ne muodostavat karteesisen koordinaatiston.
Pisteen P koordinaatit 3–ulotteisessa avaruudessa muodostavat järjestetyn kolmikon (x, y, z),
missä reaaliluvut x, y ja z ovat pisteen etäisyydet origosta x–, y– ja z–akselin suunnassa.
Kolmiulotteista avaruutta merkitään symbolilla R3 . Vastaavasti 2–ulotteista tasoa merkitään
symbolilla R2 . On syytä huomata että kolmiulotteiseen avaruuteen voidaan taso asettaa monessa eri asennossa, eli pelkkä merkintä R2 ei kerro kaikkea mahdollista informaatiota vaan on
oleellista mitä avaruuden koordinaatiston akselit edustavat.
2.1
Vektoreiden peruskäsitteet
Vektori on otus jolla on suunta ja suuruus (koko, pituus). Geometrinen esitys: nuoli alkupisteestä
loppupisteeseen. Vektoria pisteestä A pisteeseen B merkitään
−→
v = AB
(12)
−
v ja →
v ovat käteviä. Varsin
Erityisesti käsin kirjoitettaessa myös vaihtoehtoiset merkinnät v, →
−
tavallista on myös käyttää vain merkintää v, ja jättää lukijan vastuulle arvata asiayhteydestä
onko kyseessä vektori vai ei.
−→
Vektorin v suuruus = "nuolen"pituus, merkitään |v| tai |AB|.
Vektorit u ja v ovat yhtäsuuria, jos niillä on sama pituus ja suunta.
Esimerkki 2.1. Piirrä vektorit u ja v siten että niiden suunta on sama ja u on tuplasi pidempi
kuin v. Voidaanko vektorit piirtää useammalla eri tavalla?
Edellä käytetyt geometriset esitykset toimivat hyvin havainnollistavasti kun käsittelemme vektoreita avaruudessa R2 tai R3 . Keskitymmekin aluksi näihin avaruuksiin, vaikka lähes kaikki
ominaisuudet ja kaavat joita esitämme toimisivat myös Rn :ssä.
Vektorien u ja v summa saadaan asettamalla vektorin v häntä vektorin u kärkeen. Summavektori u + v on vektori u:n alkupäästä v:n kärkeen.
Skalaarilla kertominen: Jos v on vektori ja t on skalaari, skalaarimonikerta tv on vektori, jonka
pituus on |t| kertaa v:n pituus ja suunta sama kuin v:llä, jos t > 0 ja vastakkainen suunta, jos
t < 0. Jos t = 0, pituus on nolla, kyseessä on nollavektori, merkitään 0.
20
u
u+v
v
2v
− 12 v
Kuva 16: Vektorien summa ja skalaarilla kertominen.
2.1.1
Standardikantavektorit
Määritellään R2 :ssa vektorit i ja j seuraavasti: i on vektori origosta pisteeseen (1, 0) ja j origosta pisteeseen (0, 1). Nämä vektorit ovat standardikantavektorit tasossa.
Jokainen vektori r origosta pisteeseen (x, y) voidaan ilmaista vektorien i ja j avulla:
r = xi + yj.
(13)
Vaikka vektorin merkintä itsessään ei sisälläkkään yleisesti tietoa vektorin alkupisteestä, usein
oletamme että se alkaa origosta. Jos
p tätä tahdotaan korostaa, voidaan puhua paikkavektorista.
Paikkavektorin r pituus on |r| = x2 + y 2
y
(x, y)
y
1
r
j
i
1
x
x
Kuva 17: Standardikantavektorit ja paikkavektori.
Vektorien u = u1 i + u2 j ja v = v1 i + v2 j summa ja skalaarilla kertominen komponenttien avulla:
u + v = (u1 + v1 )i + (u2 + v2 )j
(14)
tu = (tu1 )i + (tu2 )j
(15)
Nollavektori: 0 = 0i + 0j
Vektoria jonka pituus on 1 kutsutaan yksikkövektoriksi. Mistä tahansa vektorista v voidaan
muodostaa yksikkövektori v̂ jakamalla se pituudellaan:
1
v̂ =
v
(16)
|v|
21
Kaikki edelliset määritelmät yleistyvät suoraan R3 :n vektoreille suoraviivaisesti. Kolmiulotteisessa avaruudessa standardikannan muodostavat vektorit i, j ja k, ts. vektorit origosta
pisteisiin (1, 0, 0), (0, 1, 0) ja (0, 0, 1).
Kaikki R3 :n vektorit voidaan esittää kantavektorien lineaarikombinaatioina, esim. paikkavektori pisteeseen (x, y, z)
r = xi + yj + zk
(17)
x, y ja z ovat r:n komponentit. r:n pituus
|r| =
p
x2 + y 2 + z 2
(18)
−−→
Vektori v = P1 P2 pisteestä P1 = (x1 , y1 , z1 ) pisteeseen P2 = (x2 , y2 , z2 ) voidaan esittää kantavektorien avulla:
−−→
v = P1 P2 = (x2 − x1 )i + (y2 − y1 )j + (z2 − z1 )k
(19)
Vektorit n–ulotteisessa avaruudessa Rn voidaan ilmaista yksikkövektorien e1 , e2 , · · · , en
avulla muodossa
x = x1 e1 + x2 e2 + · · · xn en
(20)
2.1.2
Vektoreiden välinen kulma ja pistetulo
R2 :n vektorien u = u1 i + u2 j ja v = v1 i + v2 j pistetulo u · v määritellään
u · v = u1 v1 + u2 v2
(21)
Vastaavasti R3 :ssa vektorien u = u1 i + u2 j + u3 k ja v = v1 i + v2 j + v3 k pistetulo
u · v = u1 v1 + u2 v2 + u3 v3
(22)
Samoin määriteltäisiin pistetulo myös avaruuden Rn vektoreille.
Pistetulon ominaisuuksia:
u·v =v·u
u · (v + w) = u · v + u · w
(tu) · v = u · (tv) = t(u · v)
u · u = |u|2
(23)
Jos θ on vektorien u ja v välinen kulma (0 ≤ θ ≤ π), niin
u · v = |u||v| cos θ
(24)
Esimerkki 2.2. Laske vektorien u = 2i + 3j ja v = −1i + 2j välinen kulma.
Esimerkki 2.3. Määritä kaikki vektorit jotka ovat kohtisuorassa vektoria u = 2i + 3j − k
vastaan.
22
2.2
Suorat ja tasot vektorien avulla esitettynä
Perinteinen tapa esittää suora R2 :ssa (xy-koordinaatistossa) on yhtälö y = kx + c. Vektoreiden
avulla esitettynä kaikkien suoran pisteiden paikkavektorit saadaan kun parametrin t ∈ R arvoa
vaihdetaan yhtälössä
r = (r0 + tv),
(25)
missä r0 on suoran minkä tahansa pisteen paikkavektori ja v on suoran suuntainen vektori.
Tämä esitystapa kelpaa suoralle sekä R2 :ssa että R3 :ssa ja yleisemminkin.
y
L
tv
Lkv
r
r0
x
Kuva 18: Suora vektorien avulla esitettynä.
Esimerkki 2.4. Esitä suora y = 2x + 3 vektoreiden avulla.
Esimerkki 2.5. Suora kulkee pisteiden (4, 5, 1) ja (2, 0, 7) kautta. Mikä on tämän suoran yhtälö?
Jos parametrin t arvot rajoitetaan välille [a, b] niin muodostuu jana. Mikäli suuntavektorin
v pituus on 1, tällöin janan pituus on |b − a|.
Esimerkki 2.6. Määrittele suora joka kulkee x−akselin suuntaisesti ja kulkee pisteen (3, 1, 2)
kautta. Määrittele myös edellä mainitulta suoralta jana jonka pituus on 5 ja keskipiste (3, 1, 2).
Jos merkitään r = xi + yj + zk, r0 = x0 i + y0 j + z0 k ja v = ai + bj + ck tarkastellaan
yhtälössä (25) jokaista kolmea komponettia erikseen, saadaan suoran (skalaari) esitysmuoto


x = x0 + at
(26)
y = y0 + bt
(−∞ < t < ∞)


z = z0 + ct
23
Esimerkki 2.7. Muodosta suoran normaali esitysmuoto eliminoimalla esitysmuodosta (26)
parametri t.
Ratkaisu: Jos a 6= 0, b 6= 0 ja c 6= 0, voidaan t ratkaista kaikista yhtälöistä, jolloin saadaan
standardimuoto:
y − y0
z − z0
x − x0
=
=
(27)
a
b
c
Jos jokin v:n komponenteista häviää niin voidaan t toki yhä eliminoida, Esim jos c = 0 niin
x − x0
y − y0
=
, z = z0 .
a
b
(28)
Esimerkki 2.8. Määritä suora joka kulkee pisteen P = (3, 3, 2) kautta ja leikkaa x-akselin
pisteessä x = (0, 2, 0), i) vektorimuodossa, ii) skalaarimuodossa, iii) normaalimuodossa.
Kahden geometrisen objektin välinen etäisyydellä tarkoitetaan niillä olevien kahden pisteen
välistä lyhintä etäisyyttä. Pisteen etäisyys suorasta voidaan laskea hyvin monella eri tavalla.
Eräs tapa on käyttää n.k. ristitulon sisältävää kaavaa: Pisteen P0 etäisyys pisteen P1 kautta
kulkevasta suorasta, joka on vektorin v suuntainen on
s=
|(r0 − r1 ) × v|
|v|
(29)
Kaavan tarvitsema ristitulo × esitellään hieman myöhemmin mutta käymme seuraavan tehtävän sisällä läpi periaatteen jolla saadaaan myös lähin piste, ei pelkästään etäisyyttä.
Esimerkki 2.9. Etsi pistettä (4, −2) lähin piste suoralta y = 2x + 1.
Olkoon piste r1 suoralla L1 jonka suuntavektori on v1 . Vastaavasti olkoon r2 suoralla L2 jonka
suuntavektori on v2 . Suorien L1 ja L2 välinen (lyhin) etäisyys on
s=
|(r2 − r1 ) · (v1 × v2 )|
.
|v1 × v2 |
(30)
Tämä kaava löytyy useimmista kaavakirjoista. Jälleen kaavan käyttö vaatisi mystisen ristitulon
hallintaa. Eikä kaava anna edes tietoa siitä mitkä nuo lähimmät pisteet ovat. Kokeillaanpa
seuraavan esimerkin ratkaisussa käyttää taas helppoa geometrista lähestymistapaa tähän.
24
z
v1 × v2
L2
v2 v
1
s
y
L1
x
Kuva 19: Suorien etäisyys
z
y
v1 × v2
v2
v1
v1
v2
x
Kuva 20: Ristitulo.
Esimerkki 2.10. Oletetaan että kaksi maanalaista tunnelia kulkevat suorien L1 ja L2 suuntaisesti. Olkoon nämä suorat määrittelevät paikka- ja suuntavektorit r1 = 1i + 0j + 1k, v1 =
1i + 1j + 1k, r2 = 0i + 0j + 2k, r1 = 2i + 0j + 0k. Mitkä ovat ne tunnelien pisteet jotka ovat
toisiaan lähimpänä.
25
2.2.1
Tasot
Olkoon jälleen P0 = (x0 , y0 , z0 ) R3 :n piste, jonka paikkavektori on r0 = x0 i + y0 j + z0 k. Jos
n = Ai + Bj + Ck on nollasta poikkeava vektori, on olemassa täsmälleen yksi taso, joka kulkee
pisteen P0 kautta ja on n:ää vastaan kohtisuora. Tällöin n on tason normaalivektori.
Jos P = (x, y, z) on mielivaltainen piste tasossa, jonka paikkavektori on r, tason yhtälö
vektorimuodossa on
n · (r − r0 ) = 0.
(31)
Taso siis muodostuu kaikista niistä pisteistä joiden paikkavektori r toteuttaa edellisen yhtälön.
Mitähän e.m. yhtälö muuten mahtaa geometrisesti merkitä?
z
n
P0
r − r0
y
P
r0
r
O
x
Kuva 21: Taso ja sen normaalivektori
Jos edellisessä yhtälössä pistetulo lasketaan auki niin saadaan tason yhtälö normaalimuodossa:
A(x − x0 ) + B(y − y0 ) + C(z − z0 ) = 0
(32)
Esimerkki 2.11. Kävellään pitkin pisteen (1, 2, 1) kautta kulkevaa tasoa jonka normaalivektori on (2, 1, 2). Ajatellaan z-koordinaattia korkeutena. lKuinka paljon liikutaan ylöspäin (tai
alaspäin) aina kun
a) x-suunnassa liikutaan yksi yksikkö ja y suunnassa nolla yksikköä.
b) y-suunnassa liikutaan yksi yksikkö ja x suunnassa nolla yksikköä
c) sekä x että y suunnassa liikutaan yksi askel
Taso voidaan myös esittää parametrisessa muodossa (kahden parametrin avulla) kun annetaan
tason suunnan määrittävät suuntavektorit v1 ja v2 sekä yksi piste r0 tasolta:
r = r0 + t1 v1 + t2 v2
, missä t1 , t2 ∈ R
26
(33)
Esimerkki 2.12. Oletetaan että kolmiulotteisessa avaruudessa pystytään liikkumaan aina vain
vektoreiden v1 = i + 2j + 3k ja v2 = 4i + 5j + 6k suuntiin. Oletetaan lähdetään liikkumaan
pisteestä (−1, 0, 1). Esitä parametrisessa muodossa kaikki mahdolliset pisteet joihin päästään
liikkumaan.
Pisteen etäisyydelle tasosta on suoria kaavoja: Olkoon P0 mikä tahansa tason piste. Pisteen
P = (x1 , y1 , z1 ) etäisyys tasosta Ax + By + Cz + D = 0:
−−→ P P · n |(r − r) · n|
|r0 · n − r · n|
0 0
s=
=
(34)
=
|n| |n|
|n|
Koordinaattien (x1 , y1 , z1 ) avulla lausuttuna
s=
|Ax1 + By1 + Cz1 + D|
√
.
A2 + B 2 + C 2
(35)
z
n
P0
r − r0
P
s
y
r0
r
O
x
Kuva 22: Pisteen etäisyys tasosta
Jälleen kerran nämä kaavat epäonnistuvat vastaamaan yksinkertaiseen kysymykseen: mikä
on pistettä P lähin piste? Mietitään tähän ratkaisumallia seuraavan tehtävän yhteydessä.
Esimerkki 2.13. Mikä on pisteen (2, −1, 3) etäisyys tasosta, jonka yhtälö on 2x − 2y − z = 9?
Mikä on tämä kyseinen piste johon matka on lyhin?
27
2.3
Vaihtoehtoisia ilmaisutapoja vektoreille
Rakkaalla lapsella on monta nimeä ja vektoreitakin voidaan merkitä monella eri tavalla. Esimerkiksi R3 :ssa olemme käyttäneet yksikkövektoreita i, j ja k vektoreita käsiteltäessä. Näiden
lisäksi yleisesti käytetään ainakin kaarisulkuja ja hakasulkuja joiden väliin vain ladotaan edellämainittujen yksikkövektoreiden kertoimet. Nämä kertoimetkin voidaan latoa joko peräkkäin
tai päälleekkäin, pilkuilla erotettuna tai ilman pilkkuja, tilanteesta riippuen. Siis alla olevat
merkinnät voitaisiin tulkita samaksi vektoriksi R3 :ssa

2i + 3j − k,
2 3 −1 ,
2, 3, −1 ,

2
 3 ,
−1

2 3 −1 ,
2, 3, −1 ,

2
3
−1
Samanlaisia merkintöjä voidaan käyttää myös Rn :ssä. Jollei asiayhteydestä homma selviä
niin joillaikin merkinnöillä tietysti R2 :ssa on mahdollisuus sekoittaa lukujoukko ja vektori keskenään. Ja toiseksi viimeisintä merkintätapaahan käytetään myös avaruuden pisteiden merkitsemiseen, mutta tässä ei suurta vaaraa ole koska pistettä voidaan oleellisesti ajatella (paikka)vektorina.
2.4
Usean muuttujan reaaliarvoiset funktiot
Kappaleessa 1.2. esitettiin yleinen funktion määritelmä ja sitä sovellettiin yhden reaalimuuttujan reaaliarvoisten funktioden kanssa. Tässä kappaleessa käsitellään usean reaalimuuttujan
reaaliarvoisia funktioita. Esimerkiksi f (x, y, z) = x2 y + cos(zx) on kolmen muuttujan funktio
reaaliarvoinen funktio.
Usean muuttujan funktion argumenttia voidaan ajatella myös avaruuden Rn pisteenä tai vektorina (ja puhua vektorimuuttujan funktiosta). Esimerkiksi jos x = (x1 , x2 ) niin g(x) = f (x1 , x2 ) =
x21 ex2 on kahden muuttujan reaaliarvoinen funktio. Edelliset funktiot olivat sillä tavalla yksinkertaisia että ne olivat kaikkialla määriteltyjä ja arvojoukotkin on helppo nähdä: f : R3 → R,
R(f ) =] − ∞, ∞[, g : R2 → R ja R(g) = [0, ∞[.
Suurimman mahdollisen määrittelyjoukon etsiminen usean muuttujan funktioille ei periaatteessa ole sen vaikeampaa kuin yhden muuttujan funktoillekkaan: mietitään vain milloin laskutoimitukset ovat sallittuja. Sensijaan määrittelyjoukon hahmottelu voi olla haastavaa.
Esimerkki
mahdollinen määrittelyjoukkko funktioille f (x, y) =
p 2.14. Etsi ja hahmottele suurin
p
1
2
2
+ −x − y + 5 ja f (x, y, z) = x + y 2 + z 2 − 1 + ln(x + y).
x−2y
Arvojoukon määrittäminen usean muuttujan funktioilla on yleisesti hyvinkin vaikea ongelma,
laskettiin sitten käsin tai tietokoneella. Edellisen esimerkin funktioiden arvojoukot lienevät vielä
pääteltävissä, mutta entäpä esim. funktion f (x, y) = cos(xy) + x3 − y 2 kun D(f ) = {(x, y) ∈
R2 | x2 + y 2 < 1)}? Arvojoukko jää ehkä päättelemättä/käsin laskematta.
Kuten yhdenkin muuttujan funktioiden tapauksessa niin myös usean muuttujan funktioiden
käyttäytymistä voidaan arvioida funktion kuvaajaa tarkastelemalla. Ainakin jos muuttujia ei
ole kauhean paljoa.
• Kahden muuttujan funktion f (x, y) kuvaajaa voidaan ajatella pintana kolmiulotteisessa
avaruudessa: Jos koordinaattiakselit
ovat x, y ja z niin merkitään z = f (x, y). Esimerkiksi
p
2
2
funktion f (x, y) = 1 − x − y kuvaaja on yksikköpallon xy-tason yläpuoleinen osa.
28
• Kolmen muuttujan funktion kuvaajaa voi ajatella vaikka "animaationa"jossa yhtä muuttujaa ajatellaan
p vaikkapa aikana. Tällöin pinta muuttuisi ajansuhteen. Esim. funktion
f (x, y, t) = (1 + cos(t)) − x2 − y 2 kuvaajaa voisi demonstroida xy-tason yläpuoleisena
osana pallosta jonka säde ensin pienenee, sitten suurenee, sitten pienenee jne.
Myös tasa-arvo käyriä voidaan käyttää kuvaajien hahmottelussa. Kahden muuttujan funktiolle
f (x, y) tasa-arvo käyrät ovat sellaisia xy-tason käyriä joissa funktio saa aina saman arvon.
Jos funktion arvoa ajattelee korkeuskoordinaattina ja kuvaajaa pintana niin tasa-arvokäyrät
ovat samassa roolissa kuin suunnistuskartassa näkyvät käyrät ovat maaston korkeudelle. Eli
jos muuttujien arvoja vaihdellaan vain niin että pysytään tasa-arvokäyrällä niin kuvaajalla ei
liikuta ylös- eikä alaspäin.
Esimerkki 2.15. Funktion f (x, y) = 2y + x2 tasa-arvokäyrät ovat muotoa 2y + x2 = C eli
alaspäin aukeavia paraabeleja. Kun tässä lukua C kasvatetaan niin funktion arvo kasvaa ja
samalla nämä paraabelit siirtyvät ylospäin. Tästä voimmekin nähdä että kun otetaan yksi
askel y-suunnassa niin kuvaaja nousee kaksi askelta korkeammalle. Toisiin suuntiin kuvaajan
muutosten tarkka hahmottaminen ei olekkaan niin helppoa.
Injektiivisyys, surjektiivisuus ja bijektiivisyys määritellään usean muuttujan funktioille aivan
samoin kuin yhden muuttujan funktioille. Nämä eivät kuitenkaan ole kovin mielenkiintoisia
käsitteitä jos funktion maalijoukko on R sillä tällöin injektiiviset funktiot ovat aika harvassa
jolleivat määrittelyjoukot ole hyvin rajoittuneita (oleellisesti yksiulotteisina ajateltavia).
2.5
Vektoriarvoiset funktiot
Aikaisemmin funktioidemme maalijoukko on ollut aina R tai sen osajoukko. Vektoriarvoisista
funktioista puhuttaessa
avaruus.
ajattelemme että maalijoukko voi olla
myös
√
√ useampiulotteinen
Esim. f (x) = x2 , x3 on funktio f : R → R2 ja f (x) = x2 ,
x,
1 − x on funktio f :
[0, 1] → R3 . Edellisten esimerkkien kaltaisten yhden muuttujan vektoriarvoisten funktioiden
kuvaajat voidaan ajatella käyrinä maaliavaruudessa: kyseinen käyrä muodostuu niistä kaikista
pisteistä joita funktio arvokseen saa kun sen (ainut) muuttuja saa kaikki arvonsa.
Esimerkki 2.16. Hahmottele funktioiden f (x) = x2 , 2x ja g(t) = 2t, t + 1, 2 kuvaajia.
Usein tälläisen funktion muuttujaa t voidaan ajatella aikana ja funktion arvo f (t) kertoo
missä pisteessä ollaan tänä ajanhetkenä.
Yleisimmillään tällä kurssilla funktion määrittelyjoukko on Rn (tai sen osajoukko) ja maalijoukko on Rm . Tälläisiä funktioita syntyy esimerkiksi kun sähköisten piirien toimintaa mallintaessa:
- Funktion f muuttujina olisi esimerkiksi jännitelähteiden (n kappaletta) jännitteet vektorissa
U ja funktion arvona vektori I joka sisältää piirissä kulkevien meitä kiinnostavien virtojen arvoja (m kappaletta). Eli f (U) = I.
-Jos funktio olisi surjektio (maalijoukkona Rm ) niin jännitteet sopivasti valitsemalla saataisiin
varmasti aikaiseksi mitkä tahansa virrat.
- Pystyttäisiinkö jännitteet selvittämään mitatuista virroista yksikäsitteisesti riippuisi varmaan
siitä mitä virtoja on mitattu. Jos tälläinen funktio olisi injektio niin mitatuista virroista voisi
päätellä kaikki jännitteet käyttämällä käänteisfunktiota f −1 (I) = U.
29
Surjektiivisuus ja injektiivisyyskäsitteet ovat siin tietysti aivan samat kuin aikaisemmin yhden
muuttujan reaaliarvoisia funktioita käsitellessä. Käytännössä tällä kurssilla käsittelemme vektorimuuttujan vektoriarvoisista funktioista puhuttaessa vain n.k. lineaarisia funktioita, jotka
esitellään myöhemmissä kappaleissa.
3
Matriisit
Matriisilla tarkoitetaan luku– tai funktiojoukkoa, joka on järjestetty hakasulkujen (tai kaarisulkujen) ympäröimäksi suorakulmaiseksi taulukoksi. Näitä lukuja tai funktioita kutsutaan
matriisin alkioiksi tai elementeiksi. Esimerkkejä matriiseista:
x
e sin x
4 28 −1
4
a1 a2 a3 ,
(36)
,
,
e2x x2
11 0.27 0
7
Ja sitten tuhannen taalan kysymys: Mihin matriiseja tarvitaan? Vastaus tähän on: Matriisit
ovat monesti kätevä apuväline tiedon kompaktiin ja tehokkaaseen esittämiseen, analysointiin ja
muokkaukseen. Erityisesti lineaariset yhtälöryhmät, esim.
(
5x − 2y + z = 0
(37)
3x + 4z = 0
on kätevää esittää kerroinmatriisin
5 −2 1
A=
3 0 4
(38)
avulla. Esimerkkejä matriisien sovellusalueilta ovat mm.:
• sähkö–, tie– ym. verkostojen mallintaminen
• säätötekniikka
• kemialliset reaktiot
• tilastollisen tiedon analysointi
• mekaniikka
• tietokonegrafiikka
3.1
Matriiseihin liittyvät peruskäsitteet
Termillä rivi viitataan lyhyesti matriisin vaakariviin ja termillä sarake matriisin pystyriviin.
Yleensä matriisia merkitään isolla kirjaimella (A, B, C jne.) tai kirjoittamalla yleinen matriisielementti haka- tai kaarisulkuihin: A = [ajk ]. Ensimmäinen indeksi ilmoittaa rivin ja toinen
sarakkeen, josta kyseinen elementti löytyy.


a11 a12 · · · a1n
 a21 a22 · · · a2n 


(39)
A = [ajk ] =  ..
..
.. 
 .
. ···
. 
am1 am2 · · · amn
Matriisi, jossa on m riviä ja n saraketta on m × n–matriisi. Mikäli matriiisin A elementit ovat
reaalilukuja niin voidaan merkitä A ∈ Rm×n . Tärkeitä erikoistapauksia:
30
• Jos m = n, on kyseessä n × n– neliömatriisi. Neliömatriisin diagonaali, jolla ovat alkiot
a11 , a22 , . . . , ann on matriisin päälävistäjä.
• Jos m = 1 ja n > 1 kutsutaan matriisia yleensä rivivektoriksi tai vaakavektoriksi ja
merkintänä käytetään yleensä ison kirjaimen sijasta pientä kirjainta, esim. v = [2 4 1].
• Jos n = 1 ja m > 1 kutsutaan matriisia yleensä sarakevektoriksi tai pystyvektoriksi
ja
b
merkintänä käytetään yleensä ison kirjaimen sijasta pientä kirjainta, esim b = 1
b2
Matriisien yhtäsuuruus: Matriisit A ja B ovat yhtäsuuria, ts. A = B, jos niiden kaikki alkiot
ovat yhtäsuuria, eli ajk = bjk kaikilla j:n ja k:n arvoilla.
Vektorin a transpoosi aT saadaan vaihtamalla pystyvektori vaakavektoriksi tai päinvastoin. Vastaavasti matriisin A transpoosi AT saadaan vaihtamalla matriisin rivit ja sarakkeet keskenään:


a11 a21 · · · am1
 a12 a22 · · · am2 


(40)
AT = [akj ] =  ..
..
.. 
 .
. ···
. 
a1n a2n · · · amn
Jos AT = A, matriisi A on symmetrinen. Symmetriset matriisit ovat varsin yleisiä sovelluksissa.
Jos AT = −A, matriisi A on vinosymmetrinen (skew–symmetric).
Matriisin A ∈ Rm×n alimatriisi (tai osamatriisi, engl. submatrix) saadaan jättämällä A:sta
rivejä ja/tai sarakkeita pois. Esim. 2 × 3–matriisin
a11 a12 a13
(41)
A=
a21 a22 a23
2 × 2–alimatriisit ovat
a12 a13
a11 a13
a11 a12
ja
,
a22 a23
a21 a23
a21 a22
(42)
Yo. matriisilla A on myös kaksi 1 × 3–, kolme 2 × 1–, kuusi 1 × 2 ja kuusi 1 × 1–alimatriisia.
Pienemmistä matriiseja (erityisesti vektoreita) yhdistetään usein myös suuremmiksi matriiseiksi
esim. vaakavektoreista
ai = ai1 ai2 · · · ain , i = 1, . . . , m
(43)
voidaan koota m × n matriisi


a1
 a2 
 
A =  .. 
 . 
(44)
am
Samoin esim. pystyvektoreista
bi = b1i b2i · · ·
bni
T
,
i = 1, . . . , m
(45)
voidaan koota n × x matriisi
B = b1 , b2 , . . . , bm
(46)
Esitysmuodossa (46) jätetään pilkut usein myös merkitsemättä tai sitten vektorit bi erotellaan
väli- tai katkoviivalla.
31
Neliömatriisi, jonka päälävistäjän yläpuolella
Esim.

1
−2
5
olevat alkiot ovat nollia, on alakolmiomatriisi.

0 0
3 0
(47)
0 2
Neliömatriisi, jonka päälävistäjän alapuolella olevat alkiot ovat nollia, on yläkolmiomatriisi.


1 6 −1
0 3 2 
(48)
0 0 2
Molemmissa tapauksessa päälävistäjän alkiot voivat olla tai olla olematta nollia.
Neliömatriisi A = [ajk ], jonka päälävistäjän ylä– ja alapuoliset alkiot ovat nollia, ts. ajk = 0,
kun j 6= k, on diagonaalimatriisi.
Diagonaalimatriisi, jonka päälävistäjän alkiot ovat kaikki ykkösiä, on identtinen matriisi eli
yksikkömatriisi, merkitään In tai I. Esim. 3 × 3–yksikkömatriisi:


1 0 0
I = 0 1 0
(49)
0 0 1
3.2
3.2.1
Matriisien laskutoimitukset
Matriisien yhteenlasku ja kertominen skalaarilla
• Yhteenlasku: Jos A = [ajk ] ja B = [bjk ], niin
A + B = [ajk + bjk ]
(50)
• Skalaarilla kertominen: Olkoon A = [ajk ] m × n–matriisi ja c skalaari (yleensä reaali- tai
kompleksiluku). Tällöin
cA = [cajk ]
(51)
Kuten yleensäkin, luvulla −1 kertominen voidaan esittää lyhyesti: (−1)A = −A ja yleisemmin
(−k)A = −kA. Negatiivisten skalaarien avulla matriisien vähennyslasku tulee määriteltyä myös
luonnollisella tavalla: A + (−B) = A − B. erotus).
Nollamatriisi: m × n–matriisi on m × n–nollamatriisi, jos kaikki sen elementit ovat nollia, merkitään 0 (tai 0, jos ei ole vaaraa sekoittaa nollamatriisia reaalilukuun). Toisinsanoen A = B jos
ja vain jos A − B on nollamatriisi.
Edellisistä määritelmistä seuraa selvästi mm. seuraavat reaaliluvuille ja vektoreillekin pätevät tutut ominaisuudet:
A+B=B+A
(52)
(U + V) + W = U + (V + W)
(53)
A+0=A
(54)
A + (−A) = 0
(55)
c(A + B) = cA + cB
(56)
32
(c + k)A = cA + kA
(57)
c(kA) = (ck)A
(58)
1A = A
(59)
Huom. Matriisien on oltava samankokoisia, jotta yhteenlasku olisi määritelty.
Selvästi pätee myös että
(A + B)T = AT + BT
(60)
(cA)T = cAT
(61)
Esimerkki 3.1. Olkoon
1 3 2
A=
,
−1 2 −3
0 4 0
B=
.
−1 2 1
(62)
Laske 4A, A + B, 2B − 2A, AT +BT, A−BT , tai perustele miksi lasku ei ole määritelty. Määritä
a siten että a2 A + 2aA + A = 0
3.2.2
Matriisien kertolasku
Tähän loppuikin sitten samankaltaisuus matriisien ja reaalinumeroiden välisten operaatioiden
välillä, matriisin kertolasku määritellään seuraavasti:
m × n–matriisin A = [ajk ] ja r × p–matriisin B = [bjk ] tulo C = AB on määritelty jos ja
vain jos r = n (B:n rivien määrä = A:n sarakkeiden määrä) ja määritellään m × p–matriisina
C = [cjk ], jonka elementit ovat
cjk =
n
X
ajl blk = aj1 b1k + aj2 b2k + · · · + ajn bnk
(63)
l=1
Huom. Vaikka olisi AB = 0, niin välttämättä ei ole A = 0, B = 0 tai BA = 0. Esim.
1 1 −1 1
−1 1
1 1
vs.
2 2
1 −1
1 −1 2 2
Yleisessä tapauksessa siis AB 6= BA, esim.
9 3 1 −4
vs.
−2 0 2 5
1 −4
9 3
2 5
−2 0
(64)
(65)
Intuitiivisesti selvempiä matriisitulon ominaisuuksia ovat:
(kA)B = (kAB) = A(kB)
(66)
A(BC) = (AB)C
(67)
(A + B)C = AC + BC
(68)
C(A + B) = CA + CB
(69)
Vähemmän intuitiivinen taasen on ominaisuus
(AB)T = BT AT
33
(70)
Esimerkki 3.2.
1 3 2
A=
,
−1 2 −3
0 4 0
B=
.
−1 2 1
(71)
Laske AB, BA, AT B, ABT , AT BT ja BT AT tai perustele miksi kertolasku ei ole määritelty.
Esimerkki 3.3. Jos A on 4 × 5 matriisi ja B on 3 × 4 matriisi niin minkä kokoisia täytyy
matriisien C ja D olla jotta lauseke AC + DB olisi määritelty?
Matriisien tulon määritelmästä seuraa: Jos a ja b ovat n:n alkion pystyvektoreita, aT on vaakavektori ja vektorien kertolaskun tulos on 1 × 1–matriisi, ts. reaaliluku. Tätä lukua kutsutaan
vektorien a ja b sisätuloksi tai pistetuloksi, merkitään a · b:
 
b1
n
 ..  X
T
a · b = a b = [a1 · · · an ]  .  =
al bl = a1 b1 + · · · + an bn .
(72)
l=1
bn
3.3
Lineaariset yhtälöryhmät
Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x1 , · · · , xn on joukko yhtälöitä,
jotka ovat muotoa

a11 x1 + · · · + a1n xn = b1



a x + · · · + a x = b
21 1
2n n
2
(73)

·
·
·



am1 x1 + · · · + amn xn = bm
Esim. kahden yhtälön ja kolmen tuntemattoman yhtälöryhmä:
(
5x1 + 2x2 − x3 = 4
x1 − 4x2 + 3x3 = 6
(74)
Lukuja ajk kutsutaan ryhmän kertoimiksi.
• Jos kaikki luvut bi ovat nollia, kyseessä on homogeeninen yhtälöryhmä.
• Jos ainakin yksi bi on nollasta poikkeava, on kyseessä epähomogeeninen ryhmä.
Yhtälöryhmän ratkaisu on lukujoukko x1 , · · · , xn , joka toteuttaa kaikki m yhtälöä. Yhtälöryhmän ratkaisuvektori on vektori x, jonka komponentit muodostavat ryhmän ratkaisun. Jos
yhtälöryhmä on homogeeninen, on olemassa ainakin triviaaliratkaisu x1 = 0, · · · , xn = 0.
Erityisen kiinnostavia kysymyksiä
• Kuinka yhtälöryhmä ratkaistaan algoritmillisesti? (Muutama tapa esitetään tällä kurssilla)
• Ratkaisujen määrä: Onko ratkaisua? Jos on, niin millaisia erilaista ratkaisua löytyy? (tämän kurssin ydinainesta)
• Kuinka herkkä ratkaisu on matriisin lukujen aij tai bi muutoksille, eli tilanteelle jossa joko
systeemi muuttuu tai häiriöitä esiintyy? (käsitellään hieman myös tällä kurssilla)
34
Yhtälöryhmä (73) voidaan kirjoittaa matriisien avulla:
Ax = b ,
missä kerroinmatriisi A = [ajk ] on m × n–matriisi

a11 a12
 a21 a22

A =  ..
..
 .
.
am1 am2
(75)

a1n
a2n 

.. 
. 
···
···
···
···
(76)
amn
ja pystyvektorit


x1
 
x =  ... 


b1
 
b =  ... 
xn
Matriisi

a11
 a21

à =  ..
 .
(77)
bm
a12
a22
..
.
am1 am2
···
···
···
···
a1n
a2n
..
.

b1
b2 

.. 
. 
(78)
amn bm
on yhtälöryhmän lisätty matriisi (augmented matrix). Matriisi à sisältää yhtälöryhmän kaikki annetut luvut ja määrittää siten yhtälöryhmän täydellisesti. Yhtälöryhmän ratkaisemiseksi
tarvitsee näin ollen tarkastella ainoastaan lisättyä matriisia. Käytännön resepti: Gaussin eliminointi.
Esimerkki 3.4. Kirjoita yhtälöryhmä
(
5x1 + 2x2 − x3 = 4
x1 − 4x2 + 3x3 = 6
(79)
matriisimuodossa ja esitä myös yhtälöryhmää kuvaava lisätty matriisi.
3.3.1
Gaussin eliminointi
Tässä kappaleessa esitetään eräs yksinkertainen algoritmi, Gaussin eliminaatio, lineaarisin yhtälöryhmän ratkaisemiseksi. Tämä algoritmi ei ole erityisen tehokas (vaatii paljon laskutoimituksia) mutta antaa tarkan ratkaisun ja on käyttökelpoinen pieniä yhtälöryhmiä käsin ratkaistaessa.
Yleisesti: yhtälöryhmän ratkaisut pysyvät samoina, jos tehdään perusoperaatiot yhtälöille:
• Yhtälöiden järjestys vaihdetaan (ei vaikuta ratkaisuihin)
• Yksi tai useampi yhtälö kerrotaan nollasta poikkeavalla vakiolla
• Yhtälö lisätään (puolittin) toiseen yhtälöön.
Gaussin eliminointi käyttää näitä operaatioita lineaariseen yhtälöryhmään. Jos yhtälöryhmä
kuvataan lisätyn matriisin avulla niin operaatiot on nopeampi suorittaa koska xi symboleja ja
ylimääräisiä "+"symboleja ei tarvitse kirjoittaa näkyviin. Vastaavat lineaarisenvyhtälöryhmän
käsittelyn perusoperaatiot lisätylle matriisille:
• Vaihdetaan kaksi riviä keskenään
35
• Yksi tai useampi rivi kerrotaan nollasta poikkeavalla vakiolla
• Lisätään vakiolla kerrottu rivi toiseen riviin
Gaussin eliminaation tarkoituksena on muokata yhtälöryhmän lisättymatriisi niinkutsuttuun porrasmuotoon.
1. Vähennetään ylin rivi sopivalla kertoimella kerrottuna kaikista muista riveistä. Kerroin
valitaan aina siten että ensimmäisen sarakkeeseen tulee nolla. Tämän toimenpiteen jälkeen
ensimmäisessä sarakkeessa on ainoastaan ylimmällä rivillä nollasta poikkeava alkio.
2. Vähennetään toinen rivii sopivalla kertoimella kerrottuna kaikista alapuoleisista riveistä.
Kerroin valitaan aina siten että kullakin rivillä toiseen sarakkeeseen (lävistäjän alapuolella) tulee nollia.
3. Jatketaan vastaavasti kunnes lävistäjän alapuolella on pelkkiä nollia.
4. Ratkaistaan alimmalta riviltä viimeisen muuttujan arvo ja sijoitetaan se toiseksi alimpaan
yhtälöön (riviin).
5. Ratkaistaan toiseksi alimmalta riviltä (yhtälöstä) toiseksi viimeisen muuttujan arvo ja
sijoitetaan se kolmanneksi alimpaan yhtälöön (riviin). Jatketaan muuttujen ratkaisua
tällä tavalla kunnes kaikki muuttujat on ratkaistu.
HUOM! Edellisessä algoritmissa voi tulla välillä vastaan tilanne jossa ei voida edetä koska
lävistäjällä on jossain vaiheessa lukuarvo 0. Tällöin voidaan toimia seuraavasti:
a) Jos kyseisessä sarakkeessa on lävistäjän alapuolella vielä nollasta poikkeavia arvoja, vaihdetaan rivejä keskenään.
b) Jos lävistäjäalkio ja kaikki sen alapuolella ovat nollia niin siirrytään seuraavaan sarakkeeseen. Jotta tällöin algoritmissa voitaisiin puhua vielä lävistäjäalkioista, pitää "unohtaa"matriisin ensimmäinen saraka (jota ei muutenkaan enää tarvita mihinkään) ennen
vaiheita 4 ja 5. Tätä "lävistäjäalkiota"kutsutaankin yleensä tukialkioksi".
Huomionarvoista on myös että mikä tahansa rivi voidaan missä tahansa vaiheessa kertoa millä
tahasa nollasta poikkeavalla luvulla: näin kannattaa tehdä joskus esim. murtolukujen välttämiseksi tai algoritmin numeerisen stabiilisuuden parantamiseksi (ei käsitellä tällä kurssilla).
Esimerkki 3.5. Olkoon x ∈ R3 ja


1 0 −4
A = −2 0 3 
−1 2 1
(80)
a) Ratkaise Gaussin eliminoinnilla yhtälöryhmä Ax = 0.
b) Etsi ne vektorit x ∈ R3 joille Ax = x.
Edellistä algoritmia voidaan käyttää myös tapauksissa joissa muuttujia on enemmän kuin yhtälöitä. Tässä tapauksessa (mikäli ratkaisua on ylipäätään olemassa) jotkut luvuista xj jäävät
varmasti vapaasti valittaviksi. Ratkaisuja voi siis olla äärettömän monta. Esimerkiksi kolmen
muuttujan (x1 , x2 ja x3 ) tapauksessa voidaan sanoa että yhtälörymän ratkaisuiksi kelpaavat
(x1 , x2 , x3 ) pisteet muodostavat jonkin seuraavista
36
a) tyhjän joukon (eli ei ole olemassa ratkaisua)
b) yksittäisen pisteen avaruudessa R3
c) suoran avaruudessa R3
d) tason avaruudessa R3 (melko harvinainen tapaus)
Esimerkki 3.6. Yhtälö


 
1 0 −4
1
−2 0 3  x = 1
−1 2 1
a
(81)
kuvaa erästä prosessia jossa x on alkutuotteiden määrä ja oikean puolen vektori ilmaiseen
haluttujen lopputuotteiden määrään. Millä parametrin a arvoilla yhtälöllä
a) on yksi ratkaisu?
a) ei ole yhtään ratkaisua?
c) on ääretön määrä ratkaisuja?
Esimerkki 3.7. Tutkitaan yhtälöryhmää Ax = b. Yhtälöryhmää kuvaava lisätty matriisi
à = [A b] voidaan Gaussin reduktiolla muokata porrasmatriisimuotoon. Merkitään näin saatua
porrasmatriisia symbolilla B. Tutkitaan viittä erilaista
yhtälöryhmää
: 



2 4 0 2
2 4 0 1 0
2 4 0
2 4 0
(i) B =
, (ii) B =
(iii) B = 0 0 0 0 , (iv) B = 0 0 1 1 1 , (v)
0 2 1
0 0 1
0 0 0 0
0 0 0 0 0


2 4 0 1 1
0 0 1 1 0

B=
0 0 0 2 4
0 0 0 0 0
Kussakin tapauksessa vastaa seuraaviin kysymyksiin:
a) Onko yksikään edellisessä kohdassa tutkituista yhtälörymistä homogeeninen? Jollei, niin
kuinka matriisi B muuttuisi jos alkup yhtälöryhmä olisi homogeeninen (mutta A ei muuttuisi)?
b) Ratkaise matriisin B kuvaama htälöryhmä. Mikäli mahdollista, anna ratkaisu muodossa
x = b̃ + c1 v1 + . . . ck vk , missä ci ∈ R (eli etsi vektorit b̃ ja vi ).
c) Tulkitse geometrisesti edelliset ratkaisut kohtien (i)-(iii) matriiseille.
d) Ratkaise vastaavat homogeeniset yhtälöryhmät. Tulkitse ratkaisut geometrisesti kohdissa
(i)-(iii).
Kappaleen lopuksi esittelemme vielä hieman kehittyneen version edellä esitetystä algoritmista: Gaussin-Jordan eliminaation. Tässä algoritmissa suoritetaan edellisen algoritmin vaiheen 3
jälkeen seuraavat askeleet
1. "nollataan"viimeisen "ei nolla"rivin ensimmäisen nollasta poikkeavan alkion (n.k. tukialkion) yläpuolelta kaikki luvut lisäämällä kyseistä riviä yläpuoleisiin riveihin sopivilla kertoimilla kerrottuna.
2. Siirrytään seuraavaksi ylimpään "ei nolla"riviin ja toistetaan edellinen. Jatketaan niin
kauan että kaikki rivit on käyty läpi.
37
Tällöion saatavassa porrasmatriisissa on yleensä huomattavasti enemmän nollia ja alkuperäisen algoritmin vaiheet 4 ja 5 on nopeampi suorittaa. Lisäksi usein Gaussin tai Gauss-Jordanin
eliminaatiossa muutetaan ensin arvoon 1 tukialkio, eli se lisättävän rivin alkio jonka alapuoleisia alkioita viedään nollaksi. Tämä tapahtuu yksinkertaisesti kertomalla koko kyseinen rivi
sopivalla luvulla.
Esimerkki 3.8. Ratkaise Gauss-Jordan eliminaatiolla seuraavat yhtälöryhmät




−3x
+
2y
−
6z
=
6

 2x1 − x2 + 1x3 = 1
(a)
(b)
5x + 7y − 5z = 6
3x1 + 2x2 − 4x3 = 4




x + 4y − 2z = 8
−6x1 + 3x2 − 3x3 = 2
3.3.2
Lineaarinen riippumattomuus
Vektorien a1 , · · · , am lineaarikombinaatio on muotoa
c1 a1 + · · · + cm am ,
(82)
missä c1 , · · · , cm ovat skalaareja (tässä tapauksessa reaalilukuja).
Vektorit a1 , · · · , am ovat lineaarisesti riippumattomia, jos ja vain jos
c1 a1 + c2 a2 + · · · + cm am = 0 ⇔ c1 = c2 = · · · = cm = 0
(83)
Jos lineaarikombinaatio on nolla siten, että jokin kertoimista on nollasta poikkeava, vektorit
ovat lineaarisesti riippuvia. Tällöin ainakin jokin niistä voidaan ilmaista toisten lineaarikombinaationa.
z
v2
v1
y
v3
0, 5v1
−1, 5v2
x
Kuva 23: Lineaarisesti riippuvat vektorit.
38
z
v2
y
v1
v3
0, 5v1
1, 5v2
x
Kuva 24: Lineaarisesti riippumattomat vektorit.
Matriisin A = [ajk ] lineaarisesti riippumattomien rivien tai sarakkeiden maksimimäärä on matriisin A aste (rank), merkitään rankA.
Edellä esitetyssä matriisin asteen määritelmä pitää sisällään seuraavan tuloksen: matriisin A ja
sen transpoosin AT aste on sama. Tämä tulos ei ole millään muotoa triviaali ja useissa lähteissä
matriisin asteen määritelmä pitääkin sisällään vain maininnan joko sarakkeesta tai rivistä, ei
molemmista. On täysin sovelluskohtaista kiinnostaako matriisin lineaarisesti riippumattomien
rivi- vai sarakevektorien määrä.
Gaussin eliminaation yhteydessä esitetyt perusoperaatiot (rivien vaihto etc) eivät muuta matriisin astetta. Matriisin aste saadaankin siis eliminaation lopputuloksena saatavan porrasmatriisin
ei–nollarivien lukumääränä (osaatko perustella miksi?).
Suora seuraus lineaarisen riippumattomuuden käsitteestä on että kaikki vektorit v ∈ Rn voidaan
esittää vektoreiden v1 , . . . , vm lineaarikombinaatioina jos ja vain jos vektoreiden v1 , . . . , vm
joukosta n kappaletta on lineaarisesti riippumattomia. Jos näin on, niin sanomme että vektorit
v1 , . . . , vm virittävät avaruuden Rn .
Esimerkki 3.9. Tutki ovatko vektorit 1 0 −3 , 3 1 −4 ja −2 −1 1 lineaarisesti
riiippumattomia.
3.3.3
Ratkaisujen yleisiä ominaisuuksia
Lineaarisella yhtälöryhmällä


a11 x1 + a12 x2 + · · · + a1n xn = b1

a x + a x + · · · + a x = b
21 1
22 2
2n n
2

···



am1 x1 + am2 x2 + · · · + amn xn = bm
eli yhtälöryhmällä Ax = b
• on ratkaisuja jos ja vain jos r = rank(A) = rank(Ã)
39
(84)
• on täsmälleen yksi ratkaisu, jos r = n
• on ääretön määrä ratkaisuja, jos r < n
Homogeeniselle lineaariselle yhtälöryhmälle


a11 x1 + a12 x2 + · · · + a1n xn = 0

a x + a x + · · · + a x = 0
21 1
22 2
2n n

···



am1 x1 + am2 x2 + · · · + amn xn = 0
(85)
pätee:
• Triviaaliratkaisu x = 0 aina olemassa
• Ei–triviaaliratkaisuja olemassa jos ja vain jos r = rank(A) < n
• Jos r < n, triviaali– ja ei–triviaaliratkaisut yhdessä muodostavat ratkaisuavaruuden, jonka
dimensio on n − r (ei päde epähomogeenisille yhtälöryhmille, osaatko sanoa miksi?)
• Ratkaisuavaruuden dimensio = A:n nulliteetti, merk. null(A). Pätee siis
rank(A) + null(A) = n
(86)
Käytännössä null(A) on yhtälöryhmän ratkaisussa vapaiksi jäävien muuttujien lukumäärä (epähomogeenisen yhtälöryhmän tapauksessa sillä oletuksella että ratkaisua on ylipäätään olemassa).
Esimerkki 3.10. Olkoon B matriisi joka saadaan kun matriisi A muokataan Gaussin eliminaatiolla porrasmatriisimuotoon. Määritä rank(A) , null(A) sekä yhtälöryhmän Ax = 0 ratkaisuavaruuden dimensio (eli ratkaisussa
vapaaksi
kun


 jäävien muuttujien lukumäärä)





2 4 0 1 1
2 4 0
2 4 0 1
2 4
0 0 1 1 0







, d) B = 0 0 1.
0
0
a) B = 0 0 1 1 , b) B = 
,
c)
B
=
0 0 0
0 0 0 2 4
0 0 0 2
0 0
0 0 0 0 0
0 0 0
Esimerkki 3.11. Olkoon B matriisi joka saadaan kun yhtälöryhmään Ax = b liittyvä lisätty
matriisi à = [A b] muokataan Gaussin eliminaatiolla porrasmatriisimuotoon. Määritä rank(A)
, null(A) sekä yhtälöryhmän Ax =b ratkaisussa vapaaksi
kun
 jäävien muuttujien lukumäärä






2 4 0 1 1 0
2 4 0 −1
2 4 0 1 −1
2 4 1
0 0 1 1 0 −3


, c) B = 0 0 1, d) B = 0 0 1 −2.
a) B = 0 0 1 1 1 , b) B = 
0 0 0 2 4 0 
0 0 0 0 
0 0 0 2 0
0 0 0
0 0 0 0 0 0
0 0 0 0
3.4
Käänteismatriisi
Tarkastellaan neliömatriiseja
n × n–matriisin A = [ajk ] käänteismatriisi A−1 on matriisi, jolle pätee
AA−1 = A−1 A = I
(87)
3 1
Esimerkki 3.12. Olkoon A =
. Muotoile lineaarinen yhtälöryhmä joka ratkaisemalla
−2 4
saataisiin käänteismatriisi A−1 .
40
Käänteismatriisi voidaan määrittää esim. Gauss–Jordan –eliminoinnilla.
• Idea: muodostetaan lisätty matriisi à = [A I] ja saatetaan se Gauss-Jordan eliminoinnilla
muotoon [I K], jossa tällöin K = A−1 .
• Myöhemmin esitetään menetelmä, jolla käänteismatriisin voi määrittää determinanttien
avulla


1 −1 1
Esimerkki 3.13. Määritä matriisille A = 0 0 1 käänteismatriisi.
5 5 0
Epähomogeenisella yhtälöryhmällä ei välttämättä ole ratkaisua. Niinpä käänteismatriisiakaan
ei kaikille matriiseille voida määrittää. Jos A:lla on käänteismatriisi, kutsutaan matriisia ei–
singulaariseksi, muussa tapauksessa se on singulaarinen.
A
x
Ax
A−1
Kuva 25: Käänteismatriisi
Mihinkä käänteismatriisia sitten käytetään? Käänteismatriisin määritelmästä seuraa että jos
käänteismatriisi A−1 on olemassa niin yhtälöryhmä Ax = b voidaan ratkaista kun yhtälö kerrotaa puolittain käänteismatriisilla: A−1 Ax = Ix = x, eli x = A−1 b. Siis jos kerroinmatriisin
käänteismatriisi on valmiina, voidaan yhtälöryhmä ratkaista suoraan matriisin ja vektorin kertolaskuna. Jokainen vektorin x arvo voidaan lisäksi laskea toisistaan riippumatta, jolloin laskenta
on mahdollista toteuttaa tehokkaasti esim. rinnakkaislaskentaa hyväksi käyttäen.
Esimerkki 3.14.


 
1 −1 1
2



0
0
1
Ratkaise yhtälöryhmä Ax = b käänteismatriisin avulla kun A =
ja b = 0 
5 5 0
−1
Muutamia käänteismatriisiin liittyviä ominaisuuksia:
• Käänteismatriisi on yksikäsitteinen.
• n × n–matriisilla A on käänteismatriisi jos ja vain jos rank A = n
• Käänteismatriisin käänteismatriisi: (A−1 )−1 = A
• Tulon käänteismatriisi: (AC)−1 = C−1 A−1
Edellisistä ominaisuuksista seuraa että A,B ja C ovat n × n–matriiseja, niin
41
• Jos rank A = n ja AB = AC, niin B = C
• Jos rank A = n, niin AB = 0 ⇒ B = 0
• Jos A on singulaarinen, niin ovat myös AB ja BA
Esimerkki 3.15. Oletetaan että A ja B ovat ei-singulaarisia 3 × 3 matriiseja ja x, y ja b ovat
3 × 1 matriiseja (sarakevektoreita). a) Ratkaise x kun tiedetään että Ab + B(x − y) = b. b)
Millä ehdolla yhtälöllä Ab + B(x − y) = x on i) yksikäsitteinen ratkaisu ii) ääretön määrä
ratkaisuja?
Esimerkki 3.16. Eräs tyypillinen sovellus käänteismatriisille on pienimmän neliösumman menetelmä jossa data-pisteisiin (xi , yi ), i = 1, . . . , n yritetään sovittaa mallia y = a1 f1 (x) +
a2 f2 (x) + · · · + am fm (x) missä m ≤ n. Mikäli tällä ongelmalla on yksikäsitteinen ratkaisu niin
se voidaan muotoilla yhtälöryhmän AT Aa = AT b ratkaisuna, missä matriisi A riippuu pisteistä
xi ja funktioista fj ja vektori b riippuu yi pisteistä. Mitä tässä tapauksessa voidaan sanoa matriisin AT A asteesta? Muodosta matriisi A ja vektori b kun sovitettavana on lineaarinen malli
y = a1 x + a2 .
3.5
Determinantit
Determinantti on neliömatriiseihin liittyvä käsite. Determinanttia voidaan käyttää mm. kun ratkaistaan yhtälöryhmiä, luokitella kriittisiä pisteitä, tutkitaan lineaarista riippuvuutta, määritetään käänteismatriisia, tehdään muuttujanvaihtoja, määritetään ristituloa jne. Determinantin
sovelluskohteet ovat siis moninaiset, joskin ilman determinanttejakin voitaisiin pärjätä: determinantti on pohjimmiltaan laskusääntö jolla suhteellisen monimutkainen asia voidaan joskus
esittää melko helposti muistettavasa ja toteutettavassa muodossa.
3.5.1
Determinantin määritelmä
Käsitellään siis n × n–matriiseja, merkitään

a11
 a21

A =  ..
 .
an1
a12 · · ·
a22 · · ·
..
. ···
an2 · · ·

a1n
a2n 

..  .
. 
(88)
ann
Tapauksessa n = 2 determinantti määritellään kaavalla
a11 a12 = a11 a22 − a12 a21
detA = a21 a22 (89)
Tämä 2 × 2 matriisin determinantin laskukaava on peruskaava joka löytyy useimmista kaavastoista. Myös 3 × 3 matriisin determinantin laskukaava löytyy usein jossain muodossa kaavastoista, esim. seuraava muoto on hyvin yleisesti käytetty:
a11 a12 a13 a21 a22 a23 = a11 a22 a23 − a21 a12 a13 + a31 a12 a13 (90)
a32 a33 a32 a33 a22 a23 a31 a32 a33 Huom. merkit: + - + Yhtälön oikealla puolella olevat alideterminantit saadaan poistamalla
D:stä ko. determinantin kerrointa vastaava rivi ja sarake, esim. a11 :n tapauksessa ensimmäinen
42
rivi ja sarake jne. Tämä on itseasiassa erikoistapaus rekursiokaavasta jolla suurempien matriisien
determinantti on kätevää määritellä:
a11 a12 a13 · · · a1n n
a21 a22 a23 · · · a2n X
(−1)j+k ajk Mjk
..
=
.
k=1
a31 a32 a33 · · · ann missä alideterminantti Mjk on n − 1:en kertaluvun determinantti, joka saadaan poistamalla
matriisista j:s rivi ja k:s sarake. Indeksi j voi siis viitata mihin tahansa riviin. Tällä tavalla
laskettua determinanttia kutsutaan rivin suhteen auki kehitetyksi. Determinantti voidaan myös
kehittää auki sarakkeen suhteen:
a11 a12 a13 · · · a1n n
a21 a22 a23 · · · a2n X
(−1)j+k ajk Mjk ,
..
=
.
k=1
a31 a32 a33 · · · ann lopputulos on sama.

0
−1
Esimerkki 3.17. Määritä det(A) käyttämällä rekursiokaavaa kun A = 
2
0
1
0
1
4

0 −1
0 2
.
3 0
0 2
Usein käytetään käsitettä liittotekijä (cofactor): ajk :n liittotekijä on Cjk = (−1)j+k Mjk ja
determinantti liittotekijöiden avulla:
det(A) = aj1 Cj1 + aj2 Cj2 + · · · + ajn Cjn = a1k C1k + a2k C2k + · · · + ank Cnk
3.5.2
(91)
Determinanttien perusominaisuuksia
Determinantilla on useita ominaisuuksia joista kaikki eivät ensisilmäyksellä ole välttämättä
aivan itsestäänselviä listaamme näistä joitakin:
• Jos determinantin rivit ja sarakkeet vaihdetaan keskenään, determinantin arvo ei muutu.
• Jos determinantin jokin rivi tai sarake kerrotaan vakiolla k, determinantin arvo muuttuu
k–kertaiseksi.
• Jos jonkin rivin tai sarakkeen kaikki alkiot ovat nollia, on determinantin arvo = 0.
• Jos determinantin kaksi riviä tai saraketta vaihdetaan keskenään, vaihtuu determinantin
merkki.
• Jos jokin rivi tai sarake saadaan toisesta vakiolla kertomalla, on determinantin arvo = 0.
• Jos jokin rivi tai sarake lisätään toiseen vakiolla kerrottuna, determinantin arvo ei muutu.
• n × n–matriiseille A ja B,
det(AB) = det(BA) = det(A)det(B)
43
(92)
• Jos determinantin alkiot ovat funktioita, determinantin D derivaatta D0 on
D0 = D(1) + D(2) + · · · D(n) ,
(93)
missä D(j) saadaan derivoimalla j:nnen rivin alkiot.
• Transpoosin determinantti:
detAT = detA
(94)
1
detA
(95)
• Käänteismatriisin determinantti:
detA−1 =
• Neliömatriisin rivit (tai sarakkeet) ovat lineaarisesti riippumattomia jos ja vain jos matriisin determinantti ei ole nolla.
• Homogeenisen yhtälöryhmälle (jonka kerroinmatriisi on neliömatriisi) triviaaliratkaisu on
ainut ratkaisu jos ja vain jos kerroinmatriisin determinantti ei ole nolla.
Edellisiä ominaisuuksia käyttäen voidaan osoittaa että determinantin arvo voidaan laskea
viemällä matriisi porrasmuotoon Gaussin eliminaatiota käyttämällä ja sen jälkeen kertomalla
diagonaalialkiot keskenään.


1 0 −1
Esimerkki 3.18. Määritä det(A) käyttämällä Gaussin eliminaatiota kun −1 1 0 .
2 1 3
3.5.3
Cramerin sääntö
Cramerin säääntöä voidaan käyttää tietyissä tilanteissa raktaisemaan lineaarinen yhtälöryhmä
determinantteja hyväksi käyttäen: Jos n:n yhtälön ja n:n muuttujan yhtälöryhmällä

a11 x1 + · · · + a1n xn = b1



a x + · · · + a x = b
21 1
2n n
2
(96)

·
·
·



an1 x1 + · · · + ann xn = bn
on nollasta poikkeava kerroin matriisin determinantti, eli D = det(A) 6= 0, ryhmällä on täsmälleen yksi ratkaisu, joka saadaan kaavasta
D2
Dn
D1
, x2 =
, · · · , xn =
,
(97)
x1 =
D
D
D
missä Dk on determinantti, joka saadaan D:stä korvaamalla k:s sarake alkioilla b1 , · · · , bn .
Cramerin säännön seurauksena saadaan kääteismatriisin laskemiselle determinanttien avulla
sääntö


A11 A21 · · · An1

1
1 
 A12 A22 · · · An2 
A−1 =
[Ajk ]T =
(98)
. ···
. 
detA
detA  .
A1n A2n · · · Ann ,
missä Ajk on ajk :ta vastaava liittotekijä.
Huom. Cramerin sääntö on joskus kätevä käsin laskettaessa ja sitä on helppo soveltaa vaikka matriisi A sisältäisi parametreja (eli jotkut tai jopa kaikki alkiot olisivat tuntemattomia).
Se ei myöskään sisällä jakolaskuja, mikä usein saattaa auttaa numeriikan kanssa. Myös teoreettisia tuloksia johdettaessa, Cramerin sääntö voi yksinkertaistaa välivaiheita huomattavasti.
Kuitenkin kun lasketaan kuinka monta laskutoimenpidettä joudutaan tekemään determinanttien aukikehityksessä, huomataan tämän olevan niin suuri ettei tätä menetelmää kovin usein
sovelleta käytännön sovelluksissa.
44
3.6
Ominaisarvot ja ominaisvektorit
Ominaisvektorit ja ominaisarvot ovat suuressa roolissa lineaaristen systeemien käyttäytymistä
tutkittaessa. Monet tärkeät matemaattiset apuneuvot (mm. diagonalisointi ja singulaariarvohajotelma) myös käyttävät ominaisarvoja ja vektoreita hyödykseen.
3.6.1
Määritelmä ja laskenta
Olkoon A = [ajk ] n × n–matriisi. Tarkastellaan vektoriyhtälöä
Ax = λx,
(99)
missä λ on luku. Sellaista λ:n arvoa, jolla yhtälöllä on ratkaisu x 6= 0, kutsutaan matriisin A
ominaisarvoksi (eigenvalue). Vastaavasti ratkaisut x 6= 0 ovat A:n ominaisarvoa λ vastaavia
ominaisvektoreita. Suoraan määritelmästä seuraa että jos x on matriisin A ominaisarvoa λ vastaava ominaisvektori, niin on myös kx ∀ k 6= 0.
Ominaisarvojen joukko = A:n spektri (kirjallisuudessa usein puhutaan kuvauksen tai operaattorin A spektristä).
Ominaisarvoon λ liittyvät ominaisvektorit yhdessä vektorin 0 kanssa muodostavat tähän ominaisarvoon liittyvän A:n ominaisavaruuden.
Matriisin ominaisarvojen ja –vektorien määräämistä kutsutaan ominaisarvo–ongelmaksi (eigenvalue problem).
Ominaisarvoyhtälö voidaan kirjoittaa muotoon
(A − λI)x = 0
(100)
Tällä yhtälöllä on nollasta poikkeavia ratkaisuja jos ja vain jos rank(A − λI) < n. Tämä taas
sattuu olemaan yhtäpitävä sen kanssa että
a11 − λ
a
·
·
·
a
12
1n a21
a22 − λ · · ·
a2n D(λ) = det(A − λI) = ..
(101)
..
.. = 0
...
.
.
.
an1
an2
· · · ann − λ
Yo. yhtälö on matriisin A karakteristinen yhtälö, ja D(λ) karakteristinen determinantti. Kun
D(λ) kehitetään, saadaan λ:n shut-in n:nnen asteen polynomi, joka on matriisin A karakteristinen polynomi. Etsimällä tämän polynomin nollakohdat siis löydetään ominaisarvot. Ominaisarvoja tosin etsitään tällä tavoin vain pienille matriiseille ja lähinnä käsin laskettaessa.
Edellisestä nähdään suoraan että n × n–matriisilla on siis vähintään yksi ominaisarvo ja enintään n erilaista ominaisarvoa (siis jos myös polynomien kompleksijuuret sallittaisiin). Kuinka
monta erilaista (lineaarisesti riippumatonta) ominaisvektoria sitten kuhunkin ominaisarvoon
liittyy? Tätä ei voi suoraan ominaisarvon perusteella täsmällisesti ennustaa sen paremmin kuin
että yksi niitä vähintään on. Etsimällä annetulle ominaisarvolle yhtälöryhmän Ax = λx yleinen
ratkaisu, saamme sitten kaikki ominaisarvot ja tässä ratkaisussa vapaaksi jäävien muuttujien
lkm. lineaarisesti riippumattomien ominaisvektorien määrä.
45
Jos ajatellaan matriisia A lineaarimuunnoksena, ominaisvektorit ovat niitä vektoreita jotka säilyttävät suuntansa tässä kuvauksessa. Näissä tapauksissa kuvaus on siis vain tietyn skalaarin
sanelema pituuden skaalaus, ja tämä skalaari on kyseistä ominaisvektoria vastaava ominaisarvo.
Käsin laskien ominaisarvot laskettava ensin, sen jälkeen voidaan laskea ominaisvektorit esim.
Gaussin eliminoinnilla. Suurille matriiseille ominaisarvot (ja ominaisvektorit) lasketaan yleensä
tietokoneella.
Jos matriisin A ominaisarvo λ on karakteristisen yhtälön Mλ :nnen kertaluvun juuri, Mλ on λ:n
algebrallinen kertaluku (algebraic multiplicity).
Ominaisarvoon λ liittyvien lineaarisesti riippumattomien ominaisvektorien lukumäärä mλ on
λ:n geometrinen kertaluku (geometric multiplicity).


1 0 0
Esimerkki 3.19. Määritä matriisin C = 3 0 1 ominaisarvot sekä niiden algebraalinen
1 1 0
että geometrinen monikerta. Määritä myös näihin ominaisarvoihin liittyvät ominaisvektorit.
Huom. matriisilla ei välttämättä ole reaalisia ominaisarvoja. Kompleksilukuja käyttäen löytäisimme kuitenkin ominaisarvoja ja ominaisvektoreita mutta näitä tarvitsemme vasta kurssilla
"BM20A5830 Differentiaaliyhtälöiden peruskurssi", joten emme käsittele niitä tällä kurssilla.
0 1
Esimerkki 3.20. Onko matriisilla
reaalisia ominaisarvoja?.
−1 0
46