YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Tämä

Transcription

YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Tämä
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Tämä luentomoniste on koottu useista lähteistä, joista tärkeimmät lienevät Sydsæter & Hammond (2008), Sydsæter et al. (2008) ja Simon & Blume (1994).
Lisään luentomonisteeseen lukuja luentojen edistymisen mukaan. Sisältö on kuitenkin jo melko lailla selvillä.
1
2
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Sisältö
1. Matriiseista
3
1.1. Matriisin ominaisarvot ja -vektorit
3
1.2. Matriisin definiittisyys
4
2. Konkaavit ja konveksit funktiot
7
3. Ääriarvotehtävistä
12
3.1. Rajoittamaton ääriarvotehtävä
12
3.2. Yhtälörajoitteinen ääriarvotehtävä, Lagrangen menetelmä ja kerroin 15
4. Ääriarvotehtävät epäyhtälörajoitteilla
21
5. Komparatiivinen statiikka
29
5.1. Kokonaisdifferentiaali
29
5.2. Ketjusäännöt
31
5.3. Implisiittifunktiolauseet
32
6. Integraalilaskentaa
38
7. Differentiaaliyhtälöt
44
8. Differentiaaliyhtälöt R2 :ssa
54
8.1. Lineaariset differentiaaliyhtälöt R2 :ssa
54
8.2. Epälineaariset differentiaaliyhtälöt R2 :ssa
55
8.3. Vaihetaso
57
60
9. 23 sivua differenssiyhtälöistä
LIITE 1: Kertaus trigonometrisistä funktioista
62
LIITE 2: Kompleksiluvut lyhyesti
64
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
3
1. Matriiseista
Tarvittavia esitietoja ovat mm. lineaarisen yhtälöryhmän ratkaiseminen, matriisilaskutoimitukset (summa, erotus ja tulo), eräät matriisityypit (neliömatriisi, symmetrinen matriisi ja identtinen matriisi) ja determinantin laskeminen. Palauta kurssilta Y100 mieleen myös käänteismatriisi ja niin sanottu Cramerin sääntö.
1.1. Matriisin ominaisarvot ja -vektorit. Tulkitaan vektori x = (x1 , . . . , xn )
(sarake)vektorina x = [x1 , . . . , xn ]T . Olkoon A neliömatriisi, jonka koko on n × n.
Määritelmä 1.1. Luku λ on matriisin A ominaisarvo, jos on olemassa vektori
x = [x1 , . . . , xn ]T 6= 0 siten, että
(1.1)
Ax = λx.
Vektori x on ominaisarvoon λ liittyvä ominaisvektori.
◦
Jos matriisin A ajatellaan vastaavan kuvausta (funktiota), ominaisvektorin idea
selvenee hieman. Kun kuvataan ominaisvektoria x matriisin A avulla, saadaan kuvaksi ominaisarvo kertaa ominaisvektori. Voi ajatella, että ominaisvektorin kuvaaminen matriisilla on sama asia kuin sen venyttäminen tai kutistaminen ominaisarvollaan (myös suunta voi muuttua). Ominaisarvoja ja -vektoreita tarvitaan useissa
tilanteissa, kuten optimoinnissa ja differentiaaliyhtälöissä.
Kirjoitetaan yhtälö(ryhmä) Ax = λx muotoon (A − λI)x = 0, jossa I on identtinen matriisi. Seuraava lause antaa tavan laskea matriisin A ominaisarvot.
Lause 1.1. Luku λ on matriisin A ominaisarvo, jos ja vain jos |A − λI| = 0.
Todistus. Sydsæter et al. (2008).
Lauseen 1.1 mukaan ominaisarvo saadaan yhtälön |A − λI| = 0 ratkaisuna. Tämä
yhtälö on polynomiyhtälö, joten sen ratkaisut saattavat olla myös kompleksilukuja
(katso Liite 2).
1 −2
ominaisarvot ovat Lauseen 1.1 mukaisesti seuEsimerkki 1.1. Matriisin
−3 2
raavan yhtälön ratkaisut.
1 0
1 −2
= 0.
−λ
det
0 1
−3 2
Suorittamalla matriisilaskutoimitukset ja kehittämällä determinantti yhtälö saadaan muotoon (1 − λ)(2 − λ) − 6 = 0. Yhtälön ratkaisut, ja siten ominaisarvot,
ovat λ = 4 ja λ = −1.
⋄
Matriisin A jälki, jota merkitään tr(A), on matriisin A diagonaalialkioiden summa.
a b
ominaisarvot ovat yhtälön λ2 − (a + d)λ + ad −
Esimerkki 1.2. Matriisin
c d
cb = 0 ratkaisut. Huomaa, että tämä yhtälö voidaan kirjoittaa myös muodossa
λ2 − tr(A)λ + det(A) = 0.
⋄
4
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE


1 1 −1
Esimerkki 1.3. Lasketaan matriisin 0 2 0  ominaisarvot. Ne ovat yhtälön
2 0 0
1 − λ
1
−1 0
2 − λ 0 = −(1 − λ)(2 − λ)λ + (2 − λ)2 = 0
2
0
−λ
ratkaisut. Yhtälö voidaan kirjoittaa muotoon
(2 − λ)(λ2 − λ + 2) = 0,
jolloin sen ratkaisut, ja siten ominaisarvot, ovat λ = 2, λ = 12 + i
√
Tässä i on niin sanottu imaginääriyksikkö, jolle pätee −1 = i.
√
7
2
ja λ =
1
2
−i
√
7
.
2
⋄
Ominaisarvojen laskemisen jälkeen jokaiseen ominaisarvoon λ liittyvä ominaisvektori x saadaan yhtälöryhmän (A − λI)x = 0 ratkaisuna.
1 −2
ominaisarvot ovat λ = 4 ja λ = −1. OminaiEsimerkki 1.4. Matriisin
−3 2
sarvoon λ = 4 liittyvä ominaisvektori x = [x1 , x2 ]T on yhtälön
x1
1 0
−3 −2 x1
1 −2
−4
=0 ⇔
=0
0 1
x2
−3 −2 x2
−3 2
ratkaisu. Kirjoitetaan yhtälö tavalliseen tyyliin yhtälöparina
−3x1 − 2x2 = 0,
−3x1 − 2x2 = 0.
Yhtälöt ovat samat, jolloin mikä tahansa nollasta poikkeava vektori, joka toteuttaa
yhtälön −3x1 − 2x2 = 0, kelpaa ominaisarvoa λ = 4 vastaavaksi ominaisvektoriksi.
Tällaiseksi vektoriksi käy esimerkiksi [x1 , x2 ]T = [2, −3]T . Ominaisarvoa λ = −1
vastaavaksi ominaisvektoriksi voidaan valita esimerkiksi [x1 , x2 ]T = [1, 1]T , koska
ominaisarvoa λ = −1 käyttäen määritelmän yhtälöpariksi saadaan
2x1 − 2x2 = 0,
−3x1 + 3x2 = 0.
⋄
Ominaisvektori ei siis ole yksikäsitteinen. Kuten Esimerkissä 1.3, ominaisarvo
saattaa olla kompleksiluku, mutta on mahdollista osoittaa, että symmetrisen matriisin ominaisarvot ovat reaalilukuja. Lisäksi n × n matriisin, jonka ei tarvitse olla
symmetrinen, determinantti on ominaisarvojen tulo ja jälki on niiden summa.
1.2. Matriisin definiittisyys. Matriisista A (ei tarvitse olla neliömatriisi) voidaan
muodostaa erilaisia alimatriiseja poistamalla mitkä tahansa rivit ja mitkä tahansa
sarakkeet. Tarkastellaan kuitenkin vain neliömatriisin alimatriiseja. Olkoon sen koko
n × n. Tarpeellisimmat alimatriisit ovat ne, jotka saadaan poistamalla samat rivit
ja sarakkeet. Nämä ovat pääalimatriiseja.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE

2
Esimerkki 1.5. Muodostetaan matriisin 0
2
matriiseista on matriisi itse. Kolme seuraavaa
taan sama rivi ja sama sarake:
2 2
2 0
,
,
2 0
0 2
5

0 2
2 4 pääalimatriisit. Yksi pääali4 0
pääalimatriisia saadaan, kun poiste
2 4
.
4 0
Kolme viimeistä pääalimatriisia saadaan, kun poistetaan kaksi samaa riviä ja saraketta:
2 , 2 , 0 .
⋄
Johtavat pääalimatriisit ovat ne matriisit, jotka saadaan poistamalla yhtä monta
viimeistä riviä ja saraketta. Mitkä matriisit ovat johtavia pääalimatriiseja esimerkkissä 1.5?
Pääalimatriiseihin liittyviä determinantteja kutsutaan pääalideterminanteiksi (tai
pääminoreiksi) ja vastaavasti johtavaan pääalimatriisiin liittyvää determinanttia
kutsutaan johtavaksi pääalideterminantiksi (tai johtavaksi pääminoriksi). Johtavilla
pääminoreilla on keskeinen rooli pääteltäessä jonkin matriisin niin sanottua definiittisyyttä. Merkitään johtavia pääminoreita alaindeksein |Ak |, jossa alaindeksi osoittaa, että kyseessä on se johtava pääminori, joka on saatu poistamalla n−k viimeistä
riviä ja saraketta. Tässä n on siis matriisin A rivien ja sarakkeiden lukumäärä.
Esimerkki 1.6. Esimerkin 1.5 matriisin johtavat pääminorit ovat:
|A1 | = 2,
|A2 | = 4,
|A3 | = −40.
⋄
Lause 1.2. Olkoon A symmetrinen matriisi, jonka koko on n × n. Tällöin
(i) A on positiivisesti definiitti matriisi, jos ja vain jos kaikki johtavat pääminorit ovat aidosti positiivisia eli
|A1 | > 0,
|A2 | > 0,
|A3 | > 0, . . .
(ii) A on negatiivisesti definiitti matriisi, jos ja vain jos jokaisen johtavan pääminorin merkki on sama kuin (−1)k eli
|A1 | < 0,
|A2 | > 0,
|A3 | < 0, . . .
(iii) A on indefiniitti matriisi, jos jokin nollasta poikkeava johtava pääminori
rikkoo kohtien i) tai ii) ehdot.
Todistus. Simon & Blume (1994).
6
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
4 1
on positiivisesti definiitti, koska |A1 | = 4 > 0 ja
Esimerkki 1.7. Matriisi
1 2
|A2 | = 7 > 0. Matriisi


−2 0
0
 0 −2 −1
0 −1 −3
on sen sijaan negatiivisesti definiitti, koska |A1 | = −2 < 0, |A2 | = 4 > 0 ja |A3 | =
−10 < 0.
⋄
Esimerkki 1.8. Esimerkin 1.5 matriisi on indefiniitti, koska A1 > 0 ja |A3 | < 0.
⋄
Matriisi voi olla myös semidefiniitti:
Lause 1.3. Olkoon A symmetrinen matriisi, jonka koko on n × n. Tällöin
(i) A on positiivisesti semidefiniitti matriisi, jos ja vain jos kaikki pääalideterminantit (pääminorit) ovat ei-negatiivisia.
(ii) A on negatiivisesti semidefiniitti matriisi, jos ja vain jos −A on positiivisesti
semidefiniitti.
Todistus. Todistus löytyy lineaarialgebran kirjallisuudesta. (Lisätiedot: Sydsæter et
al. 2008.)
1 1
1
ei ole definiitti, koska |A2 | = 0. Nyt |A1 | =
Esimerkki 1.9. Matriisi A = 2
1 2
2
ja toinen 1 × 1-pääalimatriisin determinantti on 2. Kaikki pääminorit ovat siis einegatiivisia, joten matriisi on positiivisesti semidefiniitti.
⋄
Vaihtoehtoisesti definiittisyys voidaan määrittää ominaisarvojen avulla.
Lause 1.4. Olkoon A symmetrinen matriisi, jonka koko on n × n. Tällöin
(i) A on positiivisesti definiitti, jos ja vain jos sen kaikki ominaisarvot ovat
aidosti positiivisia.
(ii) A on positiivisesti semidefiniitti, jos ja vain jos sen kaikki ominaisarvot ovat
positiivisia.
(iii) A on negatiivisesti definiitti, jos ja vain jos sen kaikki ominaisarvot ovat
aidosti negatiivisia.
(iv) A on negatiivisesti semidefiniitti, jos ja vain jos sen kaikki ominaisarvot ovat
negatiivisia.
(v) A on indefiniitti, jos ja vain jos osa matriisin A ominaisarvoista on negatiivisia ja osa positiivisia.
Todistus. Sydsæter et al. (2008).
Definiittisyyden päättely ominaisarvojen avulla voi kuitenkin olla vaikeaa.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
7
2. Konkaavit ja konveksit funktiot
Tässä vaiheessa on hyvä kerrata käsite osittaisderivaatta, sen laskeminen ja yhden
muuttujan funktion konkaavisuus ja konveksisuus.
Olkoot x, y ∈ Rn kaksi pistettä, siis x = (x1 , . . . , xn ) ja y = (y1 , . . . , yn ). Näiden
pisteiden yhdysjana on koostuu pisteistä z, jotka ovat muotoa z = λx + (1 − λ)y
jollakin reaaliluvulla λ ∈ [0, 1]. Jos λ = 0, z = y. Jos taas λ = 1, z = x.
Määritelmä 2.1. Joukko X ∈ Rn on konveksi, jos se sisältää kaikkien pisteidensä
väliset yhdysjanat eli jos millä tahansa x, y ∈ X ja λ ∈ [0, 1], pätee
z = λx + (1 − λ)y ∈ X.
Kuva 2.1 havainnollistaa tilannetta tason R2 tapauksessa.
◦
x
z
y
Kuva 2.1. Vasen kuva: Ei-konveksi joukko. Oikea kuva: Konveksi joukko.
Esimerkki 2.1. Olkoot x1 ja x2 hyödykkeiden 1 ja 2 määrät. Hyödykkeiden määrät
eivät voi olla negatiivisia, joten sekä x1 ≥ 0 että x2 ≥ 0. Näiden hyödykkeiden
määrät kuuluvat positiiviseen tason neljännekseen eli joukkoon R2+ , joka on konveksi
joukko. Myös joukko R2++ , jossa x1 > 0 ja x2 > 0, on konveksi joukko. Myös
kuluttajan budjettijoukko
B = {(x1 , x2 ) ∈ R2 | x1 ≥ 0, x2 ≥ 0, p1 x1 + p2 x2 ≤ I},
on konveksi. Tässä p1 ja p2 ovat hyödykkeiden hinnat ja I on kuluttajan tulot. Piirrä
tämä joukko tasoon. Kuinka todistaisit Määritelmään 2.1 perustuen, että joukko B
on konveksi?
⋄
Määritelmä 2.2. Olkoon X ⊂ Rn konveksi joukko. Funktio f : X → R on
(i) konkaavi joukossa X, jos kaikille eri pisteille x, y ∈ X ja λ ∈ (0, 1) pätee
epäyhtälö
f (λx + (1 − λ)y) ≥ λf (x) + (1 − λ)f (y),
(ii) konveksi joukossa X, jos kaikille eri pisteille x, y ∈ X ja λ ∈ (0, 1) pätee
epäyhtälö
f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y).
(iii) Lisäksi funktion sanotaan olevan aidosti konkaavi tai aidosti konveksi joukossa X, jos yllä olevat epäyhtälöt pätevät aitoina kaikilla λ ∈ (0, 1).
◦
8
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Määritelmän oletus joukon X konveksisuudesta on oleellinen, koska se takaa, että
joukon X kahden pisteen välisen yhdysjanan pisteet kuuluvat myös joukkoon X.
Funktio on siis konkaavi, jos minkä tahansa funktion määrittelyjoukon X pisteiden yhdysjanan pisteen kuva, eli f (λx + (1 − λ)y), on suurempi tai yhtäsuuri kuin
pisteiden kuvien välisen yhdysjanan piste λf (x) + (1 − λ)f (y). Konkaavin funktion
kuvaaja on kupera ja konveksin funktion kuvaaja on kovera. Kuvassa 2.2 on esitetty
konkaavin funktion kuvaaja (ja z = λx + (1 − λ)y).
f (z)
f (x)
λf (x) + (1 − λ)f (y)
f (y)
x z
y
Kuva 2.2. Konkaavi funktio. (Piirrä itse viereen vastaavankaltainen
kuva konveksista funktiosta)
Määritelmästä huomataan, että jos funktio f on konkaavi, funktio −f on konveksi,
koska epäyhtälön kertominen negatiivisella luvulla kääntää epäyhtälön suunnan.
Esimerkki 2.2. Olkoon funktio f : R → R määritelty kaavalla f (x) = x2 . Perustellaan määritelmän avulla, että funktio f on aidosti konveksi. Tarkastellaan tätä
varten erotusta
f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y),
jossa λ ∈ (0, 1).
Jos erotus on eri reaaliluvuilla x ja y (aidosti) positiivinen, funktio on (aidosti) konkaavi. Jos erotus on (aidosti) negatiivinen, funktio on (aidosti) konveksi. Käytetään
funktion määritelmää ja muokataan erotusta
(λx + (1 − λ)y)2 − λx2 − (1 − λ)y 2 = −λ(1 − λ)(x − y)2 ,
joka on aidosti negatiivinen, koska λ, (1−λ) ja (x−y)2 ovat kaikki aidosti positiivisia,
kun λ ∈ (0, 1). Siten funktio on aidosti konveksi kuten funktion kuvaajasta voi
ennustaa.
⋄
Esimerkki 2.3. Funktio f : R → R, joka määritellään yhtälöllä f (x) = ax + b,
a, b ∈ R, on sekä konkaavi että konveksi. Perustele tämä yllä annetun määritelmän
avulla.
⋄
Annetun funktion päättely konkaaviksi tai konveksiksi voi olla pelkän määritelmän perusteella työlästä. Helpommin se käy seuraavien lauseiden avulla. Ensin yhden muuttujan funktio:
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
9
Lause 2.1. Olkoon X ⊂ R avoin konveksi joukko ja f : X → R kahdesti jatkuvasti
derivoituva funktio. Tällöin
(i) funktio on konkaavi, jos ja vain jos kaikilla x ∈ X pätee f ′′ (x) ≤ 0,
(ii) funktio on konveksi, jos ja vain jos kaikilla x ∈ X pätee f ′′ (x) ≥ 0.
(iii) funktio on aidosti konkaavi, jos kaikilla x ∈ X pätee f ′′ (x) < 0.
(iv) funktio on aidosti konveksi, jos kaikilla x ∈ X pätee f ′′ (x) > 0.
Todistus. Sydsæter et al. (2008).
Kustannuksena helppoudesta tässä tapauksessa on, että funktion täytyy olla kahdesti jatkuvasti derivoituva.
Esimerkki 2.4.
(i) Olkoon funktio f : R → R määritelty kaavalla f (x) = ax2 + bx + c. Tämän
toinen derivaatta on 2a, jolloin funktio on esimerkiksi konkaavi, jos a ≤ 0 ja
konveksi, jos a ≥ 0.
(ii) Olkoon funktio määritelty kaavalla f (x) = x3 . Tämä funktio ei ole konkaavi
eikä konveksi, koska sen toinen derivaatta f ′′ (x) = 6x on negatiivinen muuttujan x ollessa negatiivinen ja positiivinen muuttujan x ollessa positiivinen.
⋄
Usean muuttujan funktiolle löytyy Lausetta 2.1 vastaava tulos. Siinä toinen derivaatta korvataan funktion Hessen matriisilla H, joka muodostetaan funktion f
toisen kertaluvun osittaisderivaatoista.
Määritelmä 2.3. Funktion f Hessen

f11 (x)
 f21 (x)
H(x) = 
 ...
fn1 (x)
matriisi pisteessä x ∈ Rn on

f12 (x) . . . f1n (x)
f22 (x) . . . f2n (x) 
,
..
.. 
...
. 
.
fn2 (x) . . .
fnn (x)
jossa f11 (x) = fx1 x1 (x), f12 (x) = fx1 x2 (x) ja niin edelleen.
◦
Hessen matriisi on siis muodostettu toisen kertaluvun osittaisderivaatoista ja sen
arvo riippuu pisteestä x = (x1 , x2 , . . . , xn ). Esimerkiksi ensimmäisen rivin alkiot
on saatu osittaisderivoimalla osittaisderivaattaa fx1 kaikkien muuttujien suhteen.
Kahdesti jatkuvasti derivoituvalle funktiolle on voimassa fij (x) = fji (x) (”Ristiderivaatat” ovat yhtä suuret).1
Esimerkki 2.5. Lasketaan funktion f (x, y) = x+xy 3 Hessen matriisi. Ensimmäisen
kertaluvun osittaisderivaatat ovat:
(2.1)
1Kahdesti
fx (x, y) = 1 + y 3 ,
fy (x, y) = 3xy 2 .
jatkuvasti derivoituvalla funktiolla tarkoitetaan funktiota, jolla on jatkuvat toisen
kertaluvun osittaisderivaatat. Taloustieteessä funktiot ovat usein juuri näitä.
10
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Kyseessä on kahden muuttujan funktio, jolloin toisen kertaluvun osittaisderivaattoja
on 22 = 4 kappaletta. Hessen matriisi on
0 3y 2
.
H(x, y) =
3y 2 6xy
Huomaa, että Hessen matriisi tosiaan riippuu pisteestä (x, y).
⋄
Lause 2.2. Olkoon X ⊂ Rn avoin konveksi joukko ja f : X → R funktio, joka on
kahdesti jatkuvasti derivoituva. Tällöin
(i) funktio on konkaavi, jos ja vain jos Hessen matriisi H(x) on negatiivisesti
semidefiniitti kaikilla x ∈ X.
(ii) funktio on konveksi, jos ja vain jos Hessen matriisi H(x) on positiivisesti
semidefiniitti kaikilla x ∈ X.
Todistus. Sydsæter et al. (2008).
Voimme päätellä funktion konkaavisuuden/konveksisuuden laskemalla Hessen matriisin ja tutkimalla sen semidefiniittisyyttä. Jos funktion Hessen matriisi on negatiivisesti semidefiniitti kaikilla funktion määrittelyjoukon alkioilla, funktio on konkaavi. Jos Hessen matriisi on positiivisesti semidefiniitti kaikilla funktion määrittelyjoukon alkioilla, funktio on konveksi. Jos matriisi on positiivisesti definiitti, se on
automaattisesti positiivisesti semidefiniitti. Jos taas matriisi on negatiivisesti definiitti, se on automaattisesti negatiivisesti semidefiniitti.
Funktion aito konkaavisuus tai aito konveksisuus voidaan tarkastaa seuraavan
lauseen avulla:
Lause 2.3. Olkoon X ⊂ Rn avoin konveksi joukko ja f : X → R funktio, joka on
kahdesti jatkuvasti derivoituva.
(i) Jos Hessen matriisi H(x) on negatiivisesti definiitti kaikilla x ∈ X, funktio
f on aidosti konkaavi.
(ii) Jos Hessen matriisi H(x) on positiivisesti definiitti kaikilla x ∈ X, funktio
f on aidosti konveksi.
Todistus. Sydsæter et al. (2008).
Päinvastaiset väitteet eivät päde. Vastaesimerkiksi kohtaan (i) käy funktio f (x, y) =
−x4 − y 4 , joka on aidosti konkaavi, mutta Hessen matriisi ei ole negatiivisesti definiitti, koska H(0, 0) = 0 (laske itse).
Esimerkki 2.6. Olkoon funktio f ”Cobb-Douglas muotoa” eli f (x, y) = xa y b , jossa a, b > 0. Ensimmäisen kertaluvun osittaisderivaatat ovat fx (x, y) = axa−1 y b ja
fy (x, y) = bxa y b−1 , jolloin saamme laskettua Hessen matriisiksi
a(a − 1)xa−2 y b
abxa−1 y b−1
fxx (x, y) fxy (x, y)
=
.
(2.2)
fyx (x, y) fyy (x, y)
abxa−1 y b−1
b(b − 1)xa y b−2
Oletetaan, että a + b < 1. Tällöin funktio on aidosti konkaavi, koska
a(a − 1)xa−2 y b < 0
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
11
a(a − 1)xa−2 y b
abxa−1 y b−1 = ab(1 − a − b)x2a−2 y 2b−2 > 0.
abxa−1 y b−1
b(b − 1)xa y b−2 ⋄
ja (laske)
(2.3)
Lopuksi
Lause 2.4.
(i) Kahden konkaavin funktion summa on konkaavi funktio.
(ii) Positiivisella reaaliluvulla kerrottu konkaavi funktio on konkaavi.
Todistus. Sydsæter et al. (2008).
Vastaavat väitteet pätevät konveksille funktiolle.
Esimerkki 2.7. Jos tuotantofunktio f (x, y) on konkaavi, myös voittofunktio Π(x, y) =
pf (x, y) − wx − zy on konkaavi. Voittofunktiossa p on lopputuotteen hinta ja w ja
z ovat tuotantopanosten hinnat.
⋄
12
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
3. Ääriarvotehtävistä
Kertaa kriittisen pisteen laskeminen. Lisäksi ääriarvotehtäviä havainnoillistetaan
usein (luennoilla) funktion tasa-arvojoukkojen avulla. Esimerkiksi kahden muuttujan funktion f eräs tasa-arvojoukko koostuu funktion määrittelyjoukon pisteistä,
jotka toteuttavat yhtälön f (x, y) = c, jossa c on jokin luku. Tämä käsite on tärkeä
muutenkin; esimerkiksi indifferenssikäyrät ovat hyötyfunktion tasa-arvojoukkoja.
3.1. Rajoittamaton ääriarvotehtävä. Muistellaan ensin hieman yhden muuttujan funktion ääriarvojen määrittämistä. ”Ensimmäisen kertaluvun välttämätön ehto” maksimille tai minimille tietyssä pisteessä on, että derivaatta tässä pisteessä on
nolla. ”Toisen kertaluvun riittävä ehto” maksimille on, että toinen derivaatta tässä
pisteessä on aidosti negatiivinen, ja minimille, että toinen derivaatta tässä pisteessä
on aidosti positiivinen.
Olkoon nyt X ⊂ Rn ja f : X → R eli tarkastellaan usean muuttujan funktiota.
”Ensimmäisen kertaluvun välttämätön ehto” funktion ääriarvopisteelle on, että kaikki osittaisderivaatat ovat kyseisessä pisteessä nollia eli että kyseessä on kriittinen
piste. Toisin sanoen, jos piste x∗ = (x∗1 , x∗2 , . . . , x∗n ) ∈ Rn on funktion ääriarvopiste,
fxi (x∗ ) = 0,
jokaisella i = 1, . . . , n,
tai kompaktimmin ∇f (x∗ ) = 0 eli funktion gradienttivektori on nolla pisteessä x∗ .
Kriittinen piste voi kuitenkin olla maksimipiste, minimipiste tai satulapiste. Kriittisen pisteen laadun tarkastamista varten täytyy tehdä lisätyötä. Usean muuttujan
funktion tapauksessa ”toisen kertaluvun riittävät ehdot” liittyvät Hessen matriisiin
ja sen definiittisyyteen kriittisessä pisteessä. Seuraava lause antaa keinon löytää
maksimipisteet ja minimipisteet kriittisten pisteiden joukosta. Tässä keskitytään
paikallisiin ääriarvopisteisiin.
Lause 3.1 (Toisen kertaluvun riittävät ehdot).
Olkoon X ∈ Rn avoin joukko ja f : X → R kahdesti jatkuvasti derivoituva funktio
ja olkoon piste x∗ = (x∗1 , x∗2 , . . . , x∗n ) ∈ X funktion kriittinen piste eli piste, joka ratkaisee yhtälöryhmän fxi (x) = 0, i = 1, . . . , n. Tällöin pätee:
i) Jos funktion f Hessen matriisi H(x) on kriittisessä pisteessä negatiivisesti definiitti eli jos kriittisessä pisteessä on voimassa
(3.1)
|H1 | <0,
|H2 | >0,
|H3 | <0,
|H4 | >0, . . . ,
|H1 | >0,
|H2 | >0,
|H3 | >0,
|H4 | >0, . . . ,
kriittinen piste x∗ on paikallinen maksimipiste.
ii) Jos funktion f Hessen matriisi H(x) on kriittisessä pisteessä positiivisesti definiitti eli jos kriittisessä pisteessä on voimassa
(3.2)
kriittinen piste x∗ on paikallinen minimipiste.
iii) Jos ehdoista (3.1) ja (3.2) kumpikaan ei ole voimassa jollain nollasta poikkeavalla johtavalla pääminorilla, kriittinen piste x∗ ei ole paikallinen maksimipiste eikä
minimipiste vaan satulapiste.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Todistus. Simon & Blume (1994).
13
Kriittisen pisteen laatu voidaan useimmiten määrittää maksimi- tai minimipisteeksi tämän lauseen avulla, jossa siis luvut |Hk | ovat Hessen matriisin johtavia
pääminoreita. Kahden muuttujan funktion tapauksessa seuraava esimerkki on hyödyllinen.
Esimerkki 3.1. Olkoon f (x, y) funktio, joka täyttää Lauseen 3.1 ehdot. Siihen
liittyvä Hessen matriisi on
fxx (x, y) fxy (x, y)
.
H(x, y) =
fyx (x, y) fyy (x, y)
Olkoon (x∗ , y ∗ ) funktion f kriittinen piste. Lauseen 3.1 perusteella pätee siten seuraavaa:
• Jos fxx (x∗ , y ∗ ) < 0 ja fxx (x∗ , y ∗ )fyy (x∗ , y ∗ ) − fxy (x∗ , y ∗ )2 > 0, kriittinen piste
on maksimipiste.
• Jos fxx (x∗ , y ∗ ) > 0 ja fxx (x∗ , y ∗ )fyy (x∗ , y ∗ ) − fxy (x∗ , y ∗ )2 > 0, kriittinen piste
on minimipiste.
• Jos fxx (x∗ , y ∗ )fyy (x∗ , y ∗ ) − fxy (x∗ , y ∗ )2 < 0, kriittinen piste on satulapiste.
⋄
Esimerkki 3.2. Etsitään funktion f (x, y) = x2 + 2y 2 + 2 (paikallinen) ääriarvopiste
ja vastaava funktion ääriarvo sekä määritetään ääriarvon laatu. Ehdokkaat ääriarvopisteiksi löytyvät kriittisten pisteiden joukosta. Kriittinen piste on (0, 0) (laske).
Funktion Hessen matriisi on
2 0
,
H(x, y) =
0 4
jolloin sen johtavat pääminorit ovat |H1 | = 2 ja |H2 | = 8. Molemmat ovat positiivisia, joten Hessen matriisi on positiivisesti definiitti ja kriittinen piste on minimipiste.
Vastaava funktion minimiarvo on f (0, 0) = 2.
⋄
Esimerkki 3.3. Muutetaan yllä olevaa esimerkkiä hieman. Olkoon funktio f (x, y) =
−x2 + 2y 2 + 2. Kriittinen piste on nytkin (0, 0), mutta Hessen matriisi on
−2 0
,
H(x, y) =
0 4
jolloin sen johtavat pääminorit ovat |H1 | = −2 ja |H2 | = −8. Kriittinen piste on
satulapiste. Entä jos funktiona on f (x, y) = −x2 − 2y 2 + 2?
⋄
Esimerkki 3.4. Etsitään funktion f (x, y, z) = x2 +y 2 +z 2 +xy+4z+xz ääriarvopiste
ja määrätään sen laatu. Lasketaan osittaisderivaatat ja ratkaistaan kriittinen piste:
fx = 2x + y + z = 0, fy = 2y + x = 0, fz = 2z + 4 + x = 0.
14
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Kirjoitetaan yhtälöryhmä matriisimuotoon ja käytetään Cramerin sääntöä sen ratkaisemiseen (palauta sääntö mieleen laskemalla itse)2

    
0
x
2 1 1
1 2 0  ·  y  =  0  .
−4
z
1 0 2
Ratkaisuksi saadaan kriittinen piste (x, y, z) = (2, −1, −3). Määrätään sen laatu
muodostamalla Hessen matriisi, joka on:


2 1 1
1 2 0 
1 0 2
Johtavat pääminorit ovat |H1 | = 2, |H2 | = 3 ja |H3 | = 4. Kaikki ovat positiivisia, joten kriittinen piste on minimipiste. Vastaava funktion minimiarvo on
f (2, −1, −3) = −6.
⋄
Huomautus: Jos funktio on kahdesti jatkuvasti derivoituva ja Hessen matriisi on
negatiivisesti semidefiniitti kriittisessä pisteessä, niin tällöin kriittinen piste ei välttämättä ole maksimipiste. Vastaesimerkiksi käy funktio f (x) = x3 , jonka toinen
derivaatta on kriittisessä pisteessä 0 eli Hessen matriisi on tässä pisteessä negatiivisesti semidefiniitti (myös positiivisesti). Origon mistä tahansa ympäristöstä löytyy
kuitenkin pisteitä, joissa funktion arvo pienempi kuin 0 tai suurempi kuin 0. Toinen
vastaesimerkki on funktio f (x, y) = x3 + y 3 . Tutkitaan vielä yksi esimerkki.
Esimerkki 3.5. Tutkitaan funktiota f (x, y) =
kriittiset pisteet:
2 3
y
3
− xy − y + 21 x2 . Lasketaan
fx = −y + x = 0
fy = 2y 2 − x − 1 = 0.
Ratkaisut ovat (1, 1) ja − 12 , − 12 . Määritetään niiden laatu Hessen matriisilla:
1 −1
.
H(x, y) =
−1 4y
Kriittisessä pisteessä (1, 1) Hessen matriisi on
1 −1
.
H(1, 1) =
−1 4
Se on positiivisesti definiitti, koska |H1 | = 1 ja |H2 | = 3. Tämä kriittinen piste on
siten paikallinen minimipiste ja vastaava funktion paikallinen minimiarvo on − 56 .
Kriittisessä pisteessä − 12 , − 12 Hessen matriisi on
1 1
1 −1
.
H(− , − ) =
−1 −2
2 2
Koska |H2 | = −3 < 0, tämä kriittinen piste on satulapiste.
2Olisi
varmasti helpompaa laskea tämä eliminoimalla muuttujia.
⋄
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
15
Yllä käsiteltiin paikallisten ääriarvojen etsimistä.3 Globaalien tai absoluuttisten
ääriarvojen löytäminen pelkästään kriittisen pisteen avulla onnistuu, esimerkiksi jos
tarkasteltava funktio on konkaavi tai konveksi.
Lause 3.2. Olkoon X ⊂ Rn avoin ja konveksi joukko ja funktio f : X → R jatkuvasti
derivoituva
(i) Jos funktio f on konkaavi ja pisteessä x∗ ∈ X pätee ∇f (x∗ ) = 0, piste x∗
on funktion f globaali maksimipiste.
(i) Jos funktio f on konveksi ja pisteessä x∗ ∈ X pätee ∇f (x∗ ) = 0, piste x∗ on
funktion f globaali minimipiste.
Todistus. Sydsæter et al. (2008).
Eli, jos tavoitefunktio on konkaavi, kriittinen piste on automaattisesti globaali
maksimipiste.
Esimerkki 3.6. Olkoon jälleen voittofunktio Π(x, y) = pf (x, y) − wx − zy. Kun
voittofunktio on konkaavi, maksimipiste löytyy suoraan seuraavan yhtälöparin ratkaisuna
pfx (x, y) − w = 0, pfy (x, y) − z = 0.
⋄
3.2. Yhtälörajoitteinen ääriarvotehtävä, Lagrangen menetelmä ja kerroin.
Tarkastellaan rajoitettua ääriarvotehtävää4
(Max)
max f (x1 , x2 )
{x1 ,x2 }
siten että g(x1 , x2 ) = c,
ja palautetaan mieliin Lagrangen lause tässä yhden rajoitteen tapauksessa (oletetaan, ettei rajoitefunktion osittaisderivaatat ole molemmat nollia tehtävän ratkaisussa (x∗1 , x∗2 )):
Lause 3.3. Oletetaan, että (x∗1 , x∗2 ) on tehtävän (Max) ratkaisu, kun funktiot f ja
g ovat jatkuvasti derivoituvia. Tällöin on olemassa Lagrangen kerroin λ∗ siten että
piste (x∗1 , x∗2 , λ∗ ) on kriittinen piste Lagrangen funktiolle
L(x1 , x2 , λ) = f (x1 , x2 ) − λ(g(x1 , x2 ) − c).
Todistus. Sydsæter et al. (2008).
Esimerkki 3.7. Ratkaistaan tehtävä max x1 x2 siten että x1 +4x2 = 16. Lagrangen
funktio on:
{x1 ,x2 }
L(x1 , x2 , λ) = x1 x2 − λ(x1 + 4x2 − 16).
3Moni
esimerkkien ääriarvopisteistä on myös globaali ääriarvopiste.
tarkastella myös minimointitehtävää; Lause 3.3 kelpaa siihenkin.
4Voitaisiin
Lisätty 28.1.
16
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Osittaisderivoidaan Lagrangen funktio kaikkien kolmen muuttujan suhteen ja asetetaan osittaisderivaatat nolliksi:5
(3.3)
Lx1 = x 2 − λ = 0
(3.4)
Lx2 = x1 − 4λ = 0
(3.5)
Lλ = −x1 − 4x2 + 16 = 0.
Ensimmäisen yhtälön mukaan x2 = λ, joten toisesta yhtälöstä saamme x1 = 4x2 .
Sijoitetaan tämä kolmanteen yhtälöön, jolloin −4x2 − 4x2 = −16 eli x2 = 2. Täten
Lagrangen funktion kriittinen piste on (x∗1 , x∗2 , λ∗ ) = (8, 2, 2). Tällöin alkuperäisen
tehtävän ratkaisu on (x∗1 , x∗2 ) = (8, 2) ja funktion maksimiarvo on 16. Geometrisesti
ratkaisu on tavoitefunktion tasa-arvojoukon ja rajoitesuoran x2 = 4 − 41 x1 sivuamispiste, katso seuraava kuva.
⋄
x2
2
8
x1
Kuva 3.1. Kuvassa on tavoitefunktion yksi tasa-arvokäyrä x1 x2 = 16
ja rajoite.
Mistä tiedetään, että laskettu Lagrangen funktion kriittinen piste oikeasti antaa maksimi- tai minimipisteen? Tähän tarvitaan (esimerkiksi) reunustettua Hessen
matriisia. Reunustettua Hessen matriisia merkitään lisäämällä yläviiva Hessen matriisin merkintään eli symbolilla H. Yksi tapa kirjoittaa reunustettu Hessen matriisi
on


0
gx1 (x1 , x2 )
gx2 (x1 , x2 )
H(x1 , x2 , λ) = gx1 (x1 , x2 ) Lx1 x1 (x1 , x2 , λ) Lx1 x2 (x1 , x2 , λ) .
(3.6)
gx2 (x1 , x2 ) Lx2 x1 (x1 , x2 , λ) Lx2 x2 (x1 , x2 , λ)
Reunustetun Hessen matriisin ensimmäinen johtava pääminori |H1 | on nolla ja toinen johtava pääminori |H2 | on negatiivinen. Nämä kaksi seikkaa ovat voimassa aina. Tarkasteltavana olevassa tapauksessa johtavan pääminorin |H3 | = |H| merkki
kertoo kriittisen pisteen laadun:
Lause 3.4. Olkoon L(x1 , x2 , λ) Lagrangen funktio ja olkoon piste (x∗1 , x∗2 , λ∗ ) sen
kriittinen piste. Tällöin
(i) (x∗1 , x∗2 ) on paikallinen maksimipiste, jos reunustetulle Hessen matriisille H
on voimassa
|H(x∗1 , x∗2 , λ∗ )|>0.
5Viimeinen
näistä yhtälöistä on oleellisesti vain rajoiteyhtälö.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
17
(ii) (x∗1 , x∗2 ) on paikallinen minimipiste, jos reunustetulle Hessen matriisille H
on voimassa
|H(x∗1 , x∗2 , λ∗ )|<0.
Todistus. Sydsæter et al. (2008).
Siis, jos reunustetun Hessen matriisin determinantti on kriittisessä pisteessä positiivinen, piste (x∗1 , x∗2 ) on paikallinen maksimipiste. Jos reunustetun Hessen matriisin determinantti on kriittisessä pisteessä negatiivinen, piste (x∗1 , x∗2 ) on paikallinen
minimipiste.
Esimerkki 3.8. Esimerkissä 3.7 vain oletettiin, että kyseisellä maksimointitehtävällä on ratkaisu. Perustellaan, että laskettu ratkaisu tosiaan antaa (paikallisen)
rajoitetun maksimin. Lasketaan reunustettu Hessen matriisi:


0 1 4
H =  1 0 1 .
4 1 0
Reunustetun Hessen matriisin determinantti on 4 + 4 = 8, joten (8, 2) on rajoitettu
maksimipiste. Funktion rajoitettu maksimiarvo on 16.
⋄
Esimerkki 3.9. Etsitään funktion f (x, y) = 2xy ääriarvopisteet rajoitteella x2 +
y 2 = 1. Rajoite on yksikköympyrä. Lagrangen funktio on
L(x, y, λ) = 2xy − λ(x2 + y 2 − 1).
Ensimmäisen kertaluvun välttämättömät ehdot ovat
2y − 2λx = 0,
2x − 2λy = 0,
−x2 − y 2 + 1 = 0.
Ensimmäisen yhtälön mukaan y = λx, joten λ = xy . Sijoittamalla tämä toiseen
yhtälöön saamme x2 = y 2 . Sijoittamalla tämä edelleen viimeiseen yhtälöön saamme
1
−y 2 − y 2 + 1 = 0 ⇔ y = ± √ .
2
Kriittisiksi pisteiksi saamme siten
1 1
1
1
(x∗ , y ∗ , λ∗ ) = ( √ , √ , 1),
(x∗ , y ∗ , λ∗ ) = (− √ , − √ , 1)
2 2
2
2
1 1
1
1
(x∗ , y ∗ , λ∗ ) = (− √ , √ , −1)
(x∗ , y ∗ , λ∗ ) = ( √ , − √ , −1).
2 2
2
2
Näiden joukosta löytyvät maksimi- ja minimipisteet. Reunustettu Hessen matriisi
on:


0
2x
2y
2 .
H = 2x −2λ
(3.7)
2y
2
−2λ
18
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Sen determinatti on (laske itse):
H = 8(x2 λ + y 2 λ + 2xy).
Laskemalla determinantin arvo kriittisissä pisteissä ja käyttämällä Lausetta 3.4
saamme lopputulokseksi: Pisteet ( √12 , √12 ) ja (− √12 , − √12 ) ovat rajoitettuja maksimipisteitä, koska näissä pisteissä |H| > 0. Pisteet (− √12 , √12 ) ja ( √12 , − √12 ) ovat
rajoitettuja minimipisteitä, koska näissä pisteissä |H| < 0. Vastaavat funktion rajoitetut ääriarvot voidaan laskea sijoittamalla rajoitetut maksimi- ja minimipisteet
tavoitefunktioon.
⋄
Lagrangen menetelmä yleistyy tilanteeseen, jossa tavoitefunktio f on n:n muuttujan funktio ja rajoitteita on useampia, sanotaan m kappaletta.6 Rajoitteet ovat
gj (x1 , . . . , xn ) = cj ,
j = 1, . . . , m.
Lauseen 3.3 periaate pysyy ennallaan: Jos tiedämme, että tehtävän tavoitefunktio
ja rajoitefunktiot ovat ”sopivia” ja että tehtävällä on rajoitettu maksimi tai minimi pisteessä (x∗1 , . . . , x∗n ), on olemassa Lagrangen kertoimet (λ∗1 , . . . , λ∗m ) siten että
piste (x∗1 , . . . , x∗n , λ∗1 , . . . , λ∗m ) on Lagrangen funktion kriittinen piste. Nyt Lagrangen
funktio on
m
X
L(x1 , . . . , xn , λ1 , . . . , λm ) = f (x1 , . . . , xn ) −
λj (gj (x1 , . . . , xn ) − cj ).
j=1
Lagrangen funktiossa on nyt useampia termejä, jotka sisältävät rajoitteen ja sitä
vastaavan kertoimen, aivan samaan tyyliin kuin yhden rajoitteen tapauksessa.
Esimerkki 3.10. Funktio f (x, y, z) = 21 x2 + 5y 2 + z 2 saa rajoitetun minimiarvon
rajoitteilla
−x + 2y − 4z = 1, ja x − y + z = 0.
Tehtävänä on etsiä rajoitettu minimipiste. Lagrangen funktio on
1
L(x, y, z, λ, µ) = x2 + 5y 2 + z 2 − λ(−x + 2y − 4z − 1) − µ(x − y + z),
2
ja sen kriittinen piste ratkaisee yhtälöryhmän
x + λ − µ = 0,
10y − 2λ + µ = 0,
2z + 4λ − µ = 0,
−x + 2y − 4z = 1,
x − y + z = 0,
Kriittinen piste on (x, y, z, λ, µ) = 31 , 0, − 13 , 31 , 23 (Laske). Eli
tettu minimipiste.
6Mieluiten
m < n.
1
, 0, − 31
3
on rajoi⋄
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
19
Kun tavoitefunktiossa on muuttujia enemmän kuin kaksi, mutta rajoitteita edelleen yksi, riittäviä ehtoja varten tulee tarkastaa useamman johtavan pääminorin
merkki.7
Lause 3.5. Olkoon L(x1 , x2 , . . . , xn , λ) Lagrangen funktio ja olkoon piste (x∗1 , x∗2 , . . . , x∗n , λ∗ )
sen kriittinen piste. Tällöin
(i) (x∗1 , x∗2 , . . . , x∗n ) on paikallinen maksimipiste, jos reunustetulle Hessen matriisille H pätee kriittisessä pisteessä
|H3 | > 0,
|H4 | < 0,
|H5 | > 0, . . .
|H3 | < 0,
|H4 | < 0,
|H5 | < 0, . . .
(ii) (x∗1 , x∗2 , . . . , x∗n ) on paikallinen minimipiste, jos reunustetulle Hessen matriisille H pätee kriittisessä pisteessä
Todistus. Sydsæter et al. (2008).
Tähän asti on käsitelty paikallisia ääriarvoja. Entä globaalit ääriarvot rajoitetussa tapauksessa? Tarkastellaan tilannetta maksimointitehtävän ja usean rajoitteen
tapauksessa.
Lause 3.6. Oletetaan, että piste (x∗1 , . . . , x∗n , λ∗1 , . . . , λ∗m ) on Lagrangen funktion
kriittinen piste, ja että Lagrangen funktio on konkaavi muuttujien x1 , . . . , xn suhteen. Tällöin piste (x∗1 , . . . , x∗n ) on tehtävän globaali ratkaisu.
Todistus. Sydsæter et al. (2008).
Minimointitehtävän tapauksessa Lagrangen konkaavisuus korvataan konveksisuudella.
Esimerkki 3.11. Koska Esimerkissä 3.10 Lagrangen
funktio L on konveksi muut
tujien x, y ja z suhteen (miksi?), piste 13 , 0, − 31 on rajoitettu globaali minimipiste.
⋄
Selvitetään luvun lopuksi Lagrangen kertoimen (taloustieteellistä) merkitystä kahden muuttujan ja yhden rajoitteen tapauksessa. Lagrangen kerroin on matemaattisessa mielessä vain apumuuttuja, jonka avulla löydetään tehtävän ratkaisu. Taloustieteellisissä malleissa kertoimesta on myös muuta hyötyä. Esimerkiksi maksimointitehtävässä Lagrangen kerroin kertoo (intuitiivisesti sanottuna) kuinka funktion
maksimiarvo muuttuu, jos rajoitetta löysätään hieman. Tarkastellaan tehtävää:
max f (x, y) siten että g(x, y) = c.
{x,y}
Tämän tehtävän ratkaisu (x∗ , y ∗ ) riippuu parametrista c, joten merkitään tehtävän ratkaisua (x∗ (c), y ∗ (c)) ja Lagrangen kerrointa λ(c). Lisäoletuksin on voimassa
7Entä jos rajoitteita on useita? Tämän voit kurkata kurssikirjoista. Usean rajoitteen tapauksessa
ehdot ovat monimutkaisemmat ja vaikeammat muistaa.
20
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Lause 3.7. Olkoon (x∗ (c), y ∗ (c)) rajoitetun maksimointitehtävän ratkaisu ja f (x∗ (c), y ∗ (c))
tavoitefunktion maksimiarvo. Tällöin
df (x∗ (c), y ∗ (c))
= λ∗ (c).
dc
Todistus. Sydsæter et al. (2008).
Esimerkiksi, jos kyseessä on kuluttujan hyödyn maksimointitehtävä annetulla
budjettirajoitteella px + qy = I, Lagrangen kerroin, joka on kyseisessä tehtävässä
positiivinen, kertoo kuinka paljon maksimihyöty likimäärin kasvaa tulojen noustessa
hieman.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
21
4. Ääriarvotehtävät epäyhtälörajoitteilla
Esimerkki 4.1. Tarkastellaan tehtävää
(4.1)
max f (x) rajoitteella x ≥ 0.
{x}
Oletetaan ensin, että tehtävän ratkaisu x∗ on 0. Tällöin funktion f (x) derivaatta
on välttämättä negatiivinen tai nolla tässä pisteessä eli f ′ (x∗ ) < 0 tai f ′ (x∗ ) = 0,
koska muuten funktion arvoa voitaisiin kasvattaa siirtymällä positiiviseen suuntaan
pisteestä nolla. Toisaalta, jos tehtävän ratkaisu on jokin positiivinen luku eli x∗ >
0, niin tällöin tässä pisteessä derivaatan on oltava nolla eli f ′ (x∗ ) = 0. Eli olipa
tehtävän ratkaisu x∗ = 0 tai x∗ > 0, se toteuttaa ehdot:
Katso Kuva 4.1.
f ′ (x) ≤ 0,
x ≥ 0,
xf ′ (x) = 0.
⋄
Kuva 4.1. Vasen kuva: x∗ = 0 ja f ′ (x∗ ) < 0. Oikea kuva: x∗ > 0 ja
f ′ (x∗ ) = 0. (Tapaus, jossa f ′ (0) = 0 on jätetty piirtämättä.)
Edellinen oli esimerkki epäyhtälörajoitteisesta ääriarvotehtävästä. Olkoot f ja g
jatkuvasti derivoituvia kahden muuttujan funktioita. Tarkastellaan tehtävää
(E)
max f (x, y) rajoitteella g(x, y) ≤ 0.
{x,y}
Toisin sanoen, tehtävässä etsitään sellaista pistettä (x∗ , y ∗ ), jossa funktio f (x, y)
saa maksimiarvon, ja joka sisältyy rajoitteen g(x, y) ≤ 0 määräämään joukkoon
(käypäjoukko)
B = {(x, y) ∈ R2 | g(x, y) ≤ 0}.
Oletetaan, että rajoitteelle pätee gx (x∗ , y ∗ ) 6= 0 ja gy (x∗ , y ∗ ) 6= 0, jossa (x∗ , y ∗ )
on tehtävän (E) ratkaisu. Lauseessa 4.1 annetaan ehdot, jotka tehtävän ratkaisu
toteuttaa. Otetaan ensin johdatteleva esimerkki:
Esimerkki 4.2. Tehtävänä on
(4.2)
max −(x − 2)2 − (y − 2)2
{x,y}
rajoitteella y + x − 2 ≤ 0.
Tässä f (x, y) = −(x − 2)2 − (y − 2)2 , ja sen tasa-arvokäyrät ovat ympyröitä, joiden
keskipisteenä on (2, 2). Rajoitteena on epäyhtälö y + x − 2 ≤ 0, joka muodostaa
joukon
B = {(x, y) ∈ R2 | y + x − 2 ≤ 0}.
22
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
4
3
2
1
-2
1
-1
2
3
4
-1
-2
Kuva 4.2. Tavoitefunktion tasa-arvokäyrät ja rajoitejoukko B (varjostettu alue)
Esimerkiksi origo (0, 0) kuuluu tähän joukkoon, kuten myös kaikki (suoran)yhtälön
y = −x + 2 toteuttavat pisteet. Ilman rajoitetta funktion f maksimipiste on (2, 2)
(miksi?), mutta tämä piste ei kuitenkaan kuulu rajoitejoukkoon B. Pohtimalla rajoitejoukkoa ja funktion tasa-arvokäyriä huomataan, että tehtävän ratkaisu on piste (1, 1). Tässä pisteessä funktion f gradientti ∇f (x, y) on rajoitteen gradientti
∇g(x, y) kerrottuna jollain kertoimella λ (millä?). Gradientit ovat siten yhdensuuntaisia. Gradientin geometriasta tiedetään, että gradientti osoittaa suuntaan, johon
funktion arvo kasvaa voimakkaimmin ja että se on kohtisuorassa funktion tasaarvojoukon tangenttisuoraa vastaan. Pisteessä (1, 1) funktion f gradientti osoittaa
pisteen (2, 2) suuntaan. Jos näin ei olisi, vaan gradientti osoittaisi rajoitejoukon
suuntaan, funktion f arvoa voitaisiin kasvattaa ja pysyä edelleen rajoitejoukossa.
Tällöin piste (1, 1) ei olisi tehtävän ratkaisu. Funktion f gradientti osoittaa siis
ulospäin rajoitejoukosta. Rajoitteen gradientti osoittaa samaan suuntaan, joten yhtälöstä
∇f (x, y) = λ∇g(x, y)
seuraa, että λ > 0.
⋄
Yllä olevassa esimerkissä optimi saavutettiin rajoitejoukon reunalla eli pisteessä,
jossa g(x, y) = 0. Tällöin sanotaan, että rajoite on sitova tai aktiivinen. Muutetaan
ylläolevaa esimerkkiä hieman, jolloin optimi saavutetaankin rajoitejoukon sisällä eli
pisteessä, jossa g(x, y) < 0:
Esimerkki 4.3. Tehtävänä on
(4.3)
max −(x − 2)2 − (y − 2)2
{x,y}
rajoitteella y + x − 6 ≤ 0.
Nyt rajoitteena on epäyhtälö y + x − 6 ≤ 0, joka muodostaa joukon (piirrä)
B = {(x, y) ∈ R2 | y + x − 6 ≤ 0}.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
23
Tarkastellaan pistettä (3, 3), joka toteuttaa rajoitteena olevan epäyhtälön yhtäsuuruutena. Tässä pisteessä rajoitteen gradientti osoittaa ulospäin rajoitejoukosta aivan kuten edellisessä esimerkissä. Tällä kertaa kuitenkin funktion f (x, y) gradientti
osoittaa rajoitejoukon sisuksen suuntaan eli voimme kasvattaa funktion arvoa siirtymällä pisteestä (3, 3) sisuksen suuntaan. Tehtävän ratkaisuna on rajoittamaton
ääriarvopiste (2, 2).
⋄
Ylläolevan esimerkin tilanteessa, jossa tehtävän ratkaisu saavutetaan rajoitejoukon sisuksessa, rajoite ei ole sitova.
Tehtävään (E) liittyvä Lagrangen funktio on
L(x, y, λ) = f (x, y) − λg(x, y),
jota voi käyttää apuna tehtäviä ratkoessa.8 Epäyhtälörajoitteisissa tehtävissä on
väliä sillä mikä merkki on Lagrangen kertojan λ edessä. Tehtävään (E) liittyvä Lagrangen funktio kannattaa kirjoittaa täsmälleen yllä mainitussa muodossa. Yhtälörajoitteisissa tehtävissä (osittais)derivoitiin myös kertojan λ suhteen, mutta epäyhtälörajoitteisissa tehtävissä ei.9
Seuraava lause antaa välttämättömät ehdot tehtävän ratkaisulle:
Lause 4.1. Olkoon piste (x∗ , y ∗ ) tehtävän (E) ratkaisu. Tällöin on olemassa reaaliluku λ∗ siten että seuraavat ehdot ovat yhtäaikaa voimassa:
(i) ∇f (x∗ , y ∗ ) = λ∗ ∇g(x∗ , y ∗ ),
(ii) g(x∗ , y ∗ ) ≤ 0, λ∗ ≥ 0 ja λ∗ g(x∗ , y ∗ ) = 0.
Todistus. Sydsæter et al. (2008).
Ehtoja (i) ja (ii) voidaan kutsua Kuhn-Tucker-ehdoiksi (KT-ehdoiksi). Ehto (i)
on tuttu ja sen yhtälö voidaan kirjoittaa muodossa
fx (x∗ , y ∗ ) = λ∗ gx (x∗ , y ∗ ),
fy (x∗ , y ∗ ) = λ∗ gy (x∗ , y ∗ ).
(Lagrangen funktion avulla nämä ehdot ovat Lx (x∗ , y ∗ , λ∗ ) = 0 ja Ly (x∗ , y ∗ , λ∗ ) =
0.) Ehto (ii) on uusi. Ehto sanoo, että optimipisteessä epäyhtälörajoite on voimassa
ja Lagrangen kertoja on ei-negatiivinen. Lisäksi optimissa kertojan ja rajoitefunktion tulo on nolla; siis joko kertoja on nolla tai rajoitefunktio on nolla tai molemmat ovat nollia. Toisin sanoen, jos rajoite pätee muodossa g(x∗ , y ∗ ) < 0, on yhtälön
λ∗ g(x∗ , y ∗ ) = 0 mukaan oltava λ∗ = 0. Jos taas λ∗ > 0, on yhtälön λ∗ g(x∗ , y ∗ ) = 0
mukaan oltava g(x∗ , y ∗ ) = 0.
Esimerkki 4.4. Ratkaistaan Esimerkki 4.2 Lauseen 4.1 avulla. Lagrangen funktio
on
L(x, y, λ) = −(x − 2)2 − (y − 2)2 − λ(y + x − 2).
8Se
on muodostettu samaan tapaan kuin aiemminkin.
tehtävissä derivointi kertojan suhteen on vähän turhaa, koska derivaatta
kertojan suhteen asetettuna nollaksi on oleellisesti vain rajoiteyhtälö.
9Yhtälörajoitteisissakin
24
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Lauseen 4.1 ehto (i) voidaan kirjoittaa muotoon
(4.4)
−2(x − 2) = λ,
(4.5)
−2(y − 2) = λ.
Ehto (ii) on
y + x − 2 ≤ 0, λ ≥ 0, λ(y + x − 2) = 0.
Mietitään, mitä tapahtuu, jos λ = 0. Tällöin yhtälöt (4.4) ja (4.5) tulevat muotoon
−2(x − 2) = 0,
−2(y − 2) = 0,
jolloin x = 2 ja y = 2. Piste (x, y) = (2, 2) ei kuitenkaan kuulu rajoitejoukkoon, joten
ei voi päteä λ = 0. Entä jos λ > 0? Tällöin Lauseen 4.1 viimeisen ehdon mukaan on
oltava y + x − 2 = 0, joten yhdistämällä tämä ehtoon (i) saadaan yhtälöryhmä
−2(x − 2) = λ,
−2(y − 2) = λ,
y + x − 2 = 0.
Yhtälöryhmän ratkaisu on (x∗ , y ∗ , λ∗ ) = (1, 1, 2). Geometrisesti (katso Kuva 4.2) on
selvää, että (1, 1) on tehtävän ratkaisu ja vastaava funktion rajoitettu maksimiarvo
on −2.
⋄
Esimerkki 4.5 (Kirjasta S&B). Tehtävänä on
(4.6)
max xy
{x,y}
rajoitteella x2 + y 2 ≤ 1.
Lagrangen funktio on
L(x, y, λ) = xy − λ(x2 + y 2 − 1).
Lauseen 4.1 ehdot (i) ja (ii) voidaan kirjoittaa muotoon
(4.7)
y = 2λx,
(4.8)
(4.9)
x = 2λy,
2
2
x + y ≤ 1,
λ ≥ 0,
λ(x2 + y 2 − 1) = 0.
y
x
ja λ = 2y
. Eli x2 = y 2 .
Yhtälöistä (4.7) ja (4.8) saadaan λ = 2x
Käytetään nyt ehtoja (4.9) ja katsotaan mitä tapahtuu, kun λ = 0. Tällöin yhtälöiden (4.7) ja (4.8) mukaan myös y = 0 ja x = 0. Piste (0, 0) sisältyy varmasti
rajoitejoukkoon, joten kolmikko (0, 0, 0) on yksi ratkaisukandidaatti. Muut kandidaatit löydetään, kun katsotaan mitä tapahtuu, kun λ > 0. Tällöin ehtojen (4.9)
mukaan rajoite on sitova eli x2 + y 2 = 1. Käytetään tämän lisäksi yhtälöä x2 = y 2 ,
jolloin laskemalla saadaan neljä ehdokasta:
1 1
1
1
1
1 1 1
1
1 1
1
√ ,√ ,
, −√ , −√ ,
, √ , −√ , −
ja − √ , √ , −
.
2 2 2
2
2 2
2
2 2
2 2 2
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
25
Kahdessa jälkimmäisessä λ < 0, joten hylkäämme ne. Jäljelle jäävät siten √12 , √12 , 21
ja − √12 , − √12 , 21 sekä aiemmin laskettu (0, 0, 0). Sijoitetaan kunkin x ja y ar
1 √1
√
vot tavoitefunktioon xy, jolloin saamme rajoitetuiksi maksimipisteiksi
, 2 ,
2
⋄
− √12 , − √12 . Nämä tuottavat tavoitefunktiolle rajoitetun maksimiarvon 21 .
Esimerkki 4.6. Perustellaan Esimerkkiä 4.1 Lauseen 4.1 avulla. Kirjoitetaan rajoite x ≥ 0 lauseessa esiintyvään muotoon eli −x ≤ 0. Tehtävään liittyvä Lagrangen
funktio on
L(x, λ) = f (x) − λ(−x),
ja lauseen ehdot ovat nyt
f ′ (x) + λ = 0,
(4.10)
−x ≤ 0, λ ≥ 0,
λ(−x) = 0.
Ensimmäinen yhtälö on yhtäpitävä yhtälön λ = −f ′ (x) kanssa, jolloin ehdot (4.10)
saadaan Esimerkkiä 4.1 vastaavaan muotoon:
(4.11)
x ≥ 0,
f ′ (x) ≤ 0,
f ′ (x)x = 0.
⋄
Periaatteessa niin sanottuja ei-negatiivisuus rajoitteita, x ≥ 0, voidaan käsitellä
juuri kuten edellisessä esimerkissä.
Esimerkki 4.7 (Kirjasta S&B). Tehtävänä on kuluttujan hyödynmaksimointi budjettirajoitteella, jonka ei tarvitse olla sitova eli kuluttajan ei tarvitse käyttää välttämättä kaikkea tuloaan hyödykkeisiin:
(4.12)
max u(x1 , x2 ) rajoitteella p1 x1 + p2 x2 ≤ I,
{x1 ,x2 }
jossa x1 ja x2 ovat hyödykkeiden määrät, p1 ja p2 ovat niiden hinnat ja I on kuluttajan käytettävissä oleva tulo. Oletetaan, että rajahyöty on aidosti positiivinen
molempien hyödykkeiden suhteen eli
(4.13)
ux1 (x1 , x2 ) > 0,
ja ux2 (x1 , x2 ) > 0.
Muodostetaan Lagrangen funktio
L(x, y, λ) = u(x1 , x2 ) − λ(p1 x1 + p2 x2 − I)
ja käytetään jälleen Lausetta 4.1. Lauseen mukaiset ehdot ovat
(4.14)
ux1 (x1 , x2 ) = λp1 ,
(4.15)
ux2 (x1 , x2 ) = λp2 ,
(4.16)
p1 x1 + p2 x2 ≤ I,
λ ≥ 0,
λ(p1 x1 + p2 x2 − I) = 0.
26
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Katsotaan mitä tapahtuu, kun λ = 0. Tällöin yhtälöiden (4.14) ja (4.15) mukaan
olisi
(4.17)
ux1 (x1 , x2 ) = 0,
ja ux2 (x1 , x2 ) = 0,
mikä on kuitenkin ristiriidassa oletettujen rajahyötyjen aidon positiivisuuden kanssa. Ei voi päteä λ = 0. Mitä seuraa, jos λ > 0? Tällöin ehtojen (4.16) mukaisesti on
oltava p1 x1 + p2 x2 = I eli kuluttaja käyttää kaiken tulonsa hyödykkeisiin.
⋄
Jos pyritään etsimään tavoitefunktion f minimiä jossain rajoitejoukossa, voidaan
käyttää edelleen Lausetta 4.1 kunhan maksimoidaan funktiota −f . Toisin sanoen
tehtävän
(4.18)
min f (x, y) rajoitteella g(x, y) ≤ 0
{x,y}
ratkaisu on täsmälleen sama kuin tehtävän
(4.19)
max −f (x, y) rajoitteella g(x, y) ≤ 0.
{x,y}
(Miksi?)
Esimerkki 4.8. Tehtävän
(4.20)
min (x − 2)2 + (y − 2)2
{x,y}
rajoitteella y + x − 2 ≤ 0
ratkaisu on (1, 1) Esimerkin 4.4 perusteella.
⋄
Esimerkki 4.9. Ratkaistaan tehtävä
(4.21)
min x2 + y 2
{x,y}
rajoitteella 3x + 2y + 6 ≤ 0.
Lagrangen funktio on (tehtävä on ensin muutettu maksimointitehtäväksi.)
L(x, y, λ) = −x2 − y 2 − λ(3x + 2y + 6).
Lauseen 4.1 ehto (i) voidaan kirjoittaa muotoon
(4.22)
−2x = 3λ,
(4.23)
−2y = 2λ,
ja ehto (ii) on
3x + 2y + 6 ≤ 0,
λ ≥ 0,
λ(3x + 2y + 6) = 0.
Mietitään, mitä tapahtuu, jos λ = 0. Tällöin yhtälöistä (4.22) ja (4.23) seuraa, että
x = 0 ja y = 0. Sijoitetaan nämä rajoiteyhtälöön, jolloin saadaan 6 ≤ 0, mikä on
mahdotonta. Entä jos λ > 0? Tällöin on Lauseen 4.1 viimeisen ehdon mukaan oltava
3x + 2y + 6 = 0, joten yhdistämällä tämän ehtoon (i) saadaan yhtälöryhmä
−2x = 3λ,
−2y = 2λ,
3x + 2y + 6 = 0.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
27
18
12 12
Yhtälöryhmän ratkaisu on (x∗ , y ∗ , λ∗ ) = − 13
, − 13
, 13 . Geometrisesti on selvää,
12
on tehtävän ratkaisu ja vastaava funktion rajoitettu minimiarvo on
, − 13
että − 18
13
468
.
⋄
169
Esimerkeistä on käynyt ilmi yksi tapa tutkia eräitä epäyhtälörajoitteisia tehtäviä.
Toinen tapa on tutkia tapaukset, joissa toisessa rajoite ei ole sitova ja toisessa rajoite
on sitova. (Suosittelen laskemaan ainakin yhden esimerkin näinkin.)
Mistä tiedetään, että Lauseen 4.1 ehdot toteuttava piste on tosiaan tehtävän
ratkaisu? Yksi mahdollisuus on soveltaa seuraavaa lausetta.
Lause 4.2. Oletetaan, että pari (x∗ , y ∗ ) ja kerroin λ∗ toteuttavat Lauseen 4.1 ehdot,
ja että Lagrangen funktio on konkaavi muuttujien x ja y suhteen. Tällöin (x∗ , y ∗ )
on tehtävän (E) ratkaisu.
Todistus. Sydsæter et al. (2008).
Usean valintamuuttujan ja usean epäyhtälörajoitteen tapauksessa maksimointitehtävä on
(4.24)
max f (x1 , . . . , xn ) rajoitteilla gj (x1 , . . . , xn ) ≤ 0, j = 1, . . . , m,
{x1 ,...,xn }
jossa tavoitefunktio f ja rajoitefunktiot gj ovat jatkuvasti derivoituvia funktioita.
Lausetta 4.1 vastaa seuraava tulos.10
Lause 4.3. Olkoon piste (x∗1 , . . . , x∗n ) tehtävän (4.24) ratkaisu. Tällöin on olemassa
reaaliluvut λ∗1 , . . . , λ∗m siten että seuraavat ehdot ovat yhtäaikaa voimassa:
(i) Lxi (x∗1 , . . . , x∗n , λ∗1 , . . . , λ∗m ) = 0 kaikilla i = 1, . . . , n,
(ii) gj (x∗1 , . . . , x∗n ) ≤ 0, λ∗j ≥ 0 ja λ∗j gj (x∗1 , . . . , x∗n ) = 0 kaikilla j = 1, . . . , m.
Todistus. Sydsæter et al. (2008).
Esimerkki 4.10. Ratkaistaan tehtävä
max xy
{x,y}
1
rajoitteilla y + x − 6 ≤ 0, y + 2x − 12 ≤ 0
2
Lagrangen funktio on
1
L(x, y, λ2 , λ2 ) = xy − λ1 (y + x − 6) − λ2 (y + 2x − 12),
2
ja Lauseen 4.3 ehdot ovat
1
y − λ1 − 2λ2 = 0
(4.25)
2
(4.26)
x − λ1 − λ2 = 0
1
1
(4.27)
y + x − 6 ≤ 0, λ1 ≥ 0, λ1 (y + x − 6) = 0
2
2
(4.28)
y + 2x − 12 ≤ 0, λ2 ≥ 0, λ2 (y + 2x − 12) = 0.
10Jotta
tulos olisi voimassa pitäisi olettaa jotain lisää rajoitteista (niin sanottu constraint qualification ehto), joka on tässä jätetty huomioimatta.
28
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Ratkaisuehdokkaita ovat siis kaikki pisteet (x, y, λ1 , λ2 ), jotka toteuttavat nämä ehdot. Tässä on neljä tapausta tutkittavana:
Tapaus 1. λ1 = 0 ja λ2 = 0. Tässä tapauksessa ehdoista (4.25)–(4.26) saadaan
(x, y) = (0, 0). Tämä piste toteuttaa myös ehdot (4.27) ja (4.28). Se on siis ehdokas
ratkaisuksi.
Tapaus 2. λ1 > 0 ja λ2 = 0. Tässä tapauksessa saadaan yhtälöryhmä
1
y − λ1 = 0
(4.29)
2
(4.30)
x − λ1 = 0
1
y + x − 6 = 0,
(4.31)
2
jonka ratkaisu on (x, y, λ1 ) = (6, 3, 6). Toteutuuko epäyhtälö y + 2x − 12 ≤ 0? Ei.
Tästä tapauksesta ei saada lisää ratkaisuehdokkaita.
Tapaus 3. λ1 = 0 ja λ2 > 0. Nyt saadaan yhtälöryhmä
(4.32)
(4.33)
(4.34)
y − 2λ2 = 0
x − λ2 = 0
y + 2x − 12 = 0,
jonka ratkaisu on (x, y, λ2 ) = (3, 6, 3). Toteutuuko epäyhtälö y + 21 x − 6 ≤ 0? Ei.
Tästäkään tapauksesta ei saada lisää ratkaisuehdokkaita.
Tapaus 4. λ1 > 0 ja λ2 > 0. Tällä kertaa saadaan yhtälöryhmä
1
(4.35)
y − λ1 − 2λ2 = 0
2
(4.36)
x − λ1 − λ2 = 0
1
y+ x−6=0
(4.37)
2
(4.38)
y + 2x − 12 = 0,
jonka ratkaisu on (x, y, λ1 , λ2 ) = 4, 4, 83 , 43 . Tämä piste toteuttaa kaikki ehdot,
joten se kelpaa ratkaisuehdokkaaksi. Itseasiassa se on ratkaisu, koska tavoitefunktion
arvo on siinä 16, kun taas ehdokkaassa (0, 0) se on vain 0.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
29
5. Komparatiivinen statiikka
Komparatiivisen statiikan avulla voi tutkia jonkin mallin eksogeenisen muuttujan muutoksen vaikutusta endogeeniseen muuttujaan. Endogeeninen muuttuja voi
olla vaikka tuotanto ja eksogeeninen muuttuja esimerkiksi lopputuotteen hinta. Tarpeellisia apuvälineitä ovat kokonaisdifferentiaali, ketjusääntö ja erityisesti implisiittifunktiolauseet.
5.1. Kokonaisdifferentiaali. Muistellaan ensin derivoituvaa yhden muuttujan funktiota y = f (x). Tarkastellaan pistettä (x0 , f (x0 )) ja sen kautta kulkevaa tangenttisuoraa, jonka yhtälö differentiaalien avulla kirjoitettuna (katso kurssi YE19a tai
EMEA) on
(5.1)
dy = f ′ (x0 )dx,
jossa dy = y−f (x0 ) ja dx = x−x0 . Yhtälö (5.1) on funktion f differentiaali pisteessä
(x0 , f (x0 )) ja sitä voisi merkitä myös df = f ′ (x0 )dx. Funktion arvon muutosta
∆y = f (x) − f (x0 ) voidaan arvioida yhtälön (5.1) avulla seuraavasti
(5.2)
∆y ≈ dy = f ′ (x0 )dx.
Mitä pienempi on muutos muuttujan x arvossa, sitä parempi tämä arvio yleensä
on. Tätä voi ajatella myös niin, että funktion kuvaajaa pisteessä (x0 , f (x0 )) pyritään
arvioimaan tangenttisuoralla. Funktion kuvaaja on tämän pisteen läheisyydessä siten ”melkein” suora. Arviointia differentiaalin avulla kutsutaan funktion linearisoinniksi kyseisessä pisteessä. Parempi merkintä funktion differentiaalille olisi
(5.3)
df (x0 ) = f ′ (x0 )dx,
jolloin olisi selvempää, että differentiaali riippuu muun muassa pisteestä x0 .
Esimerkki 5.1. Tutkitaan funktiota f (x) = x2 ja pistettä x0 = 2. Oletetaan, että
x muuttuu kohdasta 2 kohtaan 2.1. Arvioidaan funktion arvon muutosta funktion
differentiaalin df (x0 ) = f ′ (x0 )dx avulla. Nyt kohtien (5.2) ja (5.3) perusteella ∆y ≈
f ′ (2)(2.1 − 2) eli ∆y ≈ 4(2.1 − 2) = 0.4. Todellinen muutos funktion arvossa on
4.41 − 4 = 0.41. Heittoa on 0.01.
⋄
Sama ajatus voidaan laajentaa usean muuttujan funktioon, jolloin puhutaan kokonaisdifferentiaalista. Esimerkiksi kahden muuttujan funktion tapauksessa kuvaajaa
ei enää arvioida tangenttisuoralla vaan tangenttitasolla. Olkoon y = f (x1 , x2 , . . . , xn )
sopiva n:n muuttujan funktio. Tämän kokonaisdifferentiaali on
(5.4)
df (x0 ) = fx1 (x0 )dx1 + . . . + fxn (x0 )dxn ,
jossa dxi = xi − x0i , i = 1, . . . , n ja x0 = (x01 , x02 , . . . , x0n ). Kokonaisdifferentiaalilla
df voidaan arvioida muutosta funktion arvossa, kun kaikki muuttujat (tai vain osa
niistä) muuttuvat: ∆y ≈ df . Arvio on yleensä sitä parempi, mitä pienempiä differentiaalit dxi ovat. Edelleen voidaan puhua funktion linearisoinnista. Myös usean
muuttujan tapauksessa (kokonais)differentiaali riippuu pisteestä (x01 , . . . , x0n ).
Esimerkki 5.2.
30
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
(i) Lasketaan funktion f (x1 , x2 ) = x11 − x32 , x1 6= 0, kokonaisdifferentiaali. Kokonaisdifferentiaali muodostetaan siis laskemalla osittaisderivaatat ja käyttämällä kaavaa (5.4):
1
df = fx1 dx1 + fx2 dx2 eli df = − 2 dx1 − 3x22 dx2 .
x1
(ii) Funktion f (x, y, z) = 3x2 − y 4 + yz + xz 3 kokonaisdifferentiaali on
df = (6x + z 3 )dx + (z − 4y 3 )dy + (y + 3xz 2 )dz.
⋄
Esimerkki 5.3. Olkoon yrityksen tuotanto y kahden panoksen x1 ja x2 funktio q
eli y = q(x1 , x2 ). Tämän kokonaisdifferentiaali on
dq = qx1 dx1 + qx2 dx2 .
Tämä antaa arvion muutokselle tuotannossa, esimerkiksi kun molemmat panokset
muuttuvat. Se on summa rajatuotannoin kerrotuista panosten differentiaaleista. ⋄
Esimerkki 5.4. Oletetaan, että yritys maksimoi voittoaan valitsemalla tuotannon
tason y. Olkoon voittofunktio π(y) = py − C(y), jossa p on hinta ja C(y) on kustannusfunktio, joka täyttää millä tahansa tuotannon tasolla ominaisuudet C ′ (y) > 0
ja C ′′ (y) > 0. Kustannusfunktio on siten aidosti kasvava ja aidosti konveksi funktio. Millä tavalla optimaalinen tuotannon taso y ∗ riippuu hinnasta p eli mikä on
merkki optimaalisella tuotannon tasolla? Jos olisi annettu jokin paraderivaatan dy
dp
metrinen muoto kustanusfunktiolle, esimerkiksi ay 2 , a > 0, voitaisiin vain ratkaista
optimaalinen tuotanto ja derivoida sitä hinnan suhteen. Kustannusfunktio on annettu nyt yleisemmässä muodossa, joten näin ei voida toimia. Yrityksen tehtävänä
on maksimoida voittoaan:
max {π(y) = py − C(y)}
{y}
Välttämätön ehto maksimipisteelle on
(5.5)
π ′ (y ∗ ) = p − C ′ (y ∗ ) = 0,
jossa y ∗ viittaa optimaaliseen tuotannon tasoon. (Miksi y ∗ on optimaalinen?) Alkuperäiseen kysymykseen vastaus saadaan kokonaisdifferentioimalla hinnan p ja tuotannon y suhteen ehtoa (5.5) ja ”ratkaisemalla” haluttu derivaatta:
dy
1
dp − C ′′ (y ∗ )dy = 0 ⇒
= ′′ ∗ .
dp
C (y )
Tämä on positiivinen, koska oletuksen mukaan C ′′ (y ∗ ) > 0.11 Jos tuotteen hinta nousee, optimaalinen tuotanto kasvaa. Myöhemmin lasku tehdään käyttämällä
implisiittifunktiolausetta.
⋄
11Jos
tuotanto tosiaan riippuu hinnasta jonkin funktion kautta, siis y = f (p), voidaan laskea
funktion differentiaali dy = f ′ (p)dp. Vertaamalla tätä kokonaisdifferentiaalilla saatuun yhtälöön
dp − C ′′ (y ∗ )dy = 0, huomataan, että f ′ (p) = C ′′ 1(y∗ ) .
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
31
5.2. Ketjusäännöt. Tähän asti on käsitelty n:n muuttujan funktiota f , y = f (x),
jossa siis x = (x1 , . . . , xn ). Entä jos muuttujat xi riippuvat muuttujasta t, eli siis
x(t) = (x1 (t), . . . , xn (t)), ja halutaan tietää kuinka y riippuu muuttujasta t?
Aloitetaan tapauksella, jossa f (x) on vain yhden muuttujan funktio ja x = x(t)
on muuttujan t funktio. Merkitään h(t) = (f ◦ x)(t) eli h(t) = f (x(t)). Yhdistetyn
funktion derivointisääntö (tai ketjusääntö) antaa:
h′ (t) = f ′ (x(t))x′ (t).
Palataan tilanteeseen, jossa x(t) = (x1 (t), . . . , xn (t)). Miten derivoidaan h(t) =
f (x(t))? Tietyin säännöllisyysoletuksin on voimassa seuraava lause:
Lause 5.1. Yhdistetyn funktion h(t) = f (x(t)) derivaatta h′ (t) saadaan kaavalla
n
∂f dx1
∂f dxn X ∂f dxi
′
(5.6)
h (t) =
+ ... +
=
.
∂x1 dt
∂xn dt
∂xi dt
i=1
Todistus. Sydsæter et al. (2008).
Kaavaa (5.6) kutsutaan ketjusäännöksi.
12
Tutkitaan asiaa esimerkin kautta.
Esimerkki 5.5. Olkoon f (x, y) = 2x + y 2 + y, jossa x = et ja y = 3t. Merkitään
h(t) = f (x, y). Käytetään yllä olevaa lausetta (eikä suoraa sijoitusta) derivaatan
h′ (t) määräämiseen:
∂f dx ∂f dy
h′ (t) =
+
= 2et + (2y + 1)3 = 2et + 3(6t + 1).
∂x dt
∂y dt
⋄
Oletetaan seuraavaksi, että h(t) = f (t, x1 (t), x2 (t), . . . , xn (t)). Funktio f riippuu
nyt myös ”suoraan” muuttujasta t. Tämän derivaatta muuttujan t suhteen saadaan
kaavalla
df
∂f dx1
∂f dt
∂f dxn
(5.8)
h′ (t) =
+
=
+ ... +
.
dt
∂t |{z}
dt ∂x1 dt
∂xn dt
=1
Intuitiivisesti derivaatta kaavassa (5.8) koostuu ”suorasta vaikutuksesta” muuttujan t suhteen ja ”epäsuorista vaikutuksista”, jotka syntyvät muiden muuttujien
kautta muuttujan t muuttuessa.
Esimerkki 5.6. Oletetaan, että tuotanto q riippuu pääomasta K, työvoimasta L
ja ajasta t funktion q = f (K, L, t) mukaisesti. Oletaan lisäksi, että K ja L riippuvat
myös ajasta. Tuotannon derivaatta ajan suhteen saadaan ketjusäännöllä (5.8):
∂f dK
∂f dL ∂f
dq
=
+
+
.
dt
∂K dt
∂L dt
∂t
12Kaavan
(5.6) voisi esittää myös muodossa
df
= ∇f (x) · x′ (t).
(5.7)
dt
Tässä ∇f (x) on gradienttivektori ja x′ (t) on vektori, joka koostuu funktioiden xi derivaatoista.
32
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
⋄
5.3. Implisiittifunktiolauseet. Tähän asti on käsitelty pääasiassa funktioita, jotka voidaan esittää yhden muuttujan tapauksessa muodossa y = f (x). Tämä funktio on niin sanotussa ratkaistussa eli eksplisiittisessä muodossa. Usein funktio y =
f (x) on annettu ratkaisemattomassa eli implisiittisessä muodossa jonkin yhtälön
F (x, y) = 0 avulla, jossa F on kahden muuttujan funktio. Tarkemmin sanottuna
yhtälö F (x, y) = 0 määrittää muuttujan y muuttujan x funktiona implisiittisesti,
jos jollain välillä on olemassa funktio y = f (x) siten että F (x, f (x)) = 0.
Usein, kuten Esimerkissä 5.4, kiinnostuksen kohteena on ratkaista annetusta yhtälöstä F (x, y) = 0 derivaatta f ′ (x). Miten? Jos yhtälö tosiaan määrittelee muuttujan
y muuttujan x funktiona y = f (x), voidaan yhtälöä derivoida puolittain muuttujan x suhteen. Yhtälön vasemman puolen derivaatta on Fx (x, y) + Fy (x, y)f ′ (x), ja
oikean puolen nolla, joten ratkaisemalla saadaan
f ′ (x) = −
Fx (x, y)
,
Fy (x, y)
kunhan Fy (x, y) 6= 0.
Tämä kaavaa kannattaa pitää mielessä. Miltä kaava näyttää, jos yhtälönä olisi
F (x, y) = c, jossa c on vakio? Entä jos x voitaisiin lausua muuttujan y funktiona, x = g(y), siten että F (g(y), y) = 0? Miltä derivaatta g ′ (y) näyttäisi tässä tapauksessa?
Implisiittifunktio voidaan yrittää ratkaista eksplisiittisessä muodossa, mutta tämä
ei usein onnistu.
Esimerkki 5.7. Olkoon F (x, y) = 0 muotoa 2y − x2 + 2 = 0. Yhtälö määrittelee
muuttujan y muuttujan x implisiittisenä funktiona: funktion y = f (x) ratkaistu (eli
eksplisiittinen) muoto on
1
y = x2 − 1.
2
Tämän derivaatta on x. Sama tulos saadaan myös käyttämällä kaavaa f ′ (x) =
(x,y)
(Laske).
⋄
− FFxy (x,y)
Esimerkki 5.8. Olkoon F (x, y) = 0 muotoa y 5 − x2 + 3y = 0. Muuttujan y ratkaiseminen tästä yhtälöstä on vaikeaa. On kuitenkin olemassa pisteitä, joissa yhtälö
toteutuu, kuten esimerkiksi pisteet (x, y) = (2, 1) ja (x, y) = (−2, 1). Voiko olla niin,
että ainakin näiden pisteiden ympäristössä muuttuja y voidaan lausua muuttujan
x funktiona?
⋄
Millä ehdoilla muuttuja y voidaan lausua muuttujan x funktiona jonkin pisteen
ympäristössä?
Lause
(i)
(ii)
(iii)
5.2. Olkoon F (x, y) = 0 annettu ja
piste (x0 , y0 ) sellainen, että F (x0 , y0 ) = 0,
F (x, y) jatkuvasti derivoituva pisteen (x0 , y0 ) ympäristössä,
ja Fy (x0 , y0 ) 6= 0.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
33
Tällöin pisteen (x0 , y0 ) ympäristössä on olemassa jatkuvasti derivoituva funktio y =
f (x) siten että
(5.9)
Fx (x0 , y0 )
dy
(x0 ) = f ′ (x0 ) = −
.
dx
Fy (x0 , y0 )
Todistus. Rosenlicht (1986).13
Huomaa kaavassa oleva miinus-merkki. Tässä lauseessa on annettu ehdot, joiden
täyttyessä on olemassa pisteen (x0 , y0 ) ympäristö siten että muuttuja y voidaan
lausua siinä muuttujan x funktiona.
Huom. Luentomonisteessa ja tehtävissä esiintyvien funktioiden osittaisderivaatat
ovat jatkuvia. Tämän johdosta ehdosta (ii) ei tarvitse välittää. Sen sijaan on aina
syytä ymmärtää, että piste toteuttaa yhtälön F (x, y) = 0, ja että osittaisderivaatta
muuttujan y suhteen ei ole nolla kyseisessä pisteessä.
Lauseessa muuttujaa y voidaan kutsua endogeeniseksi muuttujaksi ja muuttujaa
x eksogeeniseksi. Lauseessa annetaan ehdot joiden täyttyessä voidaan endogeeninen
muuttuja määrittää implisiittisesti eksogeenisen muuttujan funktiona. Lauseen ehdossa (iii) on funktion F osittaisderivaatta juuri endogeenisen muuttujan suhteen.
dy
Lisäksi tämän implisiittifunktiolauseen avulla voidaan myös laskea derivaatta dx
kohdassa x0 , mikä on koko komparatiivisen statiikan tarkoitus.
Esimerkki 5.9. Palataan Esimerkkiin 5.8 ja tarkastellaan pistettä (2, 1). Lasketaan
dy
kohdassa 2. Yhtälönä on y 5 − x2 + 3y = 0, joten piste (2, 1) toteuttaa
derivaatta dx
sen ((1)5 − 22 + 3 = 0). Implisiittifunktiolauseen vaatimus (iii) toteutuu, koska
Fy (2, 1) = 8 6= 0.
Yllä oleva huomautus mukaan luettuna Lauseen 5.2 ehdot toteutuvat ja sen vuoksi muuttuja y voidaan lausua muuttujan x funktiona pisteen (2, 1) ympäristössä.
dy
Tällöin on järkevää puhua derivaatasta dx
. Nyt Fx = −2x. Implisiittifunktiolauseen
perusteella derivaataksi kyseisessä pisteessä saadaan
dy
−4
1
(2) = −
= .
dx
8
2
⋄
Muistisäännöksi tarkastellaan yhtälöä F (x, y) = 0 ja sen kokonaisdifferentiaalia.
Laskemalla saadaan
Fx
dy
=− .
Fx dx + Fy dy = 0 ⇒ Fy dy = −Fx dx ⇒
dx
Fy
Erityisesti tätä kautta on helpompi muistaa kaavassa (5.9) oleva miinusmerkki.
Esimerkki 5.10. Palataan voittoa maksimoivaan yritykseen eli Esimerkkiin 5.4.
Ensimmäisen kertaluvun välttämätön ehto maksimille on π ′ (y ∗ ) = p − C ′ (y ∗ ) = 0.
13Maxwell
Rosenlicht, Introduction to analysis.
34
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Piste (p, y ∗ ) toteuttaa tämän yhtälön. Lasketaan derivaatta dy
implisiittifunktiodp
lauseella:
1
dy
1
dy
=−
⇔
= ′′ ∗ .
(5.10)
′′
∗
dp
−C (y )
dp
C (y )
Päädyttiin siis aivan samaan lopputulokseen kuin aiemminkin.
⋄
Lause 5.2 yleistyy seuraavasti:
Lause 5.3. Olkoon F (x1 , . . . , xn , y) = 0 annettu ja
(i) piste (x01 , . . . , x0n , y 0 ) sellainen, että F (x01 , . . . , x0n , y 0 ) = 0,
(ii) F (x1 , . . . , xn , y) jatkuvasti derivoituva,
(iii) ja Fy (x01 , . . . , x0n , y 0 ) 6= 0.
Tällöin pisteen (x01 , . . . , x0n , y 0 ) ympäristössä on olemassa jatkuvasti derivoituva funktio y = f (x1 , . . . , xn ) siten että jokaisella i = 1, . . . , n on voimassa
(5.11)
Fx (x0 , . . . , x0n , y 0 )
∂y 0
.
(x1 , . . . , x0n ) = − i 01
∂xi
Fy (x1 , . . . , x0n , y 0 )
Todistus. Rosenlicht (1986).
Kaavasta (5.11) on hyvä huomioida, että kyseessä on osittaisderivaatta. Lauseen
avulla voidaan siis laskea kaikki osittaisderivaatat, kunhan ehdot ovat voimassa.
Esimerkki 5.11. Olkoon F (x, z, y) = y 3 xz 2 +4x2 −2xzy−y+1 = 0. Lasketaan osit∂y
pisteessä (x, z, y) = (0, 1, 1) käyttämällä yllä olevaa implisiittifunktaisderivaatta ∂x
tiolausetta. Piste (x, z, y) = (0, 1, 1) toteuttaa yhtälön, koska F (0, 1, 1) = −1+1 = 0.
Lisäksi
Fy (x, z, y) = 3y 2 xz 2 − 2xz − 1,
joka pisteessä (0, 1, 1) saa arvon
Fy (0, 1, 1) = −1 6= 0.
Lisäksi Fx (x, z, y) = y z +8x−2zy, jonka arvo pisteessä (0, 1, 1) on −1. Soveltamalla
Lausetta 5.3 osittaisderivaataksi saadaan
−1
∂y
(0, 1) = −
= −1.
∂x
−1
⋄
3 2
Tarkastellaan lopuksi tilanne, jossa yhtälöitä on useita.14 Miksi tämä tapaus on
tärkeä? Ajattele vaikka yritystä, jonka tuotanto on saastuttavaa ja jota reguloidaan
jollain instrumentilla, kuten esimerkiksi verolla. Yritys maksimoi voittoaan valitsemalla tuotannon ja puhdistuksen määrät y ja a. Tällöin ensimmäisen kertaluvun
välttämättömiä ehtoja maksimille on kaksi (yksi tuotannon ja toinen puhdistuksen
suhteen) ja optimaalinen tuotanto ja puhdistus ovat implisiittisessä muodossa. Tällaisessa mallissa halutaan tutkia esimerkiksi miten lopputuotteen hinta p (tai vaikka
14Täsmällinen
esitys lauseen muodossa löytyy kirjasta Sydsæter et al. (2008), ja sen todistus
kirjassa mainituista lähteistä, tai kirjasta Rosenlicht (1986).
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
35
vero) vaikuttaa esimerkiksi optimaalisen tuotannon määrään eli selvittää derivaatan
dy
merkki (tai osittaisderivaatan merkki, jos eksogeenisia muuttujia on useita). Aidp
emmin annetut keinot tämän derivaatan löytämiseksi eivät riitä, koska optimaalinen
tuotanto ja puhdistus ovat ratkaisu kahteen yhtälöön.
Olkoon annettu m kappaletta jatkuvasti derivoituvia funktioita F1 , . . . , Fm ja
yhtälöryhmä:


F1 (x1 , . . . , xn , y1 , . . . , ym ) = c1
..
..
..
(5.12)
.
.
.


Fm (x1 , . . . , xn , y1 , . . . , ym ) = cm
Ylläolevissa yhtälöissä y1 , . . . , ym ovat endogeenisiä ja x1 , . . . , xn eksogeenisia muut0
tujia. Olkoon piste P = (x01 , . . . , x0n , y10 , . . . , ym
) sellainen, että se toteuttaa yhtälöryhmän. Oleelliset kysymykset ovat:
1. Milloin näistä yhtälöistä voidaan (ainakin periaatteessa) ratkoa muuttujat yj
muuttujien xi suhteen pisteen P ympäristössä?
∂y1
pisteen P ympäristössä?
2. Miten löydetään esimerkiksi osittaisderivaatta ∂x
2
Funktiot Fi ovat jatkuvasti derivoituvia, joten niillä on osittaisderivaatat jokaisen
muuttujan suhteen. Yhtälöistä voidaan ratkoa muuttujat yj muuttujien xi suhteen
pisteen P ympäristössä silloin, kun pisteessä P on voimassa:
∂F1 ∂F1
∂F1 ∂y
.
.
.
∂y
∂y
m
∂F1 ∂F2
∂F2 2
2
∂y1 ∂y2 . . . ∂ym ..
.. 6= 0.
..
...
.
. .
∂F
m ∂Fm . . . ∂Fm ∂y1
∂y2
∂ym
Yksi tapa osittaisderivaattojen laskemiseen on yhtälöiden kokonaisdifferentiointi
puolittain, jolloin saadaan yhtälöryhmä:
 ∂F1
∂F1
∂F1
∂F1

 ∂x1 dx1 + . . . + ∂xn dxn + ∂y1 dy1 + . . . + ∂ym dym = 0
..
..
.
.

 ∂Fm
∂Fm
∂Fm
∂Fm
dx1 + . . . + ∂xn dxn + ∂y1 dy1 + . . . + ∂ym dym = 0
∂x1
∂y1
saadaan asettamalla dxi = 0, kun i 6= 1,
Nyt esimerkiksi osittaisderivaatta ∂x
1
dy1
ja jakamalla yhtälöt dx1 :llä ja tulkitsemalla differentiaalien osamäärä dx
halutuksi
1
osittaisderivaataksi. Näin saadaan lineaarinen yhtälöryhmä, jossa osittaisderivaatat
ovat tuntemattomat muuttujat.
Esimerkki 5.12. Tarkastellaan yhtälöparia
(5.13)
F1 (x, y, k) = x2 + ky 2 = 2
(5.14)
F2 (x, y, k) = kx + y 3 = 2.
36
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Määritteleekö yhtälöpari endogeeniset muuttujat x ja y eksogeenisen muuttujan k
funktioina pisteen P = (1, 1, 1) ympäristössä? Kyllä, koska
∂F1 ∂F1 ∂x ∂y 2x 2ky ∂F2 ∂F2 = k 3y 2 ∂x ∂y ja pisteessä (1, 1, 1) tämän determinantin arvo on 4 6= 0 ja lisäksi piste P toteuttaa
arvo kyseisessä pisteessä? Derivaamolemmat yhtälöt. Entä mikä on derivaatan dx
dk
tan määrittämistä varten lasketaan kokonaisdifferentiaalit:
(5.15)
2xdx + 2kydy + y 2 dk = 0
(5.16)
kdx + 3y 2 dy + xdk =0.
Jaetaan yhtälöryhmä differentiaalilla dk ja ryhmitellään, jolloin saadaan
dy
dx
+ 2ky
= −y 2
dk
dk
dx
dy
k
(5.18)
+ 3y 2
= −x.
dk
dk
Huomataan, että kyseessä on kahden tuntemattoman muuttujan lineaarinen yhtädy
ja dk
. Ratkaistaan Cramerin säännöllä
löryhmä. Nämä muuttujat ovat derivaatat dx
dk
haluttu derivaatta:
2
−y 2ky −x 3y 2 dx
−3y 4 + 2kxy
=
= .
dk
6xy 2 − 2k 2 y
2x 2ky2 k 3y (5.17)
2x
Pisteessä (1, 1, 1) derivaatan arvo on − 41 (tämän sijoituksen olisi voinut tehdä
jo hieman aiemmin lineaarisen yhtälöryhmän muodostamisen yhteydessä yhtälöissä
dy
(5.17)–(5.18)). Käyttämällä Cramerin sääntöä voidaan laskea myös derivaatta dk
pisteessä (1, 1, 1). Tämän derivaatan arvo on myöskin − 41 . Laske derivaatta itse
käyttämällä Cramerin sääntöä.15
⋄
Esimerkissä eksogeenisiä muuttujia oli vain yksi. Jos niitä olisi ollut useampi, olisi
laskun yhteydessä täytynyt tulkita derivaatat osittaisderivaattoina.
”Parempi tapa” laskea (osittais)derivaatat on käyttää ketjusääntöä sen sijaan että
muodostaisi kokonaisdifferentiaalit.
Esimerkki 5.13. Tulkitaan edellisessä esimerkissä endogeeniset muuttujat x ja y
eksogeenisen muuttujan k funktioina eli x = x(k) ja y = y(k), jolloin saadaan
15Derivaatat
olisi voinut laskea myös ratkaisemalla yhtälöistä (5.15) ja (5.16) differentiaalit dy
ja dx differentiaalin dk suhteen, jolloin saataisiin dy = f1′ dk ja dx = f2′ dk. Tässä f1 ja f2 ovat
kaksi funktiota, joille pätee y = f1 (k) ja x = f2 (k).
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
37
yhtälöryhmäksi
(5.19)
(5.20)
F1 (x(k), y(k), k) = x(k)2 + ky(k)2 − 2 = 0
F2 (x(k), y(k), k) = kx(k) + y(k)3 − 2 = 0.
Derivoidaan ketjusäännöllä muuttujan k suhteen
dy
dx
(5.21)
+ 2ky(k)
+ y(k)2 = 0
2x(k)
dk
dk
dx
dy
k
(5.22)
+ 3y(k)2
+ x(k) = 0.
dk
dk
Järjestelemällä tätä ja jättämällä riippuvuus muuttujasta k merkitsemättä saadaan
dy
dx
(5.23)
+ 2ky
= −y 2
2x
dk
dk
dx
dy
k
(5.24)
+ 3y 2
= −x,
dk
dk
joka vastaa aiempaa lineaarista yhtälöryhmää. Loppuosa laskusta menee samaan
tyyliin kuin yllä.
⋄
38
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
6. Integraalilaskentaa
Integrointia voidaan ajatella intuitiivisesti kahdella tapaa: joko derivoinnin käänteisoperaationa tai sitten pinta-alan määräämisenä. Olkoon f : X → Y yhden muuttujan funktio, y = f (x), jossa X = [a, b] ⊂ R on väli, jonka päätepisteet ovat a ja b.
Kurssilla käsitellään yhden muuttujan funktion määrättyjä ja määräämättömiä integraaleja. Määrätyssä integraalissa integroidaan annetun välin yli. Tätä merkitään
Z b
f (x) dx.
(6.1)
a
Tässä väli [a, b] on integrointiväli ja x on muuttuja, jonka suhteen integroidaan.
Määräämätöntä integraalia merkitään
Z
(6.2)
f (x) dx.
Kun puhutaan integraalista derivoinnin käänteisoperaationa, tarkoitetaan määräämätöntä integraalia (6.2). Aloitetaan integroinnista derivoinnin käänteisoperaationa, koska tämän jälkeen on helpompaa lähestyä määrättyä integraalia (6.1).
Integroitaessa funktiota f etsitään sellaista funktiota F , jonka derivaatta on funktio f . Tätä funktiota F kutsutaan funktion f integraalifunktioksi:
Määritelmä 6.1. Funktion f : X → Y integraalifunktio F on se funktio F : X →
Y , jolle pätee F ′ (x) = f (x) kaikilla x ∈ X.
◦
R
Tätä integraalifunktiota merkitään F (x)= f (x) dx. Integraalifunktio on siis se
funktio, jonka derivaatta on alkuperäinen funktio f . Lisäksi integraalifunktio on
jatkuva, koska sillä on derivaatta.
Esimerkki 6.1. Olkoon f (x) = 2x. Tämän funktion integraalifunktio F (x) on se
funktio, jolle pätee F ′ (x) = 2x. Yksi tälläinen on F (x) = x2 . Integraalifunktioksi
sopisi myös F (x) = x2 + c, jossa c ∈ R, koska vakion derivaatta on nolla. Vakiota c
kutsutaan integrointivakioksi.
⋄
Lause 6.1. Olkoon c ∈ R. Jos F on funktion f integraalifunktio, jokainen funktio
G = F + c on funktion f integraalifunktio.
Todistus. Tämä seuraa suoraan määritelmästä.
Integraalifunktio ei siis ole yksikäsitteinen. Jos tiedämme yhden pisteen (x0 , y0 ),
joka kuuluu funktion G kuvaajaan, voimme kuitenkin ratkaista integraalifunktion,
joka kulkee kyseisen pisteen kautta.
Esimerkki 6.2. Olkoon f (x) = 4x, jolloin F (x) = 2x2 + c. Oletetaan, että piste
(3, 2) kuuluu integraalifunktion kuvajaan. Tällöin F (x) = 2x2 − 16, koska F (3) = 2
on sama kuin
2(3)2 + c = 2 eli c = −16.
⋄
Lause 6.2. Olkoon funktioilla f ja g integraalifunktiot. Tällöin
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
(i)
(ii)
Z
Z
Z
39
Z
(f (x) + g(x)) dx = f (x) dx + g(x) dx,
Z
af (x) dx = a f (x) dx, jossa a ∈ R.
Todistus. Nämä seuraavat suoraan vastaavista derivointisäännöistä.
Sääntö (i) sanoo, että funktioiden summa (samoin kuin erotus (ii)-kohdan perusteella) voidaan integroida termeittäin. Esimerkiksi kahden polynomifunktion summa
voidaan integroida integroimalla kukin polynomi erikseen ja laskemalla integraalien
summa. Lisäksi säännön (ii) mukaan vakio voidaan viedä integraalin eteen. Seuraava lause sisältää integrointikaavoja, joita kannattaa verrata tarkkaan vastaaviin
derivointikaavoihin.
Lause 6.3. Olkoon c ∈ R ja f jokin derivoituva funktio. Tällöin
Z
1
xn+1 + c, kun n 6= −1,
(i)
xn dx =
n
+
1
Z
1
(ii)
dx = ln |x| + c, kun x 6= 0,
Z x
(iii)
ex dx = ex + c
Z
1
f (x)n+1 + c, kun n 6= −1.
(iv)
f ′ (x)f (x)n dx =
n+1
Z ′
f (x)
(v)
dx = ln |f (x)| + c, kun f (x) 6= 0,
Z f (x)
(vi)
f ′ (x)ef (x) dx = ef (x) + c.
Todistus. Nämä seuraavat suoraan derivointikaavoista.
Nämä kaavat seuraavat vastaavista derivointikaavoista. Huom: jokaisessa kaavassa on mukana integrointivakio c. Muista laskuissa lisäksi, että integraalifunktion
derivaatta on integroitavana oleva funktio, joten voit tarkastaa ratkaisusi derivoimalla.
Esimerkki
6.3.
Z
1
1
1
(i) (2x + 2x3 ) dx = 2 · x2 + 2 · x4 + c = x2 + x4 + c,
2
4
2
Z
Z √
√
3
3
1
2
+1
x2 + c =
(ii)
x3 dx = x 2 dx = 3
x5 + c,
5
+
1
2 Z
Z
Z
2 2x
1
1
2x
(iii)
e dx =
e dx =
2e2x dx = e2x + c.
2
2
2
Huomaa juuren muuttaminen potenssimuotoon kohdassa (ii) ja kerroin
(iii). (Tarkista vastaukset derivoimalla!)
2
2
kohdassa
⋄
40
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Esimerkki 6.4. Lasketaan integraali
Z
2x(x2 + 10)5 dx.
Tässä integroitava funktio on muotoa f ′ (x)f (x)n , joten käytetään Lauseen 6.3 laskusääntöä (iv):
Z
1
1
2x(x2 + 10)5 dx =
(x2 + 10)5+1 + c = (x2 + 10)6 + c.
5+1
6
Tarkista tämäkin vastaus derivoimalla.
⋄
Esimerkki 6.5. Lasketaan seuraava integraali suorittamalla ensin jakolasku
Z Z 2
2
1
x − 2x + 1
1 − + 2 dx
dx =
x2
x x
1
= x − 2 ln |x| +
x−2+1 + c
−2 + 1
1
= x − 2 ln |x| − + c.
x
⋄
Esimerkki 6.6. Lasketaan integraali
Z
Z
1
1
2
dx |{z}
=
) dx = ln |x| − ln |x + 2| + c
( −
x(x + 2)
x x+2
(∗)
Yhtäsuurudessa (∗) käytettiin osamurtohajotelmaa: Olkoon A ja B reaalilukuja.
Muodostetaan osamurtohajotelma
2
A
B
= +
x(x + 2)
x x+2
⇔
2
A(x + 2) + Bx
=
.
x(x + 2)
x(x + 2)
Täytyy siis olla voimassa 2 = A(x + 2) + Bx, joten pohdinnan jälkeen valitsemme
A = 1 ja B = −1. Tällöin yhtäsuuruus (∗) pitää paikkansa. Osamurtohajotelmassa
jaettavana olevan polynomin aste on oltava pienempi tai yhtäsuuri kuin jakajan ja
jakajana olevan polynomin tulee olla jaettuna tekijöihinsä. Jos jaettavan polynomin aste on suurempi kuin jakajan, voidaan suorittaa polynomien jakolasku ennen
osamurtohajotelman soveltamista.
⋄
Osittaisintegroinnista on hyötyä:
Lause 6.4. Olkoon f ja g derivoituvia funktioita. Tällöin on voimassa
Z
Z
′
(6.3)
f (x)g (x) dx = f (x)g(x) − f ′ (x)g(x) dx.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
41
Osittaisintegrointikaava (6.3) on helpompi johtaa kuin muistaa ulkoa. Kaava seuraa tulon derivointisäännöstä, kun kyseinen sääntö integroidaan puolittain:
D(f (x)g(x)) = f (x)g ′ (x) + f ′ (x)g(x) ⇔
Z
f (x)g(x) = (f (x)g ′ (x) + f ′ (x)g(x)) dx.
Osittaisintegrointikaava seuraa tästä käyttämällä integraalin yhteenlaskuominaisuutta ja järjestelemällä yhtälöä uudelleen. Kaavan soveltamiseksi on tunnistettava
tarvittavat funktiot f ja g.
R
Esimerkki 6.7. Lasketaan interaali xex dx. Valitaan f (x) = x ja g ′ (x) = ex ,
jolloin f ′ (x) = 1 ja g(x) = ex . Sovelletaan sitten kaavaa (6.3):
Z
Z
x
x
xe dx = xe − ex dx = xex − ex + c = ex (x − 1) + c.
Olisivatko valinnat f (x) = ex ja g ′ (x) = x johtaneet mihinkään?
⋄
R
Esimerkki 6.8. Lasketaan ln x dx. Valitaan f (x) = ln x ja g ′ (x) = 1, jolloin
1
f ′ (x) = ja g(x) = x. Sovelletaan sitten kaavaa (6.3):
x
Z
Z
1
x dx = x ln x − x + c.
ln x dx = x ln x −
x
Tarkista vastaus derivoimalla.
⋄
Siirrytään määrättyyn integraaliin. RMäärätyssä integraalissa integroidaan funkb
tiota f yli välin [a, b] ja sitä merkitään a f (x) dx. Tulkinta määrätylle integraalille:
Määrätyssä integraalissa on kyse käyrän ja x-akselin väliin jäävästä pinta-alasta,
kun f (x) ≥ 0 millä tahansa x ∈ [a, b].
Esimerkki 6.9. Tarkastellaan vakiofunktiota f (x) = 2 välillä [0, 2]. Tässä tapauksessa ”käyrän” alle jäävä pinta-ala välillä [0, 2] saadaan neliön alana. Neliön ala on:
kanta × korkeus = 2 × 2 = 4.
Ajatellaan tilannetta nyt määrätyn integraalin avulla.R Myöhemmin esitettävän Lauseen
b
6.5 mukaan, määrätty integraali lasketaan kaavalla a f (x) dx = F (b) − F (a). Esimerkissä [a, b] = [0, 2] ja F (x) = 2x + c, joten
Z 2
f (x) dx = F (2) − F (0) = 4.
0
⋄
Käytännössä määrätyn integraalin laskeminen ei juuri eroa määräämättömän integraalin laskemisesta. Määrätyn integraalin laskemiseen tarvitaan määräämättömän integraalin laskemista integraalifunktion F määrittämiseksi ja vähennyslaskua
kuten seuraava lause kertoo.
42
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Lause 6.5. Olkoon funktio F funktion f : [a, b] → R integraalifunktio. Tällöin määrätty integraali saadaan kaavalla
Z b
f (x) dx = F (b) − F (a).
(6.4)
a
Todistus. Rosenlicht (1986).
Usein laskuissa on tapana merkitä välivaihe sijoitukselle:
Z b
b
.
f (x) dx = F (x) = F (b) − F (a).
a
a
Seuraavasta lauseesta käy ilmi määrätyn integraalin perusominaisuuksia:
Lause 6.6. Olkoon c ∈ R ja funktiot f ja g integroituvia. Tällöin
Z b
Z b
Z b
(i)
(f (x) + g(x)) dx =
f (x) dx +
g(x) dx,
a
a
a
Z b
Z b
f (x) dx,
cf (x) dx = c
(ii)
a
a
Z b
Z d
Z b
f (x) dx, kun d ∈ [a, b],
f (x) dx +
f (x) dx =
(iii)
d
Za b
Za b
g(x) dx, kun f (x) ≤ g(x) välillä [a, b].
f (x) dx ≤
(iv)
a
a
Todistus. Rosenlicht (1986).
Esimerkki 6.10.
Z 1
1 .
1 2
1
1
1
x
x
(x + e ) dx =
x + e = · 12 + e 1 − · 02 − e 0 = e − .
2
2
2
2
0
0
⋄
Osittaisintegrointikaava (6.3) tulee määrätyssä integroinnissa muotoon
Z b
Z b
b
.
′
f ′ (x)g(x) dx.
f (x)g (x) dx = f (x)g(x) −
(6.5)
a
a
a
Esimerkki 6.11. Pohditaan määrätyn integraalin sovelluksena kuluttajan- ja tuottajan ylijäämiä. Olkoon tuotteen käänteiskysyntäkäyrä p = d(q) ja käänteistarjontakäyrä p = s(q). Olkoon käänteiskysyntäkäyrä vähenevä ja käänteistarjontakäyrä
kasvava tuotannon suhteen. Käänteiskysyntä edustaa kuluttajien maksuhalukkuutta tietystä tuotannon määrästä. Kokonaismaksuhalukkuus määrästä q0 on siten
Z q0
d(q) dq.
0
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
43
Kuluttajan ylijäämä on kokonaismaksuhalukkuuden ja ostamisesta koituvien kulujen erotus. Tuottajien kannalta käänteistarjontakäyrä edustaa tuotannon rajakustannusta, joten kokonaiskustannus määrästä q0 saadaan
Z q0
s(q) dq.
0
Tuottajan ylijäämä on myyntitulojen ja kokonaiskustannuksen erotus. Kuluttajien
ja tuottajien ylijäämien summa on siten
Z q0
Z q0
Z q0
d(q) dq − pq0 + pq0 −
s(q) dq =
[d(q) − s(q)] dq.
0
0
0
Kuva 6.1 havainnollistaa jo tuttua asiaa:
p
Kuluttajan ylijäämä
s(q)
Tuottajan ylijäämä
p0
d(q)
q0
q
Kuva 6.1. Kuluttajan- ja tuottajan ylijäämät.
Seuraava lause on on tärkeä:
⋄
Lause 6.7. OlkoonR f : [a, b] → R jatkuva funktio ja funktio F : [a, b] → R määritelty
x
kaavalla F (x) = a f (t) dt. Tällöin F on derivoituva ja F ′ (x) = f (x) kaikilla
x ∈ [a, b].
Todistus. Rosenlicht (1986).
R b(x)
Olkoon F (x) = a(x) f (x, t) dt. Seuraava kaava voidaan osoittaa oikeaksi (sopivin
oletuksin, katso Sydsæter et al. 2008):
Z b(x)
dF (x)
∂f (x, t)
′
′
(6.6)
= b (x)f (x, b(x)) − a (x)f (x, a(x)) +
dt.
dx
∂x
a(x)
44
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
7. Differentiaaliyhtälöt
Tavallinen differentiaaliyhtälö sisältää tuntemattoman yhden muuttujan funktion
x(t) ja sen derivaattoja x′ (t), x′′ (t), . . . , x(n) (t). Funktion riippumattoman muuttujan
symbolina käytetään kirjainta t, jonka voi ajatella aikana. Tässä luvussa derivaattai ẋ. Lisäksi eksplisiittinen riippuvuus ajasta t jätetään
taa merkitään joko x′ , dx
dt
yhtälöissä usein merkitsemättä. Differentiaaliyhtälöt ovat keskeinen väline useissa
taloustieteellisissä malleissa, joissa aika on mukana.
Esimerkki 7.1. Yksinkertainen esimerkki differentiaaliyhtälöstä on
dx(t)
(7.1)
= x(t).
dt
Funktion x(t) derivaatta on siis yhtäsuuri kuin funktio itse. Huomataan, että funktio
x(t) = et kelpaisi yhtälön ratkaisuksi. Toisaalta myös funktiot x(t) = 2et ja x(t) =
3et kelpaisivat. Yleisesti yhtälön (7.1) ratkaisuja ovat kaikki muotoa x(t) = cet ,
c ∈ R, olevat funktiot.
⋄
Differentiaaliyhtälön ratkaisulla tarkoitetaan sitä funktiota, joka toteuttaa kyseisen yhtälön, ja differentiaaliyhtälön ratkaisemisella tarkoitetaan yhtälön kaikkien
ratkaisujen löytämistä. Ratkaiseminen voi olla vaikeaa, mutta usein on yksinkertaista tarkistaa, onko jokin funktio jonkin yhtälön ratkaisu.
Esimerkki 7.2. Onko funktio x(t) = 3t differentiaaliyhtälön x′ (t) = x(t)
ratkaisu?
t
x(t)
Derivoimalla ehdokasta saadaan x′ (t) = 3. Toisaalta t = 3 ja tämä on sama kuin
x′ (t), joten funktio x(t) = 3t ratkaisee yhtälön.
⋄
Differentiaaliyhtälöiden yhteydessä tulee tuntea ero yksityisratkaisun ja yleisen
ratkaisun välillä:
(i) Differentiaaliyhtälön yksityisratkaisu jollain välillä I on funktio, joka toteuttaa yhtälön kaikilla t välillä I.
(ii) Differentiaaliyhtälön yleinen ratkaisu on kaikkien yksityisratkaisujen joukko
(se sisältää usein yhden tai useamman vakion).
Esimerkissä 7.1 yleinen ratkaisu on x = cet ja yksi yhtälön yksityisratkaisuista on
x = 2et . Yleisestä ratkaisusta saadaan yksityisratkaisu, jos tehtävässä on annettu
jokin alkuarvo eli funktion arvo jollain muuttujan t arvolla. Yhtälöllä saattaa myös
olla triviaaliratkaisuja, joita kutsutaan myös erikoisratkaisuiksi. Niitä ei (useimmiten) saada yleisestä ratkaisusta millään vakion c arvolla. Jatketaan Esimerkkiä 7.1
lisäämällä tehtävälle alkuarvo.
Esimerkki 7.3. Ratkaistaan alkuarvotehtävä
dx
(7.2)
= x, x(0) = 1.
dt
Alkuarvon, x(0) = 1, mukaan funktion arvo hetkellä t = 0 on 1. Yhtälön yleinen
ratkaisu on muotoa x = cet . Alkuarvon mukaan x(0) = 1, joten yhdistämällä tämä
tieto yleiseen ratkaisuun saadaan määritettyä vakion c arvo: ce0 = 1, joten c = 1.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
45
Alkuarvoon x(0) = 1 liittyväksi (yksityis)ratkaisuksi saadaan siten funktio x = et .
⋄
Esimerkki 7.4. Ratkaistaan differentiaaliyhtälö x′ = t3 . Yleinen ratkaisu saadaan
esimerkiksi integroimalla yhtälö puolittain:
x′ = t 3
⇔
1
x = t4 + c.
4
⋄
Esimerkki 7.5. Ratkaistaan differentiaaliyhtälö x′′ = 1. Integroimalla kerran saadaan x′ = t + c1 . Yleinen ratkaisu saadaan integroimalla toistamiseen:
1
x = t 2 + c1 t + c2 .
2
Yleinen ratkaisu riippuu tässä tapauksessa kahdesta vakiosta c1 ja c2 . Siten jonkin yksityisratkaisun löytämiseen tarvittaisiin kaksi alkuarvoa, toinen funktiolle ja
toinen sen derivaatalle.
⋄
Kertalukua n olevan differentiaaliyhtälön normaalimuoto on
x(n) = f (t, x, x′ , . . . , x(n−1) ),
jossa f on jokin funktio. Kertaluku tarkoittaa yhtälön korkeimman derivaatan kertalukua. Kertalukua n olevan differentiaaliyhtälön yleinen ratkaisu x(t, c1 , . . . , cn )
sisältää (useimmiten) n kappaletta vakioita ci . Siten kertalukua n olevan differentiaaliyhtälön yksityisratkaisua varten tarvitaan n kappaletta alkuarvoja.
Kertalukua n oleva differentiaaliyhtälö on lineaarinen, jos se voidaan esittää muodossa
(7.3)
x(n) + am (t)x(n−1) + · · · + a2 (t)x′ + a1 (t)x = b(t).
Lineaarinen differentiaaliyhtälö ei siis sisällä esimerkiksi funktion tai sen jonkin derivaatan kertolaskua. Yhtälö (7.3) on lisäksi vakiokertoiminen, jos kerroinfunktiot
ai (t) ovat kaikki vakioita (eli eivät riipu ajasta t), ja homogeeninen, jos b(t) = 0.
Esimerkin 7.1 differentiaaliyhtälö on ensimmäisen kertaluvun lineaarinen differentiaaliyhtälö. Se on lisäksi vakiokertoiminen ja homogeeninen.
Esimerkki 7.6.
(i) Yhtälö x′ = x + 2 voidaan kirjoittaa muotoon x′ − x = 2, joten se on ensimmäisen kertaluvun lineaarinen ja epähomogeeninen differentiaaliyhtälö.
(ii) Yhtälö x′ = x(1−x) on ensimmäisen kertaluvun epälineaarinen yhtälö, koska
sitä ei voi kirjoittaa muotoon (7.3).
(iii) Yhtälö 2x′′ = 5x + 7t2 voidaan kirjoittaa muotoon x′′ − 52 x = 27 t2 , joten se
on toisen kertaluvun lineaarinen ja epähomogeeninen differentiaaliyhtälö.
⋄
46
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Luvussa tarkastellaan vain ensimmäisen kertaluvun lineaarisia differentiaaliyhtälöitä, muutamaa epälineaarista yhtälötyyppiä ja toisen kertaluvun lineaarisia ja vakiokertoimisia yhtälöitä. Normaalimuoto ensimmäisen kertaluvun differentiaaliyhtälölle annettuna jokin alkuarvo x0 ∈ R hetkellä t0 on
dx
= f (t, x), x(t0 ) = x0
dt
Alkuarvotehtävää (7.4) ratkaistaessa pyritään etsimään funktiota, joka toteuttaa
kyseisen yhtälön ja annetun alkuarvon. Seuraava lause koskee ratkaisun olemassaoloa ja yksikäsitteisyyttä (teknisiä ykstyiskohtia on karsittu kuten muutamissa
muissakin lauseissa)
(7.4)
Lause 7.1. Jos f (t, x) on jatkuva ja osittaisderivaatta muuttujan x suhteen on
olemassa jatkuvana, alkuarvotehtävällä (7.4) on yksikäsitteinen ratkaisu x(t) jollain
t0 :n sisältävällä välillä.
Todistus. Kurssi Differentiaaliyhtälöt II Kumpulassa. Idea on kirjassa FMEA.
Tärkeintä tällä kurssilla on oppia ratkaisemaan joitakin differentiaaliyhtälöitä.
Aloitetaan ensimmäisen kertaluvun lineaarisista differentiaaliyhtälöistä, jotka ovat
muotoa
(7.5)
x′ + p(t)x = q(t)
Jos funktiot p(t) ja q(t) ovat vakioita, differentiaaliyhtälö on vakiokertoiminen. Tarkastellaan ensin vakiokertoimisen yhtälön ratkaisua niin sanotun integroivan tekijän
avulla. Ratkaistavana on siis yhtälö
(7.6)
x′ + ax = b,
jossa a ja b ovat reaalilukuja. Integroiva tekijä on tässä tapauksessa
(7.7)
e
R
a dt
= eat
(tässä integrointivakio on valittu nollaksi). Kertomalla yhtälö (7.6) molemmin puolin
tällä tekijällä saadaan
eat x′ + aeat x = beat .
Tämä yhtälö selittää integroivan tekijän käytön, koska vasemmalla puolella on funktion eat x derivaatta muuttujan t suhteen (tulon derivointisääntö). Tämän huomion
jälkeen voidaan sitten integroida yhtälö molemmin puolin muuttujan t suhteen,
d at
b
b
(e x) = beat ⇔ eat x = eat + c ⇔ x = + ce−at , c ∈ R.
dt
a
a
Näin on saatu vakiokertoimisen lineaarisen differentiaaliyhtälön yleinen ratkaisu.
Tätä kaavaa ei pidä opetella ulkoa, vaan opetella integroivan tekijän käyttö tässä yhteydessä. Kuten aiemmin, jokin yksityisratkaisu löydetään, jos tehtävässä on
annettu alkuarvo.
(7.8)
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
47
Esimerkki 7.7. Ratkaistaan alkuarvotehtävä
x′ − 2x = 1,
x(0) = 1.
Tässä integroiva tekijä on e−2t . Kerrotaan yhtälön molemmat puolet tällä, jolloin
saadaan e−2t x′ − 2xe−2t = e−2t . Vasemmalle puolelle saadaan näin funktion e−2t x
derivaatta muuttujan t suhteen, jolloin voidaan integroida
d −2t
1
1
(7.9)
(e x) = e−2t ⇔ e−2t x = − e−2t + c ⇔ x = − + ce2t .
dt
2
2
Tämä on differentiaaliyhtälön yleinen ratkaisu (vertaa kaavaan (7.8)). Alkuarvotehtävän ratkaisu saadaan määrittämällä vakion c arvo käyttämällä alkuehtoa x(0) = 1.
⋄
Siis − 12 + c = 1, joten alkuarvotehtävän ratkaisuksi saadaan x = − 12 + 23 e2t .
Entä jos kyseessä ei olekaan vakiokertoiminen yhtälö? Edetään vastaavalla tavalla
eli ratkaistaan yhtälö (7.5) käyttämällä integroivaa tekijää, joka on nyt
e
R
p(t) dt
= eP (t) .
Kerrotaan yhtälö (7.5) integroivalla tekijällä
d P (t)
eP (t) x′ + p(t)xeP (t) = eP (t) q(t) ⇔
(e x) = eP (t) q(t)
dt
Z
Z
eP (t) x =
eP (t) q(t) dt + c
⇔
x = e−P (t)
⇔
eP (t) q(t) dt + e−P (t) c.
Tämä on yhtälön yleinen ratkaisu.
2
Esimerkki 7.8. Ratkaistaan yhtälö x′ − 2tx = et . Integroiva tekijä on nyt
e
R
−2t dt
2
2
= e−t ,
2
2
2
joten kertomalla yhtälö sillä saadaan e−t x′ − 2te−t x = e−t et . Nyt
d −t2
2
2
(e x) = 1 ⇔ e−t x = t + c ⇔ x = et (t + c).
dt
Tarkista derivoimalla ja sijoituksella, että ratkaisu on oikein.
Seuraavaksi tarkastellaan separoituvia differentiaaliyhtälöitä.
⋄
Esimerkki 7.9. Ratkaistaan differentiaaliyhtälö x′ = tx. Erikoisratkaisu on vakio= tx. Ratkaistaan yhtälö siirtämällä
funktio x = 0. Kirjoitetaan yhtälö muotoon dx
dt
muuttujaa x sisältävät termit yhtälön vasemmalle ja muuttujaa t sisältävät termit
yhtälön oikealle puolelle ja integroimalla puolittain.16
Z
Z
dx
1
(7.10)
= tdt ⇔
dx = t dt + c
x
x
eli
1 2
1 2
1 2
1
(7.11) ln |x| = t2 + c ⇔ eln |x| = e 2 t +c ⇔ |x| = e 2 t +c ⇔ x = ke 2 t ,
2
c
jossa k = ±e .
⋄
16Tämä
on laskumenetelmä.
48
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Ylläolevan esimerkin differentiaaliyhtälö on separoituva differentiaaliyhtälö. Differentiaaliyhtälö on separoituva, jos se voidaan kirjoittaa muodossa
dx
= p(t)g(x),
dt
jossa p on jokin muuttujan t funktio ja g jokin muuttujan x funktio. Kirjoitetaan
yhtälö muotoon, jossa muuttujaa x sisältävät termit ovat vasemmalla ja muuttujaa
t sisältävät termit ovat oikealla puolella yhtälöä,
dx
= p(t)dt
g(x)
Tämä voidaan ratkaista integroimalla molemmat puolet, jolloin saadaan
Z
Z
1
(7.12)
dx = p(t) dt + c.
g(x)
Juuri näin toimittiin Esimerkissä 7.9.17 Yhtälöllä saattaa olla muitakin ratkaisuja.
Näin on kun funktiolla g(x) on nollakohtia. Tällöin nollakohdat ovat yhtälön erikoisratkaisuja. Ne ovat siis ratkaisuja, jotka eivät kuulu yhtälön yleiseen ratkaisuun
eli niitä ei saada millään vakion c arvolla. Esimerkissä 7.9 tällainen oli vakiofunktio
x = 0. Miksi sitä ei saada yleisestä ratkaisusta millään vakion arvolla?
Esimerkki 7.10. Ratkaistaan uudelleen Esimerkin 7.1 yhtälö dx
= x, joka on
dt
separoituva. Yhtälössä g(x) = x. Funktiolla g on nollakohta x = 0. Tämä on yhtälön
= dt. Integroimalla
erikoisratkaisu. Siirretään muuttujat omille puolilleen, jolloin dx
x
tämä puolittain saadaan
Z
Z
1
dx = 1 dt + c ⇔ ln |x| = t + c ⇔ eln |x| = et+c ⇔ x = ket ,
x
jossa k = ±ec . Tämä on haluttu ratkaisu. Lisäksi tulee muistaa erikoisratkaisu.
2
⋄
Esimerkki 7.11. Ratkaistaan yhtälö x′ = xt 2 . Tämä yhtälö on separoituva, kun
p(t) = t2 ja g(x) = x12 . Nyt funktiolla g(x) ei ole nollakohtaa. Separoidaan
dx
t2
= 2
dt
x
ja integroidaan
Z
Z
2
x dx = t2 dt+c
⇔
⇔
1 3 1 3
x = t +c
3
3
x2 dx = t2 dt,
⇔
x3 = t3 +3c
⇔
x=
√
3
t3 + 3c.
⋄
Ratkaistaan seuraavaksi yksi sovelluksissa usein esiintyvä differentiaaliyhtälö:
R
17Perustelu
laskumenetelmälle: (ẋ tarkoittaa derivaattaa muuttujan
R t suhteen.) Olkoon H(x) =
1
, jolloin H ′ (x) = h(x). Olkoon lisäksi P (t) = p(t) dt, jolloin Ṗ (t) = p(t).
h(x) dx ja h(x) = g(x)
Koska Ḣ(x) = H ′ (x)ẋ = H ′ (x)p(t)g(x) = p(t), Ḣ = Ṗ . Tällöin H = P + c eli (7.12) pätee.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
49
Esimerkki 7.12. Tarkastellaan logistista kasvufunktiota, joka on muotoa
x
′
x = rx 1 −
.
K
Tässä x tarkoittaa populaation kokoa tietyllä hetkellä, joten sen on oltava positiivinen luku. Yhtälössä K on ympäristön kantokyky ja r on populaation eksponentiaalinen kasvuaste, jos kantokyky olisi ääretön. Parametri r voidaan tulkita yksinkertaisesti populaation hedelmällisyydeksi eli syntyvyyden ja kuolleisuuden erotukseksi.
Oletetaan, että r = 1 ja K = 1, jolloin differentiaaliyhtälö saa muodon,
dx
= x(1 − x).
dt
Tällä yhtälöllä on kaksi erikoisratkaisua x = 0 ja x = 1. Yhtälö on separoituva,
joten saadaan
Z
Z
1
(7.13)
dx = 1 dt + c.
x(1 − x)
Integrointia varten on käytettävä osamurtokehitelmää (katso Esimerkki 6.6)
(7.14)
1
A
B
= +
x(1 − x)
x 1−x
⇔
1
A(1 − x) + Bx
=
.
x(1 − x)
x(1 − x)
Tämä yhtälö pätee, kun A = 1 ja B = 1. Nyt yhtälö (7.13) tulee muotoon (oletus:
populaation koolle pätee 0 < x < 1)
(7.15)
Z
Z x
1
1
dx = 1 dt+c ⇔ ln x−ln (1 − x) = t+c ⇔ ln
+
= t+c,
x 1−x
1−x
joka on sama asia kuin
x
= et+c
1−x
jossa jälleen k = ec .
(7.16)
⇔
x = et+c − xet+c
⇔
x=
ket
,
1 + ket
⋄
Aiemmin käsiteltiin ensimmäisen kertaluvun lineaarisia differentiaaliyhtälöitä, jotka ratkaistiin integroivan tekijän avulla. Toinen tapa ratkaista ensimmäisen kertaluvun lineaarinen differentiaaliyhtälö on jakaa ongelma kahtia homogeenisen yhtälön
yleisen ratkaisun ja täydellisen yhtälön yksityisratkaisun etsimiseen. Alkuperäisen
differentiaaliyhtälön ratkaisu on näiden kahden summa. Olkoon
(7.17)
x′ + p(t)x = q(t).
Tähän liittyvä homogeeninen yhtälö on x′ + p(t)x = 0 ja täydellinen yhtälö on
yhtälö itse. Homogeenisen yhtälön yleinen ratkaisu saadaan separoimalla muuttujat
ja täydellisen yhtälön yksityisratkaisu saadaan arvaamalla, vakion varioinnilla tai
määräämättömien kertoimien keinolla. Täydellisen yhtälön yleinen ratkaisu saadaan
näiden summana.
50
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Esimerkki 7.13. Ratkaistaan yhtälö x′ −2x = 1 uudelleen. Tähän yhtälöön liittyvä
homogeeninen yhtälö on x′ − 2x = 0, jonka yleinen ratkaisu saadaan separoimalla
(7.18)
Z
Z
1
dx = 2 dt + c ⇔ ln |x| = 2t + c ⇔ eln |x| = e2t+c ⇔ x = ke2t ,
x
jossa k = ±ec . Täydellisen yhtälön yksityisratkaisuksi kelpaa arvaus x = − 21 . Täydellisen yhtälön yleinen ratkaisu on siten
1
x = − + ke2t ,
2
joka on sama kuin ratkaisu integroivan tekijän avulla.
⋄
Tässä menetelmässä hankaluutena on täydellisen yhtälön yksityisratkaisun löytäminen. Apuvälineet tätä varten ovat vakion variointi ja määräämättömien kertoimien keino. Näistä jälkimmäinen esitellään toisen kertaluvun yhtälöiden yhteydessä.
Tarkastellaan lopuksi ensimmäisen kertaluvun autonomisen differentiaaliyhtälön
niin sanotun tasapainotilan stabiilisuutta. Differentiaaliyhtälö on autonominen, jos
se on muotoa ẋ = f (x), eli oikea puoli ei riipu suoraan ajasta t. Tämän yhtälön tasapainotila on yhtälön f (x) = 0 ratkaisu. Merkitään tasapainotilaa nyt symbolein x∗ .
Esimerkissä 7.13 tasapainotila on x∗ = − 12 . Tasapainotila on yksi differentiaaliyhtälön ẋ = f (x) ratkaisu (huomaa, että tasapainotilan derivaatta on nolla). Karkeasti
sanoen, jos tasapainotilan läheltä alkavat ratkaisut pysyvät lähellä tasapainotilaa,
tasapainotila on stabiili. Jos lisäksi tasapainotilan läheltä alkavat ratkaisut lähestyvät tasapainotilaa, kun t → ∞, tasapainotila on asymptoottisesti stabiili. Tasapainotila x∗ on asymptoottisesti stabiili, jos f ′ (x∗ ) < 0 eli jos funktion f derivaatta
on tasapainotilassa negatiivinen. Tasapainotila x∗ on epästabiili, jos f ′ (x∗ ) > 0.
Esimerkissä 7.13 tasapainotila on epästabiili, koska yhtälössä f (x) = 2x + 1 ja
f ′ (x) = 2.
Seuraavaksi tutkitaan differentiaaliyhtälöitä, joissa esiintyy myös tuntemattoman
funktion toinen derivaatta. Erityisesti tutkitaan toisen kertaluvun vakiokertoimisia
ja lineaarisia differentiaaliyhtälöitä, jotka voi esittää standardimuodossa
(7.19)
ẍ + a1 ẋ + a0 x = f (t),
a1 , a0 ∈ R,
jossa f on jokin muuttujan t funktio. Tällaisen ratkaiseminen voi olla vaikeaa riippuen tästä funktiosta. Homogeenisen yhtälön
(7.20)
ẍ + a1 ẋ + a0 x = 0,
ratkaiseminen on sen sijaan suoraviivaista. Oletetaan, että funktio x(t) = eλt on
homogeenisen yhtälön ratkaisu. Sijoittamalla x(t) ja sen derivaatat x′ (t) = λeλt ja
x′′ (t) = λ2 eλt homogeeniseen yhtälöön saadaan
λ2 eλt + a1 λeλt + a0 eλt = 0
(7.21)
λ2 + a1 λ + a0 = 0.
⇔
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
51
Toisin sanoen funktio x(t) = eλt on homogeenisen yhtälön ratkaisu täsmälleen kun
λ on yhtälön (7.21) eli niin sanotun karakteristisen polynomin ratkaisu. Karakteristisella polynomilla voi olla ratkaisunaan joko yksi reaaliluku, kaksi reaalilukua tai
sitten kompleksilukupari (liittoluvut). Seuraava lause antaa keinon ratkoa homogeeninen yhtälö:
Lause 7.2. Olkoon
ẍ + a1 ẋ + a0 x = 0
ja olkoot λ1 ja λ2 tähän yhtälöön liittyvän karakteristisen polynomin (7.21) ratkaisut.
Tällöin pätee:
(i) Jos λ1 ja λ2 ovat eri reaalilukuja, homogeenisen yhtälön ratkaisu on
x(t) = C1 eλ1 t + C2 eλ2 t ,
jossa
C1 , C2 ∈ R.
(ii) Jos λ1 ja λ2 ovat sama reaaliluku λ, homogeenisen yhtälön ratkaisu on
x(t) = C1 eλt + C2 teλt ,
jossa
C1 , C2 ∈ R.
(iii) Jos λ1 = α + iβ ja λ2 = α − iβ, homogeenisen yhtälön ratkaisu on
x(t) = eαt (C1 cos(βt) + C2 sin(βt)),
jossa
Todistus. Sydsæter et al. (2008).
C1 , C2 ∈ R.
Vakiot C1 ja C2 voidaan määrittää, jos yhtälölle on annettu alkuarvot x(0) = x0
ja ẋ(0) = x1 .
Esimerkki 7.14. Ratkaistaan alkuarvotehtävä
ẍ − 3ẋ + 2x = 0,
x(0) = 0,
ẋ(0) = 1.
Karakteristisen polynomin λ − 3λ + 2 = 0 ratkaisut ovat λ = 1 ja λ = 2, joten
Lauseen 7.2 mukaan yhtälön (yleinen) ratkaisu on
2
x(t) = C1 et + C2 e2t .
Määritetään vakiot alkuarvojen avulla. Ratkaisun ja alkuarvojen avulla saadaan
yhtälöpari
0 = C1 + C2
1 = C1 + 2C2 .
Parin ratkaisu on C1 = −1 ja C2 = 1. Alkuarvotehtävän ratkaisu on x(t) = −et +e2t .
(Tarkista vastaus derivoimalla ja sijoittamalla).
⋄
Esimerkki 7.15. Ratkaistaan yhtälö
ẍ + 4ẋ + 5x = 0.
Karakteristisen polynomin λ2 + 4λ + 5 = 0 ratkaisut ovat λ = −2 + i ja λ = −2 − i,
joten Lauseen 7.2 mukaan yhtälön ratkaisu on
x(t) = e−2t (C1 cos(t) + C2 sin(t)).
⋄
52
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Lause 7.3. Yhtälön
(7.22)
ẍ + a1 ẋ + a0 x = f (t),
a1 , a0 ∈ R,
ratkaisu saadaan homogeenisen yhtälön ẍ + a1 ẋ + a0 x = 0 yleisen ratkaisun ja
epähomogeenisen yhtälön ẍ + a1 ẋ + a0 x = f (t) yksityisratkaisun summana.
•
Ongelma on epähomogeenisen yhtälön yksityisratkaisun etsiminen. Siihen on useita keinoja, joista tässä esitellään määräämättömien kertoimien keino. Siinä yksityisratkaisua haetaan sopivalla yritteellä, jonka valinta riippuu funktiosta f . Jos
esimerkiksi f on astetta n oleva polynomi, kannattaa yritteeksi kokeilla astetta n
olevaa polynomia. Esimerkiksi, jos f on toisen asteen polynomi, yritteeksi kannattaa asettaa x(t) = A + Bx + Cx2 , jolloin tämän yritteen ja annetun yhtälön avulla
pyritään ratkaisemaan kertoimet A, B ja C siten, että yhtälö toteutuu yritteellä.
Jos f on eksponenttifunktio ceat , kannattaa yritteeksi kokeilla esimerkiksi funktioita
Aeat , Ateat tai At2 eat .18 Lisäksi f voi sisältää trigonometrisia funktioita tai erilaisia kombinaatioita yllä mainituista, jolloin vastaava yrite sisältää samantyyppisiä
funktioita.
Esimerkki 7.16. Ratkaistaan yhtälö ẍ + ẋ − 2x = 3 − 2t. Homogeenisen yhtälön
ẍ + ẋ − 2x = 0 ratkaisu on x(t) = C1 e−2t + C2 et . Etsitään epähomogeenisen yhtälön
yksityisratkaisua yritteen x(t) = A + Bt avulla sijoittaen yrite ja sen derivaatat
yhtälöön. Saadaan
B − 2(A + Bt) = 3 − 2t
⇔
B − 2A − 2Bt = 3 − 2t.
Kertoimien A ja B täytyy siten toteuttaa yhtälöpari
B − 2A = 3,
−2B = −2.
Parin ratkaisu on B = 1 ja A = −1. Siten yksityisratkaisuksi kelpaa x(t) = −1 + t.
Lauseen 7.3 mukaan yleinen ratkaisu on tämän ja homogeenisen yhtälön ratkaisun
summa eli
x(t) = C1 e−2t + C2 et − 1 + t.
⋄
Esimerkki 7.17. Ratkaistaan yhtälö ẍ+4ẋ+4x = e−2t . Homogeenisen yhtälön ẍ+
4ẋ + 4x = 0 ratkaisu on x(t) = C1 e−2t + C2 te−2t . Etsitään epähomogeenisen yhtälön
yksityisratkaisua yritteen x(t) = At2 e−2t avulla sijoittaen yrite ja sen derivaatat
yhtälöön. Saadaan
(2Ae−2t − 4Ate−2t − 4Ate−2t + 4At2 e−2t ) + 4(2Ate−2t − 2At2 e−2t ) + 4At2 e−2t
= e−2t
18Yritteen
e
at
⇔
2A = 1
valinta tässä tapauksessa riippuu homogeenisen yhtälön ratkaisusta. Jos esimerkiksi
ratkaisee homogeenisen yhtälön, Aeat ei toimi yritteenä.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
53
1
Siten yksityisratkaisuksi kelpaa x(t) = t2 e−2t . Lauseen 7.3 mukaan yleinen ratkaisu
2
on tämän ja homogeenisen yhtälön ratkaisun summa eli
1
x(t) = C1 e−2t + C2 te−2t + t2 e−2t .
2
−2t
Yrite Ae
ei toimi (kokeile), kuten ei toimi myöskään yrite Ate−2t .
⋄
54
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
8. Differentiaaliyhtälöt R2 :ssa
8.1. Lineaariset differentiaaliyhtälöt R2 :ssa. Hyödyllisenä tietona seuraava: Toisen kertaluvun homogeeninen differentiaaliyhtälö voidaan kirjoittaa muodossa
(8.1)
ẍ + a1 ẋ + a0 x = 0,
a1 , a0 ∈ R.
Tämä voidaan esittää differentiaaliyhtälöryhmänä, joka koostuu kahdesta ensimmäisen kertaluvun yhtälöstä: otetaan käyttöön uudet muuttujat x1 ja x2 , ja suoritetaan muuttujan vaihdokset x1 = x ja x2 = ẋ. Yhtälö (8.1) voidaan tällöin kirjoittaa
yhtälöryhmänä
ẋ1 = x2 ,
(8.2)
ẋ2 = −a0 x1 − a1 x2 ,
koska ẋ1 = ẋ = x2 ja ẋ2 = ẍ = −a0 x − a1 ẋ = −a0 x1 − a1 x2 .
Tämän luvun alussa kiinnostuksen kohteena ovat muotoa
(8.3)
ẋ = Ax
olevat yhtälöt, jossa x on pystyvektori [x1 , x2 ]T ja A on 2 × 2 vakiomatriisi eli
ẋ1 = ax1 + bx2
ẋ2 = cx1 + dx2 ,
jossa a, b, c, d ∈ R. Tämän differentiaaliyhtälöparin ratkaisulla (jollain aikavälillä)
tarkoitetaan funktioparia (x1 (t), x2 (t)), joka sijoitettuna yhtälöihin toteuttaa ne.
Vaikka tämäntyyppisen differentiaaliyhtälöparin voi ratkaista, on tärkeämpää sovellusten kannalta osata tutkia eräiden ratkaisujen (tasapainoratkaisujen) ominaisuuksia (stabiilisuutta).
Differentiaaliyhtälöparin yksikäsitteinen tasapainoratkaisu on yhtälöiden ẋ1 = 0
ja ẋ2 = 0 ratkaisu eli (x1 , x2 ) = (0, 0), jos kerroinmatriisin determinantti ei ole nolla.
Tavoitteena on tutkia tasapainotilan stabiilisuutta. Differentialiyhtälöryhmän (8.3)
niin sanottu karakteristinen yhtälö on
(8.4)
det(A − λI) = 0,
jossa I on 2 × 2 identtinen matriisi ja λ ∈ R. Karakteristisen yhtälön ratkaisut
ovat siis matriisin A ominaisarvot. Kuten aiemmin, jos tasapainotilan läheltä alkavat ratkaisut pysyvät lähellä tasapainotilaa, niin tasapainotila on stabiili. Jos lisäksi tasapainotilan läheltä alkavat ratkaisut lähestyvät tasapainotilaa, kun t → ∞,
niin tasapainotila on asymptoottisesti stabiili. Jos tasapainotila ei ole stabiili, se on
epästabiili.
Differentiaaliyhtälöryhmän (8.3) stabiilisuusominaisuuksia voidaan tutkia matriisin A ominaisarvojen avulla:
Lause 8.1. Olkoon ẋ = Ax ja A jokin 2 × 2 vakiomatriisi. Tällöin tasapainotila
(x1 , x2 ) = (0, 0) on:
(i) stabiili, jos matriisin A ominaisarvojen reaaliosat ovat negatiiviset tai ominaisarvoista toinen on nolla ja toinen negatiivinen.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
55
(ii) asymptoottisesti stabiili, jos matriisin A ominaisarvojen reaaliosat ovat negatiiviset.
(iii) epästabiili, jos ainakin toinen matriisin A ominaisarvojen reaaliosista on
positiivinen.
•
ẋ
x
1 0
Esimerkki 8.1. Tutkitaan yhtälön 1 =
· 1 tasapainotilan (0, 0) staẋ
0 2
x2
2
1 0
. Lasketaan matriisin A ominaisarvot:
biilisuusominaisuudet. Nyt A =
0 2
1 − λ
0
= 0 ⇔ (1 − λ)(2 − λ) = 0,
0
2 − λ
joten ominaisarvot ovat λ1 = 1 ja λ2 = 2. Molemmat ovat positiivisia reaalilukuja,
joten Lauseen 8.1 perusteella tasapaino on epästabiili.
⋄
x
ẋ1
2
1
· 1 tasapainotilan (0, 0)
Esimerkki 8.2. Tutkitaan yhtälön
=
x2
ẋ2
−8 −3
2
1
. Lasketaan matriisin A ominaisarvot:
stabiilisuusominaisuudet. Nyt A =
−8 −3
2 − λ
1
2
−8 −3 − λ = 0 ⇔ λ + λ + 2 = 0,
√
√
−1 − i 7
−1 + i 7
ja λ2 =
. Ominaisarvojen reaajoten ominaisarvot ovat λ1 =
2
2
liosat on negatiiviset, joten Lauseen 8.1 perusteella tasapaino on asymptoottisesti
stabiili.
⋄
8.2. Epälineaariset differentiaaliyhtälöt R2 :ssa. Tarkastellaan seuraavaksi epälineaarisia differentiaaliyhtälöitä tasossa. Tarkasteltava autonominen differentiaaliyhtälöpari on
ẋ(t) = f (x(t), y(t)),
(P)
ẏ(t) = g(x(t), y(t)),
jossa f ja g oletetaan olevan kerran jatkuvasti derivoituvia. Parin (P) ratkaisun löytäminen, eli funktioiden x(t) ja y(t), jotka toteuttavat kyseisen parin, on vaikeaa.
Ratkaisemisen sijaan pyrimme antamaan keinoja, joiden avulla on mahdollista tutkia differentiaaliyhtälöparin tasapainotilan stabiilisuutta. Tasapainotilassa ei muuttujissa x ja y tapahdu muutoksia eli ẋ ja ẏ ovat nollia. Toisin sanoen tasapainotila
(x∗ , y ∗ ) ratkaisee yhtälöparin
f (x, y) = 0,
g(x, y) = 0.
56
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Esimerkki 8.3. Yhtälöparin
ẋ = 4 − xy
ẏ = x − y,
tasapainotilat ovat (2, 2) ja (−2, −2).
⋄
Yllä olevan epälineaarisen differentiaaliyhtälöparin tapauksessa, tasapainotilojen
stabiilisuuden tutkimiseen voidaan käyttää niin sanottua Jacobin matriisia
fx (x, y) fy (x, y)
,
(8.5)
gx (x, y) gy (x, y)
ja ominaisarvoja:
Lause 8.2. Differentiaaliyhtälöparin (P) tasapainotila on
(i) asymptoottisesti stabiili, jos tasapainotilassa Jacobin matriisin ominaisarvojen reaaliosat ovat negatiiviset.
(ii) epästabiili, jos ainakin toinen Jacobin matriisin ominaisarvojen reaaliosista
on positiivinen tasapainotilassa.
Stabiilisuusominaisuuksia varten riittää usein tutkia Jacobin matriisia tasapainotilassa.
Esimerkki 8.4. Tutkitaan parin
ẋ = 2y + 1
ẏ = x − y,
tasapainotilan − 12 , − 12 stabiilisuus. Jacobin matriisi on
0 2
,
(8.6)
1 −1
ja sen ominaisarvot ovat λ = 1 ja λ = −2, joten tasapainotila on epästabiili.
Esimerkki 8.5. Tutkitaan parin
⋄
ẋ = x(4 − 2x − 2y)
ẏ = y(8 − 6x − 2y),
tasapainotilojen (0, 4), (2, 0), (0, 0) ja (1, 1) stabiilisuus. Jacobin matriisi on
4 − 4x − 2y
−2x
.
(8.7)
−6y
8 − 6x − 4y
Tutkitaan tasapainotilan (1, 1) stabiilisuus sijoittamalla se Jacobin matriisiin, jolloin
−2 −2
.
−6 −2
√
√
Sen ominaisarvot ovat λ = −2 − 2 3 ja λ = −2 + 2 3. Toinen on positiivinen,
joten tasapainotila on epästabiili. Samaan tapaan selvitetään, että tasapainotilat
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
57
(0, 4), (2, 0) ovat asymptoottisesti stabiileja kun taas tasapainotila (0, 0) on epästabiili.
⋄
8.3. Vaihetaso. Vaihetasoanalyysin (phase plane analysis) avulla voidaan tutkia
differentiaaliyhtälöparin ratkaisujen kulkua (ja tasapainotilan tai -tilojen stabiilisuusominaisuuksia). Tarkastellaan sopivaa differentiaaliyhtälöparia
(8.8)
ẋ(t) = f (x(t), y(t))
(8.9)
ẏ(t) = g(x(t), y(t)),
ja sen ratkaisua. Tämän yhtälön jostain alkuarvosta (x0 , y0 ) alkava ratkaisu (x(t), y(t))
muodostaa polun xy-tasoon. Tietyllä hetkellä (esim. t = t1 ) tämä ratkaisu määrittää
xy-tason pisteen (esim. (x(t1 ), y(t1 ))) ja funktiot f ja g määrittävät kussakin ratkaisun muodostaman polun pisteessä suunnan (vektorin) johon ratkaisu on menossa.
Toisaalta jokaiseen alkuarvoon liittyy oma ratkaisunsa, jonka jokaiseen pisteeseen
funktiot f ja g liittävät suunnan (vektorin).
Jätetään argumentti t merkitsemättä. Vaihetasoanalyysin tavoitteena on hahmotella ratkaisujen kulkua tasossa. Tätä varten tulee ensin määrittää niin sanotut
isokliinit. x-isokliini koostuu pisteistä (x, y), jotka toteuttavat yhtälön ẋ = 0 (eli
yhtälön f (x, y) = 0). Näissä pisteissä ei muuttujan x arvoissa tapahdu muutosta,
joten ratkaisun suunta riippuu vain ẏ:stä. Toisin sanoen liikkeen suunta on samansuuntaista y-akselin kanssa. x-isokliini jakaa tason kahtia, toisella puolella ẋ > 0 ja
toisella ẋ < 0.
Vastaavasti y-isokliini koostuu pisteistä (x, y), jotka toteuttavat yhtälön ẏ = 0 (eli
yhtälön g(x, y) = 0). Näissä pisteissä ei muuttujan y arvoissa tapahdu muutosta,
joten ratkaisun suunta riippuu vain ẋ:stä. Toisin sanoen liikkeen suunta on samansuuntaista x-akselin kanssa. Myös y-isokliini jakaa tason kahtia, toisella puolella
ẏ > 0 ja toisella ẏ < 0.
Tasapainotilassa, eli yhtälöiden ẋ = 0 ja ẏ = 0 ratkaisussa, ei tapahdu mitään
liikettä. Vaihetasoanalyysissä tehdään vain kaksi asiaa: piirretään isokliinit ja hahmotellaan suuntia sekä päätellään kuvan perusteellaa tasapainotilan tai tilojen stabiilisuus, jos se vain on mahdollista. (Kaikki luvun kuvat piirretään luennoilla.) Vaihetasoanalyysia kannattaa usein täydentää tutkimalla tasapainotilan stabiilisuutta
myös Jacobin matriisin avulla, jos se on mahdollista.
Esimerkki 8.6. Tehdään vaihetasoanalyysi differentiaaliyhtälöparille
(8.10)
(8.11)
ẋ = x − y
ẏ = y + x − 2.
x-isokliinit pisteet toteuttavat yhtälön y = x ja y-isokliinin pisteet toteuttavat yhtälön y = 2 − x. Niiden leikkauspiste (1, 1) on tasapainopiste. Suora y = x jakaa tason
kahteen osaan. Toisessa osassa ẋ < 0 ja toisessa ẋ > 0. Toisaalta suora y + x − 2 = 0
jakaa tason myös kahteen osaan, toisessa ẏ < 0 ja toisessa ẏ > 0. Siten suorat yhdessä jakavat tason neljään osaan, joissa kaikissa pätee tietty muuttujien x ja y
derivaattojen merkkikombinaatio (esimerkiksi ẋ < 0 ja ẏ < 0).
58
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Miten merkit päätellään? (Periaatteessa riittäisi tarkistaa suunta jokaisessa isokliinien rajaaman neljänneksen yhdessä pisteessä.) Kiinnitetään jokin x:n arvo ja mietitään yhtälöä ẋ = x − y. Kun x on kiinteä, kasvattamalla muuttujan y arvoa
huomataan, että ẋ < 0 suoran y = x yläpuolella. Suoran alapuolella taas ẋ > 0.
Kiinnitetään seuraavaksi jokin muuttujan y arvo. Nyt kasvattamalla muuttujan x
arvoa huomataan, että ẏ > 0 suoran y +x−2 = 0 yläpuolella. Lisäksi ẏ < 0 kyseisen
suoran alapuolella.
⋄
Esimerkki 8.7. Tehdään vaihetasoanalyysi differentiaaliyhtälöparille
(8.12)
ẋ = y 2 + x
(8.13)
ẏ = y + x.
Piirretään jälleen isokliinit. Tasapainopisteitä on nyt kaksi, (0, 0) ja (−1, 1). Miten
derivaattojen ẋ ja ẏ merkit päätellään? Esimerkiksi näin: koska ∂∂xẋ = 1 > 0, käyrän
∂ ẏ
= 1 > 0,
ẋ = 0 oikealla puolella ẋ > 0 ja vasemmalla puolella ẋ < 0. Koska ∂x
käyrän ẏ = 0 oikealla puolella ẏ > 0 ja vasemmalla puolella ẏ < 0.
⋄
Esimerkki 8.8. (Tämä esimerkki on yksinkertaistettu versio Leonardin ja Longin
kirjasta Optimal Control and Static Optimization in Economics.) Tehdään vaihetasoanalyysi differentiaaliyhtälöparille
(8.14)
(8.15)
1
k̇ = sk 2 − δk
ṗ = k − γp,
jossa s, δ ja γ ovat positiivisia lukuja. Muuttuja k on pääoma (eli oletetaan, että
1
k > 0) ja sitä tuotetaan funktion sk 2 mukaisesti. Termi −δk kuvaa pääoman kulumista. Saastetta p (p > 0) syntyy yksi yksikkö per pääomayksikkö ja sitä poistuu
2
systeemistä termin −γp mukaisesti. Nyt k̇ = 0, kun k = 0 tai k = δs , ja ṗ = 0,
kun p = γk . Piirtämällä vaihekuvio kp-tasoon ja tutkimalla tilannetta Jacobin mat
s 2 s2
,
on (asymptoottisesti) stabiili.
riisin avulla huomataan, että tasapaino
δ
γδ 2
Piirtelyyn palataan luennolla.
⋄
Tutkitaan seuraavaksi yhtälön ẋ = Ax, jossa A on 2 × 2 vakiomatriisi, vaihetasokuvioita, jotka piirretään luennoilla. Oletetaan, että det(A) 6= 0. Tämä oletus takaa,
että (0, 0) on ainoa tasapainopiste. Olkoon yhtälö muotoa
ẋ1
x
a b
· 1
=
ẋ2
c d
x2 .
a − λ
b
=
Vaihetasokuvio riippuu matriisin A ominaisarvoista, jotka ovat yhtälön c
d − λ
0 eli yhtälön λ2 − (a + d)λ + (ad − bc) = 0 ratkaisut. Matriisin A jälki tr(A) on
a + d ja determinantti det(A) on ad − bc, joten yhtälö voidaan kirjoittaa lyhyemmin
muodossa λ2 − tr(A)λ + det(A) = 0. Sen ratkaisut ovat
p
tr(A) ± tr(A)2 − 4 det(A)
.
(8.16)
λ=
2
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
59
Ominaisarvot ovat joko reaalilukuja tai kompleksilukuja riippuen matriisin A jäljestä ja determinantista. Merkitään diskriminanttia tr(A)2 − 4 det(A) kirjaimella D.
Tarkastellaan seuraavaksi tavallisimmat tapaukset.
Jos D > 0, yhtälön (8.16) ratkaisut ovat reaalilukuja. Jos lisäksi det(A) > 0 ja
tr(A) < 0, ominaisarvot ovat negatiivisia eli λ1 < λ2 < 0. Tällöin tasapainotila on
asymptoottisesti stabiili. Jos D > 0 ja lisäksi det(A) > 0 ja tr(A) > 0, ominaisarvot
ovat positiivisia eli λ1 > λ2 > 0. Tällöin tasapainotila on epästabiili. Jos D > 0
ja lisäksi det(A) < 0, ominaisarvot ovat ovat erimerkkisiä eli λ1 < 0 < λ2 . Tällöin
tasapainotila on epästabiili (niin sanottu satulapiste).
Jos D < 0 eli det(A) > 14 tr(A)2 , yhtälön (8.16) ratkaisut ovat kompleksilukuja.
Jos tr(A) > 0, ominaisarvojen reaaliosat ovat positiiviset. Siten tasapainotila on
epästabiili. Jos D < 0 ja tr(A) < 0, ominaisarvojen reaaliosat ovat negatiiviset.
Siten tasapainotila on asymptoottisesti stabiili.
60
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
9.
3
2
sivua differenssiyhtälöistä
Olkoon x yhden muuttujan funktio, x(t), jonka määrittelyjoukkona ovat luonnolliset luvut {0, 1, 2, . . .}.19 Muuttuja t, jonka arvot kuuluvat siis joukkoon {0, 1, 2, . . .},
voidaan tulkita periodiksi tai hetkeksi. Funktion x arvo voisi olla vaikka kulutuksen
määrä tai jonkin populaation koko tietyllä periodilla. Differenssiyhtälöitä tarvitaan
tilanteissa, joissa funktion x arvo jonain hetkenä riippuu tietyllä tapaa aiempien
periodien funktion x arvoista. Differenssiyhtälöitä tarvitaan esimerkiksi optimointimalleissa ja ekonometriassa.
Differenssiyhtälössä tuntematon on funktio x(t), jota differenssiyhtälöiden tapauksessa merkitään xt . Eräs differenssiyhtälö on
(9.1)
xt+1 = f (t, xt ),
jossa f on jokin kahden muuttujan funktio. Differenssiyhtälön ratkaisemisella tarkoitetaan tuntemattoman funktion xt määräämistä siten, että se toteuttaa annetun differenssiyhtälön. Kurssilla käsitellään vain joitakin ensimmäisen kertaluvun
lineaarisia differenssiyhtälöitä ja niiden ratkaisemista sekä hieman stabiilisuutta.
Korkeamman kertaluvun yhtälöistä ja yhtälösysteemeistä kiinnostunut voi opiskella
kirjaa FMEA.
Differenssiyhtälö (9.1) on ensimmäistä kertalukua, koska siinä tuntemattoman
funktion arvo periodilla t + 1 riippuu vain edellisen periodin arvosta. Ensimmäisen
kertaluvun lineaarinen ja vakiokertoiminen differenssiyhtälö on muotoa
(9.2)
xt+1 = axt + f (t),
jossa f (t) on annettu reaaliarvoinen funktio, a on annettu reaaliluku ja a 6= 1.20
Tutkitaan tapausta, jossa f (t) on jokin vakiofunktio, sanotaan f (t) ≡ b. Jos tuntemattoman funktion arvo periodilla 0, x0 , on annettu, saadaan seuraavan periodin
arvo yksinkertaisesti sijoittamalla edellisen periodin arvo yhtälöön (9.2) (lukijan
tehtävä on varmistaa, että yhtälöt ovat oikein.):
x0 ,
x1 = ax0 + b,
x2 = a2 x0 + (a + 1)b,
x3 = a3 x0 + (a2 + a + 1)b,
..
.
xt = at x0 + (at−1 + at−2 + . . . + a + 1)b.
Viimeinen yhtälö antaa tuntemattoman funktion arvon minä tahansa periodina. Lisäksi sijoittamalla tämä yhtälöön, tiedetään, että tämä funktio on ratkaisu. Ratkaisu
19Määrittelyjoukko
20Jos
voi olla myös jokin tämän joukon osajoukko.
a = 1, mikä on yhtälön ratkaisu?
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
voidaan kirjoittaa muodossa (miksi näin?)
b
b
1 − at
t
t
b = a x0 −
+
.
(9.3)
xt = a x0 +
1−a
1−a
1−a
61
b
, yhtälön ratkaisu on x0 millä periodilla tahansa. Tämä alkuarvo on
Jos x0 = 1−a
yhtälön tasapainotila; jos ratkaisu alkaa tasapainotilasta, se pysyy siinä. Miten tasapainotila voidaan määrätä yhtälöstä (9.2)? Toinen tärkeä asia ratkaisuun liittyen
on, että ratkaisu sisältää eksponenttifunktion, jossa kantalukuna on a. Kun alkuarvo
ei ole tasapainotila, luku a määrää miten ratkaisu käyttäytyy. Jos |a| < 1, tasapainotila on asymptoottisesti stabiili (eli tasapainotilaa läheltä alkava ratkaisu lähestyy
tasapainotilaa ajan mennessä eteenpäin).
Kun ensimmäisen kertaluvun lineaarinen differentiaaliyhtälö ei ole vakiokertoiminen, vaan xt+1 = a(t)xt + f (t), yhtälölle löydetään ratkaisukaava, mutta se ei ole
niin yksinkertainen kuin (9.3) (katso FMEA). Hyvä harjoitustehtävä on kuitenkin
tutkia millainen on yhtälön xt+1 = axt + f (t) ratkaisukaava.
62
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
LIITE 1: Kertaus trigonometrisistä funktioista
Kulmia mitataan joko asteina välillä [0, 360] tai radiaaneina välillä [0, 2π]. Yksi
radiaani on 180 astetta jaettuna piillä. Tavoitteena on palautella mieliin trigonometrian perusasioita.
Tarkastellaan suorakulmaista kolmiota, jonka kateetit ovat x ja y sekä hypotenuusa on r. Olkoon hypotenuusan ja toisen kateetin välinen kulma θ.
r
y
θ
x
p
Pythagoraan lauseen r2 = x2 + y 2 mukaan r = x2 + y 2 . Määritellään sini-,
kosini- ja tangenttifunktiot:
y
x
y
Määritelmä 9.1.
sin θ = ,
cos θ = ,
tan θ = .
◦
r
r
x
Tarkastellaan origokeskistä yksikköympyrää ja sen sisältäviä suorakulmaisia kolmioita, joiden hypotenuusan pituus on yksi, toinen teräväkulma on origossa ja toinen yksikköympyrän kehällä. Nyt r = 1 ja ympyrän kehän pituus on siten 2π. Sinin
ja kosinin määrittelyjoukkona on reaalilukujen joukko ja arvojoukkona on suljettu
väli [−1, 1], kun taas tangentin määrittelyjoukkona ovat reaaliluvut poislukien π/2
ja sen monikerrat, eli luvut π/2 + nπ, jossa n ∈ Z. Tangenttifunktion arvojoukko
on R.
(0, 1)
b
(cos θ, sin θ)
b
(x, y)
45◦
θ
(1, 0)
Kuva 9.1. Yksikköympyrä.
Kuvan oikeassa yksikköympyrässä kulma θ on 45-astetta. Radiaaneissa tämä kulma on π4 eli kahdeksas osa yksikköympyrän kehän pituudesta. Tämän kulman sini
ja kosini ovat sama luku (miksi?), joten Pythagoraan lauseen x2 + y 2 = 1 mukaan
x = y = √12 . Siis cos π4 = √12 ja sin π4 = √12 .
Seuraavaan lauseeseen on kerätty joitain kaavoja.
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
Lause
(i)
(ii)
(iii)
(iv)
(v)
(vi)
(vii)
(viii)
63
9.1.
sin2 θ + cos2 θ = 1
sin(θ ± φ) = sin θ cos φ ± cos θ sin φ
cos(θ ± φ) = cos θ cos φ ∓ sin θ sin φ
sin θ = sin(θ + 2nπ)
cos θ = cos(θ + 2nπ)
tan θ = tan(θ + nπ)
sin(2θ) = 2 sin θ cos θ
cos(2θ) = cos2 θ − sin2 θ.
Todistus. Sydsæter et al. (2008) (katso kirjan harjoitustehtävät).
Kohtien (iv) ja (v) mukaan sini- ja kosinifunktioiden periodi on 2π (Jos siis kulmaa
θ kierretään kerran kehän ympäri, jolloin n = 1, päädytään samaan kohtaan kehällä
josta lähdettiin.) Sini- ja kosinifunktioiden kuvaajat näyttävät tältä:
1
−3π
2
−π
−π
2
−1
π
2
π
3π
2
2π
5π
2
3π
Kuva 9.2. Sini- ja kosinifunktioiden kuvaajat.
Oikeasti kurssilla tarvitaan trigonometriasta sini- ja kosinifunktioiden derivaatat:
D sin(x) = cos(x) ja D cos(x) = − sin(x).
64
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
LIITE 2: Kompleksiluvut lyhyesti
Esimerkki 9.1. Mitä ovat yhtälön x2 + 1 = 0 ratkaisut? Yhtälöllä ei ole ratkaisuja
reaalilukujen joukossa, koska minkään reaaliluvun neliö ei ole −1 (Miltä funktion f ,
f (x) = x2 + 1, kuvaaja näyttää?). Yhtälöllä on kuitenkin ratkaisu kompleksilukujen
joukossa.
⋄
Määritelmä 9.2. Luku z = x+iy on kompleksiluku, jossa reaaliluku x on kompleksiluvun reaaliosa ja reaaliluku y on kompleksiluvun imaginaariosa. Imaginaariyksikölle i on voimassa i2 = −1. Kompleksiluvun z = x + iy reaaliosaa merkitään Re(z)
ja imaginaariosaa Im(z). Kompleksilukujen joukkoa merkitään symbolilla C.
◦
Esimerkki 9.2.
(i) x2 + 1 = 0
⇔
(ii) x2 − 4x + 13 = 0
√
⇔ √
x = ± −1 ⇔ x = ±i.
4 ± 6 −1
x=
⇔ x = 2 ± i3.
2
x2 = −1
⇔
⋄
Määritelmä 9.3. Kompleksiluvun z = x + iy liittoluku tai kompleksikonjugaatti
◦
on z = x − iy. Toisin sanoen x + iy = x − iy.
Kompleksilukuja voidaan havainnollistaa seuraavalla kuvalla, jossa vaaka-akselina
on reaaliakseli ja pystyakselina on imaginaariakseli.
Im
y
x + iy
x
−y
Re
x − iy
Kuva 9.3. Kompleksiluvut z = x + iy ja z = x − iy.
Olkoot z = x + iy ja w = u + iv kompleksilukuja. Niiden summa on
z + w = (x + u) + i(y + v).
Niiden erotus on
Niiden tulo on
z − w = (x − u) + i(y − v).
zw = (x + iy)(u + iv) = xu + ixv + iyu + i2 yv = xu − yv + i(xv + yu),
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
65
koska i2 = −1. Niiden osamäärä on
x + iy u − iv
xu − ixv + iyu − i2 yv
z
=
·
=
w
u + iv u − iv
u2 + v 2
xu + yv
yu − xv
= 2
+i 2
.
2
u +v
u + v2
Yllä olevan laskun mukaan liittolukujen tulolle pätee zz = x2 + y 2 .
Esimerkki 9.3.
(i) (−7 + i5) − (2 − i5) = −7 − 2 + i(5 + 5) = −9 + i10
(ii) (2 − i3)(2 + i3) = 4 + i6 − i6 + (−i3)(i3) = 4 + 9 = 13
4 + i3 1 − i2
4 − i8 + i3 − i2 6
4 + i3
=
=
=2−i
(iii)
1 + i2
1 + i2 1 − i2
1 + 22
⋄
p
Kompleksiluvun z = x+iy moduli tai pituus on |z| = x2 + y 2 . Lisäksi kompleksiluvuille z = x + iy ja w = u + iv pätee muun muassa
(i) z + w = z + w
(ii) zw = z w
(iii) z = z
(iv) |z + w| ≤ |z| + |w|.
Kompleksiluvun z = x + iy argumentti on kulma θ, jolle on voimassa yhtälöt
x
y
cos θ =
ja sin θ =
.
|z|
|z|
Argumentti on välillä [0, 2π) yksikäsitteinen ja sitä merkitään arg z = θ. Kompleksiluku z = x + iy voidaan ylläolevien yhtälöiden perusteella ilmaista napakoordinaateissa (siis argumentin ja modulin avulla)
z = |z|(cos θ + i sin θ).
Seuraavassa kuvassa on ilmaistu kompleksiluku napakoordinaateissa sekä sen moduli
ja argumentti.
|z|(cos θ + i sin θ)
b
|z|
θ
Kuva 9.4. Kompleksiluku z = x + iy napakoordinaateissa.
66
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE
√
Esimerkki 9.4. Muutetaan
kompleksiluku
z
=
2
3 + i2 napakoordinaatteihin.
√
Luvun moduli on |z| = 12 + 4 = 4. Luvun argumentille ovat voimassa yhtälöt
√
√
3
2
1
2 3
=
ja sin θ = = ,
cos θ =
4
2
4
2
π
joten arg z = . Luku z voidaan esittää muodossa
6
π
π
z = 4(cos + i sin ).
6
6
⋄
Tutkitaan seuraavaksi kompleksiluvun potensseja. Olkoon z = x + iy, jolloin
napakoordinaattien avulla saadaan
z 2 = (|z|(cos θ + i sin θ))2 = |z|2 (cos θ + i sin θ)2
= |z|2 (cos2 θ + 2i cos θ sin θ − sin2 θ)
= |z|2 (cos(2θ) + i sin(2θ)).
Viimeisessä yhtäsuuruudessa käytettiin Lauseen 9.1 kahta viimeistä kaavaa. Kompleksitasossa kompleksiluvun toinen potenssi tarkoittaa siten modulin neliöintiä ja argumentin tuplaamista. Induktiolla voidaan osoittaa seuraava kaava oikeaksi:
(9.4)
z n = |z|n (cos(nθ) + i sin(nθ)),
mutta se mitä kurssilla näistä asioista oikeasti tarvitaan on i =
√
−1.