YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Tämä
Transcription
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Tämä
YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Tämä luentomoniste on koottu useista lähteistä, joista tärkeimmät lienevät Sydsæter & Hammond (2008), Sydsæter et al. (2008) ja Simon & Blume (1994). Lisään luentomonisteeseen lukuja luentojen edistymisen mukaan. Sisältö on kuitenkin jo melko lailla selvillä. 1 2 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Sisältö 1. Matriiseista 3 1.1. Matriisin ominaisarvot ja -vektorit 3 1.2. Matriisin definiittisyys 4 2. Konkaavit ja konveksit funktiot 7 3. Ääriarvotehtävistä 12 3.1. Rajoittamaton ääriarvotehtävä 12 3.2. Yhtälörajoitteinen ääriarvotehtävä, Lagrangen menetelmä ja kerroin 15 4. Ääriarvotehtävät epäyhtälörajoitteilla 21 5. Komparatiivinen statiikka 29 5.1. Kokonaisdifferentiaali 29 5.2. Ketjusäännöt 31 5.3. Implisiittifunktiolauseet 32 6. Integraalilaskentaa 38 7. Differentiaaliyhtälöt 44 8. Differentiaaliyhtälöt R2 :ssa 54 8.1. Lineaariset differentiaaliyhtälöt R2 :ssa 54 8.2. Epälineaariset differentiaaliyhtälöt R2 :ssa 55 8.3. Vaihetaso 57 60 9. 23 sivua differenssiyhtälöistä LIITE 1: Kertaus trigonometrisistä funktioista 62 LIITE 2: Kompleksiluvut lyhyesti 64 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 3 1. Matriiseista Tarvittavia esitietoja ovat mm. lineaarisen yhtälöryhmän ratkaiseminen, matriisilaskutoimitukset (summa, erotus ja tulo), eräät matriisityypit (neliömatriisi, symmetrinen matriisi ja identtinen matriisi) ja determinantin laskeminen. Palauta kurssilta Y100 mieleen myös käänteismatriisi ja niin sanottu Cramerin sääntö. 1.1. Matriisin ominaisarvot ja -vektorit. Tulkitaan vektori x = (x1 , . . . , xn ) (sarake)vektorina x = [x1 , . . . , xn ]T . Olkoon A neliömatriisi, jonka koko on n × n. Määritelmä 1.1. Luku λ on matriisin A ominaisarvo, jos on olemassa vektori x = [x1 , . . . , xn ]T 6= 0 siten, että (1.1) Ax = λx. Vektori x on ominaisarvoon λ liittyvä ominaisvektori. ◦ Jos matriisin A ajatellaan vastaavan kuvausta (funktiota), ominaisvektorin idea selvenee hieman. Kun kuvataan ominaisvektoria x matriisin A avulla, saadaan kuvaksi ominaisarvo kertaa ominaisvektori. Voi ajatella, että ominaisvektorin kuvaaminen matriisilla on sama asia kuin sen venyttäminen tai kutistaminen ominaisarvollaan (myös suunta voi muuttua). Ominaisarvoja ja -vektoreita tarvitaan useissa tilanteissa, kuten optimoinnissa ja differentiaaliyhtälöissä. Kirjoitetaan yhtälö(ryhmä) Ax = λx muotoon (A − λI)x = 0, jossa I on identtinen matriisi. Seuraava lause antaa tavan laskea matriisin A ominaisarvot. Lause 1.1. Luku λ on matriisin A ominaisarvo, jos ja vain jos |A − λI| = 0. Todistus. Sydsæter et al. (2008). Lauseen 1.1 mukaan ominaisarvo saadaan yhtälön |A − λI| = 0 ratkaisuna. Tämä yhtälö on polynomiyhtälö, joten sen ratkaisut saattavat olla myös kompleksilukuja (katso Liite 2). 1 −2 ominaisarvot ovat Lauseen 1.1 mukaisesti seuEsimerkki 1.1. Matriisin −3 2 raavan yhtälön ratkaisut. 1 0 1 −2 = 0. −λ det 0 1 −3 2 Suorittamalla matriisilaskutoimitukset ja kehittämällä determinantti yhtälö saadaan muotoon (1 − λ)(2 − λ) − 6 = 0. Yhtälön ratkaisut, ja siten ominaisarvot, ovat λ = 4 ja λ = −1. ⋄ Matriisin A jälki, jota merkitään tr(A), on matriisin A diagonaalialkioiden summa. a b ominaisarvot ovat yhtälön λ2 − (a + d)λ + ad − Esimerkki 1.2. Matriisin c d cb = 0 ratkaisut. Huomaa, että tämä yhtälö voidaan kirjoittaa myös muodossa λ2 − tr(A)λ + det(A) = 0. ⋄ 4 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 1 1 −1 Esimerkki 1.3. Lasketaan matriisin 0 2 0 ominaisarvot. Ne ovat yhtälön 2 0 0 1 − λ 1 −1 0 2 − λ 0 = −(1 − λ)(2 − λ)λ + (2 − λ)2 = 0 2 0 −λ ratkaisut. Yhtälö voidaan kirjoittaa muotoon (2 − λ)(λ2 − λ + 2) = 0, jolloin sen ratkaisut, ja siten ominaisarvot, ovat λ = 2, λ = 12 + i √ Tässä i on niin sanottu imaginääriyksikkö, jolle pätee −1 = i. √ 7 2 ja λ = 1 2 −i √ 7 . 2 ⋄ Ominaisarvojen laskemisen jälkeen jokaiseen ominaisarvoon λ liittyvä ominaisvektori x saadaan yhtälöryhmän (A − λI)x = 0 ratkaisuna. 1 −2 ominaisarvot ovat λ = 4 ja λ = −1. OminaiEsimerkki 1.4. Matriisin −3 2 sarvoon λ = 4 liittyvä ominaisvektori x = [x1 , x2 ]T on yhtälön x1 1 0 −3 −2 x1 1 −2 −4 =0 ⇔ =0 0 1 x2 −3 −2 x2 −3 2 ratkaisu. Kirjoitetaan yhtälö tavalliseen tyyliin yhtälöparina −3x1 − 2x2 = 0, −3x1 − 2x2 = 0. Yhtälöt ovat samat, jolloin mikä tahansa nollasta poikkeava vektori, joka toteuttaa yhtälön −3x1 − 2x2 = 0, kelpaa ominaisarvoa λ = 4 vastaavaksi ominaisvektoriksi. Tällaiseksi vektoriksi käy esimerkiksi [x1 , x2 ]T = [2, −3]T . Ominaisarvoa λ = −1 vastaavaksi ominaisvektoriksi voidaan valita esimerkiksi [x1 , x2 ]T = [1, 1]T , koska ominaisarvoa λ = −1 käyttäen määritelmän yhtälöpariksi saadaan 2x1 − 2x2 = 0, −3x1 + 3x2 = 0. ⋄ Ominaisvektori ei siis ole yksikäsitteinen. Kuten Esimerkissä 1.3, ominaisarvo saattaa olla kompleksiluku, mutta on mahdollista osoittaa, että symmetrisen matriisin ominaisarvot ovat reaalilukuja. Lisäksi n × n matriisin, jonka ei tarvitse olla symmetrinen, determinantti on ominaisarvojen tulo ja jälki on niiden summa. 1.2. Matriisin definiittisyys. Matriisista A (ei tarvitse olla neliömatriisi) voidaan muodostaa erilaisia alimatriiseja poistamalla mitkä tahansa rivit ja mitkä tahansa sarakkeet. Tarkastellaan kuitenkin vain neliömatriisin alimatriiseja. Olkoon sen koko n × n. Tarpeellisimmat alimatriisit ovat ne, jotka saadaan poistamalla samat rivit ja sarakkeet. Nämä ovat pääalimatriiseja. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 2 Esimerkki 1.5. Muodostetaan matriisin 0 2 matriiseista on matriisi itse. Kolme seuraavaa taan sama rivi ja sama sarake: 2 2 2 0 , , 2 0 0 2 5 0 2 2 4 pääalimatriisit. Yksi pääali4 0 pääalimatriisia saadaan, kun poiste 2 4 . 4 0 Kolme viimeistä pääalimatriisia saadaan, kun poistetaan kaksi samaa riviä ja saraketta: 2 , 2 , 0 . ⋄ Johtavat pääalimatriisit ovat ne matriisit, jotka saadaan poistamalla yhtä monta viimeistä riviä ja saraketta. Mitkä matriisit ovat johtavia pääalimatriiseja esimerkkissä 1.5? Pääalimatriiseihin liittyviä determinantteja kutsutaan pääalideterminanteiksi (tai pääminoreiksi) ja vastaavasti johtavaan pääalimatriisiin liittyvää determinanttia kutsutaan johtavaksi pääalideterminantiksi (tai johtavaksi pääminoriksi). Johtavilla pääminoreilla on keskeinen rooli pääteltäessä jonkin matriisin niin sanottua definiittisyyttä. Merkitään johtavia pääminoreita alaindeksein |Ak |, jossa alaindeksi osoittaa, että kyseessä on se johtava pääminori, joka on saatu poistamalla n−k viimeistä riviä ja saraketta. Tässä n on siis matriisin A rivien ja sarakkeiden lukumäärä. Esimerkki 1.6. Esimerkin 1.5 matriisin johtavat pääminorit ovat: |A1 | = 2, |A2 | = 4, |A3 | = −40. ⋄ Lause 1.2. Olkoon A symmetrinen matriisi, jonka koko on n × n. Tällöin (i) A on positiivisesti definiitti matriisi, jos ja vain jos kaikki johtavat pääminorit ovat aidosti positiivisia eli |A1 | > 0, |A2 | > 0, |A3 | > 0, . . . (ii) A on negatiivisesti definiitti matriisi, jos ja vain jos jokaisen johtavan pääminorin merkki on sama kuin (−1)k eli |A1 | < 0, |A2 | > 0, |A3 | < 0, . . . (iii) A on indefiniitti matriisi, jos jokin nollasta poikkeava johtava pääminori rikkoo kohtien i) tai ii) ehdot. Todistus. Simon & Blume (1994). 6 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 4 1 on positiivisesti definiitti, koska |A1 | = 4 > 0 ja Esimerkki 1.7. Matriisi 1 2 |A2 | = 7 > 0. Matriisi −2 0 0 0 −2 −1 0 −1 −3 on sen sijaan negatiivisesti definiitti, koska |A1 | = −2 < 0, |A2 | = 4 > 0 ja |A3 | = −10 < 0. ⋄ Esimerkki 1.8. Esimerkin 1.5 matriisi on indefiniitti, koska A1 > 0 ja |A3 | < 0. ⋄ Matriisi voi olla myös semidefiniitti: Lause 1.3. Olkoon A symmetrinen matriisi, jonka koko on n × n. Tällöin (i) A on positiivisesti semidefiniitti matriisi, jos ja vain jos kaikki pääalideterminantit (pääminorit) ovat ei-negatiivisia. (ii) A on negatiivisesti semidefiniitti matriisi, jos ja vain jos −A on positiivisesti semidefiniitti. Todistus. Todistus löytyy lineaarialgebran kirjallisuudesta. (Lisätiedot: Sydsæter et al. 2008.) 1 1 1 ei ole definiitti, koska |A2 | = 0. Nyt |A1 | = Esimerkki 1.9. Matriisi A = 2 1 2 2 ja toinen 1 × 1-pääalimatriisin determinantti on 2. Kaikki pääminorit ovat siis einegatiivisia, joten matriisi on positiivisesti semidefiniitti. ⋄ Vaihtoehtoisesti definiittisyys voidaan määrittää ominaisarvojen avulla. Lause 1.4. Olkoon A symmetrinen matriisi, jonka koko on n × n. Tällöin (i) A on positiivisesti definiitti, jos ja vain jos sen kaikki ominaisarvot ovat aidosti positiivisia. (ii) A on positiivisesti semidefiniitti, jos ja vain jos sen kaikki ominaisarvot ovat positiivisia. (iii) A on negatiivisesti definiitti, jos ja vain jos sen kaikki ominaisarvot ovat aidosti negatiivisia. (iv) A on negatiivisesti semidefiniitti, jos ja vain jos sen kaikki ominaisarvot ovat negatiivisia. (v) A on indefiniitti, jos ja vain jos osa matriisin A ominaisarvoista on negatiivisia ja osa positiivisia. Todistus. Sydsæter et al. (2008). Definiittisyyden päättely ominaisarvojen avulla voi kuitenkin olla vaikeaa. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 7 2. Konkaavit ja konveksit funktiot Tässä vaiheessa on hyvä kerrata käsite osittaisderivaatta, sen laskeminen ja yhden muuttujan funktion konkaavisuus ja konveksisuus. Olkoot x, y ∈ Rn kaksi pistettä, siis x = (x1 , . . . , xn ) ja y = (y1 , . . . , yn ). Näiden pisteiden yhdysjana on koostuu pisteistä z, jotka ovat muotoa z = λx + (1 − λ)y jollakin reaaliluvulla λ ∈ [0, 1]. Jos λ = 0, z = y. Jos taas λ = 1, z = x. Määritelmä 2.1. Joukko X ∈ Rn on konveksi, jos se sisältää kaikkien pisteidensä väliset yhdysjanat eli jos millä tahansa x, y ∈ X ja λ ∈ [0, 1], pätee z = λx + (1 − λ)y ∈ X. Kuva 2.1 havainnollistaa tilannetta tason R2 tapauksessa. ◦ x z y Kuva 2.1. Vasen kuva: Ei-konveksi joukko. Oikea kuva: Konveksi joukko. Esimerkki 2.1. Olkoot x1 ja x2 hyödykkeiden 1 ja 2 määrät. Hyödykkeiden määrät eivät voi olla negatiivisia, joten sekä x1 ≥ 0 että x2 ≥ 0. Näiden hyödykkeiden määrät kuuluvat positiiviseen tason neljännekseen eli joukkoon R2+ , joka on konveksi joukko. Myös joukko R2++ , jossa x1 > 0 ja x2 > 0, on konveksi joukko. Myös kuluttajan budjettijoukko B = {(x1 , x2 ) ∈ R2 | x1 ≥ 0, x2 ≥ 0, p1 x1 + p2 x2 ≤ I}, on konveksi. Tässä p1 ja p2 ovat hyödykkeiden hinnat ja I on kuluttajan tulot. Piirrä tämä joukko tasoon. Kuinka todistaisit Määritelmään 2.1 perustuen, että joukko B on konveksi? ⋄ Määritelmä 2.2. Olkoon X ⊂ Rn konveksi joukko. Funktio f : X → R on (i) konkaavi joukossa X, jos kaikille eri pisteille x, y ∈ X ja λ ∈ (0, 1) pätee epäyhtälö f (λx + (1 − λ)y) ≥ λf (x) + (1 − λ)f (y), (ii) konveksi joukossa X, jos kaikille eri pisteille x, y ∈ X ja λ ∈ (0, 1) pätee epäyhtälö f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y). (iii) Lisäksi funktion sanotaan olevan aidosti konkaavi tai aidosti konveksi joukossa X, jos yllä olevat epäyhtälöt pätevät aitoina kaikilla λ ∈ (0, 1). ◦ 8 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Määritelmän oletus joukon X konveksisuudesta on oleellinen, koska se takaa, että joukon X kahden pisteen välisen yhdysjanan pisteet kuuluvat myös joukkoon X. Funktio on siis konkaavi, jos minkä tahansa funktion määrittelyjoukon X pisteiden yhdysjanan pisteen kuva, eli f (λx + (1 − λ)y), on suurempi tai yhtäsuuri kuin pisteiden kuvien välisen yhdysjanan piste λf (x) + (1 − λ)f (y). Konkaavin funktion kuvaaja on kupera ja konveksin funktion kuvaaja on kovera. Kuvassa 2.2 on esitetty konkaavin funktion kuvaaja (ja z = λx + (1 − λ)y). f (z) f (x) λf (x) + (1 − λ)f (y) f (y) x z y Kuva 2.2. Konkaavi funktio. (Piirrä itse viereen vastaavankaltainen kuva konveksista funktiosta) Määritelmästä huomataan, että jos funktio f on konkaavi, funktio −f on konveksi, koska epäyhtälön kertominen negatiivisella luvulla kääntää epäyhtälön suunnan. Esimerkki 2.2. Olkoon funktio f : R → R määritelty kaavalla f (x) = x2 . Perustellaan määritelmän avulla, että funktio f on aidosti konveksi. Tarkastellaan tätä varten erotusta f (λx + (1 − λ)y) − λf (x) − (1 − λ)f (y), jossa λ ∈ (0, 1). Jos erotus on eri reaaliluvuilla x ja y (aidosti) positiivinen, funktio on (aidosti) konkaavi. Jos erotus on (aidosti) negatiivinen, funktio on (aidosti) konveksi. Käytetään funktion määritelmää ja muokataan erotusta (λx + (1 − λ)y)2 − λx2 − (1 − λ)y 2 = −λ(1 − λ)(x − y)2 , joka on aidosti negatiivinen, koska λ, (1−λ) ja (x−y)2 ovat kaikki aidosti positiivisia, kun λ ∈ (0, 1). Siten funktio on aidosti konveksi kuten funktion kuvaajasta voi ennustaa. ⋄ Esimerkki 2.3. Funktio f : R → R, joka määritellään yhtälöllä f (x) = ax + b, a, b ∈ R, on sekä konkaavi että konveksi. Perustele tämä yllä annetun määritelmän avulla. ⋄ Annetun funktion päättely konkaaviksi tai konveksiksi voi olla pelkän määritelmän perusteella työlästä. Helpommin se käy seuraavien lauseiden avulla. Ensin yhden muuttujan funktio: YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 9 Lause 2.1. Olkoon X ⊂ R avoin konveksi joukko ja f : X → R kahdesti jatkuvasti derivoituva funktio. Tällöin (i) funktio on konkaavi, jos ja vain jos kaikilla x ∈ X pätee f ′′ (x) ≤ 0, (ii) funktio on konveksi, jos ja vain jos kaikilla x ∈ X pätee f ′′ (x) ≥ 0. (iii) funktio on aidosti konkaavi, jos kaikilla x ∈ X pätee f ′′ (x) < 0. (iv) funktio on aidosti konveksi, jos kaikilla x ∈ X pätee f ′′ (x) > 0. Todistus. Sydsæter et al. (2008). Kustannuksena helppoudesta tässä tapauksessa on, että funktion täytyy olla kahdesti jatkuvasti derivoituva. Esimerkki 2.4. (i) Olkoon funktio f : R → R määritelty kaavalla f (x) = ax2 + bx + c. Tämän toinen derivaatta on 2a, jolloin funktio on esimerkiksi konkaavi, jos a ≤ 0 ja konveksi, jos a ≥ 0. (ii) Olkoon funktio määritelty kaavalla f (x) = x3 . Tämä funktio ei ole konkaavi eikä konveksi, koska sen toinen derivaatta f ′′ (x) = 6x on negatiivinen muuttujan x ollessa negatiivinen ja positiivinen muuttujan x ollessa positiivinen. ⋄ Usean muuttujan funktiolle löytyy Lausetta 2.1 vastaava tulos. Siinä toinen derivaatta korvataan funktion Hessen matriisilla H, joka muodostetaan funktion f toisen kertaluvun osittaisderivaatoista. Määritelmä 2.3. Funktion f Hessen f11 (x) f21 (x) H(x) = ... fn1 (x) matriisi pisteessä x ∈ Rn on f12 (x) . . . f1n (x) f22 (x) . . . f2n (x) , .. .. ... . . fn2 (x) . . . fnn (x) jossa f11 (x) = fx1 x1 (x), f12 (x) = fx1 x2 (x) ja niin edelleen. ◦ Hessen matriisi on siis muodostettu toisen kertaluvun osittaisderivaatoista ja sen arvo riippuu pisteestä x = (x1 , x2 , . . . , xn ). Esimerkiksi ensimmäisen rivin alkiot on saatu osittaisderivoimalla osittaisderivaattaa fx1 kaikkien muuttujien suhteen. Kahdesti jatkuvasti derivoituvalle funktiolle on voimassa fij (x) = fji (x) (”Ristiderivaatat” ovat yhtä suuret).1 Esimerkki 2.5. Lasketaan funktion f (x, y) = x+xy 3 Hessen matriisi. Ensimmäisen kertaluvun osittaisderivaatat ovat: (2.1) 1Kahdesti fx (x, y) = 1 + y 3 , fy (x, y) = 3xy 2 . jatkuvasti derivoituvalla funktiolla tarkoitetaan funktiota, jolla on jatkuvat toisen kertaluvun osittaisderivaatat. Taloustieteessä funktiot ovat usein juuri näitä. 10 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Kyseessä on kahden muuttujan funktio, jolloin toisen kertaluvun osittaisderivaattoja on 22 = 4 kappaletta. Hessen matriisi on 0 3y 2 . H(x, y) = 3y 2 6xy Huomaa, että Hessen matriisi tosiaan riippuu pisteestä (x, y). ⋄ Lause 2.2. Olkoon X ⊂ Rn avoin konveksi joukko ja f : X → R funktio, joka on kahdesti jatkuvasti derivoituva. Tällöin (i) funktio on konkaavi, jos ja vain jos Hessen matriisi H(x) on negatiivisesti semidefiniitti kaikilla x ∈ X. (ii) funktio on konveksi, jos ja vain jos Hessen matriisi H(x) on positiivisesti semidefiniitti kaikilla x ∈ X. Todistus. Sydsæter et al. (2008). Voimme päätellä funktion konkaavisuuden/konveksisuuden laskemalla Hessen matriisin ja tutkimalla sen semidefiniittisyyttä. Jos funktion Hessen matriisi on negatiivisesti semidefiniitti kaikilla funktion määrittelyjoukon alkioilla, funktio on konkaavi. Jos Hessen matriisi on positiivisesti semidefiniitti kaikilla funktion määrittelyjoukon alkioilla, funktio on konveksi. Jos matriisi on positiivisesti definiitti, se on automaattisesti positiivisesti semidefiniitti. Jos taas matriisi on negatiivisesti definiitti, se on automaattisesti negatiivisesti semidefiniitti. Funktion aito konkaavisuus tai aito konveksisuus voidaan tarkastaa seuraavan lauseen avulla: Lause 2.3. Olkoon X ⊂ Rn avoin konveksi joukko ja f : X → R funktio, joka on kahdesti jatkuvasti derivoituva. (i) Jos Hessen matriisi H(x) on negatiivisesti definiitti kaikilla x ∈ X, funktio f on aidosti konkaavi. (ii) Jos Hessen matriisi H(x) on positiivisesti definiitti kaikilla x ∈ X, funktio f on aidosti konveksi. Todistus. Sydsæter et al. (2008). Päinvastaiset väitteet eivät päde. Vastaesimerkiksi kohtaan (i) käy funktio f (x, y) = −x4 − y 4 , joka on aidosti konkaavi, mutta Hessen matriisi ei ole negatiivisesti definiitti, koska H(0, 0) = 0 (laske itse). Esimerkki 2.6. Olkoon funktio f ”Cobb-Douglas muotoa” eli f (x, y) = xa y b , jossa a, b > 0. Ensimmäisen kertaluvun osittaisderivaatat ovat fx (x, y) = axa−1 y b ja fy (x, y) = bxa y b−1 , jolloin saamme laskettua Hessen matriisiksi a(a − 1)xa−2 y b abxa−1 y b−1 fxx (x, y) fxy (x, y) = . (2.2) fyx (x, y) fyy (x, y) abxa−1 y b−1 b(b − 1)xa y b−2 Oletetaan, että a + b < 1. Tällöin funktio on aidosti konkaavi, koska a(a − 1)xa−2 y b < 0 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 11 a(a − 1)xa−2 y b abxa−1 y b−1 = ab(1 − a − b)x2a−2 y 2b−2 > 0. abxa−1 y b−1 b(b − 1)xa y b−2 ⋄ ja (laske) (2.3) Lopuksi Lause 2.4. (i) Kahden konkaavin funktion summa on konkaavi funktio. (ii) Positiivisella reaaliluvulla kerrottu konkaavi funktio on konkaavi. Todistus. Sydsæter et al. (2008). Vastaavat väitteet pätevät konveksille funktiolle. Esimerkki 2.7. Jos tuotantofunktio f (x, y) on konkaavi, myös voittofunktio Π(x, y) = pf (x, y) − wx − zy on konkaavi. Voittofunktiossa p on lopputuotteen hinta ja w ja z ovat tuotantopanosten hinnat. ⋄ 12 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 3. Ääriarvotehtävistä Kertaa kriittisen pisteen laskeminen. Lisäksi ääriarvotehtäviä havainnoillistetaan usein (luennoilla) funktion tasa-arvojoukkojen avulla. Esimerkiksi kahden muuttujan funktion f eräs tasa-arvojoukko koostuu funktion määrittelyjoukon pisteistä, jotka toteuttavat yhtälön f (x, y) = c, jossa c on jokin luku. Tämä käsite on tärkeä muutenkin; esimerkiksi indifferenssikäyrät ovat hyötyfunktion tasa-arvojoukkoja. 3.1. Rajoittamaton ääriarvotehtävä. Muistellaan ensin hieman yhden muuttujan funktion ääriarvojen määrittämistä. ”Ensimmäisen kertaluvun välttämätön ehto” maksimille tai minimille tietyssä pisteessä on, että derivaatta tässä pisteessä on nolla. ”Toisen kertaluvun riittävä ehto” maksimille on, että toinen derivaatta tässä pisteessä on aidosti negatiivinen, ja minimille, että toinen derivaatta tässä pisteessä on aidosti positiivinen. Olkoon nyt X ⊂ Rn ja f : X → R eli tarkastellaan usean muuttujan funktiota. ”Ensimmäisen kertaluvun välttämätön ehto” funktion ääriarvopisteelle on, että kaikki osittaisderivaatat ovat kyseisessä pisteessä nollia eli että kyseessä on kriittinen piste. Toisin sanoen, jos piste x∗ = (x∗1 , x∗2 , . . . , x∗n ) ∈ Rn on funktion ääriarvopiste, fxi (x∗ ) = 0, jokaisella i = 1, . . . , n, tai kompaktimmin ∇f (x∗ ) = 0 eli funktion gradienttivektori on nolla pisteessä x∗ . Kriittinen piste voi kuitenkin olla maksimipiste, minimipiste tai satulapiste. Kriittisen pisteen laadun tarkastamista varten täytyy tehdä lisätyötä. Usean muuttujan funktion tapauksessa ”toisen kertaluvun riittävät ehdot” liittyvät Hessen matriisiin ja sen definiittisyyteen kriittisessä pisteessä. Seuraava lause antaa keinon löytää maksimipisteet ja minimipisteet kriittisten pisteiden joukosta. Tässä keskitytään paikallisiin ääriarvopisteisiin. Lause 3.1 (Toisen kertaluvun riittävät ehdot). Olkoon X ∈ Rn avoin joukko ja f : X → R kahdesti jatkuvasti derivoituva funktio ja olkoon piste x∗ = (x∗1 , x∗2 , . . . , x∗n ) ∈ X funktion kriittinen piste eli piste, joka ratkaisee yhtälöryhmän fxi (x) = 0, i = 1, . . . , n. Tällöin pätee: i) Jos funktion f Hessen matriisi H(x) on kriittisessä pisteessä negatiivisesti definiitti eli jos kriittisessä pisteessä on voimassa (3.1) |H1 | <0, |H2 | >0, |H3 | <0, |H4 | >0, . . . , |H1 | >0, |H2 | >0, |H3 | >0, |H4 | >0, . . . , kriittinen piste x∗ on paikallinen maksimipiste. ii) Jos funktion f Hessen matriisi H(x) on kriittisessä pisteessä positiivisesti definiitti eli jos kriittisessä pisteessä on voimassa (3.2) kriittinen piste x∗ on paikallinen minimipiste. iii) Jos ehdoista (3.1) ja (3.2) kumpikaan ei ole voimassa jollain nollasta poikkeavalla johtavalla pääminorilla, kriittinen piste x∗ ei ole paikallinen maksimipiste eikä minimipiste vaan satulapiste. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Todistus. Simon & Blume (1994). 13 Kriittisen pisteen laatu voidaan useimmiten määrittää maksimi- tai minimipisteeksi tämän lauseen avulla, jossa siis luvut |Hk | ovat Hessen matriisin johtavia pääminoreita. Kahden muuttujan funktion tapauksessa seuraava esimerkki on hyödyllinen. Esimerkki 3.1. Olkoon f (x, y) funktio, joka täyttää Lauseen 3.1 ehdot. Siihen liittyvä Hessen matriisi on fxx (x, y) fxy (x, y) . H(x, y) = fyx (x, y) fyy (x, y) Olkoon (x∗ , y ∗ ) funktion f kriittinen piste. Lauseen 3.1 perusteella pätee siten seuraavaa: • Jos fxx (x∗ , y ∗ ) < 0 ja fxx (x∗ , y ∗ )fyy (x∗ , y ∗ ) − fxy (x∗ , y ∗ )2 > 0, kriittinen piste on maksimipiste. • Jos fxx (x∗ , y ∗ ) > 0 ja fxx (x∗ , y ∗ )fyy (x∗ , y ∗ ) − fxy (x∗ , y ∗ )2 > 0, kriittinen piste on minimipiste. • Jos fxx (x∗ , y ∗ )fyy (x∗ , y ∗ ) − fxy (x∗ , y ∗ )2 < 0, kriittinen piste on satulapiste. ⋄ Esimerkki 3.2. Etsitään funktion f (x, y) = x2 + 2y 2 + 2 (paikallinen) ääriarvopiste ja vastaava funktion ääriarvo sekä määritetään ääriarvon laatu. Ehdokkaat ääriarvopisteiksi löytyvät kriittisten pisteiden joukosta. Kriittinen piste on (0, 0) (laske). Funktion Hessen matriisi on 2 0 , H(x, y) = 0 4 jolloin sen johtavat pääminorit ovat |H1 | = 2 ja |H2 | = 8. Molemmat ovat positiivisia, joten Hessen matriisi on positiivisesti definiitti ja kriittinen piste on minimipiste. Vastaava funktion minimiarvo on f (0, 0) = 2. ⋄ Esimerkki 3.3. Muutetaan yllä olevaa esimerkkiä hieman. Olkoon funktio f (x, y) = −x2 + 2y 2 + 2. Kriittinen piste on nytkin (0, 0), mutta Hessen matriisi on −2 0 , H(x, y) = 0 4 jolloin sen johtavat pääminorit ovat |H1 | = −2 ja |H2 | = −8. Kriittinen piste on satulapiste. Entä jos funktiona on f (x, y) = −x2 − 2y 2 + 2? ⋄ Esimerkki 3.4. Etsitään funktion f (x, y, z) = x2 +y 2 +z 2 +xy+4z+xz ääriarvopiste ja määrätään sen laatu. Lasketaan osittaisderivaatat ja ratkaistaan kriittinen piste: fx = 2x + y + z = 0, fy = 2y + x = 0, fz = 2z + 4 + x = 0. 14 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Kirjoitetaan yhtälöryhmä matriisimuotoon ja käytetään Cramerin sääntöä sen ratkaisemiseen (palauta sääntö mieleen laskemalla itse)2 0 x 2 1 1 1 2 0 · y = 0 . −4 z 1 0 2 Ratkaisuksi saadaan kriittinen piste (x, y, z) = (2, −1, −3). Määrätään sen laatu muodostamalla Hessen matriisi, joka on: 2 1 1 1 2 0 1 0 2 Johtavat pääminorit ovat |H1 | = 2, |H2 | = 3 ja |H3 | = 4. Kaikki ovat positiivisia, joten kriittinen piste on minimipiste. Vastaava funktion minimiarvo on f (2, −1, −3) = −6. ⋄ Huomautus: Jos funktio on kahdesti jatkuvasti derivoituva ja Hessen matriisi on negatiivisesti semidefiniitti kriittisessä pisteessä, niin tällöin kriittinen piste ei välttämättä ole maksimipiste. Vastaesimerkiksi käy funktio f (x) = x3 , jonka toinen derivaatta on kriittisessä pisteessä 0 eli Hessen matriisi on tässä pisteessä negatiivisesti semidefiniitti (myös positiivisesti). Origon mistä tahansa ympäristöstä löytyy kuitenkin pisteitä, joissa funktion arvo pienempi kuin 0 tai suurempi kuin 0. Toinen vastaesimerkki on funktio f (x, y) = x3 + y 3 . Tutkitaan vielä yksi esimerkki. Esimerkki 3.5. Tutkitaan funktiota f (x, y) = kriittiset pisteet: 2 3 y 3 − xy − y + 21 x2 . Lasketaan fx = −y + x = 0 fy = 2y 2 − x − 1 = 0. Ratkaisut ovat (1, 1) ja − 12 , − 12 . Määritetään niiden laatu Hessen matriisilla: 1 −1 . H(x, y) = −1 4y Kriittisessä pisteessä (1, 1) Hessen matriisi on 1 −1 . H(1, 1) = −1 4 Se on positiivisesti definiitti, koska |H1 | = 1 ja |H2 | = 3. Tämä kriittinen piste on siten paikallinen minimipiste ja vastaava funktion paikallinen minimiarvo on − 56 . Kriittisessä pisteessä − 12 , − 12 Hessen matriisi on 1 1 1 −1 . H(− , − ) = −1 −2 2 2 Koska |H2 | = −3 < 0, tämä kriittinen piste on satulapiste. 2Olisi varmasti helpompaa laskea tämä eliminoimalla muuttujia. ⋄ YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 15 Yllä käsiteltiin paikallisten ääriarvojen etsimistä.3 Globaalien tai absoluuttisten ääriarvojen löytäminen pelkästään kriittisen pisteen avulla onnistuu, esimerkiksi jos tarkasteltava funktio on konkaavi tai konveksi. Lause 3.2. Olkoon X ⊂ Rn avoin ja konveksi joukko ja funktio f : X → R jatkuvasti derivoituva (i) Jos funktio f on konkaavi ja pisteessä x∗ ∈ X pätee ∇f (x∗ ) = 0, piste x∗ on funktion f globaali maksimipiste. (i) Jos funktio f on konveksi ja pisteessä x∗ ∈ X pätee ∇f (x∗ ) = 0, piste x∗ on funktion f globaali minimipiste. Todistus. Sydsæter et al. (2008). Eli, jos tavoitefunktio on konkaavi, kriittinen piste on automaattisesti globaali maksimipiste. Esimerkki 3.6. Olkoon jälleen voittofunktio Π(x, y) = pf (x, y) − wx − zy. Kun voittofunktio on konkaavi, maksimipiste löytyy suoraan seuraavan yhtälöparin ratkaisuna pfx (x, y) − w = 0, pfy (x, y) − z = 0. ⋄ 3.2. Yhtälörajoitteinen ääriarvotehtävä, Lagrangen menetelmä ja kerroin. Tarkastellaan rajoitettua ääriarvotehtävää4 (Max) max f (x1 , x2 ) {x1 ,x2 } siten että g(x1 , x2 ) = c, ja palautetaan mieliin Lagrangen lause tässä yhden rajoitteen tapauksessa (oletetaan, ettei rajoitefunktion osittaisderivaatat ole molemmat nollia tehtävän ratkaisussa (x∗1 , x∗2 )): Lause 3.3. Oletetaan, että (x∗1 , x∗2 ) on tehtävän (Max) ratkaisu, kun funktiot f ja g ovat jatkuvasti derivoituvia. Tällöin on olemassa Lagrangen kerroin λ∗ siten että piste (x∗1 , x∗2 , λ∗ ) on kriittinen piste Lagrangen funktiolle L(x1 , x2 , λ) = f (x1 , x2 ) − λ(g(x1 , x2 ) − c). Todistus. Sydsæter et al. (2008). Esimerkki 3.7. Ratkaistaan tehtävä max x1 x2 siten että x1 +4x2 = 16. Lagrangen funktio on: {x1 ,x2 } L(x1 , x2 , λ) = x1 x2 − λ(x1 + 4x2 − 16). 3Moni esimerkkien ääriarvopisteistä on myös globaali ääriarvopiste. tarkastella myös minimointitehtävää; Lause 3.3 kelpaa siihenkin. 4Voitaisiin Lisätty 28.1. 16 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Osittaisderivoidaan Lagrangen funktio kaikkien kolmen muuttujan suhteen ja asetetaan osittaisderivaatat nolliksi:5 (3.3) Lx1 = x 2 − λ = 0 (3.4) Lx2 = x1 − 4λ = 0 (3.5) Lλ = −x1 − 4x2 + 16 = 0. Ensimmäisen yhtälön mukaan x2 = λ, joten toisesta yhtälöstä saamme x1 = 4x2 . Sijoitetaan tämä kolmanteen yhtälöön, jolloin −4x2 − 4x2 = −16 eli x2 = 2. Täten Lagrangen funktion kriittinen piste on (x∗1 , x∗2 , λ∗ ) = (8, 2, 2). Tällöin alkuperäisen tehtävän ratkaisu on (x∗1 , x∗2 ) = (8, 2) ja funktion maksimiarvo on 16. Geometrisesti ratkaisu on tavoitefunktion tasa-arvojoukon ja rajoitesuoran x2 = 4 − 41 x1 sivuamispiste, katso seuraava kuva. ⋄ x2 2 8 x1 Kuva 3.1. Kuvassa on tavoitefunktion yksi tasa-arvokäyrä x1 x2 = 16 ja rajoite. Mistä tiedetään, että laskettu Lagrangen funktion kriittinen piste oikeasti antaa maksimi- tai minimipisteen? Tähän tarvitaan (esimerkiksi) reunustettua Hessen matriisia. Reunustettua Hessen matriisia merkitään lisäämällä yläviiva Hessen matriisin merkintään eli symbolilla H. Yksi tapa kirjoittaa reunustettu Hessen matriisi on 0 gx1 (x1 , x2 ) gx2 (x1 , x2 ) H(x1 , x2 , λ) = gx1 (x1 , x2 ) Lx1 x1 (x1 , x2 , λ) Lx1 x2 (x1 , x2 , λ) . (3.6) gx2 (x1 , x2 ) Lx2 x1 (x1 , x2 , λ) Lx2 x2 (x1 , x2 , λ) Reunustetun Hessen matriisin ensimmäinen johtava pääminori |H1 | on nolla ja toinen johtava pääminori |H2 | on negatiivinen. Nämä kaksi seikkaa ovat voimassa aina. Tarkasteltavana olevassa tapauksessa johtavan pääminorin |H3 | = |H| merkki kertoo kriittisen pisteen laadun: Lause 3.4. Olkoon L(x1 , x2 , λ) Lagrangen funktio ja olkoon piste (x∗1 , x∗2 , λ∗ ) sen kriittinen piste. Tällöin (i) (x∗1 , x∗2 ) on paikallinen maksimipiste, jos reunustetulle Hessen matriisille H on voimassa |H(x∗1 , x∗2 , λ∗ )|>0. 5Viimeinen näistä yhtälöistä on oleellisesti vain rajoiteyhtälö. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 17 (ii) (x∗1 , x∗2 ) on paikallinen minimipiste, jos reunustetulle Hessen matriisille H on voimassa |H(x∗1 , x∗2 , λ∗ )|<0. Todistus. Sydsæter et al. (2008). Siis, jos reunustetun Hessen matriisin determinantti on kriittisessä pisteessä positiivinen, piste (x∗1 , x∗2 ) on paikallinen maksimipiste. Jos reunustetun Hessen matriisin determinantti on kriittisessä pisteessä negatiivinen, piste (x∗1 , x∗2 ) on paikallinen minimipiste. Esimerkki 3.8. Esimerkissä 3.7 vain oletettiin, että kyseisellä maksimointitehtävällä on ratkaisu. Perustellaan, että laskettu ratkaisu tosiaan antaa (paikallisen) rajoitetun maksimin. Lasketaan reunustettu Hessen matriisi: 0 1 4 H = 1 0 1 . 4 1 0 Reunustetun Hessen matriisin determinantti on 4 + 4 = 8, joten (8, 2) on rajoitettu maksimipiste. Funktion rajoitettu maksimiarvo on 16. ⋄ Esimerkki 3.9. Etsitään funktion f (x, y) = 2xy ääriarvopisteet rajoitteella x2 + y 2 = 1. Rajoite on yksikköympyrä. Lagrangen funktio on L(x, y, λ) = 2xy − λ(x2 + y 2 − 1). Ensimmäisen kertaluvun välttämättömät ehdot ovat 2y − 2λx = 0, 2x − 2λy = 0, −x2 − y 2 + 1 = 0. Ensimmäisen yhtälön mukaan y = λx, joten λ = xy . Sijoittamalla tämä toiseen yhtälöön saamme x2 = y 2 . Sijoittamalla tämä edelleen viimeiseen yhtälöön saamme 1 −y 2 − y 2 + 1 = 0 ⇔ y = ± √ . 2 Kriittisiksi pisteiksi saamme siten 1 1 1 1 (x∗ , y ∗ , λ∗ ) = ( √ , √ , 1), (x∗ , y ∗ , λ∗ ) = (− √ , − √ , 1) 2 2 2 2 1 1 1 1 (x∗ , y ∗ , λ∗ ) = (− √ , √ , −1) (x∗ , y ∗ , λ∗ ) = ( √ , − √ , −1). 2 2 2 2 Näiden joukosta löytyvät maksimi- ja minimipisteet. Reunustettu Hessen matriisi on: 0 2x 2y 2 . H = 2x −2λ (3.7) 2y 2 −2λ 18 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Sen determinatti on (laske itse): H = 8(x2 λ + y 2 λ + 2xy). Laskemalla determinantin arvo kriittisissä pisteissä ja käyttämällä Lausetta 3.4 saamme lopputulokseksi: Pisteet ( √12 , √12 ) ja (− √12 , − √12 ) ovat rajoitettuja maksimipisteitä, koska näissä pisteissä |H| > 0. Pisteet (− √12 , √12 ) ja ( √12 , − √12 ) ovat rajoitettuja minimipisteitä, koska näissä pisteissä |H| < 0. Vastaavat funktion rajoitetut ääriarvot voidaan laskea sijoittamalla rajoitetut maksimi- ja minimipisteet tavoitefunktioon. ⋄ Lagrangen menetelmä yleistyy tilanteeseen, jossa tavoitefunktio f on n:n muuttujan funktio ja rajoitteita on useampia, sanotaan m kappaletta.6 Rajoitteet ovat gj (x1 , . . . , xn ) = cj , j = 1, . . . , m. Lauseen 3.3 periaate pysyy ennallaan: Jos tiedämme, että tehtävän tavoitefunktio ja rajoitefunktiot ovat ”sopivia” ja että tehtävällä on rajoitettu maksimi tai minimi pisteessä (x∗1 , . . . , x∗n ), on olemassa Lagrangen kertoimet (λ∗1 , . . . , λ∗m ) siten että piste (x∗1 , . . . , x∗n , λ∗1 , . . . , λ∗m ) on Lagrangen funktion kriittinen piste. Nyt Lagrangen funktio on m X L(x1 , . . . , xn , λ1 , . . . , λm ) = f (x1 , . . . , xn ) − λj (gj (x1 , . . . , xn ) − cj ). j=1 Lagrangen funktiossa on nyt useampia termejä, jotka sisältävät rajoitteen ja sitä vastaavan kertoimen, aivan samaan tyyliin kuin yhden rajoitteen tapauksessa. Esimerkki 3.10. Funktio f (x, y, z) = 21 x2 + 5y 2 + z 2 saa rajoitetun minimiarvon rajoitteilla −x + 2y − 4z = 1, ja x − y + z = 0. Tehtävänä on etsiä rajoitettu minimipiste. Lagrangen funktio on 1 L(x, y, z, λ, µ) = x2 + 5y 2 + z 2 − λ(−x + 2y − 4z − 1) − µ(x − y + z), 2 ja sen kriittinen piste ratkaisee yhtälöryhmän x + λ − µ = 0, 10y − 2λ + µ = 0, 2z + 4λ − µ = 0, −x + 2y − 4z = 1, x − y + z = 0, Kriittinen piste on (x, y, z, λ, µ) = 31 , 0, − 13 , 31 , 23 (Laske). Eli tettu minimipiste. 6Mieluiten m < n. 1 , 0, − 31 3 on rajoi⋄ YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 19 Kun tavoitefunktiossa on muuttujia enemmän kuin kaksi, mutta rajoitteita edelleen yksi, riittäviä ehtoja varten tulee tarkastaa useamman johtavan pääminorin merkki.7 Lause 3.5. Olkoon L(x1 , x2 , . . . , xn , λ) Lagrangen funktio ja olkoon piste (x∗1 , x∗2 , . . . , x∗n , λ∗ ) sen kriittinen piste. Tällöin (i) (x∗1 , x∗2 , . . . , x∗n ) on paikallinen maksimipiste, jos reunustetulle Hessen matriisille H pätee kriittisessä pisteessä |H3 | > 0, |H4 | < 0, |H5 | > 0, . . . |H3 | < 0, |H4 | < 0, |H5 | < 0, . . . (ii) (x∗1 , x∗2 , . . . , x∗n ) on paikallinen minimipiste, jos reunustetulle Hessen matriisille H pätee kriittisessä pisteessä Todistus. Sydsæter et al. (2008). Tähän asti on käsitelty paikallisia ääriarvoja. Entä globaalit ääriarvot rajoitetussa tapauksessa? Tarkastellaan tilannetta maksimointitehtävän ja usean rajoitteen tapauksessa. Lause 3.6. Oletetaan, että piste (x∗1 , . . . , x∗n , λ∗1 , . . . , λ∗m ) on Lagrangen funktion kriittinen piste, ja että Lagrangen funktio on konkaavi muuttujien x1 , . . . , xn suhteen. Tällöin piste (x∗1 , . . . , x∗n ) on tehtävän globaali ratkaisu. Todistus. Sydsæter et al. (2008). Minimointitehtävän tapauksessa Lagrangen konkaavisuus korvataan konveksisuudella. Esimerkki 3.11. Koska Esimerkissä 3.10 Lagrangen funktio L on konveksi muut tujien x, y ja z suhteen (miksi?), piste 13 , 0, − 31 on rajoitettu globaali minimipiste. ⋄ Selvitetään luvun lopuksi Lagrangen kertoimen (taloustieteellistä) merkitystä kahden muuttujan ja yhden rajoitteen tapauksessa. Lagrangen kerroin on matemaattisessa mielessä vain apumuuttuja, jonka avulla löydetään tehtävän ratkaisu. Taloustieteellisissä malleissa kertoimesta on myös muuta hyötyä. Esimerkiksi maksimointitehtävässä Lagrangen kerroin kertoo (intuitiivisesti sanottuna) kuinka funktion maksimiarvo muuttuu, jos rajoitetta löysätään hieman. Tarkastellaan tehtävää: max f (x, y) siten että g(x, y) = c. {x,y} Tämän tehtävän ratkaisu (x∗ , y ∗ ) riippuu parametrista c, joten merkitään tehtävän ratkaisua (x∗ (c), y ∗ (c)) ja Lagrangen kerrointa λ(c). Lisäoletuksin on voimassa 7Entä jos rajoitteita on useita? Tämän voit kurkata kurssikirjoista. Usean rajoitteen tapauksessa ehdot ovat monimutkaisemmat ja vaikeammat muistaa. 20 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Lause 3.7. Olkoon (x∗ (c), y ∗ (c)) rajoitetun maksimointitehtävän ratkaisu ja f (x∗ (c), y ∗ (c)) tavoitefunktion maksimiarvo. Tällöin df (x∗ (c), y ∗ (c)) = λ∗ (c). dc Todistus. Sydsæter et al. (2008). Esimerkiksi, jos kyseessä on kuluttujan hyödyn maksimointitehtävä annetulla budjettirajoitteella px + qy = I, Lagrangen kerroin, joka on kyseisessä tehtävässä positiivinen, kertoo kuinka paljon maksimihyöty likimäärin kasvaa tulojen noustessa hieman. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 21 4. Ääriarvotehtävät epäyhtälörajoitteilla Esimerkki 4.1. Tarkastellaan tehtävää (4.1) max f (x) rajoitteella x ≥ 0. {x} Oletetaan ensin, että tehtävän ratkaisu x∗ on 0. Tällöin funktion f (x) derivaatta on välttämättä negatiivinen tai nolla tässä pisteessä eli f ′ (x∗ ) < 0 tai f ′ (x∗ ) = 0, koska muuten funktion arvoa voitaisiin kasvattaa siirtymällä positiiviseen suuntaan pisteestä nolla. Toisaalta, jos tehtävän ratkaisu on jokin positiivinen luku eli x∗ > 0, niin tällöin tässä pisteessä derivaatan on oltava nolla eli f ′ (x∗ ) = 0. Eli olipa tehtävän ratkaisu x∗ = 0 tai x∗ > 0, se toteuttaa ehdot: Katso Kuva 4.1. f ′ (x) ≤ 0, x ≥ 0, xf ′ (x) = 0. ⋄ Kuva 4.1. Vasen kuva: x∗ = 0 ja f ′ (x∗ ) < 0. Oikea kuva: x∗ > 0 ja f ′ (x∗ ) = 0. (Tapaus, jossa f ′ (0) = 0 on jätetty piirtämättä.) Edellinen oli esimerkki epäyhtälörajoitteisesta ääriarvotehtävästä. Olkoot f ja g jatkuvasti derivoituvia kahden muuttujan funktioita. Tarkastellaan tehtävää (E) max f (x, y) rajoitteella g(x, y) ≤ 0. {x,y} Toisin sanoen, tehtävässä etsitään sellaista pistettä (x∗ , y ∗ ), jossa funktio f (x, y) saa maksimiarvon, ja joka sisältyy rajoitteen g(x, y) ≤ 0 määräämään joukkoon (käypäjoukko) B = {(x, y) ∈ R2 | g(x, y) ≤ 0}. Oletetaan, että rajoitteelle pätee gx (x∗ , y ∗ ) 6= 0 ja gy (x∗ , y ∗ ) 6= 0, jossa (x∗ , y ∗ ) on tehtävän (E) ratkaisu. Lauseessa 4.1 annetaan ehdot, jotka tehtävän ratkaisu toteuttaa. Otetaan ensin johdatteleva esimerkki: Esimerkki 4.2. Tehtävänä on (4.2) max −(x − 2)2 − (y − 2)2 {x,y} rajoitteella y + x − 2 ≤ 0. Tässä f (x, y) = −(x − 2)2 − (y − 2)2 , ja sen tasa-arvokäyrät ovat ympyröitä, joiden keskipisteenä on (2, 2). Rajoitteena on epäyhtälö y + x − 2 ≤ 0, joka muodostaa joukon B = {(x, y) ∈ R2 | y + x − 2 ≤ 0}. 22 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 4 3 2 1 -2 1 -1 2 3 4 -1 -2 Kuva 4.2. Tavoitefunktion tasa-arvokäyrät ja rajoitejoukko B (varjostettu alue) Esimerkiksi origo (0, 0) kuuluu tähän joukkoon, kuten myös kaikki (suoran)yhtälön y = −x + 2 toteuttavat pisteet. Ilman rajoitetta funktion f maksimipiste on (2, 2) (miksi?), mutta tämä piste ei kuitenkaan kuulu rajoitejoukkoon B. Pohtimalla rajoitejoukkoa ja funktion tasa-arvokäyriä huomataan, että tehtävän ratkaisu on piste (1, 1). Tässä pisteessä funktion f gradientti ∇f (x, y) on rajoitteen gradientti ∇g(x, y) kerrottuna jollain kertoimella λ (millä?). Gradientit ovat siten yhdensuuntaisia. Gradientin geometriasta tiedetään, että gradientti osoittaa suuntaan, johon funktion arvo kasvaa voimakkaimmin ja että se on kohtisuorassa funktion tasaarvojoukon tangenttisuoraa vastaan. Pisteessä (1, 1) funktion f gradientti osoittaa pisteen (2, 2) suuntaan. Jos näin ei olisi, vaan gradientti osoittaisi rajoitejoukon suuntaan, funktion f arvoa voitaisiin kasvattaa ja pysyä edelleen rajoitejoukossa. Tällöin piste (1, 1) ei olisi tehtävän ratkaisu. Funktion f gradientti osoittaa siis ulospäin rajoitejoukosta. Rajoitteen gradientti osoittaa samaan suuntaan, joten yhtälöstä ∇f (x, y) = λ∇g(x, y) seuraa, että λ > 0. ⋄ Yllä olevassa esimerkissä optimi saavutettiin rajoitejoukon reunalla eli pisteessä, jossa g(x, y) = 0. Tällöin sanotaan, että rajoite on sitova tai aktiivinen. Muutetaan ylläolevaa esimerkkiä hieman, jolloin optimi saavutetaankin rajoitejoukon sisällä eli pisteessä, jossa g(x, y) < 0: Esimerkki 4.3. Tehtävänä on (4.3) max −(x − 2)2 − (y − 2)2 {x,y} rajoitteella y + x − 6 ≤ 0. Nyt rajoitteena on epäyhtälö y + x − 6 ≤ 0, joka muodostaa joukon (piirrä) B = {(x, y) ∈ R2 | y + x − 6 ≤ 0}. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 23 Tarkastellaan pistettä (3, 3), joka toteuttaa rajoitteena olevan epäyhtälön yhtäsuuruutena. Tässä pisteessä rajoitteen gradientti osoittaa ulospäin rajoitejoukosta aivan kuten edellisessä esimerkissä. Tällä kertaa kuitenkin funktion f (x, y) gradientti osoittaa rajoitejoukon sisuksen suuntaan eli voimme kasvattaa funktion arvoa siirtymällä pisteestä (3, 3) sisuksen suuntaan. Tehtävän ratkaisuna on rajoittamaton ääriarvopiste (2, 2). ⋄ Ylläolevan esimerkin tilanteessa, jossa tehtävän ratkaisu saavutetaan rajoitejoukon sisuksessa, rajoite ei ole sitova. Tehtävään (E) liittyvä Lagrangen funktio on L(x, y, λ) = f (x, y) − λg(x, y), jota voi käyttää apuna tehtäviä ratkoessa.8 Epäyhtälörajoitteisissa tehtävissä on väliä sillä mikä merkki on Lagrangen kertojan λ edessä. Tehtävään (E) liittyvä Lagrangen funktio kannattaa kirjoittaa täsmälleen yllä mainitussa muodossa. Yhtälörajoitteisissa tehtävissä (osittais)derivoitiin myös kertojan λ suhteen, mutta epäyhtälörajoitteisissa tehtävissä ei.9 Seuraava lause antaa välttämättömät ehdot tehtävän ratkaisulle: Lause 4.1. Olkoon piste (x∗ , y ∗ ) tehtävän (E) ratkaisu. Tällöin on olemassa reaaliluku λ∗ siten että seuraavat ehdot ovat yhtäaikaa voimassa: (i) ∇f (x∗ , y ∗ ) = λ∗ ∇g(x∗ , y ∗ ), (ii) g(x∗ , y ∗ ) ≤ 0, λ∗ ≥ 0 ja λ∗ g(x∗ , y ∗ ) = 0. Todistus. Sydsæter et al. (2008). Ehtoja (i) ja (ii) voidaan kutsua Kuhn-Tucker-ehdoiksi (KT-ehdoiksi). Ehto (i) on tuttu ja sen yhtälö voidaan kirjoittaa muodossa fx (x∗ , y ∗ ) = λ∗ gx (x∗ , y ∗ ), fy (x∗ , y ∗ ) = λ∗ gy (x∗ , y ∗ ). (Lagrangen funktion avulla nämä ehdot ovat Lx (x∗ , y ∗ , λ∗ ) = 0 ja Ly (x∗ , y ∗ , λ∗ ) = 0.) Ehto (ii) on uusi. Ehto sanoo, että optimipisteessä epäyhtälörajoite on voimassa ja Lagrangen kertoja on ei-negatiivinen. Lisäksi optimissa kertojan ja rajoitefunktion tulo on nolla; siis joko kertoja on nolla tai rajoitefunktio on nolla tai molemmat ovat nollia. Toisin sanoen, jos rajoite pätee muodossa g(x∗ , y ∗ ) < 0, on yhtälön λ∗ g(x∗ , y ∗ ) = 0 mukaan oltava λ∗ = 0. Jos taas λ∗ > 0, on yhtälön λ∗ g(x∗ , y ∗ ) = 0 mukaan oltava g(x∗ , y ∗ ) = 0. Esimerkki 4.4. Ratkaistaan Esimerkki 4.2 Lauseen 4.1 avulla. Lagrangen funktio on L(x, y, λ) = −(x − 2)2 − (y − 2)2 − λ(y + x − 2). 8Se on muodostettu samaan tapaan kuin aiemminkin. tehtävissä derivointi kertojan suhteen on vähän turhaa, koska derivaatta kertojan suhteen asetettuna nollaksi on oleellisesti vain rajoiteyhtälö. 9Yhtälörajoitteisissakin 24 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Lauseen 4.1 ehto (i) voidaan kirjoittaa muotoon (4.4) −2(x − 2) = λ, (4.5) −2(y − 2) = λ. Ehto (ii) on y + x − 2 ≤ 0, λ ≥ 0, λ(y + x − 2) = 0. Mietitään, mitä tapahtuu, jos λ = 0. Tällöin yhtälöt (4.4) ja (4.5) tulevat muotoon −2(x − 2) = 0, −2(y − 2) = 0, jolloin x = 2 ja y = 2. Piste (x, y) = (2, 2) ei kuitenkaan kuulu rajoitejoukkoon, joten ei voi päteä λ = 0. Entä jos λ > 0? Tällöin Lauseen 4.1 viimeisen ehdon mukaan on oltava y + x − 2 = 0, joten yhdistämällä tämä ehtoon (i) saadaan yhtälöryhmä −2(x − 2) = λ, −2(y − 2) = λ, y + x − 2 = 0. Yhtälöryhmän ratkaisu on (x∗ , y ∗ , λ∗ ) = (1, 1, 2). Geometrisesti (katso Kuva 4.2) on selvää, että (1, 1) on tehtävän ratkaisu ja vastaava funktion rajoitettu maksimiarvo on −2. ⋄ Esimerkki 4.5 (Kirjasta S&B). Tehtävänä on (4.6) max xy {x,y} rajoitteella x2 + y 2 ≤ 1. Lagrangen funktio on L(x, y, λ) = xy − λ(x2 + y 2 − 1). Lauseen 4.1 ehdot (i) ja (ii) voidaan kirjoittaa muotoon (4.7) y = 2λx, (4.8) (4.9) x = 2λy, 2 2 x + y ≤ 1, λ ≥ 0, λ(x2 + y 2 − 1) = 0. y x ja λ = 2y . Eli x2 = y 2 . Yhtälöistä (4.7) ja (4.8) saadaan λ = 2x Käytetään nyt ehtoja (4.9) ja katsotaan mitä tapahtuu, kun λ = 0. Tällöin yhtälöiden (4.7) ja (4.8) mukaan myös y = 0 ja x = 0. Piste (0, 0) sisältyy varmasti rajoitejoukkoon, joten kolmikko (0, 0, 0) on yksi ratkaisukandidaatti. Muut kandidaatit löydetään, kun katsotaan mitä tapahtuu, kun λ > 0. Tällöin ehtojen (4.9) mukaan rajoite on sitova eli x2 + y 2 = 1. Käytetään tämän lisäksi yhtälöä x2 = y 2 , jolloin laskemalla saadaan neljä ehdokasta: 1 1 1 1 1 1 1 1 1 1 1 1 √ ,√ , , −√ , −√ , , √ , −√ , − ja − √ , √ , − . 2 2 2 2 2 2 2 2 2 2 2 2 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 25 Kahdessa jälkimmäisessä λ < 0, joten hylkäämme ne. Jäljelle jäävät siten √12 , √12 , 21 ja − √12 , − √12 , 21 sekä aiemmin laskettu (0, 0, 0). Sijoitetaan kunkin x ja y ar 1 √1 √ vot tavoitefunktioon xy, jolloin saamme rajoitetuiksi maksimipisteiksi , 2 , 2 ⋄ − √12 , − √12 . Nämä tuottavat tavoitefunktiolle rajoitetun maksimiarvon 21 . Esimerkki 4.6. Perustellaan Esimerkkiä 4.1 Lauseen 4.1 avulla. Kirjoitetaan rajoite x ≥ 0 lauseessa esiintyvään muotoon eli −x ≤ 0. Tehtävään liittyvä Lagrangen funktio on L(x, λ) = f (x) − λ(−x), ja lauseen ehdot ovat nyt f ′ (x) + λ = 0, (4.10) −x ≤ 0, λ ≥ 0, λ(−x) = 0. Ensimmäinen yhtälö on yhtäpitävä yhtälön λ = −f ′ (x) kanssa, jolloin ehdot (4.10) saadaan Esimerkkiä 4.1 vastaavaan muotoon: (4.11) x ≥ 0, f ′ (x) ≤ 0, f ′ (x)x = 0. ⋄ Periaatteessa niin sanottuja ei-negatiivisuus rajoitteita, x ≥ 0, voidaan käsitellä juuri kuten edellisessä esimerkissä. Esimerkki 4.7 (Kirjasta S&B). Tehtävänä on kuluttujan hyödynmaksimointi budjettirajoitteella, jonka ei tarvitse olla sitova eli kuluttajan ei tarvitse käyttää välttämättä kaikkea tuloaan hyödykkeisiin: (4.12) max u(x1 , x2 ) rajoitteella p1 x1 + p2 x2 ≤ I, {x1 ,x2 } jossa x1 ja x2 ovat hyödykkeiden määrät, p1 ja p2 ovat niiden hinnat ja I on kuluttajan käytettävissä oleva tulo. Oletetaan, että rajahyöty on aidosti positiivinen molempien hyödykkeiden suhteen eli (4.13) ux1 (x1 , x2 ) > 0, ja ux2 (x1 , x2 ) > 0. Muodostetaan Lagrangen funktio L(x, y, λ) = u(x1 , x2 ) − λ(p1 x1 + p2 x2 − I) ja käytetään jälleen Lausetta 4.1. Lauseen mukaiset ehdot ovat (4.14) ux1 (x1 , x2 ) = λp1 , (4.15) ux2 (x1 , x2 ) = λp2 , (4.16) p1 x1 + p2 x2 ≤ I, λ ≥ 0, λ(p1 x1 + p2 x2 − I) = 0. 26 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Katsotaan mitä tapahtuu, kun λ = 0. Tällöin yhtälöiden (4.14) ja (4.15) mukaan olisi (4.17) ux1 (x1 , x2 ) = 0, ja ux2 (x1 , x2 ) = 0, mikä on kuitenkin ristiriidassa oletettujen rajahyötyjen aidon positiivisuuden kanssa. Ei voi päteä λ = 0. Mitä seuraa, jos λ > 0? Tällöin ehtojen (4.16) mukaisesti on oltava p1 x1 + p2 x2 = I eli kuluttaja käyttää kaiken tulonsa hyödykkeisiin. ⋄ Jos pyritään etsimään tavoitefunktion f minimiä jossain rajoitejoukossa, voidaan käyttää edelleen Lausetta 4.1 kunhan maksimoidaan funktiota −f . Toisin sanoen tehtävän (4.18) min f (x, y) rajoitteella g(x, y) ≤ 0 {x,y} ratkaisu on täsmälleen sama kuin tehtävän (4.19) max −f (x, y) rajoitteella g(x, y) ≤ 0. {x,y} (Miksi?) Esimerkki 4.8. Tehtävän (4.20) min (x − 2)2 + (y − 2)2 {x,y} rajoitteella y + x − 2 ≤ 0 ratkaisu on (1, 1) Esimerkin 4.4 perusteella. ⋄ Esimerkki 4.9. Ratkaistaan tehtävä (4.21) min x2 + y 2 {x,y} rajoitteella 3x + 2y + 6 ≤ 0. Lagrangen funktio on (tehtävä on ensin muutettu maksimointitehtäväksi.) L(x, y, λ) = −x2 − y 2 − λ(3x + 2y + 6). Lauseen 4.1 ehto (i) voidaan kirjoittaa muotoon (4.22) −2x = 3λ, (4.23) −2y = 2λ, ja ehto (ii) on 3x + 2y + 6 ≤ 0, λ ≥ 0, λ(3x + 2y + 6) = 0. Mietitään, mitä tapahtuu, jos λ = 0. Tällöin yhtälöistä (4.22) ja (4.23) seuraa, että x = 0 ja y = 0. Sijoitetaan nämä rajoiteyhtälöön, jolloin saadaan 6 ≤ 0, mikä on mahdotonta. Entä jos λ > 0? Tällöin on Lauseen 4.1 viimeisen ehdon mukaan oltava 3x + 2y + 6 = 0, joten yhdistämällä tämän ehtoon (i) saadaan yhtälöryhmä −2x = 3λ, −2y = 2λ, 3x + 2y + 6 = 0. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 27 18 12 12 Yhtälöryhmän ratkaisu on (x∗ , y ∗ , λ∗ ) = − 13 , − 13 , 13 . Geometrisesti on selvää, 12 on tehtävän ratkaisu ja vastaava funktion rajoitettu minimiarvo on , − 13 että − 18 13 468 . ⋄ 169 Esimerkeistä on käynyt ilmi yksi tapa tutkia eräitä epäyhtälörajoitteisia tehtäviä. Toinen tapa on tutkia tapaukset, joissa toisessa rajoite ei ole sitova ja toisessa rajoite on sitova. (Suosittelen laskemaan ainakin yhden esimerkin näinkin.) Mistä tiedetään, että Lauseen 4.1 ehdot toteuttava piste on tosiaan tehtävän ratkaisu? Yksi mahdollisuus on soveltaa seuraavaa lausetta. Lause 4.2. Oletetaan, että pari (x∗ , y ∗ ) ja kerroin λ∗ toteuttavat Lauseen 4.1 ehdot, ja että Lagrangen funktio on konkaavi muuttujien x ja y suhteen. Tällöin (x∗ , y ∗ ) on tehtävän (E) ratkaisu. Todistus. Sydsæter et al. (2008). Usean valintamuuttujan ja usean epäyhtälörajoitteen tapauksessa maksimointitehtävä on (4.24) max f (x1 , . . . , xn ) rajoitteilla gj (x1 , . . . , xn ) ≤ 0, j = 1, . . . , m, {x1 ,...,xn } jossa tavoitefunktio f ja rajoitefunktiot gj ovat jatkuvasti derivoituvia funktioita. Lausetta 4.1 vastaa seuraava tulos.10 Lause 4.3. Olkoon piste (x∗1 , . . . , x∗n ) tehtävän (4.24) ratkaisu. Tällöin on olemassa reaaliluvut λ∗1 , . . . , λ∗m siten että seuraavat ehdot ovat yhtäaikaa voimassa: (i) Lxi (x∗1 , . . . , x∗n , λ∗1 , . . . , λ∗m ) = 0 kaikilla i = 1, . . . , n, (ii) gj (x∗1 , . . . , x∗n ) ≤ 0, λ∗j ≥ 0 ja λ∗j gj (x∗1 , . . . , x∗n ) = 0 kaikilla j = 1, . . . , m. Todistus. Sydsæter et al. (2008). Esimerkki 4.10. Ratkaistaan tehtävä max xy {x,y} 1 rajoitteilla y + x − 6 ≤ 0, y + 2x − 12 ≤ 0 2 Lagrangen funktio on 1 L(x, y, λ2 , λ2 ) = xy − λ1 (y + x − 6) − λ2 (y + 2x − 12), 2 ja Lauseen 4.3 ehdot ovat 1 y − λ1 − 2λ2 = 0 (4.25) 2 (4.26) x − λ1 − λ2 = 0 1 1 (4.27) y + x − 6 ≤ 0, λ1 ≥ 0, λ1 (y + x − 6) = 0 2 2 (4.28) y + 2x − 12 ≤ 0, λ2 ≥ 0, λ2 (y + 2x − 12) = 0. 10Jotta tulos olisi voimassa pitäisi olettaa jotain lisää rajoitteista (niin sanottu constraint qualification ehto), joka on tässä jätetty huomioimatta. 28 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Ratkaisuehdokkaita ovat siis kaikki pisteet (x, y, λ1 , λ2 ), jotka toteuttavat nämä ehdot. Tässä on neljä tapausta tutkittavana: Tapaus 1. λ1 = 0 ja λ2 = 0. Tässä tapauksessa ehdoista (4.25)–(4.26) saadaan (x, y) = (0, 0). Tämä piste toteuttaa myös ehdot (4.27) ja (4.28). Se on siis ehdokas ratkaisuksi. Tapaus 2. λ1 > 0 ja λ2 = 0. Tässä tapauksessa saadaan yhtälöryhmä 1 y − λ1 = 0 (4.29) 2 (4.30) x − λ1 = 0 1 y + x − 6 = 0, (4.31) 2 jonka ratkaisu on (x, y, λ1 ) = (6, 3, 6). Toteutuuko epäyhtälö y + 2x − 12 ≤ 0? Ei. Tästä tapauksesta ei saada lisää ratkaisuehdokkaita. Tapaus 3. λ1 = 0 ja λ2 > 0. Nyt saadaan yhtälöryhmä (4.32) (4.33) (4.34) y − 2λ2 = 0 x − λ2 = 0 y + 2x − 12 = 0, jonka ratkaisu on (x, y, λ2 ) = (3, 6, 3). Toteutuuko epäyhtälö y + 21 x − 6 ≤ 0? Ei. Tästäkään tapauksesta ei saada lisää ratkaisuehdokkaita. Tapaus 4. λ1 > 0 ja λ2 > 0. Tällä kertaa saadaan yhtälöryhmä 1 (4.35) y − λ1 − 2λ2 = 0 2 (4.36) x − λ1 − λ2 = 0 1 y+ x−6=0 (4.37) 2 (4.38) y + 2x − 12 = 0, jonka ratkaisu on (x, y, λ1 , λ2 ) = 4, 4, 83 , 43 . Tämä piste toteuttaa kaikki ehdot, joten se kelpaa ratkaisuehdokkaaksi. Itseasiassa se on ratkaisu, koska tavoitefunktion arvo on siinä 16, kun taas ehdokkaassa (0, 0) se on vain 0. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 29 5. Komparatiivinen statiikka Komparatiivisen statiikan avulla voi tutkia jonkin mallin eksogeenisen muuttujan muutoksen vaikutusta endogeeniseen muuttujaan. Endogeeninen muuttuja voi olla vaikka tuotanto ja eksogeeninen muuttuja esimerkiksi lopputuotteen hinta. Tarpeellisia apuvälineitä ovat kokonaisdifferentiaali, ketjusääntö ja erityisesti implisiittifunktiolauseet. 5.1. Kokonaisdifferentiaali. Muistellaan ensin derivoituvaa yhden muuttujan funktiota y = f (x). Tarkastellaan pistettä (x0 , f (x0 )) ja sen kautta kulkevaa tangenttisuoraa, jonka yhtälö differentiaalien avulla kirjoitettuna (katso kurssi YE19a tai EMEA) on (5.1) dy = f ′ (x0 )dx, jossa dy = y−f (x0 ) ja dx = x−x0 . Yhtälö (5.1) on funktion f differentiaali pisteessä (x0 , f (x0 )) ja sitä voisi merkitä myös df = f ′ (x0 )dx. Funktion arvon muutosta ∆y = f (x) − f (x0 ) voidaan arvioida yhtälön (5.1) avulla seuraavasti (5.2) ∆y ≈ dy = f ′ (x0 )dx. Mitä pienempi on muutos muuttujan x arvossa, sitä parempi tämä arvio yleensä on. Tätä voi ajatella myös niin, että funktion kuvaajaa pisteessä (x0 , f (x0 )) pyritään arvioimaan tangenttisuoralla. Funktion kuvaaja on tämän pisteen läheisyydessä siten ”melkein” suora. Arviointia differentiaalin avulla kutsutaan funktion linearisoinniksi kyseisessä pisteessä. Parempi merkintä funktion differentiaalille olisi (5.3) df (x0 ) = f ′ (x0 )dx, jolloin olisi selvempää, että differentiaali riippuu muun muassa pisteestä x0 . Esimerkki 5.1. Tutkitaan funktiota f (x) = x2 ja pistettä x0 = 2. Oletetaan, että x muuttuu kohdasta 2 kohtaan 2.1. Arvioidaan funktion arvon muutosta funktion differentiaalin df (x0 ) = f ′ (x0 )dx avulla. Nyt kohtien (5.2) ja (5.3) perusteella ∆y ≈ f ′ (2)(2.1 − 2) eli ∆y ≈ 4(2.1 − 2) = 0.4. Todellinen muutos funktion arvossa on 4.41 − 4 = 0.41. Heittoa on 0.01. ⋄ Sama ajatus voidaan laajentaa usean muuttujan funktioon, jolloin puhutaan kokonaisdifferentiaalista. Esimerkiksi kahden muuttujan funktion tapauksessa kuvaajaa ei enää arvioida tangenttisuoralla vaan tangenttitasolla. Olkoon y = f (x1 , x2 , . . . , xn ) sopiva n:n muuttujan funktio. Tämän kokonaisdifferentiaali on (5.4) df (x0 ) = fx1 (x0 )dx1 + . . . + fxn (x0 )dxn , jossa dxi = xi − x0i , i = 1, . . . , n ja x0 = (x01 , x02 , . . . , x0n ). Kokonaisdifferentiaalilla df voidaan arvioida muutosta funktion arvossa, kun kaikki muuttujat (tai vain osa niistä) muuttuvat: ∆y ≈ df . Arvio on yleensä sitä parempi, mitä pienempiä differentiaalit dxi ovat. Edelleen voidaan puhua funktion linearisoinnista. Myös usean muuttujan tapauksessa (kokonais)differentiaali riippuu pisteestä (x01 , . . . , x0n ). Esimerkki 5.2. 30 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE (i) Lasketaan funktion f (x1 , x2 ) = x11 − x32 , x1 6= 0, kokonaisdifferentiaali. Kokonaisdifferentiaali muodostetaan siis laskemalla osittaisderivaatat ja käyttämällä kaavaa (5.4): 1 df = fx1 dx1 + fx2 dx2 eli df = − 2 dx1 − 3x22 dx2 . x1 (ii) Funktion f (x, y, z) = 3x2 − y 4 + yz + xz 3 kokonaisdifferentiaali on df = (6x + z 3 )dx + (z − 4y 3 )dy + (y + 3xz 2 )dz. ⋄ Esimerkki 5.3. Olkoon yrityksen tuotanto y kahden panoksen x1 ja x2 funktio q eli y = q(x1 , x2 ). Tämän kokonaisdifferentiaali on dq = qx1 dx1 + qx2 dx2 . Tämä antaa arvion muutokselle tuotannossa, esimerkiksi kun molemmat panokset muuttuvat. Se on summa rajatuotannoin kerrotuista panosten differentiaaleista. ⋄ Esimerkki 5.4. Oletetaan, että yritys maksimoi voittoaan valitsemalla tuotannon tason y. Olkoon voittofunktio π(y) = py − C(y), jossa p on hinta ja C(y) on kustannusfunktio, joka täyttää millä tahansa tuotannon tasolla ominaisuudet C ′ (y) > 0 ja C ′′ (y) > 0. Kustannusfunktio on siten aidosti kasvava ja aidosti konveksi funktio. Millä tavalla optimaalinen tuotannon taso y ∗ riippuu hinnasta p eli mikä on merkki optimaalisella tuotannon tasolla? Jos olisi annettu jokin paraderivaatan dy dp metrinen muoto kustanusfunktiolle, esimerkiksi ay 2 , a > 0, voitaisiin vain ratkaista optimaalinen tuotanto ja derivoida sitä hinnan suhteen. Kustannusfunktio on annettu nyt yleisemmässä muodossa, joten näin ei voida toimia. Yrityksen tehtävänä on maksimoida voittoaan: max {π(y) = py − C(y)} {y} Välttämätön ehto maksimipisteelle on (5.5) π ′ (y ∗ ) = p − C ′ (y ∗ ) = 0, jossa y ∗ viittaa optimaaliseen tuotannon tasoon. (Miksi y ∗ on optimaalinen?) Alkuperäiseen kysymykseen vastaus saadaan kokonaisdifferentioimalla hinnan p ja tuotannon y suhteen ehtoa (5.5) ja ”ratkaisemalla” haluttu derivaatta: dy 1 dp − C ′′ (y ∗ )dy = 0 ⇒ = ′′ ∗ . dp C (y ) Tämä on positiivinen, koska oletuksen mukaan C ′′ (y ∗ ) > 0.11 Jos tuotteen hinta nousee, optimaalinen tuotanto kasvaa. Myöhemmin lasku tehdään käyttämällä implisiittifunktiolausetta. ⋄ 11Jos tuotanto tosiaan riippuu hinnasta jonkin funktion kautta, siis y = f (p), voidaan laskea funktion differentiaali dy = f ′ (p)dp. Vertaamalla tätä kokonaisdifferentiaalilla saatuun yhtälöön dp − C ′′ (y ∗ )dy = 0, huomataan, että f ′ (p) = C ′′ 1(y∗ ) . YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 31 5.2. Ketjusäännöt. Tähän asti on käsitelty n:n muuttujan funktiota f , y = f (x), jossa siis x = (x1 , . . . , xn ). Entä jos muuttujat xi riippuvat muuttujasta t, eli siis x(t) = (x1 (t), . . . , xn (t)), ja halutaan tietää kuinka y riippuu muuttujasta t? Aloitetaan tapauksella, jossa f (x) on vain yhden muuttujan funktio ja x = x(t) on muuttujan t funktio. Merkitään h(t) = (f ◦ x)(t) eli h(t) = f (x(t)). Yhdistetyn funktion derivointisääntö (tai ketjusääntö) antaa: h′ (t) = f ′ (x(t))x′ (t). Palataan tilanteeseen, jossa x(t) = (x1 (t), . . . , xn (t)). Miten derivoidaan h(t) = f (x(t))? Tietyin säännöllisyysoletuksin on voimassa seuraava lause: Lause 5.1. Yhdistetyn funktion h(t) = f (x(t)) derivaatta h′ (t) saadaan kaavalla n ∂f dx1 ∂f dxn X ∂f dxi ′ (5.6) h (t) = + ... + = . ∂x1 dt ∂xn dt ∂xi dt i=1 Todistus. Sydsæter et al. (2008). Kaavaa (5.6) kutsutaan ketjusäännöksi. 12 Tutkitaan asiaa esimerkin kautta. Esimerkki 5.5. Olkoon f (x, y) = 2x + y 2 + y, jossa x = et ja y = 3t. Merkitään h(t) = f (x, y). Käytetään yllä olevaa lausetta (eikä suoraa sijoitusta) derivaatan h′ (t) määräämiseen: ∂f dx ∂f dy h′ (t) = + = 2et + (2y + 1)3 = 2et + 3(6t + 1). ∂x dt ∂y dt ⋄ Oletetaan seuraavaksi, että h(t) = f (t, x1 (t), x2 (t), . . . , xn (t)). Funktio f riippuu nyt myös ”suoraan” muuttujasta t. Tämän derivaatta muuttujan t suhteen saadaan kaavalla df ∂f dx1 ∂f dt ∂f dxn (5.8) h′ (t) = + = + ... + . dt ∂t |{z} dt ∂x1 dt ∂xn dt =1 Intuitiivisesti derivaatta kaavassa (5.8) koostuu ”suorasta vaikutuksesta” muuttujan t suhteen ja ”epäsuorista vaikutuksista”, jotka syntyvät muiden muuttujien kautta muuttujan t muuttuessa. Esimerkki 5.6. Oletetaan, että tuotanto q riippuu pääomasta K, työvoimasta L ja ajasta t funktion q = f (K, L, t) mukaisesti. Oletaan lisäksi, että K ja L riippuvat myös ajasta. Tuotannon derivaatta ajan suhteen saadaan ketjusäännöllä (5.8): ∂f dK ∂f dL ∂f dq = + + . dt ∂K dt ∂L dt ∂t 12Kaavan (5.6) voisi esittää myös muodossa df = ∇f (x) · x′ (t). (5.7) dt Tässä ∇f (x) on gradienttivektori ja x′ (t) on vektori, joka koostuu funktioiden xi derivaatoista. 32 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE ⋄ 5.3. Implisiittifunktiolauseet. Tähän asti on käsitelty pääasiassa funktioita, jotka voidaan esittää yhden muuttujan tapauksessa muodossa y = f (x). Tämä funktio on niin sanotussa ratkaistussa eli eksplisiittisessä muodossa. Usein funktio y = f (x) on annettu ratkaisemattomassa eli implisiittisessä muodossa jonkin yhtälön F (x, y) = 0 avulla, jossa F on kahden muuttujan funktio. Tarkemmin sanottuna yhtälö F (x, y) = 0 määrittää muuttujan y muuttujan x funktiona implisiittisesti, jos jollain välillä on olemassa funktio y = f (x) siten että F (x, f (x)) = 0. Usein, kuten Esimerkissä 5.4, kiinnostuksen kohteena on ratkaista annetusta yhtälöstä F (x, y) = 0 derivaatta f ′ (x). Miten? Jos yhtälö tosiaan määrittelee muuttujan y muuttujan x funktiona y = f (x), voidaan yhtälöä derivoida puolittain muuttujan x suhteen. Yhtälön vasemman puolen derivaatta on Fx (x, y) + Fy (x, y)f ′ (x), ja oikean puolen nolla, joten ratkaisemalla saadaan f ′ (x) = − Fx (x, y) , Fy (x, y) kunhan Fy (x, y) 6= 0. Tämä kaavaa kannattaa pitää mielessä. Miltä kaava näyttää, jos yhtälönä olisi F (x, y) = c, jossa c on vakio? Entä jos x voitaisiin lausua muuttujan y funktiona, x = g(y), siten että F (g(y), y) = 0? Miltä derivaatta g ′ (y) näyttäisi tässä tapauksessa? Implisiittifunktio voidaan yrittää ratkaista eksplisiittisessä muodossa, mutta tämä ei usein onnistu. Esimerkki 5.7. Olkoon F (x, y) = 0 muotoa 2y − x2 + 2 = 0. Yhtälö määrittelee muuttujan y muuttujan x implisiittisenä funktiona: funktion y = f (x) ratkaistu (eli eksplisiittinen) muoto on 1 y = x2 − 1. 2 Tämän derivaatta on x. Sama tulos saadaan myös käyttämällä kaavaa f ′ (x) = (x,y) (Laske). ⋄ − FFxy (x,y) Esimerkki 5.8. Olkoon F (x, y) = 0 muotoa y 5 − x2 + 3y = 0. Muuttujan y ratkaiseminen tästä yhtälöstä on vaikeaa. On kuitenkin olemassa pisteitä, joissa yhtälö toteutuu, kuten esimerkiksi pisteet (x, y) = (2, 1) ja (x, y) = (−2, 1). Voiko olla niin, että ainakin näiden pisteiden ympäristössä muuttuja y voidaan lausua muuttujan x funktiona? ⋄ Millä ehdoilla muuttuja y voidaan lausua muuttujan x funktiona jonkin pisteen ympäristössä? Lause (i) (ii) (iii) 5.2. Olkoon F (x, y) = 0 annettu ja piste (x0 , y0 ) sellainen, että F (x0 , y0 ) = 0, F (x, y) jatkuvasti derivoituva pisteen (x0 , y0 ) ympäristössä, ja Fy (x0 , y0 ) 6= 0. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 33 Tällöin pisteen (x0 , y0 ) ympäristössä on olemassa jatkuvasti derivoituva funktio y = f (x) siten että (5.9) Fx (x0 , y0 ) dy (x0 ) = f ′ (x0 ) = − . dx Fy (x0 , y0 ) Todistus. Rosenlicht (1986).13 Huomaa kaavassa oleva miinus-merkki. Tässä lauseessa on annettu ehdot, joiden täyttyessä on olemassa pisteen (x0 , y0 ) ympäristö siten että muuttuja y voidaan lausua siinä muuttujan x funktiona. Huom. Luentomonisteessa ja tehtävissä esiintyvien funktioiden osittaisderivaatat ovat jatkuvia. Tämän johdosta ehdosta (ii) ei tarvitse välittää. Sen sijaan on aina syytä ymmärtää, että piste toteuttaa yhtälön F (x, y) = 0, ja että osittaisderivaatta muuttujan y suhteen ei ole nolla kyseisessä pisteessä. Lauseessa muuttujaa y voidaan kutsua endogeeniseksi muuttujaksi ja muuttujaa x eksogeeniseksi. Lauseessa annetaan ehdot joiden täyttyessä voidaan endogeeninen muuttuja määrittää implisiittisesti eksogeenisen muuttujan funktiona. Lauseen ehdossa (iii) on funktion F osittaisderivaatta juuri endogeenisen muuttujan suhteen. dy Lisäksi tämän implisiittifunktiolauseen avulla voidaan myös laskea derivaatta dx kohdassa x0 , mikä on koko komparatiivisen statiikan tarkoitus. Esimerkki 5.9. Palataan Esimerkkiin 5.8 ja tarkastellaan pistettä (2, 1). Lasketaan dy kohdassa 2. Yhtälönä on y 5 − x2 + 3y = 0, joten piste (2, 1) toteuttaa derivaatta dx sen ((1)5 − 22 + 3 = 0). Implisiittifunktiolauseen vaatimus (iii) toteutuu, koska Fy (2, 1) = 8 6= 0. Yllä oleva huomautus mukaan luettuna Lauseen 5.2 ehdot toteutuvat ja sen vuoksi muuttuja y voidaan lausua muuttujan x funktiona pisteen (2, 1) ympäristössä. dy Tällöin on järkevää puhua derivaatasta dx . Nyt Fx = −2x. Implisiittifunktiolauseen perusteella derivaataksi kyseisessä pisteessä saadaan dy −4 1 (2) = − = . dx 8 2 ⋄ Muistisäännöksi tarkastellaan yhtälöä F (x, y) = 0 ja sen kokonaisdifferentiaalia. Laskemalla saadaan Fx dy =− . Fx dx + Fy dy = 0 ⇒ Fy dy = −Fx dx ⇒ dx Fy Erityisesti tätä kautta on helpompi muistaa kaavassa (5.9) oleva miinusmerkki. Esimerkki 5.10. Palataan voittoa maksimoivaan yritykseen eli Esimerkkiin 5.4. Ensimmäisen kertaluvun välttämätön ehto maksimille on π ′ (y ∗ ) = p − C ′ (y ∗ ) = 0. 13Maxwell Rosenlicht, Introduction to analysis. 34 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Piste (p, y ∗ ) toteuttaa tämän yhtälön. Lasketaan derivaatta dy implisiittifunktiodp lauseella: 1 dy 1 dy =− ⇔ = ′′ ∗ . (5.10) ′′ ∗ dp −C (y ) dp C (y ) Päädyttiin siis aivan samaan lopputulokseen kuin aiemminkin. ⋄ Lause 5.2 yleistyy seuraavasti: Lause 5.3. Olkoon F (x1 , . . . , xn , y) = 0 annettu ja (i) piste (x01 , . . . , x0n , y 0 ) sellainen, että F (x01 , . . . , x0n , y 0 ) = 0, (ii) F (x1 , . . . , xn , y) jatkuvasti derivoituva, (iii) ja Fy (x01 , . . . , x0n , y 0 ) 6= 0. Tällöin pisteen (x01 , . . . , x0n , y 0 ) ympäristössä on olemassa jatkuvasti derivoituva funktio y = f (x1 , . . . , xn ) siten että jokaisella i = 1, . . . , n on voimassa (5.11) Fx (x0 , . . . , x0n , y 0 ) ∂y 0 . (x1 , . . . , x0n ) = − i 01 ∂xi Fy (x1 , . . . , x0n , y 0 ) Todistus. Rosenlicht (1986). Kaavasta (5.11) on hyvä huomioida, että kyseessä on osittaisderivaatta. Lauseen avulla voidaan siis laskea kaikki osittaisderivaatat, kunhan ehdot ovat voimassa. Esimerkki 5.11. Olkoon F (x, z, y) = y 3 xz 2 +4x2 −2xzy−y+1 = 0. Lasketaan osit∂y pisteessä (x, z, y) = (0, 1, 1) käyttämällä yllä olevaa implisiittifunktaisderivaatta ∂x tiolausetta. Piste (x, z, y) = (0, 1, 1) toteuttaa yhtälön, koska F (0, 1, 1) = −1+1 = 0. Lisäksi Fy (x, z, y) = 3y 2 xz 2 − 2xz − 1, joka pisteessä (0, 1, 1) saa arvon Fy (0, 1, 1) = −1 6= 0. Lisäksi Fx (x, z, y) = y z +8x−2zy, jonka arvo pisteessä (0, 1, 1) on −1. Soveltamalla Lausetta 5.3 osittaisderivaataksi saadaan −1 ∂y (0, 1) = − = −1. ∂x −1 ⋄ 3 2 Tarkastellaan lopuksi tilanne, jossa yhtälöitä on useita.14 Miksi tämä tapaus on tärkeä? Ajattele vaikka yritystä, jonka tuotanto on saastuttavaa ja jota reguloidaan jollain instrumentilla, kuten esimerkiksi verolla. Yritys maksimoi voittoaan valitsemalla tuotannon ja puhdistuksen määrät y ja a. Tällöin ensimmäisen kertaluvun välttämättömiä ehtoja maksimille on kaksi (yksi tuotannon ja toinen puhdistuksen suhteen) ja optimaalinen tuotanto ja puhdistus ovat implisiittisessä muodossa. Tällaisessa mallissa halutaan tutkia esimerkiksi miten lopputuotteen hinta p (tai vaikka 14Täsmällinen esitys lauseen muodossa löytyy kirjasta Sydsæter et al. (2008), ja sen todistus kirjassa mainituista lähteistä, tai kirjasta Rosenlicht (1986). YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 35 vero) vaikuttaa esimerkiksi optimaalisen tuotannon määrään eli selvittää derivaatan dy merkki (tai osittaisderivaatan merkki, jos eksogeenisia muuttujia on useita). Aidp emmin annetut keinot tämän derivaatan löytämiseksi eivät riitä, koska optimaalinen tuotanto ja puhdistus ovat ratkaisu kahteen yhtälöön. Olkoon annettu m kappaletta jatkuvasti derivoituvia funktioita F1 , . . . , Fm ja yhtälöryhmä: F1 (x1 , . . . , xn , y1 , . . . , ym ) = c1 .. .. .. (5.12) . . . Fm (x1 , . . . , xn , y1 , . . . , ym ) = cm Ylläolevissa yhtälöissä y1 , . . . , ym ovat endogeenisiä ja x1 , . . . , xn eksogeenisia muut0 tujia. Olkoon piste P = (x01 , . . . , x0n , y10 , . . . , ym ) sellainen, että se toteuttaa yhtälöryhmän. Oleelliset kysymykset ovat: 1. Milloin näistä yhtälöistä voidaan (ainakin periaatteessa) ratkoa muuttujat yj muuttujien xi suhteen pisteen P ympäristössä? ∂y1 pisteen P ympäristössä? 2. Miten löydetään esimerkiksi osittaisderivaatta ∂x 2 Funktiot Fi ovat jatkuvasti derivoituvia, joten niillä on osittaisderivaatat jokaisen muuttujan suhteen. Yhtälöistä voidaan ratkoa muuttujat yj muuttujien xi suhteen pisteen P ympäristössä silloin, kun pisteessä P on voimassa: ∂F1 ∂F1 ∂F1 ∂y . . . ∂y ∂y m ∂F1 ∂F2 ∂F2 2 2 ∂y1 ∂y2 . . . ∂ym .. .. 6= 0. .. ... . . . ∂F m ∂Fm . . . ∂Fm ∂y1 ∂y2 ∂ym Yksi tapa osittaisderivaattojen laskemiseen on yhtälöiden kokonaisdifferentiointi puolittain, jolloin saadaan yhtälöryhmä: ∂F1 ∂F1 ∂F1 ∂F1 ∂x1 dx1 + . . . + ∂xn dxn + ∂y1 dy1 + . . . + ∂ym dym = 0 .. .. . . ∂Fm ∂Fm ∂Fm ∂Fm dx1 + . . . + ∂xn dxn + ∂y1 dy1 + . . . + ∂ym dym = 0 ∂x1 ∂y1 saadaan asettamalla dxi = 0, kun i 6= 1, Nyt esimerkiksi osittaisderivaatta ∂x 1 dy1 ja jakamalla yhtälöt dx1 :llä ja tulkitsemalla differentiaalien osamäärä dx halutuksi 1 osittaisderivaataksi. Näin saadaan lineaarinen yhtälöryhmä, jossa osittaisderivaatat ovat tuntemattomat muuttujat. Esimerkki 5.12. Tarkastellaan yhtälöparia (5.13) F1 (x, y, k) = x2 + ky 2 = 2 (5.14) F2 (x, y, k) = kx + y 3 = 2. 36 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Määritteleekö yhtälöpari endogeeniset muuttujat x ja y eksogeenisen muuttujan k funktioina pisteen P = (1, 1, 1) ympäristössä? Kyllä, koska ∂F1 ∂F1 ∂x ∂y 2x 2ky ∂F2 ∂F2 = k 3y 2 ∂x ∂y ja pisteessä (1, 1, 1) tämän determinantin arvo on 4 6= 0 ja lisäksi piste P toteuttaa arvo kyseisessä pisteessä? Derivaamolemmat yhtälöt. Entä mikä on derivaatan dx dk tan määrittämistä varten lasketaan kokonaisdifferentiaalit: (5.15) 2xdx + 2kydy + y 2 dk = 0 (5.16) kdx + 3y 2 dy + xdk =0. Jaetaan yhtälöryhmä differentiaalilla dk ja ryhmitellään, jolloin saadaan dy dx + 2ky = −y 2 dk dk dx dy k (5.18) + 3y 2 = −x. dk dk Huomataan, että kyseessä on kahden tuntemattoman muuttujan lineaarinen yhtädy ja dk . Ratkaistaan Cramerin säännöllä löryhmä. Nämä muuttujat ovat derivaatat dx dk haluttu derivaatta: 2 −y 2ky −x 3y 2 dx −3y 4 + 2kxy = = . dk 6xy 2 − 2k 2 y 2x 2ky2 k 3y (5.17) 2x Pisteessä (1, 1, 1) derivaatan arvo on − 41 (tämän sijoituksen olisi voinut tehdä jo hieman aiemmin lineaarisen yhtälöryhmän muodostamisen yhteydessä yhtälöissä dy (5.17)–(5.18)). Käyttämällä Cramerin sääntöä voidaan laskea myös derivaatta dk pisteessä (1, 1, 1). Tämän derivaatan arvo on myöskin − 41 . Laske derivaatta itse käyttämällä Cramerin sääntöä.15 ⋄ Esimerkissä eksogeenisiä muuttujia oli vain yksi. Jos niitä olisi ollut useampi, olisi laskun yhteydessä täytynyt tulkita derivaatat osittaisderivaattoina. ”Parempi tapa” laskea (osittais)derivaatat on käyttää ketjusääntöä sen sijaan että muodostaisi kokonaisdifferentiaalit. Esimerkki 5.13. Tulkitaan edellisessä esimerkissä endogeeniset muuttujat x ja y eksogeenisen muuttujan k funktioina eli x = x(k) ja y = y(k), jolloin saadaan 15Derivaatat olisi voinut laskea myös ratkaisemalla yhtälöistä (5.15) ja (5.16) differentiaalit dy ja dx differentiaalin dk suhteen, jolloin saataisiin dy = f1′ dk ja dx = f2′ dk. Tässä f1 ja f2 ovat kaksi funktiota, joille pätee y = f1 (k) ja x = f2 (k). YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 37 yhtälöryhmäksi (5.19) (5.20) F1 (x(k), y(k), k) = x(k)2 + ky(k)2 − 2 = 0 F2 (x(k), y(k), k) = kx(k) + y(k)3 − 2 = 0. Derivoidaan ketjusäännöllä muuttujan k suhteen dy dx (5.21) + 2ky(k) + y(k)2 = 0 2x(k) dk dk dx dy k (5.22) + 3y(k)2 + x(k) = 0. dk dk Järjestelemällä tätä ja jättämällä riippuvuus muuttujasta k merkitsemättä saadaan dy dx (5.23) + 2ky = −y 2 2x dk dk dx dy k (5.24) + 3y 2 = −x, dk dk joka vastaa aiempaa lineaarista yhtälöryhmää. Loppuosa laskusta menee samaan tyyliin kuin yllä. ⋄ 38 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 6. Integraalilaskentaa Integrointia voidaan ajatella intuitiivisesti kahdella tapaa: joko derivoinnin käänteisoperaationa tai sitten pinta-alan määräämisenä. Olkoon f : X → Y yhden muuttujan funktio, y = f (x), jossa X = [a, b] ⊂ R on väli, jonka päätepisteet ovat a ja b. Kurssilla käsitellään yhden muuttujan funktion määrättyjä ja määräämättömiä integraaleja. Määrätyssä integraalissa integroidaan annetun välin yli. Tätä merkitään Z b f (x) dx. (6.1) a Tässä väli [a, b] on integrointiväli ja x on muuttuja, jonka suhteen integroidaan. Määräämätöntä integraalia merkitään Z (6.2) f (x) dx. Kun puhutaan integraalista derivoinnin käänteisoperaationa, tarkoitetaan määräämätöntä integraalia (6.2). Aloitetaan integroinnista derivoinnin käänteisoperaationa, koska tämän jälkeen on helpompaa lähestyä määrättyä integraalia (6.1). Integroitaessa funktiota f etsitään sellaista funktiota F , jonka derivaatta on funktio f . Tätä funktiota F kutsutaan funktion f integraalifunktioksi: Määritelmä 6.1. Funktion f : X → Y integraalifunktio F on se funktio F : X → Y , jolle pätee F ′ (x) = f (x) kaikilla x ∈ X. ◦ R Tätä integraalifunktiota merkitään F (x)= f (x) dx. Integraalifunktio on siis se funktio, jonka derivaatta on alkuperäinen funktio f . Lisäksi integraalifunktio on jatkuva, koska sillä on derivaatta. Esimerkki 6.1. Olkoon f (x) = 2x. Tämän funktion integraalifunktio F (x) on se funktio, jolle pätee F ′ (x) = 2x. Yksi tälläinen on F (x) = x2 . Integraalifunktioksi sopisi myös F (x) = x2 + c, jossa c ∈ R, koska vakion derivaatta on nolla. Vakiota c kutsutaan integrointivakioksi. ⋄ Lause 6.1. Olkoon c ∈ R. Jos F on funktion f integraalifunktio, jokainen funktio G = F + c on funktion f integraalifunktio. Todistus. Tämä seuraa suoraan määritelmästä. Integraalifunktio ei siis ole yksikäsitteinen. Jos tiedämme yhden pisteen (x0 , y0 ), joka kuuluu funktion G kuvaajaan, voimme kuitenkin ratkaista integraalifunktion, joka kulkee kyseisen pisteen kautta. Esimerkki 6.2. Olkoon f (x) = 4x, jolloin F (x) = 2x2 + c. Oletetaan, että piste (3, 2) kuuluu integraalifunktion kuvajaan. Tällöin F (x) = 2x2 − 16, koska F (3) = 2 on sama kuin 2(3)2 + c = 2 eli c = −16. ⋄ Lause 6.2. Olkoon funktioilla f ja g integraalifunktiot. Tällöin YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE (i) (ii) Z Z Z 39 Z (f (x) + g(x)) dx = f (x) dx + g(x) dx, Z af (x) dx = a f (x) dx, jossa a ∈ R. Todistus. Nämä seuraavat suoraan vastaavista derivointisäännöistä. Sääntö (i) sanoo, että funktioiden summa (samoin kuin erotus (ii)-kohdan perusteella) voidaan integroida termeittäin. Esimerkiksi kahden polynomifunktion summa voidaan integroida integroimalla kukin polynomi erikseen ja laskemalla integraalien summa. Lisäksi säännön (ii) mukaan vakio voidaan viedä integraalin eteen. Seuraava lause sisältää integrointikaavoja, joita kannattaa verrata tarkkaan vastaaviin derivointikaavoihin. Lause 6.3. Olkoon c ∈ R ja f jokin derivoituva funktio. Tällöin Z 1 xn+1 + c, kun n 6= −1, (i) xn dx = n + 1 Z 1 (ii) dx = ln |x| + c, kun x 6= 0, Z x (iii) ex dx = ex + c Z 1 f (x)n+1 + c, kun n 6= −1. (iv) f ′ (x)f (x)n dx = n+1 Z ′ f (x) (v) dx = ln |f (x)| + c, kun f (x) 6= 0, Z f (x) (vi) f ′ (x)ef (x) dx = ef (x) + c. Todistus. Nämä seuraavat suoraan derivointikaavoista. Nämä kaavat seuraavat vastaavista derivointikaavoista. Huom: jokaisessa kaavassa on mukana integrointivakio c. Muista laskuissa lisäksi, että integraalifunktion derivaatta on integroitavana oleva funktio, joten voit tarkastaa ratkaisusi derivoimalla. Esimerkki 6.3. Z 1 1 1 (i) (2x + 2x3 ) dx = 2 · x2 + 2 · x4 + c = x2 + x4 + c, 2 4 2 Z Z √ √ 3 3 1 2 +1 x2 + c = (ii) x3 dx = x 2 dx = 3 x5 + c, 5 + 1 2 Z Z Z 2 2x 1 1 2x (iii) e dx = e dx = 2e2x dx = e2x + c. 2 2 2 Huomaa juuren muuttaminen potenssimuotoon kohdassa (ii) ja kerroin (iii). (Tarkista vastaukset derivoimalla!) 2 2 kohdassa ⋄ 40 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Esimerkki 6.4. Lasketaan integraali Z 2x(x2 + 10)5 dx. Tässä integroitava funktio on muotoa f ′ (x)f (x)n , joten käytetään Lauseen 6.3 laskusääntöä (iv): Z 1 1 2x(x2 + 10)5 dx = (x2 + 10)5+1 + c = (x2 + 10)6 + c. 5+1 6 Tarkista tämäkin vastaus derivoimalla. ⋄ Esimerkki 6.5. Lasketaan seuraava integraali suorittamalla ensin jakolasku Z Z 2 2 1 x − 2x + 1 1 − + 2 dx dx = x2 x x 1 = x − 2 ln |x| + x−2+1 + c −2 + 1 1 = x − 2 ln |x| − + c. x ⋄ Esimerkki 6.6. Lasketaan integraali Z Z 1 1 2 dx |{z} = ) dx = ln |x| − ln |x + 2| + c ( − x(x + 2) x x+2 (∗) Yhtäsuurudessa (∗) käytettiin osamurtohajotelmaa: Olkoon A ja B reaalilukuja. Muodostetaan osamurtohajotelma 2 A B = + x(x + 2) x x+2 ⇔ 2 A(x + 2) + Bx = . x(x + 2) x(x + 2) Täytyy siis olla voimassa 2 = A(x + 2) + Bx, joten pohdinnan jälkeen valitsemme A = 1 ja B = −1. Tällöin yhtäsuuruus (∗) pitää paikkansa. Osamurtohajotelmassa jaettavana olevan polynomin aste on oltava pienempi tai yhtäsuuri kuin jakajan ja jakajana olevan polynomin tulee olla jaettuna tekijöihinsä. Jos jaettavan polynomin aste on suurempi kuin jakajan, voidaan suorittaa polynomien jakolasku ennen osamurtohajotelman soveltamista. ⋄ Osittaisintegroinnista on hyötyä: Lause 6.4. Olkoon f ja g derivoituvia funktioita. Tällöin on voimassa Z Z ′ (6.3) f (x)g (x) dx = f (x)g(x) − f ′ (x)g(x) dx. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 41 Osittaisintegrointikaava (6.3) on helpompi johtaa kuin muistaa ulkoa. Kaava seuraa tulon derivointisäännöstä, kun kyseinen sääntö integroidaan puolittain: D(f (x)g(x)) = f (x)g ′ (x) + f ′ (x)g(x) ⇔ Z f (x)g(x) = (f (x)g ′ (x) + f ′ (x)g(x)) dx. Osittaisintegrointikaava seuraa tästä käyttämällä integraalin yhteenlaskuominaisuutta ja järjestelemällä yhtälöä uudelleen. Kaavan soveltamiseksi on tunnistettava tarvittavat funktiot f ja g. R Esimerkki 6.7. Lasketaan interaali xex dx. Valitaan f (x) = x ja g ′ (x) = ex , jolloin f ′ (x) = 1 ja g(x) = ex . Sovelletaan sitten kaavaa (6.3): Z Z x x xe dx = xe − ex dx = xex − ex + c = ex (x − 1) + c. Olisivatko valinnat f (x) = ex ja g ′ (x) = x johtaneet mihinkään? ⋄ R Esimerkki 6.8. Lasketaan ln x dx. Valitaan f (x) = ln x ja g ′ (x) = 1, jolloin 1 f ′ (x) = ja g(x) = x. Sovelletaan sitten kaavaa (6.3): x Z Z 1 x dx = x ln x − x + c. ln x dx = x ln x − x Tarkista vastaus derivoimalla. ⋄ Siirrytään määrättyyn integraaliin. RMäärätyssä integraalissa integroidaan funkb tiota f yli välin [a, b] ja sitä merkitään a f (x) dx. Tulkinta määrätylle integraalille: Määrätyssä integraalissa on kyse käyrän ja x-akselin väliin jäävästä pinta-alasta, kun f (x) ≥ 0 millä tahansa x ∈ [a, b]. Esimerkki 6.9. Tarkastellaan vakiofunktiota f (x) = 2 välillä [0, 2]. Tässä tapauksessa ”käyrän” alle jäävä pinta-ala välillä [0, 2] saadaan neliön alana. Neliön ala on: kanta × korkeus = 2 × 2 = 4. Ajatellaan tilannetta nyt määrätyn integraalin avulla.R Myöhemmin esitettävän Lauseen b 6.5 mukaan, määrätty integraali lasketaan kaavalla a f (x) dx = F (b) − F (a). Esimerkissä [a, b] = [0, 2] ja F (x) = 2x + c, joten Z 2 f (x) dx = F (2) − F (0) = 4. 0 ⋄ Käytännössä määrätyn integraalin laskeminen ei juuri eroa määräämättömän integraalin laskemisesta. Määrätyn integraalin laskemiseen tarvitaan määräämättömän integraalin laskemista integraalifunktion F määrittämiseksi ja vähennyslaskua kuten seuraava lause kertoo. 42 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Lause 6.5. Olkoon funktio F funktion f : [a, b] → R integraalifunktio. Tällöin määrätty integraali saadaan kaavalla Z b f (x) dx = F (b) − F (a). (6.4) a Todistus. Rosenlicht (1986). Usein laskuissa on tapana merkitä välivaihe sijoitukselle: Z b b . f (x) dx = F (x) = F (b) − F (a). a a Seuraavasta lauseesta käy ilmi määrätyn integraalin perusominaisuuksia: Lause 6.6. Olkoon c ∈ R ja funktiot f ja g integroituvia. Tällöin Z b Z b Z b (i) (f (x) + g(x)) dx = f (x) dx + g(x) dx, a a a Z b Z b f (x) dx, cf (x) dx = c (ii) a a Z b Z d Z b f (x) dx, kun d ∈ [a, b], f (x) dx + f (x) dx = (iii) d Za b Za b g(x) dx, kun f (x) ≤ g(x) välillä [a, b]. f (x) dx ≤ (iv) a a Todistus. Rosenlicht (1986). Esimerkki 6.10. Z 1 1 . 1 2 1 1 1 x x (x + e ) dx = x + e = · 12 + e 1 − · 02 − e 0 = e − . 2 2 2 2 0 0 ⋄ Osittaisintegrointikaava (6.3) tulee määrätyssä integroinnissa muotoon Z b Z b b . ′ f ′ (x)g(x) dx. f (x)g (x) dx = f (x)g(x) − (6.5) a a a Esimerkki 6.11. Pohditaan määrätyn integraalin sovelluksena kuluttajan- ja tuottajan ylijäämiä. Olkoon tuotteen käänteiskysyntäkäyrä p = d(q) ja käänteistarjontakäyrä p = s(q). Olkoon käänteiskysyntäkäyrä vähenevä ja käänteistarjontakäyrä kasvava tuotannon suhteen. Käänteiskysyntä edustaa kuluttajien maksuhalukkuutta tietystä tuotannon määrästä. Kokonaismaksuhalukkuus määrästä q0 on siten Z q0 d(q) dq. 0 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 43 Kuluttajan ylijäämä on kokonaismaksuhalukkuuden ja ostamisesta koituvien kulujen erotus. Tuottajien kannalta käänteistarjontakäyrä edustaa tuotannon rajakustannusta, joten kokonaiskustannus määrästä q0 saadaan Z q0 s(q) dq. 0 Tuottajan ylijäämä on myyntitulojen ja kokonaiskustannuksen erotus. Kuluttajien ja tuottajien ylijäämien summa on siten Z q0 Z q0 Z q0 d(q) dq − pq0 + pq0 − s(q) dq = [d(q) − s(q)] dq. 0 0 0 Kuva 6.1 havainnollistaa jo tuttua asiaa: p Kuluttajan ylijäämä s(q) Tuottajan ylijäämä p0 d(q) q0 q Kuva 6.1. Kuluttajan- ja tuottajan ylijäämät. Seuraava lause on on tärkeä: ⋄ Lause 6.7. OlkoonR f : [a, b] → R jatkuva funktio ja funktio F : [a, b] → R määritelty x kaavalla F (x) = a f (t) dt. Tällöin F on derivoituva ja F ′ (x) = f (x) kaikilla x ∈ [a, b]. Todistus. Rosenlicht (1986). R b(x) Olkoon F (x) = a(x) f (x, t) dt. Seuraava kaava voidaan osoittaa oikeaksi (sopivin oletuksin, katso Sydsæter et al. 2008): Z b(x) dF (x) ∂f (x, t) ′ ′ (6.6) = b (x)f (x, b(x)) − a (x)f (x, a(x)) + dt. dx ∂x a(x) 44 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 7. Differentiaaliyhtälöt Tavallinen differentiaaliyhtälö sisältää tuntemattoman yhden muuttujan funktion x(t) ja sen derivaattoja x′ (t), x′′ (t), . . . , x(n) (t). Funktion riippumattoman muuttujan symbolina käytetään kirjainta t, jonka voi ajatella aikana. Tässä luvussa derivaattai ẋ. Lisäksi eksplisiittinen riippuvuus ajasta t jätetään taa merkitään joko x′ , dx dt yhtälöissä usein merkitsemättä. Differentiaaliyhtälöt ovat keskeinen väline useissa taloustieteellisissä malleissa, joissa aika on mukana. Esimerkki 7.1. Yksinkertainen esimerkki differentiaaliyhtälöstä on dx(t) (7.1) = x(t). dt Funktion x(t) derivaatta on siis yhtäsuuri kuin funktio itse. Huomataan, että funktio x(t) = et kelpaisi yhtälön ratkaisuksi. Toisaalta myös funktiot x(t) = 2et ja x(t) = 3et kelpaisivat. Yleisesti yhtälön (7.1) ratkaisuja ovat kaikki muotoa x(t) = cet , c ∈ R, olevat funktiot. ⋄ Differentiaaliyhtälön ratkaisulla tarkoitetaan sitä funktiota, joka toteuttaa kyseisen yhtälön, ja differentiaaliyhtälön ratkaisemisella tarkoitetaan yhtälön kaikkien ratkaisujen löytämistä. Ratkaiseminen voi olla vaikeaa, mutta usein on yksinkertaista tarkistaa, onko jokin funktio jonkin yhtälön ratkaisu. Esimerkki 7.2. Onko funktio x(t) = 3t differentiaaliyhtälön x′ (t) = x(t) ratkaisu? t x(t) Derivoimalla ehdokasta saadaan x′ (t) = 3. Toisaalta t = 3 ja tämä on sama kuin x′ (t), joten funktio x(t) = 3t ratkaisee yhtälön. ⋄ Differentiaaliyhtälöiden yhteydessä tulee tuntea ero yksityisratkaisun ja yleisen ratkaisun välillä: (i) Differentiaaliyhtälön yksityisratkaisu jollain välillä I on funktio, joka toteuttaa yhtälön kaikilla t välillä I. (ii) Differentiaaliyhtälön yleinen ratkaisu on kaikkien yksityisratkaisujen joukko (se sisältää usein yhden tai useamman vakion). Esimerkissä 7.1 yleinen ratkaisu on x = cet ja yksi yhtälön yksityisratkaisuista on x = 2et . Yleisestä ratkaisusta saadaan yksityisratkaisu, jos tehtävässä on annettu jokin alkuarvo eli funktion arvo jollain muuttujan t arvolla. Yhtälöllä saattaa myös olla triviaaliratkaisuja, joita kutsutaan myös erikoisratkaisuiksi. Niitä ei (useimmiten) saada yleisestä ratkaisusta millään vakion c arvolla. Jatketaan Esimerkkiä 7.1 lisäämällä tehtävälle alkuarvo. Esimerkki 7.3. Ratkaistaan alkuarvotehtävä dx (7.2) = x, x(0) = 1. dt Alkuarvon, x(0) = 1, mukaan funktion arvo hetkellä t = 0 on 1. Yhtälön yleinen ratkaisu on muotoa x = cet . Alkuarvon mukaan x(0) = 1, joten yhdistämällä tämä tieto yleiseen ratkaisuun saadaan määritettyä vakion c arvo: ce0 = 1, joten c = 1. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 45 Alkuarvoon x(0) = 1 liittyväksi (yksityis)ratkaisuksi saadaan siten funktio x = et . ⋄ Esimerkki 7.4. Ratkaistaan differentiaaliyhtälö x′ = t3 . Yleinen ratkaisu saadaan esimerkiksi integroimalla yhtälö puolittain: x′ = t 3 ⇔ 1 x = t4 + c. 4 ⋄ Esimerkki 7.5. Ratkaistaan differentiaaliyhtälö x′′ = 1. Integroimalla kerran saadaan x′ = t + c1 . Yleinen ratkaisu saadaan integroimalla toistamiseen: 1 x = t 2 + c1 t + c2 . 2 Yleinen ratkaisu riippuu tässä tapauksessa kahdesta vakiosta c1 ja c2 . Siten jonkin yksityisratkaisun löytämiseen tarvittaisiin kaksi alkuarvoa, toinen funktiolle ja toinen sen derivaatalle. ⋄ Kertalukua n olevan differentiaaliyhtälön normaalimuoto on x(n) = f (t, x, x′ , . . . , x(n−1) ), jossa f on jokin funktio. Kertaluku tarkoittaa yhtälön korkeimman derivaatan kertalukua. Kertalukua n olevan differentiaaliyhtälön yleinen ratkaisu x(t, c1 , . . . , cn ) sisältää (useimmiten) n kappaletta vakioita ci . Siten kertalukua n olevan differentiaaliyhtälön yksityisratkaisua varten tarvitaan n kappaletta alkuarvoja. Kertalukua n oleva differentiaaliyhtälö on lineaarinen, jos se voidaan esittää muodossa (7.3) x(n) + am (t)x(n−1) + · · · + a2 (t)x′ + a1 (t)x = b(t). Lineaarinen differentiaaliyhtälö ei siis sisällä esimerkiksi funktion tai sen jonkin derivaatan kertolaskua. Yhtälö (7.3) on lisäksi vakiokertoiminen, jos kerroinfunktiot ai (t) ovat kaikki vakioita (eli eivät riipu ajasta t), ja homogeeninen, jos b(t) = 0. Esimerkin 7.1 differentiaaliyhtälö on ensimmäisen kertaluvun lineaarinen differentiaaliyhtälö. Se on lisäksi vakiokertoiminen ja homogeeninen. Esimerkki 7.6. (i) Yhtälö x′ = x + 2 voidaan kirjoittaa muotoon x′ − x = 2, joten se on ensimmäisen kertaluvun lineaarinen ja epähomogeeninen differentiaaliyhtälö. (ii) Yhtälö x′ = x(1−x) on ensimmäisen kertaluvun epälineaarinen yhtälö, koska sitä ei voi kirjoittaa muotoon (7.3). (iii) Yhtälö 2x′′ = 5x + 7t2 voidaan kirjoittaa muotoon x′′ − 52 x = 27 t2 , joten se on toisen kertaluvun lineaarinen ja epähomogeeninen differentiaaliyhtälö. ⋄ 46 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Luvussa tarkastellaan vain ensimmäisen kertaluvun lineaarisia differentiaaliyhtälöitä, muutamaa epälineaarista yhtälötyyppiä ja toisen kertaluvun lineaarisia ja vakiokertoimisia yhtälöitä. Normaalimuoto ensimmäisen kertaluvun differentiaaliyhtälölle annettuna jokin alkuarvo x0 ∈ R hetkellä t0 on dx = f (t, x), x(t0 ) = x0 dt Alkuarvotehtävää (7.4) ratkaistaessa pyritään etsimään funktiota, joka toteuttaa kyseisen yhtälön ja annetun alkuarvon. Seuraava lause koskee ratkaisun olemassaoloa ja yksikäsitteisyyttä (teknisiä ykstyiskohtia on karsittu kuten muutamissa muissakin lauseissa) (7.4) Lause 7.1. Jos f (t, x) on jatkuva ja osittaisderivaatta muuttujan x suhteen on olemassa jatkuvana, alkuarvotehtävällä (7.4) on yksikäsitteinen ratkaisu x(t) jollain t0 :n sisältävällä välillä. Todistus. Kurssi Differentiaaliyhtälöt II Kumpulassa. Idea on kirjassa FMEA. Tärkeintä tällä kurssilla on oppia ratkaisemaan joitakin differentiaaliyhtälöitä. Aloitetaan ensimmäisen kertaluvun lineaarisista differentiaaliyhtälöistä, jotka ovat muotoa (7.5) x′ + p(t)x = q(t) Jos funktiot p(t) ja q(t) ovat vakioita, differentiaaliyhtälö on vakiokertoiminen. Tarkastellaan ensin vakiokertoimisen yhtälön ratkaisua niin sanotun integroivan tekijän avulla. Ratkaistavana on siis yhtälö (7.6) x′ + ax = b, jossa a ja b ovat reaalilukuja. Integroiva tekijä on tässä tapauksessa (7.7) e R a dt = eat (tässä integrointivakio on valittu nollaksi). Kertomalla yhtälö (7.6) molemmin puolin tällä tekijällä saadaan eat x′ + aeat x = beat . Tämä yhtälö selittää integroivan tekijän käytön, koska vasemmalla puolella on funktion eat x derivaatta muuttujan t suhteen (tulon derivointisääntö). Tämän huomion jälkeen voidaan sitten integroida yhtälö molemmin puolin muuttujan t suhteen, d at b b (e x) = beat ⇔ eat x = eat + c ⇔ x = + ce−at , c ∈ R. dt a a Näin on saatu vakiokertoimisen lineaarisen differentiaaliyhtälön yleinen ratkaisu. Tätä kaavaa ei pidä opetella ulkoa, vaan opetella integroivan tekijän käyttö tässä yhteydessä. Kuten aiemmin, jokin yksityisratkaisu löydetään, jos tehtävässä on annettu alkuarvo. (7.8) YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 47 Esimerkki 7.7. Ratkaistaan alkuarvotehtävä x′ − 2x = 1, x(0) = 1. Tässä integroiva tekijä on e−2t . Kerrotaan yhtälön molemmat puolet tällä, jolloin saadaan e−2t x′ − 2xe−2t = e−2t . Vasemmalle puolelle saadaan näin funktion e−2t x derivaatta muuttujan t suhteen, jolloin voidaan integroida d −2t 1 1 (7.9) (e x) = e−2t ⇔ e−2t x = − e−2t + c ⇔ x = − + ce2t . dt 2 2 Tämä on differentiaaliyhtälön yleinen ratkaisu (vertaa kaavaan (7.8)). Alkuarvotehtävän ratkaisu saadaan määrittämällä vakion c arvo käyttämällä alkuehtoa x(0) = 1. ⋄ Siis − 12 + c = 1, joten alkuarvotehtävän ratkaisuksi saadaan x = − 12 + 23 e2t . Entä jos kyseessä ei olekaan vakiokertoiminen yhtälö? Edetään vastaavalla tavalla eli ratkaistaan yhtälö (7.5) käyttämällä integroivaa tekijää, joka on nyt e R p(t) dt = eP (t) . Kerrotaan yhtälö (7.5) integroivalla tekijällä d P (t) eP (t) x′ + p(t)xeP (t) = eP (t) q(t) ⇔ (e x) = eP (t) q(t) dt Z Z eP (t) x = eP (t) q(t) dt + c ⇔ x = e−P (t) ⇔ eP (t) q(t) dt + e−P (t) c. Tämä on yhtälön yleinen ratkaisu. 2 Esimerkki 7.8. Ratkaistaan yhtälö x′ − 2tx = et . Integroiva tekijä on nyt e R −2t dt 2 2 = e−t , 2 2 2 joten kertomalla yhtälö sillä saadaan e−t x′ − 2te−t x = e−t et . Nyt d −t2 2 2 (e x) = 1 ⇔ e−t x = t + c ⇔ x = et (t + c). dt Tarkista derivoimalla ja sijoituksella, että ratkaisu on oikein. Seuraavaksi tarkastellaan separoituvia differentiaaliyhtälöitä. ⋄ Esimerkki 7.9. Ratkaistaan differentiaaliyhtälö x′ = tx. Erikoisratkaisu on vakio= tx. Ratkaistaan yhtälö siirtämällä funktio x = 0. Kirjoitetaan yhtälö muotoon dx dt muuttujaa x sisältävät termit yhtälön vasemmalle ja muuttujaa t sisältävät termit yhtälön oikealle puolelle ja integroimalla puolittain.16 Z Z dx 1 (7.10) = tdt ⇔ dx = t dt + c x x eli 1 2 1 2 1 2 1 (7.11) ln |x| = t2 + c ⇔ eln |x| = e 2 t +c ⇔ |x| = e 2 t +c ⇔ x = ke 2 t , 2 c jossa k = ±e . ⋄ 16Tämä on laskumenetelmä. 48 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Ylläolevan esimerkin differentiaaliyhtälö on separoituva differentiaaliyhtälö. Differentiaaliyhtälö on separoituva, jos se voidaan kirjoittaa muodossa dx = p(t)g(x), dt jossa p on jokin muuttujan t funktio ja g jokin muuttujan x funktio. Kirjoitetaan yhtälö muotoon, jossa muuttujaa x sisältävät termit ovat vasemmalla ja muuttujaa t sisältävät termit ovat oikealla puolella yhtälöä, dx = p(t)dt g(x) Tämä voidaan ratkaista integroimalla molemmat puolet, jolloin saadaan Z Z 1 (7.12) dx = p(t) dt + c. g(x) Juuri näin toimittiin Esimerkissä 7.9.17 Yhtälöllä saattaa olla muitakin ratkaisuja. Näin on kun funktiolla g(x) on nollakohtia. Tällöin nollakohdat ovat yhtälön erikoisratkaisuja. Ne ovat siis ratkaisuja, jotka eivät kuulu yhtälön yleiseen ratkaisuun eli niitä ei saada millään vakion c arvolla. Esimerkissä 7.9 tällainen oli vakiofunktio x = 0. Miksi sitä ei saada yleisestä ratkaisusta millään vakion arvolla? Esimerkki 7.10. Ratkaistaan uudelleen Esimerkin 7.1 yhtälö dx = x, joka on dt separoituva. Yhtälössä g(x) = x. Funktiolla g on nollakohta x = 0. Tämä on yhtälön = dt. Integroimalla erikoisratkaisu. Siirretään muuttujat omille puolilleen, jolloin dx x tämä puolittain saadaan Z Z 1 dx = 1 dt + c ⇔ ln |x| = t + c ⇔ eln |x| = et+c ⇔ x = ket , x jossa k = ±ec . Tämä on haluttu ratkaisu. Lisäksi tulee muistaa erikoisratkaisu. 2 ⋄ Esimerkki 7.11. Ratkaistaan yhtälö x′ = xt 2 . Tämä yhtälö on separoituva, kun p(t) = t2 ja g(x) = x12 . Nyt funktiolla g(x) ei ole nollakohtaa. Separoidaan dx t2 = 2 dt x ja integroidaan Z Z 2 x dx = t2 dt+c ⇔ ⇔ 1 3 1 3 x = t +c 3 3 x2 dx = t2 dt, ⇔ x3 = t3 +3c ⇔ x= √ 3 t3 + 3c. ⋄ Ratkaistaan seuraavaksi yksi sovelluksissa usein esiintyvä differentiaaliyhtälö: R 17Perustelu laskumenetelmälle: (ẋ tarkoittaa derivaattaa muuttujan R t suhteen.) Olkoon H(x) = 1 , jolloin H ′ (x) = h(x). Olkoon lisäksi P (t) = p(t) dt, jolloin Ṗ (t) = p(t). h(x) dx ja h(x) = g(x) Koska Ḣ(x) = H ′ (x)ẋ = H ′ (x)p(t)g(x) = p(t), Ḣ = Ṗ . Tällöin H = P + c eli (7.12) pätee. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 49 Esimerkki 7.12. Tarkastellaan logistista kasvufunktiota, joka on muotoa x ′ x = rx 1 − . K Tässä x tarkoittaa populaation kokoa tietyllä hetkellä, joten sen on oltava positiivinen luku. Yhtälössä K on ympäristön kantokyky ja r on populaation eksponentiaalinen kasvuaste, jos kantokyky olisi ääretön. Parametri r voidaan tulkita yksinkertaisesti populaation hedelmällisyydeksi eli syntyvyyden ja kuolleisuuden erotukseksi. Oletetaan, että r = 1 ja K = 1, jolloin differentiaaliyhtälö saa muodon, dx = x(1 − x). dt Tällä yhtälöllä on kaksi erikoisratkaisua x = 0 ja x = 1. Yhtälö on separoituva, joten saadaan Z Z 1 (7.13) dx = 1 dt + c. x(1 − x) Integrointia varten on käytettävä osamurtokehitelmää (katso Esimerkki 6.6) (7.14) 1 A B = + x(1 − x) x 1−x ⇔ 1 A(1 − x) + Bx = . x(1 − x) x(1 − x) Tämä yhtälö pätee, kun A = 1 ja B = 1. Nyt yhtälö (7.13) tulee muotoon (oletus: populaation koolle pätee 0 < x < 1) (7.15) Z Z x 1 1 dx = 1 dt+c ⇔ ln x−ln (1 − x) = t+c ⇔ ln + = t+c, x 1−x 1−x joka on sama asia kuin x = et+c 1−x jossa jälleen k = ec . (7.16) ⇔ x = et+c − xet+c ⇔ x= ket , 1 + ket ⋄ Aiemmin käsiteltiin ensimmäisen kertaluvun lineaarisia differentiaaliyhtälöitä, jotka ratkaistiin integroivan tekijän avulla. Toinen tapa ratkaista ensimmäisen kertaluvun lineaarinen differentiaaliyhtälö on jakaa ongelma kahtia homogeenisen yhtälön yleisen ratkaisun ja täydellisen yhtälön yksityisratkaisun etsimiseen. Alkuperäisen differentiaaliyhtälön ratkaisu on näiden kahden summa. Olkoon (7.17) x′ + p(t)x = q(t). Tähän liittyvä homogeeninen yhtälö on x′ + p(t)x = 0 ja täydellinen yhtälö on yhtälö itse. Homogeenisen yhtälön yleinen ratkaisu saadaan separoimalla muuttujat ja täydellisen yhtälön yksityisratkaisu saadaan arvaamalla, vakion varioinnilla tai määräämättömien kertoimien keinolla. Täydellisen yhtälön yleinen ratkaisu saadaan näiden summana. 50 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Esimerkki 7.13. Ratkaistaan yhtälö x′ −2x = 1 uudelleen. Tähän yhtälöön liittyvä homogeeninen yhtälö on x′ − 2x = 0, jonka yleinen ratkaisu saadaan separoimalla (7.18) Z Z 1 dx = 2 dt + c ⇔ ln |x| = 2t + c ⇔ eln |x| = e2t+c ⇔ x = ke2t , x jossa k = ±ec . Täydellisen yhtälön yksityisratkaisuksi kelpaa arvaus x = − 21 . Täydellisen yhtälön yleinen ratkaisu on siten 1 x = − + ke2t , 2 joka on sama kuin ratkaisu integroivan tekijän avulla. ⋄ Tässä menetelmässä hankaluutena on täydellisen yhtälön yksityisratkaisun löytäminen. Apuvälineet tätä varten ovat vakion variointi ja määräämättömien kertoimien keino. Näistä jälkimmäinen esitellään toisen kertaluvun yhtälöiden yhteydessä. Tarkastellaan lopuksi ensimmäisen kertaluvun autonomisen differentiaaliyhtälön niin sanotun tasapainotilan stabiilisuutta. Differentiaaliyhtälö on autonominen, jos se on muotoa ẋ = f (x), eli oikea puoli ei riipu suoraan ajasta t. Tämän yhtälön tasapainotila on yhtälön f (x) = 0 ratkaisu. Merkitään tasapainotilaa nyt symbolein x∗ . Esimerkissä 7.13 tasapainotila on x∗ = − 12 . Tasapainotila on yksi differentiaaliyhtälön ẋ = f (x) ratkaisu (huomaa, että tasapainotilan derivaatta on nolla). Karkeasti sanoen, jos tasapainotilan läheltä alkavat ratkaisut pysyvät lähellä tasapainotilaa, tasapainotila on stabiili. Jos lisäksi tasapainotilan läheltä alkavat ratkaisut lähestyvät tasapainotilaa, kun t → ∞, tasapainotila on asymptoottisesti stabiili. Tasapainotila x∗ on asymptoottisesti stabiili, jos f ′ (x∗ ) < 0 eli jos funktion f derivaatta on tasapainotilassa negatiivinen. Tasapainotila x∗ on epästabiili, jos f ′ (x∗ ) > 0. Esimerkissä 7.13 tasapainotila on epästabiili, koska yhtälössä f (x) = 2x + 1 ja f ′ (x) = 2. Seuraavaksi tutkitaan differentiaaliyhtälöitä, joissa esiintyy myös tuntemattoman funktion toinen derivaatta. Erityisesti tutkitaan toisen kertaluvun vakiokertoimisia ja lineaarisia differentiaaliyhtälöitä, jotka voi esittää standardimuodossa (7.19) ẍ + a1 ẋ + a0 x = f (t), a1 , a0 ∈ R, jossa f on jokin muuttujan t funktio. Tällaisen ratkaiseminen voi olla vaikeaa riippuen tästä funktiosta. Homogeenisen yhtälön (7.20) ẍ + a1 ẋ + a0 x = 0, ratkaiseminen on sen sijaan suoraviivaista. Oletetaan, että funktio x(t) = eλt on homogeenisen yhtälön ratkaisu. Sijoittamalla x(t) ja sen derivaatat x′ (t) = λeλt ja x′′ (t) = λ2 eλt homogeeniseen yhtälöön saadaan λ2 eλt + a1 λeλt + a0 eλt = 0 (7.21) λ2 + a1 λ + a0 = 0. ⇔ YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 51 Toisin sanoen funktio x(t) = eλt on homogeenisen yhtälön ratkaisu täsmälleen kun λ on yhtälön (7.21) eli niin sanotun karakteristisen polynomin ratkaisu. Karakteristisella polynomilla voi olla ratkaisunaan joko yksi reaaliluku, kaksi reaalilukua tai sitten kompleksilukupari (liittoluvut). Seuraava lause antaa keinon ratkoa homogeeninen yhtälö: Lause 7.2. Olkoon ẍ + a1 ẋ + a0 x = 0 ja olkoot λ1 ja λ2 tähän yhtälöön liittyvän karakteristisen polynomin (7.21) ratkaisut. Tällöin pätee: (i) Jos λ1 ja λ2 ovat eri reaalilukuja, homogeenisen yhtälön ratkaisu on x(t) = C1 eλ1 t + C2 eλ2 t , jossa C1 , C2 ∈ R. (ii) Jos λ1 ja λ2 ovat sama reaaliluku λ, homogeenisen yhtälön ratkaisu on x(t) = C1 eλt + C2 teλt , jossa C1 , C2 ∈ R. (iii) Jos λ1 = α + iβ ja λ2 = α − iβ, homogeenisen yhtälön ratkaisu on x(t) = eαt (C1 cos(βt) + C2 sin(βt)), jossa Todistus. Sydsæter et al. (2008). C1 , C2 ∈ R. Vakiot C1 ja C2 voidaan määrittää, jos yhtälölle on annettu alkuarvot x(0) = x0 ja ẋ(0) = x1 . Esimerkki 7.14. Ratkaistaan alkuarvotehtävä ẍ − 3ẋ + 2x = 0, x(0) = 0, ẋ(0) = 1. Karakteristisen polynomin λ − 3λ + 2 = 0 ratkaisut ovat λ = 1 ja λ = 2, joten Lauseen 7.2 mukaan yhtälön (yleinen) ratkaisu on 2 x(t) = C1 et + C2 e2t . Määritetään vakiot alkuarvojen avulla. Ratkaisun ja alkuarvojen avulla saadaan yhtälöpari 0 = C1 + C2 1 = C1 + 2C2 . Parin ratkaisu on C1 = −1 ja C2 = 1. Alkuarvotehtävän ratkaisu on x(t) = −et +e2t . (Tarkista vastaus derivoimalla ja sijoittamalla). ⋄ Esimerkki 7.15. Ratkaistaan yhtälö ẍ + 4ẋ + 5x = 0. Karakteristisen polynomin λ2 + 4λ + 5 = 0 ratkaisut ovat λ = −2 + i ja λ = −2 − i, joten Lauseen 7.2 mukaan yhtälön ratkaisu on x(t) = e−2t (C1 cos(t) + C2 sin(t)). ⋄ 52 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Lause 7.3. Yhtälön (7.22) ẍ + a1 ẋ + a0 x = f (t), a1 , a0 ∈ R, ratkaisu saadaan homogeenisen yhtälön ẍ + a1 ẋ + a0 x = 0 yleisen ratkaisun ja epähomogeenisen yhtälön ẍ + a1 ẋ + a0 x = f (t) yksityisratkaisun summana. • Ongelma on epähomogeenisen yhtälön yksityisratkaisun etsiminen. Siihen on useita keinoja, joista tässä esitellään määräämättömien kertoimien keino. Siinä yksityisratkaisua haetaan sopivalla yritteellä, jonka valinta riippuu funktiosta f . Jos esimerkiksi f on astetta n oleva polynomi, kannattaa yritteeksi kokeilla astetta n olevaa polynomia. Esimerkiksi, jos f on toisen asteen polynomi, yritteeksi kannattaa asettaa x(t) = A + Bx + Cx2 , jolloin tämän yritteen ja annetun yhtälön avulla pyritään ratkaisemaan kertoimet A, B ja C siten, että yhtälö toteutuu yritteellä. Jos f on eksponenttifunktio ceat , kannattaa yritteeksi kokeilla esimerkiksi funktioita Aeat , Ateat tai At2 eat .18 Lisäksi f voi sisältää trigonometrisia funktioita tai erilaisia kombinaatioita yllä mainituista, jolloin vastaava yrite sisältää samantyyppisiä funktioita. Esimerkki 7.16. Ratkaistaan yhtälö ẍ + ẋ − 2x = 3 − 2t. Homogeenisen yhtälön ẍ + ẋ − 2x = 0 ratkaisu on x(t) = C1 e−2t + C2 et . Etsitään epähomogeenisen yhtälön yksityisratkaisua yritteen x(t) = A + Bt avulla sijoittaen yrite ja sen derivaatat yhtälöön. Saadaan B − 2(A + Bt) = 3 − 2t ⇔ B − 2A − 2Bt = 3 − 2t. Kertoimien A ja B täytyy siten toteuttaa yhtälöpari B − 2A = 3, −2B = −2. Parin ratkaisu on B = 1 ja A = −1. Siten yksityisratkaisuksi kelpaa x(t) = −1 + t. Lauseen 7.3 mukaan yleinen ratkaisu on tämän ja homogeenisen yhtälön ratkaisun summa eli x(t) = C1 e−2t + C2 et − 1 + t. ⋄ Esimerkki 7.17. Ratkaistaan yhtälö ẍ+4ẋ+4x = e−2t . Homogeenisen yhtälön ẍ+ 4ẋ + 4x = 0 ratkaisu on x(t) = C1 e−2t + C2 te−2t . Etsitään epähomogeenisen yhtälön yksityisratkaisua yritteen x(t) = At2 e−2t avulla sijoittaen yrite ja sen derivaatat yhtälöön. Saadaan (2Ae−2t − 4Ate−2t − 4Ate−2t + 4At2 e−2t ) + 4(2Ate−2t − 2At2 e−2t ) + 4At2 e−2t = e−2t 18Yritteen e at ⇔ 2A = 1 valinta tässä tapauksessa riippuu homogeenisen yhtälön ratkaisusta. Jos esimerkiksi ratkaisee homogeenisen yhtälön, Aeat ei toimi yritteenä. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 53 1 Siten yksityisratkaisuksi kelpaa x(t) = t2 e−2t . Lauseen 7.3 mukaan yleinen ratkaisu 2 on tämän ja homogeenisen yhtälön ratkaisun summa eli 1 x(t) = C1 e−2t + C2 te−2t + t2 e−2t . 2 −2t Yrite Ae ei toimi (kokeile), kuten ei toimi myöskään yrite Ate−2t . ⋄ 54 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 8. Differentiaaliyhtälöt R2 :ssa 8.1. Lineaariset differentiaaliyhtälöt R2 :ssa. Hyödyllisenä tietona seuraava: Toisen kertaluvun homogeeninen differentiaaliyhtälö voidaan kirjoittaa muodossa (8.1) ẍ + a1 ẋ + a0 x = 0, a1 , a0 ∈ R. Tämä voidaan esittää differentiaaliyhtälöryhmänä, joka koostuu kahdesta ensimmäisen kertaluvun yhtälöstä: otetaan käyttöön uudet muuttujat x1 ja x2 , ja suoritetaan muuttujan vaihdokset x1 = x ja x2 = ẋ. Yhtälö (8.1) voidaan tällöin kirjoittaa yhtälöryhmänä ẋ1 = x2 , (8.2) ẋ2 = −a0 x1 − a1 x2 , koska ẋ1 = ẋ = x2 ja ẋ2 = ẍ = −a0 x − a1 ẋ = −a0 x1 − a1 x2 . Tämän luvun alussa kiinnostuksen kohteena ovat muotoa (8.3) ẋ = Ax olevat yhtälöt, jossa x on pystyvektori [x1 , x2 ]T ja A on 2 × 2 vakiomatriisi eli ẋ1 = ax1 + bx2 ẋ2 = cx1 + dx2 , jossa a, b, c, d ∈ R. Tämän differentiaaliyhtälöparin ratkaisulla (jollain aikavälillä) tarkoitetaan funktioparia (x1 (t), x2 (t)), joka sijoitettuna yhtälöihin toteuttaa ne. Vaikka tämäntyyppisen differentiaaliyhtälöparin voi ratkaista, on tärkeämpää sovellusten kannalta osata tutkia eräiden ratkaisujen (tasapainoratkaisujen) ominaisuuksia (stabiilisuutta). Differentiaaliyhtälöparin yksikäsitteinen tasapainoratkaisu on yhtälöiden ẋ1 = 0 ja ẋ2 = 0 ratkaisu eli (x1 , x2 ) = (0, 0), jos kerroinmatriisin determinantti ei ole nolla. Tavoitteena on tutkia tasapainotilan stabiilisuutta. Differentialiyhtälöryhmän (8.3) niin sanottu karakteristinen yhtälö on (8.4) det(A − λI) = 0, jossa I on 2 × 2 identtinen matriisi ja λ ∈ R. Karakteristisen yhtälön ratkaisut ovat siis matriisin A ominaisarvot. Kuten aiemmin, jos tasapainotilan läheltä alkavat ratkaisut pysyvät lähellä tasapainotilaa, niin tasapainotila on stabiili. Jos lisäksi tasapainotilan läheltä alkavat ratkaisut lähestyvät tasapainotilaa, kun t → ∞, niin tasapainotila on asymptoottisesti stabiili. Jos tasapainotila ei ole stabiili, se on epästabiili. Differentiaaliyhtälöryhmän (8.3) stabiilisuusominaisuuksia voidaan tutkia matriisin A ominaisarvojen avulla: Lause 8.1. Olkoon ẋ = Ax ja A jokin 2 × 2 vakiomatriisi. Tällöin tasapainotila (x1 , x2 ) = (0, 0) on: (i) stabiili, jos matriisin A ominaisarvojen reaaliosat ovat negatiiviset tai ominaisarvoista toinen on nolla ja toinen negatiivinen. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 55 (ii) asymptoottisesti stabiili, jos matriisin A ominaisarvojen reaaliosat ovat negatiiviset. (iii) epästabiili, jos ainakin toinen matriisin A ominaisarvojen reaaliosista on positiivinen. • ẋ x 1 0 Esimerkki 8.1. Tutkitaan yhtälön 1 = · 1 tasapainotilan (0, 0) staẋ 0 2 x2 2 1 0 . Lasketaan matriisin A ominaisarvot: biilisuusominaisuudet. Nyt A = 0 2 1 − λ 0 = 0 ⇔ (1 − λ)(2 − λ) = 0, 0 2 − λ joten ominaisarvot ovat λ1 = 1 ja λ2 = 2. Molemmat ovat positiivisia reaalilukuja, joten Lauseen 8.1 perusteella tasapaino on epästabiili. ⋄ x ẋ1 2 1 · 1 tasapainotilan (0, 0) Esimerkki 8.2. Tutkitaan yhtälön = x2 ẋ2 −8 −3 2 1 . Lasketaan matriisin A ominaisarvot: stabiilisuusominaisuudet. Nyt A = −8 −3 2 − λ 1 2 −8 −3 − λ = 0 ⇔ λ + λ + 2 = 0, √ √ −1 − i 7 −1 + i 7 ja λ2 = . Ominaisarvojen reaajoten ominaisarvot ovat λ1 = 2 2 liosat on negatiiviset, joten Lauseen 8.1 perusteella tasapaino on asymptoottisesti stabiili. ⋄ 8.2. Epälineaariset differentiaaliyhtälöt R2 :ssa. Tarkastellaan seuraavaksi epälineaarisia differentiaaliyhtälöitä tasossa. Tarkasteltava autonominen differentiaaliyhtälöpari on ẋ(t) = f (x(t), y(t)), (P) ẏ(t) = g(x(t), y(t)), jossa f ja g oletetaan olevan kerran jatkuvasti derivoituvia. Parin (P) ratkaisun löytäminen, eli funktioiden x(t) ja y(t), jotka toteuttavat kyseisen parin, on vaikeaa. Ratkaisemisen sijaan pyrimme antamaan keinoja, joiden avulla on mahdollista tutkia differentiaaliyhtälöparin tasapainotilan stabiilisuutta. Tasapainotilassa ei muuttujissa x ja y tapahdu muutoksia eli ẋ ja ẏ ovat nollia. Toisin sanoen tasapainotila (x∗ , y ∗ ) ratkaisee yhtälöparin f (x, y) = 0, g(x, y) = 0. 56 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Esimerkki 8.3. Yhtälöparin ẋ = 4 − xy ẏ = x − y, tasapainotilat ovat (2, 2) ja (−2, −2). ⋄ Yllä olevan epälineaarisen differentiaaliyhtälöparin tapauksessa, tasapainotilojen stabiilisuuden tutkimiseen voidaan käyttää niin sanottua Jacobin matriisia fx (x, y) fy (x, y) , (8.5) gx (x, y) gy (x, y) ja ominaisarvoja: Lause 8.2. Differentiaaliyhtälöparin (P) tasapainotila on (i) asymptoottisesti stabiili, jos tasapainotilassa Jacobin matriisin ominaisarvojen reaaliosat ovat negatiiviset. (ii) epästabiili, jos ainakin toinen Jacobin matriisin ominaisarvojen reaaliosista on positiivinen tasapainotilassa. Stabiilisuusominaisuuksia varten riittää usein tutkia Jacobin matriisia tasapainotilassa. Esimerkki 8.4. Tutkitaan parin ẋ = 2y + 1 ẏ = x − y, tasapainotilan − 12 , − 12 stabiilisuus. Jacobin matriisi on 0 2 , (8.6) 1 −1 ja sen ominaisarvot ovat λ = 1 ja λ = −2, joten tasapainotila on epästabiili. Esimerkki 8.5. Tutkitaan parin ⋄ ẋ = x(4 − 2x − 2y) ẏ = y(8 − 6x − 2y), tasapainotilojen (0, 4), (2, 0), (0, 0) ja (1, 1) stabiilisuus. Jacobin matriisi on 4 − 4x − 2y −2x . (8.7) −6y 8 − 6x − 4y Tutkitaan tasapainotilan (1, 1) stabiilisuus sijoittamalla se Jacobin matriisiin, jolloin −2 −2 . −6 −2 √ √ Sen ominaisarvot ovat λ = −2 − 2 3 ja λ = −2 + 2 3. Toinen on positiivinen, joten tasapainotila on epästabiili. Samaan tapaan selvitetään, että tasapainotilat YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 57 (0, 4), (2, 0) ovat asymptoottisesti stabiileja kun taas tasapainotila (0, 0) on epästabiili. ⋄ 8.3. Vaihetaso. Vaihetasoanalyysin (phase plane analysis) avulla voidaan tutkia differentiaaliyhtälöparin ratkaisujen kulkua (ja tasapainotilan tai -tilojen stabiilisuusominaisuuksia). Tarkastellaan sopivaa differentiaaliyhtälöparia (8.8) ẋ(t) = f (x(t), y(t)) (8.9) ẏ(t) = g(x(t), y(t)), ja sen ratkaisua. Tämän yhtälön jostain alkuarvosta (x0 , y0 ) alkava ratkaisu (x(t), y(t)) muodostaa polun xy-tasoon. Tietyllä hetkellä (esim. t = t1 ) tämä ratkaisu määrittää xy-tason pisteen (esim. (x(t1 ), y(t1 ))) ja funktiot f ja g määrittävät kussakin ratkaisun muodostaman polun pisteessä suunnan (vektorin) johon ratkaisu on menossa. Toisaalta jokaiseen alkuarvoon liittyy oma ratkaisunsa, jonka jokaiseen pisteeseen funktiot f ja g liittävät suunnan (vektorin). Jätetään argumentti t merkitsemättä. Vaihetasoanalyysin tavoitteena on hahmotella ratkaisujen kulkua tasossa. Tätä varten tulee ensin määrittää niin sanotut isokliinit. x-isokliini koostuu pisteistä (x, y), jotka toteuttavat yhtälön ẋ = 0 (eli yhtälön f (x, y) = 0). Näissä pisteissä ei muuttujan x arvoissa tapahdu muutosta, joten ratkaisun suunta riippuu vain ẏ:stä. Toisin sanoen liikkeen suunta on samansuuntaista y-akselin kanssa. x-isokliini jakaa tason kahtia, toisella puolella ẋ > 0 ja toisella ẋ < 0. Vastaavasti y-isokliini koostuu pisteistä (x, y), jotka toteuttavat yhtälön ẏ = 0 (eli yhtälön g(x, y) = 0). Näissä pisteissä ei muuttujan y arvoissa tapahdu muutosta, joten ratkaisun suunta riippuu vain ẋ:stä. Toisin sanoen liikkeen suunta on samansuuntaista x-akselin kanssa. Myös y-isokliini jakaa tason kahtia, toisella puolella ẏ > 0 ja toisella ẏ < 0. Tasapainotilassa, eli yhtälöiden ẋ = 0 ja ẏ = 0 ratkaisussa, ei tapahdu mitään liikettä. Vaihetasoanalyysissä tehdään vain kaksi asiaa: piirretään isokliinit ja hahmotellaan suuntia sekä päätellään kuvan perusteellaa tasapainotilan tai tilojen stabiilisuus, jos se vain on mahdollista. (Kaikki luvun kuvat piirretään luennoilla.) Vaihetasoanalyysia kannattaa usein täydentää tutkimalla tasapainotilan stabiilisuutta myös Jacobin matriisin avulla, jos se on mahdollista. Esimerkki 8.6. Tehdään vaihetasoanalyysi differentiaaliyhtälöparille (8.10) (8.11) ẋ = x − y ẏ = y + x − 2. x-isokliinit pisteet toteuttavat yhtälön y = x ja y-isokliinin pisteet toteuttavat yhtälön y = 2 − x. Niiden leikkauspiste (1, 1) on tasapainopiste. Suora y = x jakaa tason kahteen osaan. Toisessa osassa ẋ < 0 ja toisessa ẋ > 0. Toisaalta suora y + x − 2 = 0 jakaa tason myös kahteen osaan, toisessa ẏ < 0 ja toisessa ẏ > 0. Siten suorat yhdessä jakavat tason neljään osaan, joissa kaikissa pätee tietty muuttujien x ja y derivaattojen merkkikombinaatio (esimerkiksi ẋ < 0 ja ẏ < 0). 58 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Miten merkit päätellään? (Periaatteessa riittäisi tarkistaa suunta jokaisessa isokliinien rajaaman neljänneksen yhdessä pisteessä.) Kiinnitetään jokin x:n arvo ja mietitään yhtälöä ẋ = x − y. Kun x on kiinteä, kasvattamalla muuttujan y arvoa huomataan, että ẋ < 0 suoran y = x yläpuolella. Suoran alapuolella taas ẋ > 0. Kiinnitetään seuraavaksi jokin muuttujan y arvo. Nyt kasvattamalla muuttujan x arvoa huomataan, että ẏ > 0 suoran y +x−2 = 0 yläpuolella. Lisäksi ẏ < 0 kyseisen suoran alapuolella. ⋄ Esimerkki 8.7. Tehdään vaihetasoanalyysi differentiaaliyhtälöparille (8.12) ẋ = y 2 + x (8.13) ẏ = y + x. Piirretään jälleen isokliinit. Tasapainopisteitä on nyt kaksi, (0, 0) ja (−1, 1). Miten derivaattojen ẋ ja ẏ merkit päätellään? Esimerkiksi näin: koska ∂∂xẋ = 1 > 0, käyrän ∂ ẏ = 1 > 0, ẋ = 0 oikealla puolella ẋ > 0 ja vasemmalla puolella ẋ < 0. Koska ∂x käyrän ẏ = 0 oikealla puolella ẏ > 0 ja vasemmalla puolella ẏ < 0. ⋄ Esimerkki 8.8. (Tämä esimerkki on yksinkertaistettu versio Leonardin ja Longin kirjasta Optimal Control and Static Optimization in Economics.) Tehdään vaihetasoanalyysi differentiaaliyhtälöparille (8.14) (8.15) 1 k̇ = sk 2 − δk ṗ = k − γp, jossa s, δ ja γ ovat positiivisia lukuja. Muuttuja k on pääoma (eli oletetaan, että 1 k > 0) ja sitä tuotetaan funktion sk 2 mukaisesti. Termi −δk kuvaa pääoman kulumista. Saastetta p (p > 0) syntyy yksi yksikkö per pääomayksikkö ja sitä poistuu 2 systeemistä termin −γp mukaisesti. Nyt k̇ = 0, kun k = 0 tai k = δs , ja ṗ = 0, kun p = γk . Piirtämällä vaihekuvio kp-tasoon ja tutkimalla tilannetta Jacobin mat s 2 s2 , on (asymptoottisesti) stabiili. riisin avulla huomataan, että tasapaino δ γδ 2 Piirtelyyn palataan luennolla. ⋄ Tutkitaan seuraavaksi yhtälön ẋ = Ax, jossa A on 2 × 2 vakiomatriisi, vaihetasokuvioita, jotka piirretään luennoilla. Oletetaan, että det(A) 6= 0. Tämä oletus takaa, että (0, 0) on ainoa tasapainopiste. Olkoon yhtälö muotoa ẋ1 x a b · 1 = ẋ2 c d x2 . a − λ b = Vaihetasokuvio riippuu matriisin A ominaisarvoista, jotka ovat yhtälön c d − λ 0 eli yhtälön λ2 − (a + d)λ + (ad − bc) = 0 ratkaisut. Matriisin A jälki tr(A) on a + d ja determinantti det(A) on ad − bc, joten yhtälö voidaan kirjoittaa lyhyemmin muodossa λ2 − tr(A)λ + det(A) = 0. Sen ratkaisut ovat p tr(A) ± tr(A)2 − 4 det(A) . (8.16) λ= 2 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 59 Ominaisarvot ovat joko reaalilukuja tai kompleksilukuja riippuen matriisin A jäljestä ja determinantista. Merkitään diskriminanttia tr(A)2 − 4 det(A) kirjaimella D. Tarkastellaan seuraavaksi tavallisimmat tapaukset. Jos D > 0, yhtälön (8.16) ratkaisut ovat reaalilukuja. Jos lisäksi det(A) > 0 ja tr(A) < 0, ominaisarvot ovat negatiivisia eli λ1 < λ2 < 0. Tällöin tasapainotila on asymptoottisesti stabiili. Jos D > 0 ja lisäksi det(A) > 0 ja tr(A) > 0, ominaisarvot ovat positiivisia eli λ1 > λ2 > 0. Tällöin tasapainotila on epästabiili. Jos D > 0 ja lisäksi det(A) < 0, ominaisarvot ovat ovat erimerkkisiä eli λ1 < 0 < λ2 . Tällöin tasapainotila on epästabiili (niin sanottu satulapiste). Jos D < 0 eli det(A) > 14 tr(A)2 , yhtälön (8.16) ratkaisut ovat kompleksilukuja. Jos tr(A) > 0, ominaisarvojen reaaliosat ovat positiiviset. Siten tasapainotila on epästabiili. Jos D < 0 ja tr(A) < 0, ominaisarvojen reaaliosat ovat negatiiviset. Siten tasapainotila on asymptoottisesti stabiili. 60 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 9. 3 2 sivua differenssiyhtälöistä Olkoon x yhden muuttujan funktio, x(t), jonka määrittelyjoukkona ovat luonnolliset luvut {0, 1, 2, . . .}.19 Muuttuja t, jonka arvot kuuluvat siis joukkoon {0, 1, 2, . . .}, voidaan tulkita periodiksi tai hetkeksi. Funktion x arvo voisi olla vaikka kulutuksen määrä tai jonkin populaation koko tietyllä periodilla. Differenssiyhtälöitä tarvitaan tilanteissa, joissa funktion x arvo jonain hetkenä riippuu tietyllä tapaa aiempien periodien funktion x arvoista. Differenssiyhtälöitä tarvitaan esimerkiksi optimointimalleissa ja ekonometriassa. Differenssiyhtälössä tuntematon on funktio x(t), jota differenssiyhtälöiden tapauksessa merkitään xt . Eräs differenssiyhtälö on (9.1) xt+1 = f (t, xt ), jossa f on jokin kahden muuttujan funktio. Differenssiyhtälön ratkaisemisella tarkoitetaan tuntemattoman funktion xt määräämistä siten, että se toteuttaa annetun differenssiyhtälön. Kurssilla käsitellään vain joitakin ensimmäisen kertaluvun lineaarisia differenssiyhtälöitä ja niiden ratkaisemista sekä hieman stabiilisuutta. Korkeamman kertaluvun yhtälöistä ja yhtälösysteemeistä kiinnostunut voi opiskella kirjaa FMEA. Differenssiyhtälö (9.1) on ensimmäistä kertalukua, koska siinä tuntemattoman funktion arvo periodilla t + 1 riippuu vain edellisen periodin arvosta. Ensimmäisen kertaluvun lineaarinen ja vakiokertoiminen differenssiyhtälö on muotoa (9.2) xt+1 = axt + f (t), jossa f (t) on annettu reaaliarvoinen funktio, a on annettu reaaliluku ja a 6= 1.20 Tutkitaan tapausta, jossa f (t) on jokin vakiofunktio, sanotaan f (t) ≡ b. Jos tuntemattoman funktion arvo periodilla 0, x0 , on annettu, saadaan seuraavan periodin arvo yksinkertaisesti sijoittamalla edellisen periodin arvo yhtälöön (9.2) (lukijan tehtävä on varmistaa, että yhtälöt ovat oikein.): x0 , x1 = ax0 + b, x2 = a2 x0 + (a + 1)b, x3 = a3 x0 + (a2 + a + 1)b, .. . xt = at x0 + (at−1 + at−2 + . . . + a + 1)b. Viimeinen yhtälö antaa tuntemattoman funktion arvon minä tahansa periodina. Lisäksi sijoittamalla tämä yhtälöön, tiedetään, että tämä funktio on ratkaisu. Ratkaisu 19Määrittelyjoukko 20Jos voi olla myös jokin tämän joukon osajoukko. a = 1, mikä on yhtälön ratkaisu? YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE voidaan kirjoittaa muodossa (miksi näin?) b b 1 − at t t b = a x0 − + . (9.3) xt = a x0 + 1−a 1−a 1−a 61 b , yhtälön ratkaisu on x0 millä periodilla tahansa. Tämä alkuarvo on Jos x0 = 1−a yhtälön tasapainotila; jos ratkaisu alkaa tasapainotilasta, se pysyy siinä. Miten tasapainotila voidaan määrätä yhtälöstä (9.2)? Toinen tärkeä asia ratkaisuun liittyen on, että ratkaisu sisältää eksponenttifunktion, jossa kantalukuna on a. Kun alkuarvo ei ole tasapainotila, luku a määrää miten ratkaisu käyttäytyy. Jos |a| < 1, tasapainotila on asymptoottisesti stabiili (eli tasapainotilaa läheltä alkava ratkaisu lähestyy tasapainotilaa ajan mennessä eteenpäin). Kun ensimmäisen kertaluvun lineaarinen differentiaaliyhtälö ei ole vakiokertoiminen, vaan xt+1 = a(t)xt + f (t), yhtälölle löydetään ratkaisukaava, mutta se ei ole niin yksinkertainen kuin (9.3) (katso FMEA). Hyvä harjoitustehtävä on kuitenkin tutkia millainen on yhtälön xt+1 = axt + f (t) ratkaisukaava. 62 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE LIITE 1: Kertaus trigonometrisistä funktioista Kulmia mitataan joko asteina välillä [0, 360] tai radiaaneina välillä [0, 2π]. Yksi radiaani on 180 astetta jaettuna piillä. Tavoitteena on palautella mieliin trigonometrian perusasioita. Tarkastellaan suorakulmaista kolmiota, jonka kateetit ovat x ja y sekä hypotenuusa on r. Olkoon hypotenuusan ja toisen kateetin välinen kulma θ. r y θ x p Pythagoraan lauseen r2 = x2 + y 2 mukaan r = x2 + y 2 . Määritellään sini-, kosini- ja tangenttifunktiot: y x y Määritelmä 9.1. sin θ = , cos θ = , tan θ = . ◦ r r x Tarkastellaan origokeskistä yksikköympyrää ja sen sisältäviä suorakulmaisia kolmioita, joiden hypotenuusan pituus on yksi, toinen teräväkulma on origossa ja toinen yksikköympyrän kehällä. Nyt r = 1 ja ympyrän kehän pituus on siten 2π. Sinin ja kosinin määrittelyjoukkona on reaalilukujen joukko ja arvojoukkona on suljettu väli [−1, 1], kun taas tangentin määrittelyjoukkona ovat reaaliluvut poislukien π/2 ja sen monikerrat, eli luvut π/2 + nπ, jossa n ∈ Z. Tangenttifunktion arvojoukko on R. (0, 1) b (cos θ, sin θ) b (x, y) 45◦ θ (1, 0) Kuva 9.1. Yksikköympyrä. Kuvan oikeassa yksikköympyrässä kulma θ on 45-astetta. Radiaaneissa tämä kulma on π4 eli kahdeksas osa yksikköympyrän kehän pituudesta. Tämän kulman sini ja kosini ovat sama luku (miksi?), joten Pythagoraan lauseen x2 + y 2 = 1 mukaan x = y = √12 . Siis cos π4 = √12 ja sin π4 = √12 . Seuraavaan lauseeseen on kerätty joitain kaavoja. YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE Lause (i) (ii) (iii) (iv) (v) (vi) (vii) (viii) 63 9.1. sin2 θ + cos2 θ = 1 sin(θ ± φ) = sin θ cos φ ± cos θ sin φ cos(θ ± φ) = cos θ cos φ ∓ sin θ sin φ sin θ = sin(θ + 2nπ) cos θ = cos(θ + 2nπ) tan θ = tan(θ + nπ) sin(2θ) = 2 sin θ cos θ cos(2θ) = cos2 θ − sin2 θ. Todistus. Sydsæter et al. (2008) (katso kirjan harjoitustehtävät). Kohtien (iv) ja (v) mukaan sini- ja kosinifunktioiden periodi on 2π (Jos siis kulmaa θ kierretään kerran kehän ympäri, jolloin n = 1, päädytään samaan kohtaan kehällä josta lähdettiin.) Sini- ja kosinifunktioiden kuvaajat näyttävät tältä: 1 −3π 2 −π −π 2 −1 π 2 π 3π 2 2π 5π 2 3π Kuva 9.2. Sini- ja kosinifunktioiden kuvaajat. Oikeasti kurssilla tarvitaan trigonometriasta sini- ja kosinifunktioiden derivaatat: D sin(x) = cos(x) ja D cos(x) = − sin(x). 64 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE LIITE 2: Kompleksiluvut lyhyesti Esimerkki 9.1. Mitä ovat yhtälön x2 + 1 = 0 ratkaisut? Yhtälöllä ei ole ratkaisuja reaalilukujen joukossa, koska minkään reaaliluvun neliö ei ole −1 (Miltä funktion f , f (x) = x2 + 1, kuvaaja näyttää?). Yhtälöllä on kuitenkin ratkaisu kompleksilukujen joukossa. ⋄ Määritelmä 9.2. Luku z = x+iy on kompleksiluku, jossa reaaliluku x on kompleksiluvun reaaliosa ja reaaliluku y on kompleksiluvun imaginaariosa. Imaginaariyksikölle i on voimassa i2 = −1. Kompleksiluvun z = x + iy reaaliosaa merkitään Re(z) ja imaginaariosaa Im(z). Kompleksilukujen joukkoa merkitään symbolilla C. ◦ Esimerkki 9.2. (i) x2 + 1 = 0 ⇔ (ii) x2 − 4x + 13 = 0 √ ⇔ √ x = ± −1 ⇔ x = ±i. 4 ± 6 −1 x= ⇔ x = 2 ± i3. 2 x2 = −1 ⇔ ⋄ Määritelmä 9.3. Kompleksiluvun z = x + iy liittoluku tai kompleksikonjugaatti ◦ on z = x − iy. Toisin sanoen x + iy = x − iy. Kompleksilukuja voidaan havainnollistaa seuraavalla kuvalla, jossa vaaka-akselina on reaaliakseli ja pystyakselina on imaginaariakseli. Im y x + iy x −y Re x − iy Kuva 9.3. Kompleksiluvut z = x + iy ja z = x − iy. Olkoot z = x + iy ja w = u + iv kompleksilukuja. Niiden summa on z + w = (x + u) + i(y + v). Niiden erotus on Niiden tulo on z − w = (x − u) + i(y − v). zw = (x + iy)(u + iv) = xu + ixv + iyu + i2 yv = xu − yv + i(xv + yu), YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE 65 koska i2 = −1. Niiden osamäärä on x + iy u − iv xu − ixv + iyu − i2 yv z = · = w u + iv u − iv u2 + v 2 xu + yv yu − xv = 2 +i 2 . 2 u +v u + v2 Yllä olevan laskun mukaan liittolukujen tulolle pätee zz = x2 + y 2 . Esimerkki 9.3. (i) (−7 + i5) − (2 − i5) = −7 − 2 + i(5 + 5) = −9 + i10 (ii) (2 − i3)(2 + i3) = 4 + i6 − i6 + (−i3)(i3) = 4 + 9 = 13 4 + i3 1 − i2 4 − i8 + i3 − i2 6 4 + i3 = = =2−i (iii) 1 + i2 1 + i2 1 − i2 1 + 22 ⋄ p Kompleksiluvun z = x+iy moduli tai pituus on |z| = x2 + y 2 . Lisäksi kompleksiluvuille z = x + iy ja w = u + iv pätee muun muassa (i) z + w = z + w (ii) zw = z w (iii) z = z (iv) |z + w| ≤ |z| + |w|. Kompleksiluvun z = x + iy argumentti on kulma θ, jolle on voimassa yhtälöt x y cos θ = ja sin θ = . |z| |z| Argumentti on välillä [0, 2π) yksikäsitteinen ja sitä merkitään arg z = θ. Kompleksiluku z = x + iy voidaan ylläolevien yhtälöiden perusteella ilmaista napakoordinaateissa (siis argumentin ja modulin avulla) z = |z|(cos θ + i sin θ). Seuraavassa kuvassa on ilmaistu kompleksiluku napakoordinaateissa sekä sen moduli ja argumentti. |z|(cos θ + i sin θ) b |z| θ Kuva 9.4. Kompleksiluku z = x + iy napakoordinaateissa. 66 YE19, MATEMATIIKKAA TALOUSTIETEILIJÖILLE √ Esimerkki 9.4. Muutetaan kompleksiluku z = 2 3 + i2 napakoordinaatteihin. √ Luvun moduli on |z| = 12 + 4 = 4. Luvun argumentille ovat voimassa yhtälöt √ √ 3 2 1 2 3 = ja sin θ = = , cos θ = 4 2 4 2 π joten arg z = . Luku z voidaan esittää muodossa 6 π π z = 4(cos + i sin ). 6 6 ⋄ Tutkitaan seuraavaksi kompleksiluvun potensseja. Olkoon z = x + iy, jolloin napakoordinaattien avulla saadaan z 2 = (|z|(cos θ + i sin θ))2 = |z|2 (cos θ + i sin θ)2 = |z|2 (cos2 θ + 2i cos θ sin θ − sin2 θ) = |z|2 (cos(2θ) + i sin(2θ)). Viimeisessä yhtäsuuruudessa käytettiin Lauseen 9.1 kahta viimeistä kaavaa. Kompleksitasossa kompleksiluvun toinen potenssi tarkoittaa siten modulin neliöintiä ja argumentin tuplaamista. Induktiolla voidaan osoittaa seuraava kaava oikeaksi: (9.4) z n = |z|n (cos(nθ) + i sin(nθ)), mutta se mitä kurssilla näistä asioista oikeasti tarvitaan on i = √ −1.