MS-A0202 Differentiaali- ja integraalilaskenta 2 (SCI) Luento 6
Transcription
MS-A0202 Differentiaali- ja integraalilaskenta 2 (SCI) Luento 6
Kertausta: ääriarvot yhden muuttujan tapauksessa Funktiolla f : I ⊂ R → R on lokaali (paikallinen) maksimi pisteessä a ∈ I , jos f (x) ≤ f (a) kaikilla x:n arvoilla jossakin a:n ympäristössä (eli riittävän lähellä pistettä a). MS-A0202 Differentiaali- ja integraalilaskenta 2 (SCI) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat. Vastaavasti lokaali minimi tarkoittaa sitä, että f (x) ≥ f (a) jossakin a:n ympäristössä. Antti Rasila Maksimi tai minimi on globaali, jos kyseinen epäyhtälö on voimassa kaikilla x ∈ I . Aalto-yliopisto Ääriarvoja voi esiintyä: (i) Funktion f kriittisissä pisteissä f 0 (x) = 0, (ii) pisteissä joissa f :n derivaatta ei ole määritelty, ja (iii) määrittelyjoukon I reunalla. Syksy 2015 Seuraavaksi yleistetään näitä ehtoja funktion f : D ⊂ Rn → R tapaukseen. Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 1 / 18 Ääriarvot ja usean muuttujan funktiot Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 2 / 18 Esimerkki 1 Funktiolla f : D ⊂ Rn → R on pisteessä x0 ∈ D lokaali maksimi, jos f (x) ≤ f (x0 ) jossakin pisteen x0 ympäristössä. Vastaavasti f : D ⊂ Rn → R on pisteessä x0 ∈ D lokaali minimi, jos f (x) ≥ f (x0 ) pisteen x0 ympäristössä. Ääriarvo on globaali eli absoluuttinen, jos kyseinen epäyhtälö on voimassa kaikilla x ∈ D. Ääriarvoja voi esiintyä: 1 2 3 Funktion f kriittissä pisteissä eli gradientin nollakohdissa ∇f (x) = 0, pisteissä joissa ∇f ei ole määritelty, sekä määrittelyjoukon D reunalla. Funktiolla f (x, y ) = 1 − x 2 − y 2 on lokaali maksimi f (0, 0) = 1 pisteessä (0, 0). Tämä piste on funktion f kriittinen piste, koska ∇f (0, 0) = −2xi − 2y j = 0. Joukon D kriittistä pistettä x0 , joka ei ole maksimi tai minimi, kutsutaan funktion f : D → R satulapisteeksi. (0,0) Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 3 / 18 Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 Esimerkki 2 Esimerkki 3 Funktiolla f (x, y ) = y 2 − x 2 on satulapiste (0, 0). Tämä piste on funktion f kriittinen piste, koska ∇f (0, 0) = −2xi + 2y j = 0. Kaikki pisteet suoralla x = 0 ovat funktion f (x, y ) = −x 3 satulapisteitä. Huomaa, että ∇f (0, y ) = −3x 2 i = 0 kaikilla y ∈ R. (0,0) Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 5 / 18 4 / 18 (0,y ) Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 6 / 18 Esimerkki 4 Esimerkki 5 p Funktiolla f (x, y ) = x 2 + y 2 on lokaali minimi f (0, 0) = 0 pisteessä (0, 0). Funktio f on jatkuva, mutta sen gradientti ∇f ei ole määritelty tässä pisteessä. Funktiolla f (x, y ) = 1 − x ei ole paikallisia ääriarvoja, jos sen määrittelyjoukko on koko taso D = R2 . Jos määrittelyjoukoksi kuitenkin ajatellaan esimerkiksi kiekko D = {(x, y ) : x 2 + y 2 < 1}, niin sen reunalla saadaan maksimi f (−1, 0) = 2 ja minimi f (1, 0) = 0. Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 7 / 18 Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 8 / 18 Ääriarvojen luokittelu: johdanto Hessen matriisi Olkoon f : D ⊂ Rn → R funktio, jolla on jatkuvat toisen kertaluvun osittaisderivaatat. Ääriarvojen luokittelu perustuu suureen ∆f = f (x + h) − f (x) tarkasteluun kriittisessä pisteessä x ∈ D. Funktion f luonnollinen derivaattakäsite on gradientti, joka itsessään on vektoriarvoinen funktio ∇f : Rn → Rn . Jos ∆f saa vain positiivisia arvoja (kun khk on pieni), on piste x minimi ja negatiivisessa tapauksessa maksimi. Jos ∆f vaihtaa merkkiä, niin piste x ei ole minimi eikä maksimi. Tämä johtaa funktion f toisen derivaatan tarkasteluun kriittisessä pisteessä. Yhden muuttujan tapauksessa: 1 2 3 Siten funktion f toinen derivaatta on matriisi, jota nimitetään Hessen matriisiksi 2 ∂2 ∂ ∂2 2 f (x) ∂x2 ∂x1 f (x) . . . ∂xn ∂x1 f (x) 1 ∂x 2 2 2 ∂ ∂ f (x) f (x) . . . ∂x∂n ∂x2 f (x) ∂x ∂x ∂x22 Hf (x) = 1 .2 . .. .. .. . . ∂2 ∂2 ∂2 f (x) ∂x1 ∂xn f (x) ∂x2 ∂xn f (x) · · · ∂x 2 Jos f 00 (x) < 0, funktiolla f lokaali maksimi pisteessä x. Jos f 00 (x) > 0, funktiolla f lokaali minimi pisteessä x. Jos f 00 (x) = 0, testi ei anna vastausta, ja kysymys täytyy ratkaista muulla tavoin. n Seuraavaksi yritetään yleistää tätä ajatusta monen muuttujan funktiolle. Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 Koska f on kaksi kertaa jatkuvasti derivoituva, derivoinnin järjestystä voidaan vaihtaa, ja kyseinen matriisi on symmetrinen. Mutta mitä tarkoittaa matriisin positiivisuus? 9 / 18 Matriisin definiittisyys MS-A0202 Syksy 2015 10 / 18 Toisen derivaatan testi monen muuttajan tapauksessa Symmetristä n × n-matriisia A sanotaan positiividefiniitiksi, jos xT Ax > 0 kaikilla nollasta poikkeavilla vektoreilla x ∈ Rn . Tällaisilla matriiseilla on monia samoja ominaisuuksia kuin positiivisilla reaaliluvuilla. Yhtäpitävästi voidaan määritellä, että matriisi on positiividefiniitti, jos sen kaikki ominaisarvot ovat positiivisia. Toinen yhtäpitävä ehto on Sylvesterin kriteerio: Kaikilla 1 ≤ m ≤ n matriisin A vasemmasta yläkulmasta muodostettujen m × m-matriisien determinantti on positiivinen (nolla ei käy). Vastaavalla tavalla voidaan määritellä negatiividefiniitti matriisi. Matriisin sanotaan olevan indefiniitti, jos sen kaikki ominaisarvot ovat nollasta poikkeavia ja sillä on vähintään yksi positiivinen sekä yksi negatiivinen ominaisarvo. Matriisi on negatiividefiniitti, jos Sylvesterin kriteeriossa esiintyvistä determinateista parittomat ovat negatiivisia ja parilliset positiivisia. Muussa tapauksessa matriisi on indefiniitti. Antti Rasila (Aalto-yliopisto) Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 11 / 18 Esimerkki 6 1/2 Lause Olkoon f : D ⊂ Rn → R funktio, jolla on jatkuvat toiset osittaisderivaatat kriittisen pisteen x ∈ D ympäristössä. Tällöin: a) Jos Hf (x) on positiividefiniitti, niin f :llä on lokaali minimi pisteessä x. b) Jos Hf (x) on negatiividefiniitti, niin f :llä on lokaali maksimi pisteessä x. c) Jos Hf (x) on indefiniitti, niin f :llä on satulapiste pisteessä x. d) Muussa tapauksessa testi ei anna tietoa funktiosta f . Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 12 / 18 Esimerkki 6 2/2 Etsitään ja luokitellaan funktion Lasketaan Hessen matriisi: f (x, y , z) = x 2 y + y 2 z + z 2 − 2x 2 2 0 Hf (1, 1, −1/2) = 2 −1 2 . 0 2 2 kriittiset pisteet. Yhtälöt kriittisille pisteille ovat Käytetään Sylvesterin kriteeriota: 0 = f1 (x, y , z) = 2xy − 2, 0 = f2 (x, y , z) = x 2 + 2yz, 2 2 > 0, 0 = f3 (x, y , z) = y + 2z. Nämä yhtälöt ratkaisemalla nähdään, että funktion f ainoa kriittinen piste on P = (1, 1, −1/2). Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 13 / 18 Sovellus: Lagrangen kertojien menetelmä 1/2 Tyypillinen esimerkki tällaisesta tehtävästä on peltipurkin muodon optimointi: Halutaan minimoida purkin pinta-ala (eli käytetty materiaali) f (h, r ) = 2πrh + 2πr 2 niin, että tilavuus V (r , h) = πr 2 h on vakio. Asetetaan tehtävä: Minimoi f (x, y ) ehdolla g (x, y ) = 0. Havaitaan, että mikäli ongelmalla on ratkaisu, niin ratkaisupisteessä (a, b) vektorien ∇f ja ∇g on oltava samansuuntaisia. Miksi? Koska muussa tapauksessa funktiolla f olisi nollasta poikkeva suunnattu derivaatta käyrän g (x, y ) = 0 tangentin suuntaan pisteessä (a, b), ja siis minimi ei voi olla pisteessä (a, b). MS-A0202 = −6 < 0, 2 2 0 2 −1 2 0 2 2 = −20 < 0. Siten funktiolla f on satulapiste pisteessä P = (1, 1, −1/2). Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 14 / 18 Sovellus: Lagrangen kertojien menetelmä 2/2 Usein optimointitehtävissä halutaan asettaa rajoitteita optimoitaville muuttujille. Antti Rasila (Aalto-yliopisto) 2 2 2 −1 Syksy 2015 15 / 18 Tästä voidaan päätellä, että mikäli optimipiste on olemassa, se on Lagrangen funktion L(x, y , λ) = f (x, y ) + λg (x, y ) kriittinen piste (eli gradientin nollakohta). Menetelmä yleistyy myös useammalle muuttujalle. Esimerkiksi kolmen muuttujan tapauksessa Lagrangen funktio on L(x, y , z, λ, µ) = f (x, y , z) + λg (x, y , z) + µh(x, y , z), missä f on minimoitava funktio ja rajoite-ehdot ovat g (x, y , z) = 0 sekä h(x, y , z) = 0. Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 16 / 18 Esimerkki 7 1/2 Esimerkki 7 2/2 Minimoidaan funktio f (x, y ) = g (x, y ) = x 2 y − 16 = 0. x2 + y2 ehdolla Muodostetaan Lagrangen funktio Ensimmäisestä yhtälöstä saadaan x = 0 tai λy = −1, mutta x = 0 on ristiriidassa kolmannen yhtälön kanssa. L(x, y , λ) = x 2 + y 2 + λ(x 2 y − 16). Siten Yhtälöt kriittisille pisteille ovat 0 = 0 = 0 = Antti Rasila (Aalto-yliopisto) 0 = 2y 2 + λyx 2 = 2y 2 − x 2 . √ Tästä saadaan edelleen x = ± 2y , ja 2y 3 = 16 eli y = 2. √ Minimejä on siis kaksi: (±2 2, 2). ∂L = 2x(1 + λy ), ∂x ∂L = 2y + λx 2 , ∂y ∂L = x 2 y − 16. ∂λ MS-A0202 Syksy 2015 17 / 18 Antti Rasila (Aalto-yliopisto) MS-A0202 Syksy 2015 18 / 18