031021P Tilastomatematiikka (5 op) viikot 5–6
Transcription
031021P Tilastomatematiikka (5 op) viikot 5–6
031021P Tilastomatematiikka (5 op) viikot 5–6 Jukka Kemppainen Mathematics Division Jakauman tunnusluvut Jakauman tärkeimmät tunnusluvut ovat odotusarvo ja varianssi. ◮ Odotusarvo ilmoittaa jakauman keskikohdan eli arvon, jonka satunnaismuuttuja keskimääräisesti saavuttaa. ◮ Varianssi ilmoittaa, kuinka paljon satunnaismuuttujan arvot keskimäärin poikkeavat odotusarvosta. Muita tunnuslukuja ovat mm. ◮ Jakauman momentit, eli satunnaismuuttujan sopivien potenssien odotusarvot; ◮ Jakauman vinous; ◮ Kvartiilit; ◮ Keskipoikkeama... Jukka Kemppainen Mathematics Division 2 / 53 Odotusarvo Tarkastellaan odotusarvon määrittelyä erikseen diskreetin ja jatkuvan sm:n tapauksessa. Aloitetaan diskreetistä sm:stä. Määr. 20 Jos X on diskreetti satunnaismuuttuja, jonka arvojoukko on SX = {x1 , x2 , . . . }, niin lukua E (X ) = ∞ X xk P(X = xk ) k=1 sanotaan X :n odotusarvoksi edellyttäen, että sarja suppenee. Jukka Kemppainen Mathematics Division 3 / 53 Odotusarvo Määr. 21 Jos X on jatkuva satunnaismuuttuja, jonka tiheysfunktio on fX , niin lukua Z ∞ xfX (x)dx E (X ) = −∞ sanotaan X :n odotusarvoksi edellyttäen, että integraali suppenee. Odotusarvolle käytetään usein merkintää E (X ) = µX tai yksinkertaisesti µ = µX , jos sekaannuksen vaaraa ei ole. Huomautus 4 ◮ Erityisesti, jos diskreetti sm. saa vain äärellisen määrän arvoja, odotusarvo on aina olemassa. ◮ Kaikilla satunnaismuuttujilla ei ole odotusarvoa. Jukka Kemppainen Mathematics Division 4 / 53 Esimerkki Esim. 39 Milloin satunnaismuuttujalla X , jonka ◮ ◮ pistetodennäköisyysfunktio on muotoa P(X = k) = c k1p , k = 1, 2, . . .; tiheysfunktio on f (x) = c (1+x1 2 )p , x ∈ R, on odotusarvo? Jukka Kemppainen Mathematics Division 5 / 53 Diskreettien jakaumien odotusarvoja (1/2) ◮ Binomijakauman, X ∼ Bin(n, p), odotusarvo on E (X ) = np. ◮ Geometrisen jakauman, X ∼ Geo(p), odotusarvo on E (X ) = ◮ 1 . p Poissonin jakauman, X ∼ Poi(a), odotusarvo on E (X ) = a. Jukka Kemppainen Mathematics Division 6 / 53 Diskreettien jakaumien odotusarvoja (2/2) Laskentakaavojen intuitiivinen perustelu: ◮ ◮ ◮ Binomijakaumalle E (X ) = np, sillä yksittäisessä toistossa onnistumisen tn. on p, joten ’pitkässä juoksussa’ onnistumisten lkm. on np. Geometriselle jakaumalle E (X ) = p1 , sillä pitkässä juoksussa keskimääräinen onnistumisten lkm. per yritysten lkm. on p, joten keskimääräinen yritysten lkm. per onnistuminen on 1/p. Poissonin jakaumalle E (X ) = a on selvä, jos Poissonin jakauma ajatellaan binomijakauman raja-jakaumana. Jukka Kemppainen Mathematics Division 7 / 53 Kuvia Kuvissa on esitetty sm:ien X ∼ Bin(50, 0.2) ja X ∼ Poi(5) pistetodennäköisyysfunktiot ja merkitty odotusarvo. Kuva : X ∼ Bin(50, 0.2) ja E (X ) = 10 Jukka Kemppainen Kuva : X ∼ Poi(5) ja E (X ) = 5 Mathematics Division 8 / 53 Jatkuvien jakaumien odotusarvoja ◮ Tasajakauman, X ∼ Tas(a, b), odotusarvo on E (X ) = a+b 2 . ◮ Eksponenttijakauman, X ∼ Exp(λ), odotusarvo on E (X ) = λ1 . ◮ Normaalijakauman, X ∼ N(µ, σ 2 ), odotusarvo on E (X ) = µ. ◮ Weibullin jakauman, X ∼ Wei(α, β), odotusarvo on E (X ) = α−1/β Γ(1 + 1/β), missä Γ(x) = Z ∞ t x−1 e−t dt, α, β > 0, x > 0, 0 on Eulerin Gamma-funktio. Jukka Kemppainen Mathematics Division 9 / 53 Kuvia Kuvissa on esitetty sm:ien X ∼ N(100, 25) ja X ∼ Exp( 21 ) tiheysfunktiot ja merkitty odotusarvo. Kuva : X ∼ N(100, 25) ja E (X ) = 100 Jukka Kemppainen Kuva : X ∼ Exp( 21 ) ja E (X ) = 2 Mathematics Division 10 / 53 Esimerkkejä Esim. 40 Heitetään kolikkoa 3 kertaa. Olkoon X kruunujen lukumäärä. Laske odotusarvo E (X ). Esim. 41 Jatkuvan satunnaismuuttujan X tiheysfunktio on 0 ≤ x < 1, x, fX (x) = 2 − x, 1 ≤ x ≤ 2, 0, muulloin. Laske X :n odotusarvo. Jukka Kemppainen Mathematics Division 11 / 53 Esimerkkejä Esim. 42 Teräväpiirtotelevisiota (HDTV) on lyhyessä ajassa myyty 30000 kappaletta. Jokaisessa näistä on yksi kappale komponenttia A, jonka kestoikä on eksponenttijakautunut odotusarvona 4 vuotta. Millä todennäköisyydellä komponentti A kestää ainakin vuoden? HDTV:n takuu on vuoden. Kuinka monen HDTV:n komponentti A joudutaan keskimäärin vaihtamaan takuun puitteissa? Komponentti on halpa (3 euroa), mutta sen uusimiseen liittyvä asennuskulu on 55 euroa. Kuinka paljon kuluja on odotettavissa takuuna uusittavista komponenteista ja niiden asennuksista? Jukka Kemppainen Mathematics Division 12 / 53 Muunnoksen Y = h(X ) odotusarvo Sovelluksissa joudutaan usein tarkastelemaan satunnaismuuttujien muunnoksia. Oletetaan, että X on satunnaismuuttuja ja h : R → R sellainen funktio, että Y = h(X ) on satunnaismuuttuja (vrt. Lause 7, s.17). Jos X on diskreetti sm., saadaan Lause 11 Muunnoksen Y = h(X ) odotusarvo on X h(xi )P(X = xi ) E (Y ) = E (h(X )) = i :xi ∈SX edellyttäen, että sarja suppenee itseisesti, eli X |h(xi )|P(X = xi ) < ∞. i :xi ∈SX Jukka Kemppainen Mathematics Division 13 / 53 Muunnoksen odotusarvo Jos taasen X on jatkuva satunnaismuuttuja, jonka tiheysfunktio on fX , saadaan Lause 12 Muunnoksen Y = h(X ) odotusarvo on Z ∞ h(x)fX (x)dx E (Y ) = E (h(X )) = −∞ edellyttäen, että integraali suppenee itseisesti, eli Z ∞ |h(x)|fX (x)dx < ∞. −∞ Jukka Kemppainen Mathematics Division 14 / 53 Esimerkkejä Esim. 43 Olkoon Θ välille ] − π2 , π2 [ tasajakautunut kulma ja Y = tan(Θ). Määrää (mikäli mahdollista) Y :n odotusarvo. Jukka Kemppainen Mathematics Division 15 / 53 Esimerkkejä Esim. 44 Oletetaan, että tuotteen laatutappio on kE ((X − m)2 ), missä k on verrannollisuuskerroin ja m suureen X tavoitearvo tuotannossa. Olkoon laitteen kulutuskesto X (kk) Weibull-jakautunut parametrien arvoilla α = 0,40 ja β = 21 . Laitteen tuottaja tavoitteli tuotteelleen 100 kk:n kulutuskestoa. Mikä oli tuotteen kulutuskeston laatutappio, kun verrannollisuuskerroin oli k = 0,1? Tuottaja pyrki säätämään tuotantoaan siten, että parametrin β arvo pysyi kiinteänä ja parametrin α arvo muuttui. Millä α:n arvolla kulutuskeston tavoitearvo ja odotusarvo ovat yhtä suuret? −2 −1 (E (X ) = α β ( β1 )! ja E (X 2 ) = α β ( β2 )!, kun β1 ∈ N.) Jukka Kemppainen Mathematics Division 16 / 53 Varianssi Tarkastellaan varianssin määrittelyä erikseen diskreetin ja jatkuvan sm:n tapauksessa. Aloitetaan diskreetistä sm:stä. Määr. 22 Jos X on diskreetti satunnaismuuttuja, jonka arvojoukko on SX = {1, 2, . . . } ja odotusarvo µX , niin lukua X D 2 (X ) = (xk − µX )2 P(X = xk ) k:xk ∈SX sanotaan X :n varianssiksi ja merkitään D 2 (X ) = Var(X ) = σX2 edellyttäen, että sarja suppenee. Jukka Kemppainen Mathematics Division 17 / 53 Varianssi Vastaavasti jatkuvan sm:n tapauksessa määritellään Määr. 23 Jos X on jatkuva satunnaismuuttuja, jonka tiheysfunktio on fX ja odotusarvo µX , niin lukua Z ∞ 2 (x − µX )2 fX (x)dx D (X ) = −∞ sanotaan X :n varianssiksi ja merkitään D 2 (X ) = Var(X ) = σX2 edellyttäen, että integraali suppenee. p Lukua σX = Var(X ) sanotaan satunnaismuuttujan X keskihajonnaksi. Jukka Kemppainen Mathematics Division 18 / 53 Varianssi Jos katsotaan varianssin määritelmää ja verrataan sitä muunnoksen h(X ) = (X − µX )2 odotusarvoon, niin havaitaan, että itse asiassa varianssi on muunnoksen h(X ) odotusarvo ja siten Var(X ) = E ((X − E (X ))2 ). Edellisestä yhtäsuuruudesta saadaan varianssille seuraava hyödyllinen laskentakaava Lause 13 Olkoon X satunnaismuuttuja, jolla on varianssi. Tällöin Var(X ) = E (X 2 ) − E (X )2 . Jukka Kemppainen Mathematics Division 19 / 53 Esimerkki Esim. 45 Oletetaan, että X ∼ N(0, 1). Tällöin Y = eX noudattaa ns. log-normaalijakaumaa. Määrää Y :n odotusarvo ja varianssi. Jukka Kemppainen Mathematics Division 20 / 53 Diskreettien jakaumien variansseja ◮ Binomijakauman, X ∼ Bin(n, p), varianssi on Var(X ) = np(1 − p). ◮ Geometrisen jakauman, X ∼ Geo(p), varianssi on Var(X ) = 1−p . p2 ◮ Poissonin jakauman, X ∼ Poi(a), varianssi on Var(X ) = a. Jukka Kemppainen Mathematics Division 21 / 53 Jatkuvien jakaumien variansseja ◮ Tasajakauman, X ∼ Tas(a, b), varianssi on Var(X ) = (b−a)2 12 . ◮ Eksponenttijakauman, X ∼ Exp(a), varianssi on Var(X ) = a12 . ◮ Normaalijakauman, X ∼ N(µ, σ 2 ), varianssi on Var(X ) = σ 2 . ◮ Weibullin jakauman, X ∼ Wei(α, β), varianssi on Var(X ) = α−2/β (Γ(1 + 2/β) − Γ(1 + 1/β)2 ). Jukka Kemppainen Mathematics Division 22 / 53 Odotusarvon ja varianssin ominaisuuksia Lause 14 Jos sm. X on todennäköisyydellä yksi vakio a, ts. P(X = a) = 1, niin E (X ) = a ja Var(X ) = 0. Kääntäen, jos Var (X ) = 0, niin P(X = a) = 1 jollekin a ∈ R. Lause 15 Jos X ja Y ovat satunnaismuuttujia ja a, b ∈ R, niin E (aX + bY ) =aE (X ) + bE (Y ), Var(aX + bY ) =a2 Var(X ) + b2 Var(Y ) + 2abE ((X − E (X ))(Y − E (Y ))) edellyttäen, että em. suureet ovat äärellisiä. Jukka Kemppainen Mathematics Division 23 / 53 Ominaisuuksia Lause 16 Jos X ja Y ovat riippumattomia, niin E (XY ) = E (X )E (Y ), Var(aX + bY ) = a2 Var(X ) + b2 Var(Y ) edellyttäen, että em. suureet ovat äärellisiä. Edellinen tulos pätee myös n:n riippumattoman sm:n tapauksessa. Korollaari 2 Jos X1 , . . . , Xn ovat riippumattomia satunnaismuuttujia, joilla on odotusarvo ja varianssi, ja a1 , . . . , an ∈ R, niin E (X1 · · · Xn ) = E (X1 ) · · · E (Xn ), Var(a1 X1 + · · · + an Xn ) = a12 Var(X1 ) + · · · + an2 Var(Xn ). Jukka Kemppainen Mathematics Division 24 / 53 Esimerkkejä Esim. 46 Olkoon X ∼ N(µ, σ 2 ). Laske standardisoidun satunnaismuuttujan Z = X σ−µ odotusarvo ja varianssi. Esim. 47 Kytketään 100 sähkövastusta yhteen. Jokaisen vastuksen resistanssi on tasaisesti jakautunut 90 Ω ja 110 Ω välille. Oletetaan, että sähkövastukset ovat toisistaan riippumattomia. Määrää systeemin (a) kokonaisresistanssin odotusarvo ja varianssi, kun vastukset on kytketty sarjaan. (b) kokonaisresistanssin käänteisluvun odotusarvo ja varianssi, kun vastukset on kytketty rinnan. Jukka Kemppainen Mathematics Division 25 / 53 Todennäköisyyslaskennan raja-arvolauseita Tilastollisessa tutkimuksessa tehdään aineistojen pohjalta päätelmiä tutkittavasta ilmiöstä. Tehtäessä ilmiöstä riippumattomia havaintoja, on toivottavaa, että havaintojen lukumäärän kasvaessa saadaan yhä varmemmin ”oikea kuva todellisuudesta”. Todennäköisyyslaskennan raja-arvolauseet luovat perustan todennäköisyyslaskennan tilastollisille sovelluksille. Jukka Kemppainen Mathematics Division 26 / 53 Esimerkki Esim. 48 Olkoot X1 , X2 , . . . , Xn riippumattomia satunnaismuuttujia, joille E (Xi ) = µ ja D 2 (Xi ) = σ 2 kaikilla i = 1, . . . , n. Laske aritmeettisen keskiarvon n X = 1X Xi n i =1 odotusarvo ja varianssi. Jukka Kemppainen Mathematics Division 27 / 53 Tn-laskennan raja-arvolauseita Edellisen esimerkin mukaan tehtäessä satunnaismuuttujasta X riippumattomia havaintoja x1 , P . . . , xn keskittyy havaintojen aritmeettinen keskiarvo x = n1 ni=1 xi yhä varmemmin satunnaismuuttujan X odotusarvon ympäristöön, sillä E (X ) = µ ja D 2 (X ) → 0, kun n → ∞. Huomaa, että havaintojen aritmeettinenP keskiarvo x on sm:n X saama arvo. 1 Keskiarvot n ni=1 Xi muodostavat satunnaismuuttujajonon, joka tietyllä tavalla suppenee kohti odotusarvoa µ. Tarkastellaan seuraavaksi satunnaismuuttujajonon suppenemisen muotoja. Jukka Kemppainen Mathematics Division 28 / 53 Satunnaismuuttujajonon suppeneminen Satunnaismuuttujajonon X1 , X2 , . . . suppenemista on mahdollista luonnehtia eri tavoin. Tällä kurssilla tarkastellaan seuraavia suppenemisen muotoja: ◮ Jakaumasuppeneminen Jono X1 , X2 , . . . suppenee jakaumaltaan kohti satunnaismuuttujaa X , jos kertymäfunktioiden jono Fn suppenee kohti rajajakauman kertymäfunktiota FX jokaisessa F :n jatkuvuuspisteessä. ◮ Stokastinen suppeneminen tarkoittaa sitä, että poikkeama rajamuuttujasta X on mielivaltaisen pieni suurella todennäköisyydellä, eli kaikilla ǫ > 0 lim P(|Xn − X | < ǫ) = 1. n→∞ Jukka Kemppainen Mathematics Division 29 / 53 Satunnaismuuttujajonon suppeneminen ◮ Melkein varma suppeneminen tarkoittaa sitä, että jono X1 , X2 , . . . suppenee todennäköisyydellä yksi kohti rajamuuttujaa X , eli P( lim Xn = X ) = 1. n→∞ Voidaan osoittaa, että melkein varma suppeneminen on vahvin suppenemisen muoto ja jakaumasuppeneminen taasen heikoin muoto, eli suppenemiselle pätee Melkein varmasti ⇒ Stokastisesti ⇒ Jakaumaltaan. Jukka Kemppainen Mathematics Division 30 / 53 Chebyshevin epäyhtälö Lause 17 (Chebyshevin epäyhtälö) Olkoon X satunnaismuuttuja, jolla on odotusarvo µ ja varianssi σ 2 . Tällöin kaikilla ǫ > 0 pätee P(|X − µ| ≥ ǫ) ≤ σ2 . ǫ2 Chebyshevin epäyhtälöllä voidaan aina arvioida kuinka paljon satunnaismuuttuja poikkeaa odotusarvostaan. Arvio on tosi karkea ja se riippuu varianssin suuruudesta. Jukka Kemppainen Mathematics Division 31 / 53 Esimerkki Esim. 49 Olkoon X ∼ N(0, 1). Laske todennäköisyyksille P(|X | ≥ 1), P(|X | ≥ 2) ja P(|X | ≥ 3) (a) arvio Chebychevin epäyhtälön avulla. (b) tarkka arvo. Jukka Kemppainen Mathematics Division 32 / 53 Heikko suurten lukujen laki Lause 18 (Chebyshev) Olkoon X1 , X2 , . . . jono parittain riippumattomia, samalla tavalla jakautuneita sm:ia, joilla on odotusarvo E (Xi ) = µ ja varianssi D 2 (Xi ) = σ 2 . Olkoon X (n) n 1X = Xi n i =1 satunnaismuuttujien X1 , X2 , . . . , Xn aritmeettinen keskiarvo. Tällöin (n) P(|X − µ| ≥ ǫ) → 0, kun n → ∞ kaikilla ǫ > 0. Jukka Kemppainen Mathematics Division 33 / 53 Tulkinta Heikko suurten lukujen laki tarkoittaa seuraavaa: ◮ Satunnaismuuttujien X1 , . . . , Xn aritmeettinen keskiarvo suppenee stokastisesti kohti odotusarvoa µ. ◮ Jos X1 , . . . , Xn ovat riippumattomia havaintoja samasta satunnaismuuttujasta X , jonka odotusarvo on µ ja varianssi σ 2 , niin havaintojen lukumäärän kasvaessa havaintojen aritmeettinen keskiarvo (otoskeskiarvo) yhä varmemmin ilmoittaa todellisen odotusarvon. Otoskeskiarvolla voidaan siis estimoida odotusarvoa, kun havaintojen lukumäärä on riittävän suuri. Jukka Kemppainen Mathematics Division 34 / 53 Kuvia Kuvissa on esitetty riippumattomien normaalijakautuneiden sm:ien (n) tiheysfunktioita. Xi ∼ N(0, 1) aritmeettisen keskiarvon X Kun ǫ = 0.01, niin Lauseen 18 tn:ksi saadaan (103 ) (106 ) P(|X | ≥ ǫ) ≈ 0.75 ja P(|X | ≥ ǫ) ≈ 7.6 · 10−24 . Jukka Kemppainen Mathematics Division 35 / 53 Vahva suurten lukujen laki Lause 19 (Kolmogorov) Olkoon X1 , X2 , . . . jono parittain riippumattomia, samalla tavalla jakautuneita satunnaismuuttujia, joilla on odotusarvo E (Xi ) = µ. Tällöin (n) P( lim X = µ) = 1. n→∞ Vahva suurten lukujen laki siis sanoo, että parittain riippumattomien, samalla tavalla jakautuneiden satunnaismuuttujien X1 , . . . , Xn aritmeettinen keskiarvo suppenee melkein varmasti kohti odotusarvoa µ. Jukka Kemppainen Mathematics Division 36 / 53 Esimerkki Esim. 50 Pelatessa ruletissa väriä (musta tai punainen) yhden euron 1 euroa. Mitä suurten panoksella on voittosumman odotusarvo − 37 lukujen laki sanoo voittosummasta, jos peliä pelataan erittäin monta kertaa yhden euron panoksella? Takaako laki, että sinun tappiot ovat pieniä? Entäpä takaako laki, että suurella pelien määrällä häviät? Jukka Kemppainen Mathematics Division 37 / 53 Keskeinen raja-arvolause Suurten lukujen laeilla on lähinnä kvalitatiivinen merkitys satunnaismuuttujien aritmeettisen keskiarvon käyttäytymisestä n:n kasvaessa. Todennäköisyyksien kvantitatiiviseen laskemiseen tarvitaan tarkempaa tietoa aritmeettisen keskiarvon jakauman käyttäytymisestä. Tämän ilmoittaa keskeinen raja-arvolause. Lause 20 (Keskeinen raja-arvolause) Olkoon X1 , X2 , . . . jono keskinäisesti riippumattomia, samalla tavalla jakautuneita sm:ia, joilla E (etXi ) on olemassa, kun |t| < δ 2 2 jollakin Pδn > 0. Merkitään E (Xi ) = µ, D (Xi ) = σ ja Sn = i =1 Xi . Tällöin Z x S − E (S ) u2 1 n n lim P e− 2 du. ≤ x = Φ(x) = √ n→∞ σSn 2π −∞ Jukka Kemppainen Mathematics Division 38 / 53 Keskeinen raja-arvolause Keskeisessä raja-arvolauseessa esiintyvä suure voidaan kirjoittaa muodossa Sn −µ Sn − E (Sn ) = n σ . √ σSn n Siis riittävän suurilla n:n arvoilla keskiarvo X = n1 Sn noudattaa likimain normaalijakaumaa, eli n σ2 1X Xi ∼ N(µ, ) n n i =1 likimain, kun n on riittävän suuri. Summan todennäköisyyden arvioimista normaalijakaumalla sanotaan normaalijakauma-approksimaatioksi. Jukka Kemppainen Mathematics Division 39 / 53 Huomioita ◮ Joskus n = 3 on riittävä otoksen koko; ◮ Joskus n = 100000 ei riitä; ◮ Pääsääntöisesti (ainakin tällä kurssilla) approksimaatio on pätevä, kun n ≥ 30. Huomautus 5 Keskeisen raja-arvolauseen todisti vuonna 1901 venäläinen A.N. Lyapunov hieman yleisemmillä oletuksilla. Satunnaismuuttujien ei esimerkiksi tarvitse olla samalla tavalla jakautuneita. Jukka Kemppainen Mathematics Division 40 / 53 Kuvia P Kuvissa on esitetty jakaumien Sn = ni=1 Xi ja X ∼ N(E (Sn ), σS2n ) pistetodennäköisyydet ja tiheysfunktio, kun n = 50 ja Kuva : Sn ∼ Bin(n, 0.2) Jukka Kemppainen Mathematics Division Kuva : Xi ∼ Poi(1) 41 / 53 Kuvia P Kuvissa on esitetty jakauman Sn = ni=1 Xi kertymäfunktio kokonaislukupisteissä ja ja jakauman X ∼ N(E (Sn ), σS2n ) kertymäfunktio, kun n = 50 ja Kuva : Sn ∼ Bin(n, 0.2) Jukka Kemppainen Mathematics Division Kuva : Xi ∼ Poi(1) 42 / 53 Kuvia P Kuvissa on esitetty jakaumien Sn = ni=1 Xi ja X ∼ N(E (Sn ), σS2n ) tiheysfunktiot (tf:t) ja kertymäfunktiot (kf:t), kun n = 3 ja Xi ∼ Tas(0, 1). Kuva : Tf:t fSn ja fX Jukka Kemppainen Kuva : Kf:t FSn ja FX Mathematics Division 43 / 53 Kuvia P Kuvissa on esitetty jakaumien Sn = ni=1 Xi ja X ∼ N(E (Sn ), σS2n ) tiheysfunktiot (tf:t) ja kertymäfunktiot (kf:t), kun n = 10 ja Xi ∼ Exp(1). Kuva : Tf:t fSn ja fX Jukka Kemppainen Kuva : Kf:t FSn ja FX Mathematics Division 44 / 53 Esimerkkejä Esim. 51 Olkoon Yn erään osakkeen hinta vuoden n. päivänä. Oletetaan, että erotukset Xn = Yn+1 − Yn ovat riippumattomia, normaalijakautuneita satunnaismuuttujia, joilla on sama odotusarvo µ = 0 ja varianssi σ 2 = 41 . Jos Y1 = 100, niin laske todennäköisyys, että vuoden lopussa osakkeen hinta on (a) ≥ 100. (b) ≥ 110. (c) ≥ 120. Jukka Kemppainen Mathematics Division 45 / 53 Esimerkin 51 realisaatioita Kuvissa on esitetty 2 eri realisaatiota esimerkin 51 osakkeen hinnalle. Jukka Kemppainen Mathematics Division 46 / 53 Esimerkkejä Esim. 52 Keskeinen raja-arvolause ei päde kaikille riippumattomille jonoille X1 , X2 , . . .. Osoita, että jos Xk ∼ Poi( 21k ) kaikilla k = 1, 2, . . ., niin muuttuja Sn − E (Sn ) σSn ei lähesty N(0, 1)-jakaumaa. Esim. 53 Oletetaan, että elektronisen komponentin elinikä on sm., jonka odotusarvo on µ = a ja keskihajonta σ = a. Kuinka monta komponenttia tarvitaan, jotta niiden yhteenlaskettu elinikä olisi korkeintaan 8a enintään tn:llä 0,05? Jukka Kemppainen Mathematics Division 47 / 53 Binomijakauman normaalijakauma-approksimaatio Tarkastellaan n-kertaista toistokoetta X1 , . . . , Xn , jossa ◮ Xi ilmoittaa tapahtuuko jokin suotuisa tapahtuma A vai ei ◮ Oletetaan, että tapahtuma A sattuu yksittäisissä toistoissa muista toistoista riippumattomasti ja että P(Xi = 1) = P(A) = P(′′ A sattuu′′ ) = p ja P(Xi = 0) = P(A) = 1 − p kaikilla i = 1, . . . , n. Tällöin Sn = X1 + X2 + · · · + Xn ilmoittaa A:n esiintymiskertojen lukumäärän ja Sn ∼ Bin(n, p). Koska E (Sn ) = np ja D 2 (Sn ) = np(1 − p), niin keskeisen raja-arvolauseen mukaan Sn ∼ N(np, np(1 − p)) likimain, kun n on riittävän suuri. Jukka Kemppainen Mathematics Division 48 / 53 Binomijakauman approksimaatio Siis binomijakaumaa Bin(n, p) voidaan approksimoida normaalijakaumalla N(np, np(1 − p)), kun n on riittävän suuri. Approksimaation tarkkuutta on tutkittu ja todettu, että approksimaatio on erityisen hyvä silloin, kun p ≈ 12 . Luvun n pitäisi olla niin suuri, että varianssi np(1 − p) > 9, jolloin käytännössä saadaan riittävän hyviä approksimaatioita. Jukka Kemppainen Mathematics Division 49 / 53 Approksimaatio, p:n vaikutus Kuviin on piirretty binomijakauman X ∼ Bin(20, p) pistetodennäköisyyksiä ja normaalijakauman p N(20p, ( 20p(1 − p))2 ) tiheysfunktio, kun Kuva : p = 0.1 Jukka Kemppainen Kuva : p = 0.5 Mathematics Division 50 / 53 Approksimaatio, n:n vaikutus Kuviin on piirretty binomijakauman X ∼ Bin(n, 0.05) pistetodennäköisyyksiä ja normaalijakauman √ N(0.05n, ( 0.05 · 0.95n)2 ) tiheysfunktio, kun Kuva : n = 20 Jukka Kemppainen Kuva : n = 1000 Mathematics Division 51 / 53 Jatkuvuuskorjaus Diskreettejä jakaumia approksimoitaessa voidaan tarkkuutta parantaa tekemällä jatkuvuuskorjaus. Jos a ja b ovat kokonaislukuja, joille 0 ≤ a ≤ b ≤ n, ja X on diskreetti sm., joka saa kokonaislukuarvot 0, 1, . . . , n, niin tn:ää P(a ≤ X ≤ b) ei approksimoida integraalina a:sta b:hen, vaan integraalina a − 12 :sta b + 12 :een. Siis 1 1 ≤X ≤b+ ) 2 2 a − 1 − E (X ) b + 21 − E (X ) X − E (X ) 2 =P ≤ ≤ σX σX σX b + 1 − E (X ) a − 1 − E (X ) 2 2 ≈Φ −Φ . σX σX P(a ≤ X ≤ b) = P(a − Jukka Kemppainen Mathematics Division 52 / 53 Esimerkkejä Esim. 54 Eräästä tuotteesta 10 % on viallisia. Jos ostetaan 10 tuotetta, niin millä tn:llä saadaan korkeintaan yksi viallinen tuote, kun tn. lasketaan ◮ tarkasti? ◮ normaalijakauma-approksimaatiolla jatkuvuuskorjauksella ja ilman? ◮ Poisson-jakauman avulla? Esim. 55 Heitetään noppaa 20 kertaa. Millä todennäköisyydellä pistelukujen summa on vähintään 60 ja korkeintaan 80? Jukka Kemppainen Mathematics Division 53 / 53