Obligatorisk oppgavesett nr. 1
Transcription
Obligatorisk oppgavesett nr. 1
Obligatorisk oppgave 1 – MAT1120 H15 Innleveringsfrist: torsdag 24/09-2015, innen kl 14.30. Besvarelsen leveres på Matematisk institutt, 7. etasje i N.H. Abels hus. Husk å bruke forsiden som du finner via hjemmesiden. Dersom du på grunn av sykdom eller andre tungtveiende grunner har behov for å utsette innleveringen, må du i god tid før innleveringsfristen sende søknad til: [email protected] Husk at sykdom må dokumenteres ved legeattest. Oppgavesettet består av tilsammen 9 oppgaver/deloppgaver. For å få godkjent Oblig 1 kan høyst ett av disse 9 punktene leveres blankt og det må komme klart frem fra din besvarelse at du har gjort et seriøst forsøk på å løse alle de andre punktene. Videre må minst 6 av de 9 punktene være besvart på en tilfredstillende måte, med en ryddig fremstilling og gode begrunnelser. Det vil også bli lagt vekt på at Matlab-delene i oppgavesettet er rimelig godt besvart – en besvarelse som viser mangelfulle Matlab-ferdigheter kan bli underkjent selv om den tilfredstiller de andre kravene. Der det står at Matlab skal brukes, må det vedlegges passende utskrifter med kommentarer. Det er tillatt å bruke Python (eller en annen programpakke enn Matlab), men husk at det vil kunne bli stilt spørsmål som kreves kjennskap til Matlab ved slutteksamen. Studenter som ikke får sin opprinnelige besvarelse godkjent, men som har gjort et reelt forsøk på å løse oppgavesettet, vil få en mulighet til å levere en revidert besvarelse. Studenter som ikke får godkjent begge sine besvarelser til Oblig 1 og Oblig 2 vil ikke få adgang til avsluttende eksamen. Det er lov å samarbeide om oppgavene. Men alle må levere sin egen personlige besvarelse og selv ha gjennomført alle Matlabkjøringer. Er vi i tvil om at du virkelig ha forstått det du har levert inn, kan vi be deg om en muntlig redegjørelse. Det vises ellers til regelverket for obligatoriske oppgaver, som du finner via hjemmesiden til emnet. 1 Om Markov kjeder og absorpsjonssannsynligheter Avsnitt 4.9 i læreboka gir en innføring i Markov kjeder. Vi minner om at en Markov kjede i Rn er en følge av sannsynlighetsvektorer x0 , x1 , x2 , . . . i Rn som er slik at xk+1 = P xk , k = 0, 1, 2, . . . der P er en n × n stokastisk matrise. Vi har da at xk = P k x0 for alle k = 0, 1, 2, . . . Husk her at P 0 = In (= n×n identitetsmatrisen). Markov kjeder brukes ofte til å modellere “tilfeldige” prosesser med “diskret” tidsskala. Anta at vi studerer et system som kan veksle mellom et endelig antall tilstander, la oss si n. Hva som menes med tilstander i en konkret situasjon er gjerne en del av selve modelleringen av systemet. Er det f.eks. været i Oslo vi ønsker å modellere som en tilfeldig prosess kan vi innskrenke oss til en grov inndeling i tre tilstander (f.eks. sol, skyet og regn), eller vi kan innføre flere tilstander (f.eks. sol, delvis skyet, jevnt overskyet, periodevis regn, regn). Vi tenker oss at overgang mellom tilstander skjer ved tidspunktene 1, 2, . . . og styres i henhold til bestemte sannsynligheter (som gjerne anslås ved eksperimenter). Vi antar her at disse sannsynlighetene ikke forandrer seg med tiden (i mer naturtro modeller vil disse ofte gjøre det). Mengden S = {s1 , s2 , . . . , sn } av alle de n ulike tilstandene systemet kan være i kalles gjerne tilstandsrommet til systemet. Sannsynligheten for at systemet går fra tilstand sj til tilstand si i ett tidsskritt angis ved et tall pij i intervallet [0, 1]. Disse sannsynlighetene, som kalles overgangssannsynligheter, tilfredstiller P da at ni=1 pij = 1 for enhver j, slik at n × n matrisen P = [pij ] er en stokastisk matrise. Matrisen P kalles overgangsmatrisen til systemet. Vanligvis er vi gitt en startvektor x0 ∈ Rn som er en sannsynlighetsvektor; den i-te komponenten ai til x0 angir da sannsynligheten for at systemet er i tilstand si ved starttidspunktet t = 0. Hvis vi f.eks. vet med 100 prosents sikkerhet (altså med sannsynlighet 1) at systemet er i tilstand sj for en bestemt j ved t = 0, betyr det at aj = 1, mens ai = 0 når i 6= j, altså at x0 = ej (som betegner standardbasisvektor nr. j i Rn ). I denne obligen skal vi stort sett tenke oss Markov kjeder der startvektoren er en av ej -ene, dvs at prosessen begynner i en av tilstandene (“starttilstanden”) ved t = 0. Vektoren x1 = P x0 blir en ny sannsynlighetsvektor (dette følger av oppgave 4.9.19 i boka). Denne vektoren er slik at dens i-te 2 komponent angir sannsynligheten for at systemet er i tilstand si ved tidspunktet t = 1. De neste vektorene i den assosierte Markov kjeden, gitt ved xk+1 = P xk , k ≥ 0, har en tilsvarende tolkning. Ofte blir et system som ovenfor fremstilt ved hjelp av en figur som viser alle tilstandene og de positive overgangssannsynlighetene, angitt ved piler. (Vi sløyfer altså pil fra tilstanden sj til tilstanden si dersom pij = 0.) Eksempel 1. La n = 5. Et system er angitt ved følgende figur: 1 & s1 t 0.7 0.3 s2 j * 0.5 s3 j 0.5 * 0.35 s4 0.65 Den tilhørende overgangsmatrisen blir 1 0.7 0 0 0 0 0.5 0 P = 0 0.3 0 0.65 0 0 0.5 0 0 0 0 0.35 0 0 0 0 1 * s5 h 1 . (1) Her er f.eks. p32 = 0.3, så sannsynligheten for å gå fra tilstand s2 til tilstand s3 i ett tidsskritt er 0.3. Produktet av to overgangssannsynligheter har en naturlig tolkning som sannsynligheten for at en bestemt begivenhet inntreffer. Anta f.eks. at prosessen ovenfor starter i tilstand s3 . Hva er da sannsynligheten for at prosessen går slik: s3 → s2 → s1 i løpet av to tidsskritt? Jo, denne begivenheten har sannsynlighet lik produktet av de to aktuelle overgangssannsynlighetene, nemlig p12 p23 = 0.7 · 0.5 = 0.35. Vi kan her tenke oss at en “partikkel” starter i s3 , hopper derfra til en tilstand sl med sannsynlighet pl3 ved t = 1, at den hopper videre derfra til en tilstand si med sannsynlighet pil ved t = 2, osv. Sannsynligheten for at partikkelen vandrer langs “veien” s3 → s2 → s1 i løpet av to tidsskritt (blant alle mulige “veier” fra s3 i løpet av to tidsskritt) er da nettopp p12 p23 = 0.7 · 0.5 = 0.35. 3 Vi betrakter igjen et system med tilstandsrom S = {s1 , . . . , sn } og overgangsmatrise P = [pij ]. (k) Vi vil bruke følgende notasjon: hvis k ∈ {0, 1, 2, . . .} lar vi pij betegne elementet i posisjon (i, j) i matrisen P k . Elementene i matrisen P k kan også tolkes som sannsynligheter: (k) Elementet pij angir sannsynligheten for at systemet går fra tilstand sj til tilstand si i løpet av k tidsskritt. Vi begrunner dette for k = 2. Rad-kolonne-regelen for matriseproduktet P 2 = P P gir at (2) pij = n X pil plj l=1 Nå er pil plj sannsynligheten for å gå fra sj til sl og videre derfra til si i h.h.v. første og andre tidsskritt. Ved å summere over alle mulige mellomtilstander sl får vi sannsynligheten for å gå fra sj til si i løpet av 2 tidsskritt. Oppgave 1 Betrakt systemet med overgangsmatrise P angitt i (1). Bruk Matlab til å beregne P k for k ∈ {2, 3, 4, 40, 80}. Angi deretter sannsynlighetene for at systemet går fra tilstand s4 til tilstand s2 i løpet av henholdsvis 2, 3, 4, 40 og 80 tidsskritt. I avsnitt 4.9 i boka er mye av fokus rettet mot Markov kjeder der overgangsmatrisen er såkalt regulær. Dette skyldes at det slike stokastiske matriser har en entydig bestemt likevektsvektor, som vektorene i enhver Markov kjede vil konvergere mot (se Teorem 18 i avsnitt 4.9). Regularitetet er et sterkt krav, som mange stokastiske matriser ikke oppfyller, noe vi skal se eksempler på i denne obligen. Oppgave 2 La igjen P være den stokastiske matrisen angitt i (1). Bestem en basis for Nul(P − I5 ). Begrunn deretter at P ikke er regulær. (Hint: Har P en entydig likevektsvektor?). Kunne du ha konkludert med at P ikke er regulær på grunnlag av beregningene du utførte i Oppgave 1? Vi går tilbake til et system med tilstandsrom S = {s1 , . . . , sn } og overgangsmatrise P = [pij ]. (k) Betrakt tilstander sj og si . Dersom pij > 0 for en k ≥ 0 sier vi at tilstand sj leder til tilstand si og skriver da sj si . 4 (0) (k) Merk at vi alltid har sj sj (siden pjj = 1). At vi har pij > 0 for en k ≥ 1 svarer til at det er en positiv sannsynlighet for å gå fra sj til si i løpet av k tidsskritt: det finnes da (minst) en “vei” sj → sj1 → sj2 → · · · → sjk → si der sannsynlighetene pj1 j , pj2 j1 , . . . , pijk alle er positive. Hvis vi har at sj si og si sj , sier vi at si og sj kommuniserer (med hverandre), og skriver sj ←→ si . Eksempel 2. La n = 3 og betrakt systemet: 1 & s1 t 0.7 0.3 s2 j * s3 1 Her ser vi f.eks. at s2 ←→ s3 , s2 s1 og s3 s1 , mens s1 ikke kommuniserer med s2 og heller ikke med s3 : det fins jo ingen vei som leder fra s1 til en annen tilstand (enn s1 selv). Hvis sk er en tilstand, kalles mengden som består av alle tilstandene i S som kommuniserer med sk for en (kommunikasjons)klasse. Det kan begrunnes at tilstandsrommet S kan alltid oppdeles i et endelig antall parvis disjunkte klasser. I Eksempel 2 er det f.eks. klart at det fins bare to forskjellige klasser, nemlig K1 = {s1 } og K2 = {s2 , s3 }. En klasse K kalles lukket dersom sj ∈ K og sj si medfører at si ∈ K. Dette betyr at så snart prosessen (tenk på en partikkel som vandrer, som nederst på side 3) kommer inn i klassen K, så vil den aldri komme ut av denne igjen. I Eksempel 2 er K1 lukket, mens K2 ikke er lukket (siden vi f.eks. har at s2 ∈ K2 og s2 s1 , samtidig som s1 6∈ K2 ). Dersom en tilstand si er slik at {si } er en lukket klasse kalles si for en absorberende tilstand (fordi prosessen kommer aldri ut av denne tilstanden hvis den kommer dit en gang). I Eksempel 2 er s1 absorberende. Oppgave 3 a) Bestem klassene for systemet beskrevet i Eksempel 1. Angi hvilke klasser som er lukket, og hvilke tilstander som er absorberende. b) Betrakt et system der overgangsmatrisen P er regulær. Begrunn at det fins da bare én klasse, med andre ord at alle tilstandene kommuniserer med hverandre. 5 Gitt en starttilstand sj og en lukket klasse K, kan vi stille oss følgende grunnleggende spørsmål: hva er sannsynligheten for at prosessen før eller siden havner i K? Vi setter derfor: xK j = sannsynligheten for at prosessen før eller siden kommer til en tilstand i K, gitt starttilstand sj (2) for j = 1, 2, . . . , n. Neste oppgave handler om hvordan vi kan bestemme alle disse absorpsjonssannsynlighetene xK j . Det kan nemlig vises at absorpsjonssannsynlighetene oppfyller følgende lineære likningssystem: xK for hver sj ∈ K j = 1 Pn K K 6 K xj = i=1 pij xi for hver sj ∈ (3) der 1 ≤ j ≤ n. (De som ønsker det kan forsøke å begrunne dette ut fra elementær sannsynlighetsregning.) Oppgave 4 K Betrakt igjen systemet beskrevet i Eksempel 1. Beregn xK 2 og x3 for hver av de lukkede klassene du fant i Oppgave 3 a). Vi skal til slutt se på en noe mer generell situasjon enn den fra Eksempel 1. Igjen er tilstandsrommet S = {s1 , s2 , . . . , s5 }, men vi antar nå at systemets overgangsmatrise P er gitt ved 1 p2 0 0 0 0 0 p3 0 0 0 q 0 p 0 (4) P = 2 4 0 0 q3 0 0 0 0 0 q4 1 der 0 < pi < 1 og qi = 1 − pi for i = 2, 3, 4. Oppgave 5 a) Begrunn at s1 er en absorberende tilstand. Finnes det andre absorberende tilstander? b) La xj være sannsynligheten for at prosessen før eller siden kommer til tilstand s1 (med andre ord, at den absorberes i tilstanden s1 ) når den starter i tilstand sj (j = 1, 2, . . . , 5). Videre, la A være 3 × 3 matrisen gitt ved 6 1 −q2 0 A = −p3 1 −q3 0 −p4 1 Forklar ut fra (3) at vektoren y = (x2 , x3 , x4 ) (som består av de “ikke-trivielle” absorpsjonssannsynlighetene) er løsning av systemet A y = b for en viss vektor b ∈ R3 som du skal bestemme. (Hint: Bestem først de “trivielle” absorpsjonssannsynlighetene x1 og x5 ). c) Begrunn at A kan omformes ved hjelp av to elementære radoperasjoner til en øvre triangulær matrise. Forklar deretter hvorfor A er invertibel. Hva kan du si om løsningen til systemet A y = b ? d) Lag en Matlab funksjon Walk som for en inputvektor (p2 , p3 , p4 ) gjør følgende • sjekker at 0 < pj < 1 og beregner qj = 1 − pj for j = 2, 3, 4, • setter opp matrisen A og vektoren b, • løser systemet A y = b og returnerer vektoren y = (x2 , x3 , x4 ). Kjør programmet med (p2 , p3 , p4 ) = (0.2, 0.5, 0.3) som inputvektor og rapporter løsningen (x2 , x3 , x4 ). Legg ved utskrift av koden. Sluttkommentarer: a) Et system med en overgangsmatrise angitt ved (4) kan f.eks. oppstå ved at to personer E og G konkurrerer mot hverandre. Tilstandene s2 , s3 og s4 beskriver da at de spiller et bestemt spill for j = 2, 3, 4 (spillene kan være forskjellige), mens tallet pj angir sannsynligheten for at E vinner spillet sj . Videre tolkes tilstanden s1 som at E har vunnet hele konkurransen, mens s5 tolkes som at G har vunnet den. Et naturlig valg av starttilstand vil være at de begynner med spill s3 ; tallet x3 vil da angi sannsynligheten for at E vinner konkurransen. b) Denne oppgaven kan utvides til en enda mer generell situasjon der tilstandsrommet består av n tilstander og inputvektoren består av sannsynligheter (p2 , p3 , . . . , pn−1 ). Det overlates til spesielt interesserte å tenke over hvordan Oppgave 5 kan da reformuleres (og løses!). Lykke til! 7