C1 Kapitel 9 - Sannolikhetslära och inferensteori II
Transcription
C1 Kapitel 9 - Sannolikhetslära och inferensteori II
Sannolikhetslära och inferens II Kapitel 9 Egenskaper hos punktskattare Måns Thulin, Sannolikhetslära och inferens II 1 Egenskaper hos punktskattare En skattare är en funktion av stickprovet och således en slumpvariabel. En bedömning av kvaliteten hos en skattare (i avsikt att skatta någon parameter θ) kan därmed göras via dess samplingfördelning. Vanliga kriterier är 1. Väntevärdesriktighet (unbiasedness) 2. Konsistens (consistency) 3. Effektivitet (efficiency) Måns Thulin, Sannolikhetslära och inferens II 2 Konsistens ˆ vara en punktskattare av parametern θ. Om Definition. Låt θ det för varje ε > 0 gäller att eller ekvivalent ˆ vara en konsistent punktskattare av θ. sägs θ ˆ konvergerar i sannolikhet till θ. Ett ekvivalent påstående är att θ Vi använder då följande notation. Måns Thulin, Sannolikhetslära och inferens II 3 Uppgift 9.26 Låt Y₁,Y₂,…,Yn vara olfsv U(0,θ). ˆ (n)=max(Y₁,Y₂,…,Yn) är en konsistent skattare av θ. Visa att θ=Y Vi måste nu för varje ε>0 visa att I uppgift 6.74 visades att fördelningsfunktionen för Y(n) ges av Måns Thulin, Sannolikhetslära och inferens II 4 Uppgift 9.26 Om ε>θ kan Y(n) inte avvika med mer än ε från θ vilket innebär att saken är klar. Svårare blir det då 0<ε≤θ. varför det följer att Måns Thulin, Sannolikhetslära och inferens II 5 Viktiga resultat rörande konsistens ˆ vara en väntevärdesriktig skattare av θ. Då gäller att θˆ är Sats 9.1. Låt θ konsistent om ˆ vara en konsistent skattare av θ och θ´ ˆ en konsistent Sats 9.2. Låt θ skattare av θ´. Då gäller följande Om g är en reellvärd funktion som är kontinuerlig i θ följer dessutom att Måns Thulin, Sannolikhetslära och inferens II 6 Slutskys sats Definition. Låt Fn(x) vara fördelningsfunktion för en slumpvariabel X vid stickprovsstorlek n och F(x) fördelningsfunktion för en slumpvariabel Y. Om det för varje x gäller att limn→∞Fn(x) = F(x) sägs X konvergera i fördelning till Y. d p Sats 9.3 (Slutsky). Låt Un → Z där Z är N(0,1) och Wn → 1. Då gäller att Måns Thulin, Sannolikhetslära och inferens II 7 Uppgift 9.36 Låt Y vara Bi(n,p) med p okänd. För att skatta p använder vi p=Y/n. ˆ I uppgift 9.20 såg vi att pˆ är en väntevärdesriktig och konsistent skattare av p med variansen V(p)=pq/n där q=1-p. ˆ Enligt Centrala gränsvärdessatsen gäller dessutom att pˆ approximativt är normalfördelad då n är stort vilket betyder att vi kan konstruera ett konfidensintervall för p via pivotkvantiteten Problemet är förstås att p är okänd. Hur löser vi detta problem? Måns Thulin, Sannolikhetslära och inferens II 8 Uppgift 9.36 d Enligt CGS gäller att Zn → Z där Z är N(0,1). p Eftersom pˆ är en konsistent skattare av p gäller att pˆ → p. Låter vi q=1-Y/n följer av samma anledning att qˆ → q. ˆ p p Av Sats 9.2b följer nu att pq ˆ ˆ → pq vilket innebär att vilket enligt Sats 9.2d leder till slutsatsen att Slutligen följer av Sats 9.3 (Slutsky) att 9 Relativ effektivitet ˆ och θ₂ ˆ vara två väntevärdesriktiga skattare av θ. Låt θ₁ ˆ relativt θ₂ ˆ ges av kvoten Effektiviteten hos θ₁ Måns Thulin, Sannolikhetslära och inferens II 10 Absolut effektivitet Det visar sig att det finns en undre gräns för hur liten varians en väntevärdesriktig skattare kan ha. Låt Y₁,Y₂,…,Yn vara olfsv med gemensam täthetsfunktion f(y) som innehåller en okänd parameter θ. Låt ˆθ vara en väntevärdesriktig skattare av θ. Då gäller att I(θ) kallas för Cramér-Rao-gränsen. En skattare ˆθ för vilken det ˆ gäller att V(θ)=I(θ) sägs vara effektiv. Måns Thulin, Sannolikhetslära och inferens II 11 Uttömmande statistikor (Sufficiency) Hittills har skattare tagits fram baserat på intuition. Vi behöver en mer vetenskaplig metod för att finna bra skattare. En statistika sammanfattar den information som finns i ett stickprov vilket betyder att viss information går förlorad. En statistika som (i viss mening) innehåller all information från stickprovet gällande θ sägs vara en uttömmande statistika för θ. Låt X₁,X₂,…,Xn ha simultan täthetsfunktion f(x₁,x₂,…,xn ). θˆ sägs vara uttömmande för θ om den betingade fördelningen. inte beror på θ. Måns Thulin, Sannolikhetslära och inferens II 12 Likelihoodfunktionen och Faktoriseringssatsen Låt X₁,X₂,…,Xn ha simultan täthetsfunktion f(x₁,x₂,…,xn ) som beror på någon parameter θ. Eftersom täthetens värde beror på θ kan vi konstruera den sk Likelihoodfunktionen. om olfsv. Sats 9.4 (Faktoriseringssatsen). En statistika U är en uttömmande statistika för θ om och endast om där g(u,θ) är en funktion enbart av u och θ, samt att h(x₁,x₂,…,xn ) är en funktion som inte beror på θ. Måns Thulin, Sannolikhetslära och inferens II 13 Uppgift 9.38 a Låt Y₁,Y₂,…,Yn vara olfsv N(μ,σ) med μ okänd (men σ känd). Måns Thulin, Sannolikhetslära och inferens II 14 Uppgift 9.38 a Det gäller alltså att där och Följaktligen gäller att Y är en uttömmande statistika för μ. Måns Thulin, Sannolikhetslära och inferens II 15 Uppgift 9.49 Låt Y₁,Y₂,…,Yn vara olfsv U(0,θ). Vi vill undersöka om är en uttömmande statistika för θ. Dock gäller att vilket innebär att vi inte direkt kan avgöra detta. För att lösa problemet införs en sk indikatorfunktion. Måns Thulin, Sannolikhetslära och inferens II 16 Uppgift 9.49 Detta innebär att täthetsfunktionen för U(0,θ) kan skrivas som varför likelihoodfunktionen blir Alltså följer av faktoriseringssatsen att Y(n) är en uttömmande statistika för θ. Måns Thulin, Sannolikhetslära och inferens II 17 MVUE och Rao-Blackwell Definition. Den väntevärdesriktiga skattare som har lägst varians sägs vara MVUE (Minimum Variance Unbiased Estimator). ˆ vara en väntevärdesriktig skattare Sats (Rao-Blackwell). Låt θ ˆ av θ sådan att V(θ)<∞. Låt vidare U vara en uttömmande statistika för θ. Konstruera nu en ny skattare ˆ är en väntevärdesriktig skattare av θ som är Då gäller att θ* minst lika bra som ˆθ, dvs Måns Thulin, Sannolikhetslära och inferens II 18 MVUE och minsta uttömmande statistika För att kunna finna MVUE måste vi först finna den minsta uttömmande statistikan, dvs den som bäst sammanfattar stickprovsinformationen angående θ. Sats. Låt U vara en minsta uttömmande statistika för θ och h(U) en funktion av U sådan att Då gäller att h(U) är MVUE av θ. För de allra flesta sannolikhetsfördelningar gäller att den uttömmande statistika som följer via faktoriseringssatsen (Sats 9.4) är en minsta uttömmande statistika. Måns Thulin, Sannolikhetslära och inferens II 19 Metod för att finna MVUE för θ 1. Använd faktoriseringssatsen (Sats 9.4) för att finna en uttömmande statistika U för θ. 2. Bestäm E(U). För att finna E(U) måste man eventuellt först finna sannolikhetsfördelningen för U, dvs fU(u) eller pU(u). 3. Modifiera (eventuellt) U via någon funktion h(U) så att E[h(U)]=θ. Måns Thulin, Sannolikhetslära och inferens II 20 Uppgift 9.61 (forts. av 9.49) 1. I uppgift 9.49 visades via faktoriseringssatsen att Y(n) är en (minsta) uttömmande statistika för θ. 2. I Exempel 9.1 visades att 3. Således följer att är MVUE av θ. Måns Thulin, Sannolikhetslära och inferens II 21 Metod för att finna MVUE för g(θ) Metoden kan även användas för att finna en MVUE för någon funktion g(θ). 4. Eftersom h(U) är en MVUE för θ studeras g(h(U)). 5. g(h(U)) behöver inte vara en väntevärdesriktig skattare av g(θ) men efter vidare modifiering fås W=h*(g(h(U))) där Eftersom W är en funktion av den minsta uttömmande statistikan U följer att W är en MVUE av g(θ). Måns Thulin, Sannolikhetslära och inferens II 22 Uppgift 9.64 a Låt Y₁,Y₂,…,Yn vara olfsv N(μ,1). Bestäm MVUE av μ2. 4. Enligt uppgift 9.8a är Y MVUE av μ varför vi studerar (Y)2 5. Nu gäller dock att varför vi modifierar och får som är MVUE av μ2. Måns Thulin, Sannolikhetslära och inferens II 23 Momentmetoden Typiskt för de flesta sannolikhetsfördelningar är att momenten beror på fördelningens parametrar. Tanken med momentmetoden är att skatta populationsmomentet av ordning k med motsvarande stickprovsmoment. skattas med Momentmetoden ger konsistenta skattare som dock inte alltid är väntevärdesriktiga och inte heller de mest effektiva skattarna. Den stora fördelen med momentmetoden är dess enkelhet. Måns Thulin, Sannolikhetslära och inferens II 24 Uppgift 9.69 Låt Y₁,Y₂,…,Yn vara olfsv med gemensam täthetsfunktion För att med momentmetoden kunna skatta θ beräknas E(Y). Måns Thulin, Sannolikhetslära och inferens II 25 Uppgift 9.69 Enligt momentmetoden ska vi använda Y som skattare av E(Y) ˆ ska lösa ekvationen varför vi för att finna θ Eftersom Y är en konsistent skattare av E(Y) följer av Sats 9.2 Faktoriseringssatsen ger att den minsta uttömmande skattaren ˆ inte är en funktion av denna är den är U=-ΣlnYi och eftersom θ inte MVUE. Måns Thulin, Sannolikhetslära och inferens II 26 Maximum-Likelihood-metoden Likelihoodfunktionen anger sannolikheten/tätheten (eller likelihood) för just detta stickprov som en funktion av θ. En rimlig tanke är att som skattning av θ använda det värde på θ som maximerar sannolikheten/tätheten för detta stickprov. En skattare som använder denna princip sägs vara en Maximum-Likelihood-skattare (ML-skattare). Måns Thulin, Sannolikhetslära och inferens II 27 Maximum-Likelihood-metoden Låt X₁,X₂,…,Xn vara olfsv med en sannolikhetsfördelning som beror på någon parameter θ. Bestäm ML-skattaren för θ. 1. Bestäm den gemensamma sannolikhets-/täthetsfunktionen f(x|θ) och bestäm likelihoodfunktionen 2. För att finna det värde på θ som maximerar L(θ) kan vi (vanligtvis) derivera L(θ) och söka nollställe. Oftast är det dock enklare att istället studera lnL(θ) varpå ML-skattaren blir det värde på θ som löser ekvationen Måns Thulin, Sannolikhetslära och inferens II 28 Uppgift 9.82 a Låt Y₁,Y₂,…,Yn vara olfsv med gemensam täthetsfunktion Eftersom följer att är en (minsta) uttömmande statistika för θ. Måns Thulin, Sannolikhetslära och inferens II 29 Uppgift 9.82 b Utifrån den i a-uppgiften bestämda likelihoodfunktionen följer att Derivering med avseende på θ ger att dvs Således gäller att ML-skattaren av θ är Måns Thulin, Sannolikhetslära och inferens II 30 Uppgift 9.82 c Utifrån den i a-uppgiften bestämda likelihoodfunktionen följer att Låt x=yr Liknar tätheten för Ga(2,θ). ˆ är en väntevärdesriktig skattare av θ. Således gäller att θ Eftersom ML-skattaren dessutom är en funktion av den minsta uttömmande skattaren U följer att den är en MVUE för θ. Måns Thulin, Sannolikhetslära och inferens II 31 Maximum-Likelihood-metoden Låt U vara uttömmande för θ. Faktoriseringssatsen (9.4) ger att där g(u,θ) är en funktion enbart av u och θ, samt att h(x₁,x₂,…,xn ) är en funktion som inte beror på θ. Maximum för beror således på stickprovet enbart utifrån U. Alltså följer att en ML-skattare alltid är en funktion av U. Om en ML-skattare kan göras väntevärdesriktig är den följaktligen ofta MVUE för den aktuella parametern. Måns Thulin, Sannolikhetslära och inferens II 32 Uppgift 9.83 a Låt Y₁,Y₂,…,Yn vara olfsv U(0,2θ+1). Bestäm ML-skattaren av θ. Eftersom kan problemet inte lösas på ”det vanliga sättet”. Problemet med att parametern i definitionsområdet löser vi (som tidigare) med hjälp av en indikatorfunktion. Det följer att Måns Thulin, Sannolikhetslära och inferens II 33 Uppgift 9.83 a Alltså fås att 1. För att maximera L(θ) minimerar vi uttrycket (2θ+1)n vilket innebär att θ ska väljas så litet som möjligt. 2. Indikatorfunktionen ger begränsningen att 2θ+1≥Y(n) ML-skattningen av θ blir således Måns Thulin, Sannolikhetslära och inferens II 34 Trevliga egenskaper hos ML-skattare ˆ vara ML-skattare för θ och låt t(θ) Invariansegenskapen. Låt θ vara en funktion av θ. Då gäller att är ML-skattare av t(θ). Asymptotisk effektivitet (Avsnitt 9.8, frivilligt). Under vissa (vanligtvis uppfyllda) omständigheter gäller att ML-skattare asymptotiskt uppfyller Cramér-Rao-gränsen. Måns Thulin, Sannolikhetslära och inferens II 35 Uppgift 9.83 b Variansen för U(0,2θ+1) är Det följer då att Invariansegenskapen är ML-skattare av V(Y). Måns Thulin, Sannolikhetslära och inferens II 36