Gauss approximationsformler

Transcription

Gauss approximationsformler
G AUSS ’ S APPROXIMATIONSFORMLER
M ATEMATISK STATISTIK AK, FMS 012
J OAKIM L ÜBECK , M ARS 2007
M AGNUS W IKTORSSON , N OV 2012
1
Gauß’s approximationsformler
Väntevärde och varians eller standardavvikelse är de viktigaste läges- och spridningsmåtten. Eftersom variansen är ett mått på osäkerheten är det intressant att kunna göra sig en uppfattning om dess storlek då man har en funktion av en eller flera variabler och man
känner de ingående variablernas varians.
1.1
En variabel
För en kontinuerlig stokastisk variabel X gäller för en funktion, g(X ), av denna att
! ∞
g(x)fX (x) dx
E(g(X )) =
−∞
men denna integral är inte alltid lösbar; fX (x) kanske inte ens är känd. Men känner man väntevärde och varians för X kan man få
approximativa värden på E(g(X )) och V (g(X )) genom att approximera g(X ) med en linjär funktion.
Första ordningens Taylorutveckling av g(X ) kring punkten μ = E(X ) kan skrivas
g(x) ≈ g(µ) + g’(µ)(x−µ) →
g(µ)
y
y
E(Y)
0
0
µ = E(X) =
x
0
0
µ
x
Figur 1.1: I vänstra figuren ses hur täthetsfunktionen för X (–) transformeras till täthetsfunktionen för Y (–) på y-axeln genom Y = g(X ) (–
). I högra figuren transformeras Y istället genom den räta linje som tangerar g i punkten (μ, g(μ)). Y ’s approximativa väntevärde
E(Y ) ≈ g(μ) är markerat.
g(X ) ≈ g(μ) + (X − μ)g ′ (μ),
dvs den räta linje som tangerar g(X ) i punkten μ. För väntevärde och varians för en linjär funktion har vi färdiga räkneregler (E(aX +
b) = aE(X ) + b och V (aX + b) = a2 V (X )) så vi får här (μ, g(μ) och g ′ (μ) är tal)
E(g(X )) ≈ E[g(μ) + (X − μ)g ′ (μ)] = g(μ) + g ′ (μ)E(X ) − g ′ (μ)μ = [E(X ) = μ] = g(μ)
V (g(X )) ≈ V [g(μ) + (X − μ)g ′ (μ)] = V (g ′ (μ)X ) = [g ′ (μ)]2 V (X ).
dvs
E(g(X )) ≈ g(E(X ))
V (g(X )) ≈ [g ′ (E(X ))]2 V (X ).
Om approximationen skall stämma bra bör naturligtvis funktionen g vara hyfsat linjär i en omgivning kring μ, säg μ plus minus ett par
standardavvikelser för X . Dessutom bör g inte ha något extremvärde i denna omgivning, om g ′ (μ) är noll blir ju approximationen av
V (g(X )) noll och är vi i närheten av denna punkt blir nog approximationen för liten. I figur 1.1 visas hur X ’s fördelning transformeras
av g och första ordningens Taylorutveckling av den samma. I just det fallet är funktionen g inte speciellt linjär i det område där X har
sin fördelning. Se avsnitt 2 för hur vi kan uppskatta felet i Gauss-approximationen.
1
G AUSS ’ S APPROXIMATIONSFORMLER
2
Exempel 1.1. Låt E(X ) = μ och V (X ) = σ2 .
(a) Bestäm approximativt väntevärde och varians för Y = g(X ) = πX 2 .
E(Y ) ≈ g(E(X )) = πμ2
V (Y ) ≈ [g ′ (E(X ))]2 V (X ) = [g ′ (X ) = 2πX ] = (2πμ)2 σ2
(b) Bestäm väntevärdet för Y utan approximation.
Eftersom V (X ) = E(X 2 ) − E(X )2 fås E(X 2 ) = V (X ) + E(X )2 och det sökta väntevärdet blir
E(Y ) = E(πX 2 ) = πE(X 2 ) = π(V (X ) + E(X )2 ) = πσ2 + πμ2
Vi ser att approximationen av väntevärdet alltid är för liten men att felet blir litet om σ är liten i förhållande till μ.
!
1.2
Flera variabler
För en reelvärd funktion av två variabler, g(X , Y ), som tar värden i R blir första ordningens Taylorutveckling kring punkten (μX , μY ) =
(E(X ), E(Y )) det plan som tangerar g i denna punkt
g(X , Y ) ≈ g(μX , μY ) + (X − μX )gX′ (μX , μY ) + (Y − μY )gY′ (μX , μY )
∂g
där gX′ = ∂X
och motsvarande för Y . För en linjär funktion av två variabler har vi att E(aX + bY + c) = aE(X ) + bE(Y ) + c och
V (aX + bY + c) = a2 V (X ) + b2 V (Y ) + 2abC(X , Y ), så i det här fallet fås
E(g(X , Y )) ≈ E[g(μX , μY ) + (X − μX )gX′ (μX , μY ) + (Y − μY )gY′ (μX , μY )] =
= g(μX , μY ) + (E(X ) − μX )gX′ (μX , μY ) + (E(Y ) − μY )gY′ (μX , μY ) = g(μX , μY )
V (g(X , Y )) ≈ V [g(μX , μY ) + (X − μX )gX′ (μX , μY ) + (Y − μY )gY′ (μX , μY )] =
= [gX′ (μX , μY )]2 V (X ) + [gY′ (μX , μY )]2 V (Y ) + 2gX′ (μX , μY )gY′ (μX , μY )C(X , Y ).
Detta kan generaliseras till en reelvärd funktion av n st. variabler X1 , . . . , Xn
E(g(X1 , . . . , Xn )) ≈ g(E(X1 ), . . . , E(Xn )).
n
"
"
ci2 V (Xi ) + 2
ci cj C(Xi , Xj ),
V (g(X1 , . . . , Xn )) ≈
i=1
där ci =
i<j
∂g
(E(X1 ), . . . , E(Xn ))
∂Xi
Exempel 1.2. Bestäm approximativa värden på variansen för X · Y och X /Y om X och Y är oberoende av varandra.
Uttryck svaren i μX , μY ,V (X ) och V (Y ).
1. g(X , Y ) = X · Y . gX′ (X , Y ) = Y och gY′ (X , Y ) = X .
V (X · Y ) ≈ [gX′ (μX , μY )]2 V (X ) + [gY′ (μX , μY )]2 V (Y ) =
= μ2Y V (X ) + μ2X V (Y )
2. g(X , Y ) =
X
Y
. gX′ (X , Y ) =
1
Y
och gY′ (X , Y ) = − YX2 .
X
1
μ2
V ( ) ≈ 2 V (X ) + 4X V (Y )
Y
μY
μY
!
1.3 Andra ordningens approximation∗
Vill man basera sin approximation på en andra ordningens Taylorutveckling av g, som för en variabel blir
1
g(X ) ≈ g(μ) + (X − μ)g ′ (μ) + (X − μ)2 g ′′ (μ),
2
3
2
F ELUPPSKATTNING FÖR G AUSS - APPROXIMATION
begränsar vi oss här till väntevärdet eftersom variansapproximationen blir ganska bökig och kommer att innehålla termer av E(X 3 )
och E(X 4 ) vilket man sällan har information om vid tillämpning av Gauß-approximation.
1
1
E(g(X )) ≈ g(μ) + E(X − μ)g ′ (μ) + E[(X − μ)2 ]g ′′ (μ) = g(μ) + V (X )g ′′ (μ).
2
2
För en funktion av n oberoende variabler kan man visa att
n
E(g(X1 , . . . , Xn )) ≈ g(E(X1 ), . . . , E(Xn )) +
där di =
1" 2
d V (Xi ),
2 i=1 i
∂2g
(E(X1 ), . . . , E(Xn ))
∂Xi2
Är de inte oberoende tillkommer kovarianstermer och korsderivator.
2
Feluppskattning för Gauss-approximation
För att beskriva felet behöver en uppskatting av resttermen i Taylorutvecklingen. Vi har från analyskursen att
g(x) = g(μ) + g ′ (μ)(x − μ) + g ′′ (ξ2 (x))
(x − μ)2
2
där ξ2 (x) är ett tal mellan x och μ, (givet att g” är kontinuerlig).
2.1 Feluppskatting för väntevärdet
Om |g ′′ (x)| < c2 för alla värden x som den stokastiska variabeln X kan anta så kan vi få en feluppskattning på felet i Gaussapproximationen av väntevärdet. Vi har att
# $
%#
#
(X − μ)2 ##
′
′′
#
|Eg(X ) − g(μ)| = #E g (μ)(X − μ) + g (ξ2 (X ))
#
2
# $
%#
2
#
(X − μ) ##
= ##E g ′′ (ξ2 (X ))
#
2
%
$
(X − μ)2
≤ E |g ′′ (ξ2 (X ))|
2
$
%
(X − μ)2
σ2
≤ c2 E
= c2
2
2
Om redan förstaderivatan har begränsat belopp, mindre än c1 säg, för alla värden x som X kan anta får vi istället
g(x) = g(μ) + g ′ (ξ1 (x))(x − μ)
där ξ1 (x) är ett tal mellan x och μ, (givet att g’ är kontinuerlig). Vilket ger
|E[g(X )] − g(μ)| = |E[g ′ (ξ1 (X ))(X − μ)]|
≤ E[|g ′ (ξ1 (X ))||X − μ|]
&
≤ c1 E[|X − μ|] ≤ c1 E[(X − μ)2 ] = c1 σ,
där den sista olikheten kommer från att
V (|X − μ|) = E(X − μ)2 − (E|X − μ|)2 ≥ 0.
Vilket ger att
E|X − μ| ≤
&
E(X − μ)2 = σ.
Så sammanfattningsvis gäller:
• Om |g ′ (x)| ≤ c1 för alla värden x som X kan anta har vi att
|E[g(X )] − g(μ)| ≤ c1 σ
• Om |g ′′ (x)| ≤ c2 för alla värden x som X kan anta har vi att
|E[g(X )] − g(μ)| ≤ c2
σ2
2
2
F ELUPPSKATTNING FÖR G AUSS - APPROXIMATION
4
Vi ser att båda feluppskattningarna går mot noll då σ går mot noll. Detta är typiskt för Gaussapproximation den blir bättre ju mindre
variansen för X är.
Exempel 2.1. Om vi använder feluppskattningen på g(x) = πx 2 från exempel 1.1 ser vi att g ′′ (x) = 2π vilket gör att vi
2
kan välja c2 = 2π. Detta ger feluppskattningen |E[g(X )] − g(μ)| ≤ 2π σ2 = πσ2 vilket i det här fallet är exakt lika med
det verkliga felet. I allmänhet kommer vi dock att överskatta felet.
!
Dock om varken g ′ eller g ′′ är begränsade behöver titta på högre moment för att kunna göra en feluppskattning. I de fall där man inte
kan göra en feluppskattning bör man vara försiktig med att använda Gauss-approximationen.
2.2 Feluppskattningar för flera variabler
Det går även att göra feluppskattningar för fallet med funktioner av flera variabler x = (x1 , x2 , . . . , xn ). Låt
gi′ (x) =
∂
∂2
g(x), gij′′ (x) =
g(x), i = 1, . . . , n, j = 1, . . . , n.
∂xi
∂xi ∂xj
• Om |gi′ (x)| ≤ c1i , i = 1, . . . , n för alla värden x som X = (X1 , X2 , . . . , Xn ) kan anta har vi att
|E[g(X )] − g(μ)| ≤
n
"
i=1
c1i
&
V (Xi )
• Om |gij′′ (x)| ≤ c2ij , i = 1, . . . , n, j = 1, . . . , n för alla värden x som X = (X1 , X2 , . . . , Xn ) kan anta har vi att
|E[g(X )] − g(μ)| ≤
n "
n
"
c2ij
i=1 j=1
2
C(Xi , Xj )
2.3 Feluppskattning för andra ordningens approximation∗
Vi har att
g(x) = g(μ) + g ′ (μ)(x − μ) + g ′′ (ξ2 (x))
(x − μ)2
2
där ξ2 (x) är ett tal mellan x och μ, (givet att g” är kontinuerlig). Om |g ′′ (x) − g ′′ (μ)| ≤ ¯c2 (μ) för alla värden x som X kan anta får vi
att
#
$
%#
#
#
1
Felet = ##E[g(X )] − E g(μ) + (X − μ)g ′ (μ) + (X − μ)2 g ′′ (μ)) ##
2
# $
%#
2 #
#
(X − μ) #
= ##E (g ′′ (ξ2 (X )) − g ′′ (μ))
#
2
# $
%#
#
(X − μ)2 ##
≤ ##E |g ′′ (ξ2 (X )) − g ′′ (μ)|
#
2
'
(
≤ ¯c2 (μ)E (X − μ)2 /2
= ¯c2 (μ)
σ2
.
2
I flervariabelfallet fås, om |gij′′ (x) − gij′′ (μ)| ≤ ¯c2ij (μ), i = 1, . . . , n, j = 1, . . . , n för alla värden x som X kan anta, att
Felet ≤
n "
n
"
¯c2ij (μ)C(Xi , Xj )/2,
i=1 j=1
med samma beteckningar som i avsnitt 2.2.
2.4 Feluppskattning för variansen∗
När det gäller feluppskattning för variansen är det svårare att säga något generellt utan att använda högre ordningens väntevärden dvs
EX 3 och EX 4 . Om dessa ej är kända så måste man anta g har en uppåt och neråt begränsad förstaderivata och att g’ är kontinuerlig.
Om |g ′ (x)2 − g ′ (μ)2 | ≤ d (μ) för alla värden x som X kan anta, så kan man få fram att
|V (g(X )) − E[g ′ (μ)2 (X − μ)2 ]| ≤ d (μ)σ2
Vi ser att även för approximationen av variansen så gäller det att approximationsfelet går mot noll då X :s varians går mot noll. Dock
var vi här tvungna att anta att g hade begränsad första derivata.