TP20 : Estimation par intervalle de confiance

Transcription

TP20 : Estimation par intervalle de confiance
ECE2-B
2014-2015
TP20 : Estimation par intervalle de confiance
I Dans votre dossier Info_2a, créez le dossier TP_20.
I. Le problème d’estimation
Illustration sur un exemple
On s’intéresse de nouveau à l’exemple du cours : une urne contient des boules vertes et des boules
rouges dont on ignore le nombre et la proportion. On considère le phénomène aléatoire consistant
à effectuer un tirage dans cette urne.
Modélisation mathématique associée
On note X la v.a.r. égale à 1 si la boule obtenue est verte et à 0 sinon.
Autrement dit, X ,! B (p) où p est un paramètre à déterminer.
Afin de pouvoir estimer ce paramètre p, on a la possibilité d’observer n fois le phénomène. Dans
notre exemple, ceci correspond à effectuer n tirages (avec remise) successifs dans l’urne. On
obtient ainsi un n-uplet de données (x1 , . . . , xn ) appelé échantillon observé. Si on note Xi la v.a.r.
donnant le résultat du ième tirage, on obtient une suite (Xi ) de v.a.r. i.i.d telle que Xi ,! B (p).
Le n-uplet observé (x1 , . . . , xn ) est une réalisation du n-uplet de v.a.r. (X1 , . . . , Xn ).
II. Intervalle de confiance asymptotique obtenu par application du
théorème central limite
II.1. Quelques rappels théoriques
•
Si (Un )n2N⇤ et (Vn )n2N⇤ sont deux suites d’estimateurs de ✓, on dit que [Un , Vn ] est un intervalle de confiance asymptotique de ✓ au niveau de confiance 1 ↵ (où le risque ↵ 2]0, 1[) si :
8✓ 2 ⇥,
•
lim P(Un 6 ✓ 6 Vn ) > 1
n!+1
↵
L’obtention d’un intervalle de confiance asymptotique se fait généralement via le TCL.
Théorème Central Limite
Soit (Xn )n2N⇤ une suite de v.a.r. indépendantes et de même loi.
Supposons que les v.a.r. admettent une variance
✓
◆
p
Xn m
⇤
Notons Xn = n
2
6= 0 et notons alors m leur espérance.
⇤
Alors la suite de v.a.r. (Xn ) converge en loi vers une v.a.r. Y suivant la loi normale
centrée réduite. On a notamment, pour tout (a, b) tel que 1 6 a 6 b 6 +1 :
lim P
n!+1
⇣h
⇤
a 6 Xn 6 b
i⌘
= P ([a 6 Y 6 b])
✓ 2◆
Z b
1
t
p exp
=
dt =
2
2⇡
a
(b)
(a)
1
ECE2-B
2014-2015
II.2. Application à notre exemple
I Dans l’exemple, on considère une suite de v.a.r. (Xn ) telle que Xi ,! B (p).
Rappeler l’espérance et la variance de ces v.a.r.
I Appliquer le TCL à la suite (Xn ).
On exprimera le résultat à l’aide de
et on prendra a = b (on notera x0 cet élément).
I Soit ↵ 2]0, 1[. Comment choisir x0 de sorte que la limite obtenue à la question précédente
soit plus grande que 1
↵?
I Isoler le terme p dans l’expression précédente.
I En déduire un intervalle de confiance asymptotique de p au niveau de confiance 1
↵.
2
ECE2-B
2014-2015
II.3. Mise en œuvre en Scilab
On rappelle le programme du TP précédent permettant d’obtenir une estimation de p.
p = grand(1,1,"def")
N = grand(1,1,"uin",200,500)
n = floor(N/10)
observ = grand(1,n,"bin",1,p)
estimation = sum(observ)/n
I Recopier ce programme dans un nouvel onglet SciNotes.
I Ajouter à ce programme
les variables u et r
v contenant les observations associées aux v.a.r.
r
p)
p(1 p)
et Vn = Xn + x0
.
n
n
(on définit la variable x0 dans la question suivante)
U n = Xn
x0
p(1
I Ajouter au début de programme une variable alpha contenant le résultat d’un dialogue utili-
sateur permettant à l’utilisateur de choisir le risque souhaité pour l’estimation par intervalle
de confiance.
Comme vu précédemment, la valeur de x0 est déterminée en fonction de la valeur de alpha et
de la fonction de répartition . En Scilab, on peut réaliser de nombreux calculs sur grâce à
la commande cdfnor (cumulative distribution function normal distribution).
I Que réalise l’appel P = cdfnor("PQ",x0,0,1) ?
I Que réalise l’appel x0 = cdfnor("X",0,1,1-alpha/2,alpha/2) ?
I Que réalise l’appel m = cdfnor("Mean",1,1-alpha/2,alpha/2,x0) ?
I Que réalise l’appel sig = cdfnor("Std",1-alpha/2,alpha/2,x0,0) ?
I Ajouter l’appel permettant le calcul de x0 dans votre programme.
I Ajouter en fin de programme une variable c contenant 1 si la valeur de p est située entre u
et v et qui contient 0 sinon.
3
ECE2-B
2014-2015
L’idée est alors d’effectuer un grand nombre de tests de ce programme (par exemple 100 ou 1000)
et de compter le nombre de fois où l’intervalle [u,v] contient bien le paramètre p à estimer. On
reliera alors le résultat obtenu au niveau de confiance alpha.
I Ajouter un dialogue utilisateur au début du programme demandant le nombre de tests à
effectuer et stockant le résultat dans une variable nmax.
I Ajouter une structure itérative au programme permettant de l’itérer nmax fois.
Le contenu de c devra être incrémenté à chaque tour de boucle.
I Tester alors ce programme en prenant 100 pour nmax et 0.05 pour alpha.
Commenter le résultat obtenu.
Jusqu’à
présent, nous avons considérée
des valeurs u et v observées des v.a.r. Un = Xn
r
r
p(1 p)
p(1 p)
x0
et Vn = Xn + x0
. Ces v.a.r. ne sont pas des choix d’estimateurs pertin
n
nents du paramètre p : elles dépendent de p !
I Comment peut-on majorer p(1
p) ?
I Faire alors un choix pertinent d’estimateurs Un et Vn .
I Modifier votre programme pour que u et v prennent en compte ce choix.
I Tester de nouveau votre programme. Commenter le résultat obtenu.
4