TP20 : Estimation par intervalle de confiance
Transcription
TP20 : Estimation par intervalle de confiance
ECE2-B 2014-2015 TP20 : Estimation par intervalle de confiance I Dans votre dossier Info_2a, créez le dossier TP_20. I. Le problème d’estimation Illustration sur un exemple On s’intéresse de nouveau à l’exemple du cours : une urne contient des boules vertes et des boules rouges dont on ignore le nombre et la proportion. On considère le phénomène aléatoire consistant à effectuer un tirage dans cette urne. Modélisation mathématique associée On note X la v.a.r. égale à 1 si la boule obtenue est verte et à 0 sinon. Autrement dit, X ,! B (p) où p est un paramètre à déterminer. Afin de pouvoir estimer ce paramètre p, on a la possibilité d’observer n fois le phénomène. Dans notre exemple, ceci correspond à effectuer n tirages (avec remise) successifs dans l’urne. On obtient ainsi un n-uplet de données (x1 , . . . , xn ) appelé échantillon observé. Si on note Xi la v.a.r. donnant le résultat du ième tirage, on obtient une suite (Xi ) de v.a.r. i.i.d telle que Xi ,! B (p). Le n-uplet observé (x1 , . . . , xn ) est une réalisation du n-uplet de v.a.r. (X1 , . . . , Xn ). II. Intervalle de confiance asymptotique obtenu par application du théorème central limite II.1. Quelques rappels théoriques • Si (Un )n2N⇤ et (Vn )n2N⇤ sont deux suites d’estimateurs de ✓, on dit que [Un , Vn ] est un intervalle de confiance asymptotique de ✓ au niveau de confiance 1 ↵ (où le risque ↵ 2]0, 1[) si : 8✓ 2 ⇥, • lim P(Un 6 ✓ 6 Vn ) > 1 n!+1 ↵ L’obtention d’un intervalle de confiance asymptotique se fait généralement via le TCL. Théorème Central Limite Soit (Xn )n2N⇤ une suite de v.a.r. indépendantes et de même loi. Supposons que les v.a.r. admettent une variance ✓ ◆ p Xn m ⇤ Notons Xn = n 2 6= 0 et notons alors m leur espérance. ⇤ Alors la suite de v.a.r. (Xn ) converge en loi vers une v.a.r. Y suivant la loi normale centrée réduite. On a notamment, pour tout (a, b) tel que 1 6 a 6 b 6 +1 : lim P n!+1 ⇣h ⇤ a 6 Xn 6 b i⌘ = P ([a 6 Y 6 b]) ✓ 2◆ Z b 1 t p exp = dt = 2 2⇡ a (b) (a) 1 ECE2-B 2014-2015 II.2. Application à notre exemple I Dans l’exemple, on considère une suite de v.a.r. (Xn ) telle que Xi ,! B (p). Rappeler l’espérance et la variance de ces v.a.r. I Appliquer le TCL à la suite (Xn ). On exprimera le résultat à l’aide de et on prendra a = b (on notera x0 cet élément). I Soit ↵ 2]0, 1[. Comment choisir x0 de sorte que la limite obtenue à la question précédente soit plus grande que 1 ↵? I Isoler le terme p dans l’expression précédente. I En déduire un intervalle de confiance asymptotique de p au niveau de confiance 1 ↵. 2 ECE2-B 2014-2015 II.3. Mise en œuvre en Scilab On rappelle le programme du TP précédent permettant d’obtenir une estimation de p. p = grand(1,1,"def") N = grand(1,1,"uin",200,500) n = floor(N/10) observ = grand(1,n,"bin",1,p) estimation = sum(observ)/n I Recopier ce programme dans un nouvel onglet SciNotes. I Ajouter à ce programme les variables u et r v contenant les observations associées aux v.a.r. r p) p(1 p) et Vn = Xn + x0 . n n (on définit la variable x0 dans la question suivante) U n = Xn x0 p(1 I Ajouter au début de programme une variable alpha contenant le résultat d’un dialogue utili- sateur permettant à l’utilisateur de choisir le risque souhaité pour l’estimation par intervalle de confiance. Comme vu précédemment, la valeur de x0 est déterminée en fonction de la valeur de alpha et de la fonction de répartition . En Scilab, on peut réaliser de nombreux calculs sur grâce à la commande cdfnor (cumulative distribution function normal distribution). I Que réalise l’appel P = cdfnor("PQ",x0,0,1) ? I Que réalise l’appel x0 = cdfnor("X",0,1,1-alpha/2,alpha/2) ? I Que réalise l’appel m = cdfnor("Mean",1,1-alpha/2,alpha/2,x0) ? I Que réalise l’appel sig = cdfnor("Std",1-alpha/2,alpha/2,x0,0) ? I Ajouter l’appel permettant le calcul de x0 dans votre programme. I Ajouter en fin de programme une variable c contenant 1 si la valeur de p est située entre u et v et qui contient 0 sinon. 3 ECE2-B 2014-2015 L’idée est alors d’effectuer un grand nombre de tests de ce programme (par exemple 100 ou 1000) et de compter le nombre de fois où l’intervalle [u,v] contient bien le paramètre p à estimer. On reliera alors le résultat obtenu au niveau de confiance alpha. I Ajouter un dialogue utilisateur au début du programme demandant le nombre de tests à effectuer et stockant le résultat dans une variable nmax. I Ajouter une structure itérative au programme permettant de l’itérer nmax fois. Le contenu de c devra être incrémenté à chaque tour de boucle. I Tester alors ce programme en prenant 100 pour nmax et 0.05 pour alpha. Commenter le résultat obtenu. Jusqu’à présent, nous avons considérée des valeurs u et v observées des v.a.r. Un = Xn r r p(1 p) p(1 p) x0 et Vn = Xn + x0 . Ces v.a.r. ne sont pas des choix d’estimateurs pertin n nents du paramètre p : elles dépendent de p ! I Comment peut-on majorer p(1 p) ? I Faire alors un choix pertinent d’estimateurs Un et Vn . I Modifier votre programme pour que u et v prennent en compte ce choix. I Tester de nouveau votre programme. Commenter le résultat obtenu. 4