EXERCICES - STATISTIQUES Exercice 1 (2012) Le tableau suivant
Transcription
EXERCICES - STATISTIQUES Exercice 1 (2012) Le tableau suivant
EXERCICES - STATISTIQUES OLIVIER COLLIER Exercice 1 (2012) Le tableau suivant donne la production laitière x (en gallon par semaine) de 4 912 vaches. Ces données datent de 1922. Quantité de [7,5 , 12,5[ lait x Nombre de 123 vaches [12,5 , 15,5[ [15,5 , 18,5[ [18,5 , 21,5[ [21,5 , 26,5[ [26,5 , 33,5[ 726 1 636 1 530 821 76 Vous pouvez donner directement les résultats fournis par la calculatrice. Partie A : Statistique descriptive. (1) (2) (3) (4) Définir la population et le caractère étudiés. Préciser la nature du caractère. Représenter cette série statistique par un histogramme. Calculer la moyenne x ¯ et l’écart-type s. (a) Calculer le premier quartile Q1 . Interpréter ce paramètre. (b) Sachant que la médiane est Me = 18, 4 et le troisième quartile Q2 = 20, 9, tracer la boîte à moustache de cette série statistique et interpréter cette représentation. Partie B : Ajustement à la loi normale. Associons la variable aléatoire X au caractère quantitatif étudié x. Le but de cette partie est de montrer que l’on peut ajuster la loi de X par une loi normale N (µ, σ 2 ) dont on déterminera les paramètres µ et σ 2 . (1) Si X suit la loi normale N (µ, σ 2 ), quelle est la loi suivie pas la variable aléatoire T = X−µ σ ? (2) Le tableau suivant associe à chaque valeur observée xk P • les fréquences fk et fréquences cumulées croissantes ki=1 fi de la classe [xk−1 , xk [, P • l’écart réduit tk = xkσ−¯x tel que Π(tk ) = ki=1 fi où Π est la fonction de répartition de la loi N (0, 1). xk fk Pk tk i=1 fk 12,5 0,03 0,03 -1,88 15,5 0,15 0,18 -0,92 18,5 0,33 0,51 0,03 21,5 0,31 0,82 0,92 26,5 0,17 0,99 2,33 33,5 0,01 1 Justifier que, lorsque xk = 18, 5, on a tk = 0, 03 puis que, lorsque xk = 12, 5, on a tk = −1, 88. (3) Dans cette question, on considère les cinq premiers points du nuage. (a) Tracer le nuage de points Mk (xk , tk ) dans un repère orthogonal. 1 2 OLIVIER COLLIER (b) Déterminer le coefficient de corrélation linéaire de la série statistique double (xk , tk ). Un ajustement linéaire du nuage est-il justifié ? Pourquoi ? (c) Déterminer une équation de la droite de régression de t en x de ce nuage. (d) En déduire que l’on peut ajuster le caractère x par une variable aléatoire X qui suit une loi normale dont on déterminera les paramètres µ et σ. Exercice 2 (2009) (1) Lors des élections européennes, une des listes présentée dans le Grand Ouest a obtenu 32% des voix. Lors du dépouillement dans un bureau de vote de Nantes, on compte 925 bulletins. (a) On appelle X la variable aléatoire qui compte le nombre de bulletins en faveur de cette liste. Donner la loi de probabilité suivie par X et ses paramètres. (b) On admet qu’elle peut être approchée par une loi normale. Quels sont les paramètres de cette loi ? (c) Quelle est la probabilité que cette liste ait obtenu entre 30% et 40% des voix dans ce bureau ? (2) La tête de liste envisage de se présenter aux élections législatives de 2012. Pour donner du poids à sa candidature, elle fait effectuer un sondage. Sur 200 personnes, 46 se disent prêtes à voter pour elle. (a) Quelle estimation de son score peut-on lui proposer ? Quel est l’estimateur associé ? (b) Déterminer un intervalle de confiance à 95% de l’estimation précédente ? Exercice 3 (2008) On considère la répartition des ménages français en deux classes C1 et C2 suivant qu’ils habitent dans une commune urbaine ou une commune rurale. On désigne par p1 et p2 les proportions de chaque classe de ménages possédant un certain bien durable. Pour estimer p1 et p2 , on a tiré au hasard et avec remise n1 ménages dans C1 et n2 ménages dans C2 , et pris comme estimateurs les fréquences F1 et F2 de ménages possédant le bien considéré dans chaque échantillon. On suppose que p1 = p2 = p. (1) Les estimateurs F1 , F2 et (F1 + F2 )/2 sont-ils sans biais ? (2) Déterminez les lois des estimateurs F1 , F2 et (F1 + F2 )/2. (3) Quel est le meilleur estimateur des trois ? Discuter les résultats suivant les valeurs de n1 et n2 , en supposant par exemple que n1 > n2 . Parmi les estimateurs de la forme aF1 + bF2 , quel est le meilleur estimateur sans biais ?