EXERCICES - STATISTIQUES Exercice 1 (2012) Le tableau suivant

Transcription

EXERCICES - STATISTIQUES Exercice 1 (2012) Le tableau suivant
EXERCICES - STATISTIQUES
OLIVIER COLLIER
Exercice 1 (2012)
Le tableau suivant donne la production laitière x (en gallon par semaine) de 4 912 vaches.
Ces données datent de 1922.
Quantité de
[7,5 , 12,5[
lait x
Nombre de
123
vaches
[12,5 , 15,5[
[15,5 , 18,5[
[18,5 , 21,5[
[21,5 , 26,5[
[26,5 , 33,5[
726
1 636
1 530
821
76
Vous pouvez donner directement les résultats fournis par la calculatrice.
Partie A : Statistique descriptive.
(1)
(2)
(3)
(4)
Définir la population et le caractère étudiés. Préciser la nature du caractère.
Représenter cette série statistique par un histogramme.
Calculer la moyenne x
¯ et l’écart-type s.
(a) Calculer le premier quartile Q1 . Interpréter ce paramètre.
(b) Sachant que la médiane est Me = 18, 4 et le troisième quartile Q2 = 20, 9, tracer la
boîte à moustache de cette série statistique et interpréter cette représentation.
Partie B : Ajustement à la loi normale.
Associons la variable aléatoire X au caractère quantitatif étudié x. Le but de cette partie est
de montrer que l’on peut ajuster la loi de X par une loi normale N (µ, σ 2 ) dont on déterminera
les paramètres µ et σ 2 .
(1) Si X suit la loi normale N (µ, σ 2 ), quelle est la loi suivie pas la variable aléatoire T = X−µ
σ ?
(2) Le tableau suivant associe à chaque valeur observée xk
P
• les fréquences fk et fréquences cumulées croissantes ki=1 fi de la classe [xk−1 , xk [,
P
• l’écart réduit tk = xkσ−¯x tel que Π(tk ) = ki=1 fi où Π est la fonction de répartition de
la loi N (0, 1).
xk
fk
Pk
tk
i=1 fk
12,5
0,03
0,03
-1,88
15,5
0,15
0,18
-0,92
18,5
0,33
0,51
0,03
21,5
0,31
0,82
0,92
26,5
0,17
0,99
2,33
33,5
0,01
1
Justifier que, lorsque xk = 18, 5, on a tk = 0, 03 puis que, lorsque xk = 12, 5, on a
tk = −1, 88.
(3) Dans cette question, on considère les cinq premiers points du nuage.
(a) Tracer le nuage de points Mk (xk , tk ) dans un repère orthogonal.
1
2
OLIVIER COLLIER
(b) Déterminer le coefficient de corrélation linéaire de la série statistique double (xk , tk ).
Un ajustement linéaire du nuage est-il justifié ? Pourquoi ?
(c) Déterminer une équation de la droite de régression de t en x de ce nuage.
(d) En déduire que l’on peut ajuster le caractère x par une variable aléatoire X qui suit
une loi normale dont on déterminera les paramètres µ et σ.
Exercice 2 (2009)
(1) Lors des élections européennes, une des listes présentée dans le Grand Ouest a obtenu
32% des voix. Lors du dépouillement dans un bureau de vote de Nantes, on compte 925
bulletins.
(a) On appelle X la variable aléatoire qui compte le nombre de bulletins en faveur de
cette liste. Donner la loi de probabilité suivie par X et ses paramètres.
(b) On admet qu’elle peut être approchée par une loi normale. Quels sont les paramètres
de cette loi ?
(c) Quelle est la probabilité que cette liste ait obtenu entre 30% et 40% des voix dans ce
bureau ?
(2) La tête de liste envisage de se présenter aux élections législatives de 2012. Pour donner
du poids à sa candidature, elle fait effectuer un sondage. Sur 200 personnes, 46 se disent
prêtes à voter pour elle.
(a) Quelle estimation de son score peut-on lui proposer ? Quel est l’estimateur associé ?
(b) Déterminer un intervalle de confiance à 95% de l’estimation précédente ?
Exercice 3 (2008)
On considère la répartition des ménages français en deux classes C1 et C2 suivant qu’ils
habitent dans une commune urbaine ou une commune rurale. On désigne par p1 et p2 les
proportions de chaque classe de ménages possédant un certain bien durable.
Pour estimer p1 et p2 , on a tiré au hasard et avec remise n1 ménages dans C1 et n2 ménages
dans C2 , et pris comme estimateurs les fréquences F1 et F2 de ménages possédant le bien
considéré dans chaque échantillon. On suppose que p1 = p2 = p.
(1) Les estimateurs F1 , F2 et (F1 + F2 )/2 sont-ils sans biais ?
(2) Déterminez les lois des estimateurs F1 , F2 et (F1 + F2 )/2.
(3) Quel est le meilleur estimateur des trois ? Discuter les résultats suivant les valeurs de n1 et
n2 , en supposant par exemple que n1 > n2 . Parmi les estimateurs de la forme aF1 + bF2 ,
quel est le meilleur estimateur sans biais ?