Correction

Transcription

Correction
UNIVERSITE de NICE - SOPHIA ANTIPOLIS
Institut Sup´
erieur d’Economie et de Management
´ UNIVERSITAIRE : 2014-2015
ANNEE
REF.
´
´
ANNEE D’ETUDE : L2
`
´ STATISTIQUES
MATIERE
: PROBABILITES,
ENSEIGNANT : DIETER MITSCHE
`
´
THEME
DE LA SEANCE
: Tests d’hypoth`eses : comparaison a` une norme.
´
Fiche TD 2 - L2 Economie-Gestion
Exercice 1 : (Choix des hypoth`eses; Anderson)
Un responsable d’une concession automobile cherche `a mettre en place un nouveau syst`eme de
bonus, et souhaite ´etudier son effet sur le volume moyen des ventes. Avant la mise en place du
bonus, chaque membre du personnel charg´e de la vente vendait en moyenne 12 v´ehicules par
mois. Un ´echantillon du personnel charg´e de la vente applique le nouveau syst`eme de bonus
pendant un mois.
a. D´eterminer les hypoth`eses nulle et alternative les plus appropri´ees pour cette recherche.
On veut prouver que le nouveau syst`eme fait augmenter les ventes. On note µ le nombre moyen
de v´ehicules vendus par membre du personnel. On choisit donc H0 = “le volume moyen des
ventes n’augmente pas avec les nouveau syst`eme” : µ ≤ 12. Ha = “le volume moyen des ventes
augmente avec les nouveau syst`eme” : µ > 12.
b. A quoi correspondent les erreurs de premi`ere et seconde esp`ece dans ce cas ?
Erreur de premi`ere esp`ece : on conclut que µ > 12 alors que µ ≤ 12 = on conclut `a tort que le
nouveau syst`eme fait augmenter le niveau moyen des ventes.
Erreur de seconde esp`ece : on conclut que µ ≤ 12 alors que µ > 12 = on conclut a` tort que
le nouveau syst`eme est inefficace.
c. Quelles sont les cons´equences d’une erreur de premi`ere esp`ece ? De seconde esp`ece ?
Si on fait une erreur de premi`ere esp`ece, on mettra en place le nouveau syst`eme de bonus, alors
qu’il est inefficace, et peut-ˆetre coˆ
uteux. Si on fait une erreur de seconde esp`ece, on renoncera
a` le mettre en place, alors qu’il aurait peut-ˆetre ´et´e int´eressant.
Exercice 2 : (Choix des hypoth`eses; Anderson) Une chaˆıne de production est con¸cue pour
remplir un barril de lessive avec 3kg de produit. Un ´echantillon de barrils est p´eriodiquement
s´electionn´e, pour d´eterminer s’il y a sur- ou sous-remplissage. Dans ce cas, la chaˆıne de production est ferm´ee et ajust´ee.
a. D´eterminer les hypoth`eses nulle et alternative a` utiliser.
Hypoth`ese nulle : la quantit´e moyenne µ de lessive dans les barrils est 3kg (c’est-`a-dire : la
chaˆıne est bien r´egl´ee).
Hypoth`ese alternative : µ 6= 3kg, la chaˆıne est mal r´egl´ee.
b. A quoi correspondent les erreurs de premi`ere et seconde esp`ece dans ce cas ?
Erreur de premi`ere esp`ece : on conclut que la chaˆıne est mal r´egl´ee alors qu’elle est bien r´egl´ee.
1
Erreur de seconde esp`ece : on conclut `a tort que la chaˆıne est bien r´egl´ee.
c. Quelles sont les cons´equences d’une erreur de premi`ere esp`ece ? De seconde esp`ece ?
Si on fait une erreur de premi`ere esp`ece, on va arrˆeter la chaˆıne pour rien, ce qui coˆ
ute probablement de l’argent. Si on fait une erreur de seconde esp`ece, on va produire un certain nombre
de barrils avec une chaˆıne mal r´egl´ee.
Exercice 3 : (Moyenne d’une population, σ connu)
On consid`ere le test d’hypoth`eses suivant, o`
u µ d´esigne la moyenne d’une population :
H0 : µ = 6 ; Ha : µ 6= 6
Un ´echantillon de taille n = 80 fournit une moyenne d’´echantillon de 5, 8. L’´ecart-type de la
population est connu, ´egal `a 1.
Effectuer le test, avec un seuil de signification α = 0.05, en expliquant les diff´erentes ´etapes.
Pour vous entraˆıner, utiliser la m´ethode de la valeur p et la m´ethode de la valeur critique.
L’´ecart-type de la population est connu, on utilisera donc la loi normale pour calculer valeur
p et valeur critique; la taille de l’´echantillon est suffisante pour qu’on puisse effectuer un test.
On calcule la statistique de test :
√
z = 80(5.8 − 6)/1 ' −1.79
M´
ethode de la valeur p : C’est un test bilat´eral, donc la probabilit´e d’obtenir une statistique de test au moins aussi improbable que −1.79, en supposant que H0 est vraie, est ´egale a`
P (|Z| > 1.79), pour Z une va de loi N (0, 1). On obtient comme valeur p : 0.0734.
Conclusion : on conserve H0 au seuil de signification 0.05.
M´
ethode de la valeur critique : On souhaite un seuil de signification 0.05, pour un test
bilat´eral. La valeur critique zc est donc d´efinie par
P (|Z| > zc ) = 0.05 ,
o`
u Z est une va de loi N (0, 1). On en d´eduit que zc = 1.96.On rejette l’hypoth`ese H0 si la
statistique de test z est inf´erieure a` −zc ou sup´erieure a` zc (zone de rejet :]−∞, −zc [∪]zc , +∞[).
Dans ce cas, −1.79 n’est pas dans la zone de rejet, on conserve donc H0 .
Exercice 4 : (Moyenne d’une population, σ connu)
On consid`ere le test d’hypoth`eses suivant, o`
u µ d´esigne la moyenne d’une population :
H0 : µ ≥ 14 ; Ha : µ < 14
Un ´echantillon de taille n = 120 fournit une moyenne d’´echantillon de 13.6. L’´ecart-type de la
population est connu, ´egal `a 2.
Effectuer le test, avec un seuil de signification α = 0.02, en expliquant les diff´erentes ´etapes.
Pour vous entraˆıner, utiliser la m´ethode de la valeur p et la m´ethode de la valeur critique.
L’´ecart-type de la population est connu, on utilisera donc la loi normale pour calculer valeur
p et valeur critique; la taille de l’´echantillon est suffisante pour qu’on puisse effectuer un test.
On calcule la statistique de test :
√
z = 120(13.6 − 14)/2 ' −2.19
2
M´
ethode de la valeur p : C’est un test unilat´eral inf´erieur, donc la probabilit´e d’obtenir
une statistique de test au moins aussi improbable que −2.19, en supposant que H0 est vraie,
est ´egale a` P (Z < −2.19), pour Z une va de loi N (0, 1). On obtient comme valeur p : 0.0143.
Conclusion : on accepte Ha au seuil de signification 0.02.
M´
ethode de la valeur critique : On souhaite un seuil de signification 0.02, pour un test
unilat´eral inf´erieur. La valeur critique zc est donc d´efinie par
P (Z < zc ) = 0.02 ,
o`
u Z est une va de loi N (0, 1). On en d´eduit que zc = −2.06.On rejette l’hypoth`ese H0 si la
statistique de test z est inf´erieure a` zc (zone de rejet :] − ∞, zc [). Dans ce cas, on rejette donc
H0 , et on accepte Ha .
Exercice 5 : (Moyenne d’une population, σ inconnu)
On consid`ere le test d’hypoth`eses suivant, o`
u µ d´esigne la moyenne d’une population :
H0 : µ ≥ 34 ; Ha : µ < 34
On sait que la population a une distribution normale. Un ´echantillon de taille n = 16 fournit
une moyenne d’´echantillon de 31, et un ´ecart-type d’´echantillon de 5.
Effectuer le test, avec un seuil de signification α = 0.05, en expliquant les diff´erentes ´etapes.
Pour vous entraˆıner, utiliser la m´ethode de la valeur p et la m´ethode de la valeur critique.
L’´ecart-type de la population est inconnu, on utilisera donc une loi de Student pour calculer
valeur p et valeur critique; l’´echantillon est petit, mais on sait que la population suit une loi
normale; on peut donc tout de mˆeme effectuer un test. On calcule la statistique de test :
√
t = 16(31 − 34)/5 ' −2.4
M´
ethode de la valeur p : C’est un test unilat´eral inf´erieur, donc la probabilit´e d’obtenir
une statistique de test au moins aussi improbable que −2.4, en supposant que H0 est vraie, est
´egale a` P (T < −2.4), pour T une va de loi de Student `a 15 degr´e de libert´e. On obtient comme
valeur p une probabilit´e comprise entre 0.025 et 0.01.
Conclusion : on accepte Ha au seuil de signification 0.05.
M´
ethode de la valeur critique : On souhaite un seuil de signification 0.05, pour un test
unilat´eral inf´erieur. La valeur critique tc est donc d´efinie par
P (T < tc ) = 0.05 ,
o`
u T est une va de loi de Student `a 15 degr´es de libert´e. On en d´eduit que tc = −1.753.On
rejette l’hypoth`ese H0 si la statistique de test t est inf´erieure a` −tc (zone de rejet :] − ∞, tc [).
Dans ce cas, on rejette donc H0 , et on accepte Ha .
Exercice 6 : (Moyenne d’une population, σ inconnu)
On consid`ere le test d’hypoth`eses suivant, o`
u µ d´esigne la moyenne d’une population :
H0 : µ = 12 ; Ha : µ 6= 12
Un ´echantillon de taille n = 100 fournit une moyenne d’´echantillon de 12.25, et un ´ecart-type
d’´echantillon de 1.
3
Effectuer le test, avec un seuil de signification α = 0.01, en expliquant les diff´erentes ´etapes.
Pour vous entraˆıner, utiliser la m´ethode de la valeur p et la m´ethode de la valeur critique.
L’´ecart-type de la population est inconnu, on utilisera donc a priori une loi de Student pour
calculer valeur p et valeur critique. La taille de l’´echantillon est suffisante pour qu’on puisse
effectuer un test, mˆeme si la population ne suit pas une loi normale (n = 100). Pour n = 100,
la diff´erence entre loi de Student et loi normale est faible; on pourra donc aussi utiliser une loi
normale pour calculer valeur p et valeur critique.
On calcule la statistique de test :
√
t = 100(12.25 − 12)/1 = 2.5
M´
ethode de la valeur p : C’est un test bilat´eral donc la probabilit´e d’obtenir une statistique de test au moins aussi improbable que 2.5, en supposant que H0 est vraie, est ´egale a`
P (|T | > 2.5), pour T une va de loi de Student a` 99 degr´e de libert´e. On obtient comme valeur
p une probabilit´e comprise entre 0.01 et 0.02 (en utilisant la table d’une loi de Student `a 100
degr´es de libert´e, proche de celle d’une loi de Student `a 99 degr´es de libert´e; en utilisant la loi
normale, assez proche aussi d’une loi de Student a` 99 degr´es de libert´e, on obtient une valeur
p de 0.0124) Conclusion : on conserve H0 au seuil de signification 0.01.
M´
ethode de la valeur critique : On souhaite un seuil de signification 0.01, pour un test
bilat´eral. La valeur critique tc est donc d´efinie par
P (|T | > tc ) = 0.01 ,
o`
u T est une va de loi de Student `a 99 degr´es de libert´e. On en d´eduit que tc ' 2.63 (table de
la loi de Student `a 100 ddl).On rejette l’hypoth`ese H0 si la statistique de test t est inf´erieure a`
−tc ou sup´erieure `a tc (zone de rejet :] − ∞, −tc [∪]tc , +∞[). Dans ce cas t = 2.5, on conserve
donc H0 .
Remarque : pour n = 100, on peut aussi dire que la loi de Student a` 99 degr´es de libert´e est
proche d’une loi normale centr´ee r´eduite, et utiliser la table de la loi normale; on fera seulement
une petite erreur; on obtiendrait tc = 2.58.
Exercice 7 : (Proportion d’une population)
On consid`ere le test d’hypoth`eses suivant, o`
u µ d´esigne la proportion d’une population :
H0 : µ ≤ 0.6 ; Ha : µ > 0.6
a. Un ´echantillon de taille n = 200 a fournit une proportion d’´echantillon de .67. Calculer la
valeur p et conclure, pour un seuil de signification α = 0.05.
L’´echantillon est assez grand pour qu’on puisse effectuer le test (n × 0.6 > 10 , n × 0.4 > 10).
La statistique d’´echantillon est
p
√
z = 200(0.67 − 0.6)/ 0.6 ∗ (1 − 0.6) ' 2.02
La valeur p est P (Z > 2.02), avec Z une va de loi normale centr´ee r´eduite. Donc la valeur p
est environ 0.0217. On accepte donc l’hypoth`ese Ha .
b. Mˆeme question pour une proportion d’´echantillon de 0.62.
La statistique d’´echantillon est
p
√
z = 200(0.62 − 0.6)/ 0.6 ∗ (1 − 0.6) ' 0.577
4
La valeur p est P (Z > 0.577), avec Z une va de loi normale centr´ee r´eduite. Donc la valeur p
est environ 0.28. On ne rejette donc pas l’hypoth`ese H0 .
c. Mˆeme question pour une proportion d’´echantillon de 0.57.
La statistique de test est n´egative, et on effectue un test unilat´eral sup´erieur... Clairement,
les donn´ees ne fournissent aucun support pour Ha , et on ne rejette donc pas H0 : on obtient
cette conclusion sans calcul.
Exercice 8
Une machine d´ecoupe des tiges en acier, d’une longueur moyenne suppos´ee d’1m. On souhaite
v´erifier si la machine est correctement r´egl´ee.
988 997 995 989 997 985 1000 995 1002 990
Qu’en pensez-vous au vu des observations ci-dessus (en mm) ? On supposera que la longueur
d’une tige suit une loi normale N (µ, σ 2 ).
On note µ la longueur moyenne des tiges. On va effectuer un test bilat´eral, avec un seuil de
signification α = 0.05.
H0 : µ = 1000
Ha : µ 6= 1000
La moyenne d’´echantillon x¯ = 993.8. L’´ecart-type d’´echantillon est s¯ ' 5.55. La statistique de
test est donc
√
t = 10(993.8 − 1000)/5.55 ' −3.53
La valeur p (calcul´ee a` l’aide d’une distribution de Student a` 9 degr´es de libert´e, puisque la
variance de la population est inconnue) est donc P (T > 3.53) + P (T < −3.53) < 0.01. Au seuil
de signification 0.05, on peut accepter Ha , ie la machine est d´er´egl´ee.
Exercice 9 (Comparaison de moyennes) :
On consid`ere deux populations, d’´ecarts-types connus σ1 = 2.2 et σ2 = 3.0. On donne les
r´esultats issus de deux ´echantillons al´eatoires ind´ependants, issus de deux populations :
1- taille n1 = 50 ; moyenne d’´echantillon x¯1 = 9.0.
2- taille n2 = 70 ; moyenne d’´echantillon x¯2 = 9.5.
a. Quelle est l’estimation ponctuelle de l’´ecart entre les moyennes µ1 et µ2 des deux populations ?
L’estimation ponctuelle de µ1 − µ2 est x¯1 − x¯2 = −0.5.
b. On consid`ere le test d’hypoth`eses suivant : H0 : µ1 − µ2 ≥ 0 ; Ha : µ1 − µ2 < 0.
Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au seuil
α = 0.05 ?
¯1 − X
¯ 2 suit une loi approximativeLes ´ecarts-types des population sont connus. L’estimateur X
2
ment normale, d’esp´erance µ1 − µ2 et de variance connue σ = σ12 /n1 + σ22 /n2 = .2254. On
¯1 − X
¯ 2 )/σ, de loi normale centr´ee r´eduite. La
utilise donc comme statistique de test Z¯ = (X
statistique de test calcul´ee a` partir de l’´echantillon est z¯ ' −1.05.
La valeur p est la probabilit´e qu’une va de loi normale centr´ee r´eduite soit inf´erieure a` z¯.
On trouve 0.1469. Au seuil α = 0.05, on ne rejette donc pas H0 .
Exercice 10 (Comparaison de moyennes) :
On consid`ere deux populations, d’´ecarts-types inconnus. On donne les r´esultats issus de deux
´echantillons al´eatoires ind´ependants, issus de deux populations :
1- taille n1 = 120 ; moyenne d’´echantillon x¯1 = 21.5; ´ecart-type d’´echantillon s1 = 3.1.
2- taille n2 = 100 ; moyenne d’´echantillon x¯2 = 20.5; ´ecart-type d’´echantillon s2 = 2.5.
5
a. Quelle est l’estimation ponctuelle de l’´ecart entre les moyennes µ1 et µ2 des deux populations ?
Estimation ponctuelle de µ1 − µ2 : x¯1 − x¯2 = 1.
b. On consid`ere le test d’hypoth`eses suivant : H0 : µ1 − µ2 ≥ 0 ; Ha : µ1 − µ2 < 0.
Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au seuil
α = 0.05 ?
Les ´echantillons sont suffisamment grands (n1 , n2 ≥ 100) pour que l’on puisse consid´erer
√
√
¯ 1 − µ1 )/¯
¯ 2 − µ2 )/¯
s1 et n2 (X
s2 suivent approximativement des lois normales centr´ees
que n1 (X
¯
¯
r´eduites. Alors X1 − X2 suit approximativement une loi normale d’esp´erance µ1 − µ2 et de varix1 − x¯2 )/¯
s'
ance s21 /n1 + s22 /n2 ' 0.1426; ´ecart-type s¯ ' 0.378. La statistique de test est z¯ = (¯
2.65. La valeur p est la probabilit´e qu’une va de loi normale centr´ee r´eduite prenne une valeur
plus petite que z¯. On obtient 0.996... Bien sˆ
ur, on conserve H0 . On pouvait obtenir ce r´esultat
d`es le d´ebut, puisque les donn´ees de l’´echantillon favorisent H0 .
c. On consid`ere maintenant le test d’hypoth`eses suivant : H0 : µ2 −µ1 ≥ 0 ; Ha : µ2 −µ1 <
0. Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au
seuil α = 0.05 ?
La statistique de test est la mˆeme, z¯ ' 2.65; cette-fois, la valeur p est la probabilit´e qu’une
va de loi normale centr´ee r´eduite prenne une valeur plus grande que z¯. On obtient 0.004. On
accepte donc Ha .
Exercice 11 (Comparaison de proportions; Anderson) :
Dans un test sur la qualit´e de deux publicit´es, chacune a ´et´e diffus´ee dans une zone test
sp´ecifique 6 fois en une semaine. La semaine suivante, une enquˆete t´el´ephonique a identifi´e les
personnes qui ont vu les publicit´es. On a ensuite demand´e a` ces personnes d’´enoncer le slogan
de la publicit´e qu’ils avaient vue. L’enquˆete a fourni les r´esultats suivants :
- Nombre de personnes ayant vu la publicit´e A : 150; nombre de personnes se souvenant du
slogan 63.
- Nombre de personnes ayant vu la publicit´e B : 200; nombre de personnes se souvenant du
slogan 60.
Tester l’hypoth`ese selon laquelle il n’y a pas d’´ecart entre les proportions de personnes se
souvenant du slogan des publicit´es, au seuil de signification 0.05.
La proportion dans l’´echantillon A est p¯A = 0.42; dans l’´echantillon B : p¯B = 0.3
On d´efinit le test :
H0 : pA = pB ; Ha : pA 6= pB
Si H0 est vraie, pA = pB = p; on estime p par p¯ = (nA p¯A + nB p¯B )/(nA + nB ).
l’estimateur P¯A − P¯B a une distribution proche de N (0, σ 2 ) (application du TCL), avec
2
σ = p(1 − p)(nA + nB )/(nA nB ). On estime σ en rempla¸cant p par p¯.
La statistique de test (qui est distribu´ee suivant une loi normale centr´ee r´eduite) est donc
r
nA nB P¯A − P¯B
¯
p
Z=
nA + nB p¯(1 − p¯)
Pour les donn´ees de l’´enonc´e, on obtient z¯ ' 2.326.
Au seuil α = 0.05, pour un test bilat´eral, la zone de rejet est
] − ∞, −zα/2 [ ∪ ]zα/2 , +∞[=] − ∞, −1.96[ ∪ ]1.96, +∞[
6
z¯ est dans la zone de rejet, donc on rejette H0 .
7