Correction

Transcription

Correction

UNIVERSITE de NICE - SOPHIA ANTIPOLIS
Institut Sup´
erieur d’Economie et de Management
´ UNIVERSITAIRE : 2014-2015
ANNEE
REF.
´
´
ANNEE D’ETUDE : L2
`
´ STATISTIQUES
MATIERE
: PROBABILITES,
ENSEIGNANT : DIETER MITSCHE
`
´
THEME
DE LA SEANCE
: Tests d’hypothèses : comparaison a` une norme.
´
Fiche TD 2 - L2 Economie-Gestion
Exercice 1 : (Choix des hypothèses; Anderson)
Un responsable d’une concession automobile cherche à mettre en place un nouveau système de
bonus, et souhaite étudier son effet sur le volume moyen des ventes. Avant la mise en place du
bonus, chaque membre du personnel chargé de la vente vendait en moyenne 12 véhicules par
mois. Un échantillon du personnel chargé de la vente applique le nouveau système de bonus
pendant un mois.
a. Déterminer les hypothèses nulle et alternative les plus appropriées pour cette recherche.
On veut prouver que le nouveau système fait augmenter les ventes. On note µ le nombre moyen
de véhicules vendus par membre du personnel. On choisit donc H0 = “le volume moyen des
ventes n’augmente pas avec les nouveau système” : µ ≤ 12. Ha = “le volume moyen des ventes
augmente avec les nouveau système” : µ > 12.
b. A quoi correspondent les erreurs de première et seconde espèce dans ce cas ?
Erreur de première espèce : on conclut que µ > 12 alors que µ ≤ 12 = on conclut à tort que le
nouveau système fait augmenter le niveau moyen des ventes.
Erreur de seconde espèce : on conclut que µ ≤ 12 alors que µ > 12 = on conclut a` tort que
le nouveau système est inefficace.
c. Quelles sont les conséquences d’une erreur de première espèce ? De seconde espèce ?
Si on fait une erreur de première espèce, on mettra en place le nouveau système de bonus, alors
qu’il est inefficace, et peut-être coˆ
uteux. Si on fait une erreur de seconde espèce, on renoncera
a` le mettre en place, alors qu’il aurait peut-être été intéressant.
Exercice 2 : (Choix des hypothèses; Anderson) Une chaˆıne de production est con¸cue pour
remplir un barril de lessive avec 3kg de produit. Un échantillon de barrils est périodiquement
sélectionné, pour déterminer s’il y a sur- ou sous-remplissage. Dans ce cas, la chaˆıne de production est fermée et ajustée.
a. Déterminer les hypothèses nulle et alternative a` utiliser.
Hypothèse nulle : la quantité moyenne µ de lessive dans les barrils est 3kg (c’est-à-dire : la
chaˆıne est bien réglée).
Hypothèse alternative : µ 6= 3kg, la chaˆıne est mal réglée.
b. A quoi correspondent les erreurs de première et seconde espèce dans ce cas ?
Erreur de première espèce : on conclut que la chaˆıne est mal réglée alors qu’elle est bien réglée.
1
Erreur de seconde espèce : on conclut à tort que la chaˆıne est bien réglée.
c. Quelles sont les conséquences d’une erreur de première espèce ? De seconde espèce ?
Si on fait une erreur de première espèce, on va arrêter la chaˆıne pour rien, ce qui coˆ
ute probablement de l’argent. Si on fait une erreur de seconde espèce, on va produire un certain nombre
de barrils avec une chaˆıne mal réglée.
Exercice 3 : (Moyenne d’une population, σ connu)
On considère le test d’hypothèses suivant, o`
u µ désigne la moyenne d’une population :
H0 : µ = 6 ; Ha : µ 6= 6
Un échantillon de taille n = 80 fournit une moyenne d’échantillon de 5, 8. L’écart-type de la
population est connu, égal à 1.
Effectuer le test, avec un seuil de signification α = 0.05, en expliquant les différentes étapes.
Pour vous entraˆıner, utiliser la méthode de la valeur p et la méthode de la valeur critique.
L’écart-type de la population est connu, on utilisera donc la loi normale pour calculer valeur
p et valeur critique; la taille de l’échantillon est suffisante pour qu’on puisse effectuer un test.
On calcule la statistique de test :
√
z = 80(5.8 − 6)/1 ' −1.79
M´
ethode de la valeur p : C’est un test bilatéral, donc la probabilité d’obtenir une statistique de test au moins aussi improbable que −1.79, en supposant que H0 est vraie, est égale a`
P (|Z| > 1.79), pour Z une va de loi N (0, 1). On obtient comme valeur p : 0.0734.
Conclusion : on conserve H0 au seuil de signification 0.05.
M´
ethode de la valeur critique : On souhaite un seuil de signification 0.05, pour un test
bilatéral. La valeur critique zc est donc définie par
P (|Z| > zc ) = 0.05 ,
o`
u Z est une va de loi N (0, 1). On en déduit que zc = 1.96.On rejette l’hypothèse H0 si la
statistique de test z est inférieure a` −zc ou supérieure a` zc (zone de rejet :]−∞, −zc [∪]zc , +∞[).
Dans ce cas, −1.79 n’est pas dans la zone de rejet, on conserve donc H0 .
Exercice 4 : (Moyenne d’une population, σ connu)
H0 : µ ≥ 14 ; Ha : µ < 14
Un échantillon de taille n = 120 fournit une moyenne d’échantillon de 13.6. L’écart-type de la
population est connu, égal à 2.
L’écart-type de la population est connu, on utilisera donc la loi normale pour calculer valeur
p et valeur critique; la taille de l’échantillon est suffisante pour qu’on puisse effectuer un test.
√
z = 120(13.6 − 14)/2 ' −2.19
2
M´
ethode de la valeur p : C’est un test unilatéral inférieur, donc la probabilité d’obtenir
une statistique de test au moins aussi improbable que −2.19, en supposant que H0 est vraie,
est égale a` P (Z < −2.19), pour Z une va de loi N (0, 1). On obtient comme valeur p : 0.0143.
Conclusion : on accepte Ha au seuil de signification 0.02.
M´
unilatéral inférieur. La valeur critique zc est donc définie par
P (Z < zc ) = 0.02 ,
o`
u Z est une va de loi N (0, 1). On en déduit que zc = −2.06.On rejette l’hypothèse H0 si la
statistique de test z est inférieure a` zc (zone de rejet :] − ∞, zc [). Dans ce cas, on rejette donc
H0 , et on accepte Ha .
Exercice 5 : (Moyenne d’une population, σ inconnu)
H0 : µ ≥ 34 ; Ha : µ < 34
On sait que la population a une distribution normale. Un échantillon de taille n = 16 fournit
une moyenne d’échantillon de 31, et un écart-type d’échantillon de 5.
L’écart-type de la population est inconnu, on utilisera donc une loi de Student pour calculer
valeur p et valeur critique; l’échantillon est petit, mais on sait que la population suit une loi
normale; on peut donc tout de même effectuer un test. On calcule la statistique de test :
√
t = 16(31 − 34)/5 ' −2.4
M´
ethode de la valeur p : C’est un test unilatéral inférieur, donc la probabilité d’obtenir
une statistique de test au moins aussi improbable que −2.4, en supposant que H0 est vraie, est
égale a` P (T < −2.4), pour T une va de loi de Student à 15 degré de liberté. On obtient comme
valeur p une probabilité comprise entre 0.025 et 0.01.
Conclusion : on accepte Ha au seuil de signification 0.05.
M´
unilatéral inférieur. La valeur critique tc est donc définie par
P (T < tc ) = 0.05 ,
o`
u T est une va de loi de Student à 15 degrés de liberté. On en déduit que tc = −1.753.On
rejette l’hypothèse H0 si la statistique de test t est inférieure a` −tc (zone de rejet :] − ∞, tc [).
Dans ce cas, on rejette donc H0 , et on accepte Ha .
Exercice 6 : (Moyenne d’une population, σ inconnu)
H0 : µ = 12 ; Ha : µ 6= 12
Un échantillon de taille n = 100 fournit une moyenne d’échantillon de 12.25, et un écart-type
d’échantillon de 1.
3
L’écart-type de la population est inconnu, on utilisera donc a priori une loi de Student pour
calculer valeur p et valeur critique. La taille de l’échantillon est suffisante pour qu’on puisse
effectuer un test, même si la population ne suit pas une loi normale (n = 100). Pour n = 100,
la différence entre loi de Student et loi normale est faible; on pourra donc aussi utiliser une loi
normale pour calculer valeur p et valeur critique.
√
t = 100(12.25 − 12)/1 = 2.5
M´
ethode de la valeur p : C’est un test bilatéral donc la probabilité d’obtenir une statistique de test au moins aussi improbable que 2.5, en supposant que H0 est vraie, est égale a`
P (|T | > 2.5), pour T une va de loi de Student a` 99 degré de liberté. On obtient comme valeur
p une probabilité comprise entre 0.01 et 0.02 (en utilisant la table d’une loi de Student à 100
degrés de liberté, proche de celle d’une loi de Student à 99 degrés de liberté; en utilisant la loi
normale, assez proche aussi d’une loi de Student a` 99 degrés de liberté, on obtient une valeur
p de 0.0124) Conclusion : on conserve H0 au seuil de signification 0.01.
M´
bilatéral. La valeur critique tc est donc définie par
P (|T | > tc ) = 0.01 ,
o`
u T est une va de loi de Student à 99 degrés de liberté. On en déduit que tc ' 2.63 (table de
la loi de Student à 100 ddl).On rejette l’hypothèse H0 si la statistique de test t est inférieure a`
−tc ou supérieure à tc (zone de rejet :] − ∞, −tc [∪]tc , +∞[). Dans ce cas t = 2.5, on conserve
donc H0 .
Remarque : pour n = 100, on peut aussi dire que la loi de Student a` 99 degrés de liberté est
proche d’une loi normale centrée réduite, et utiliser la table de la loi normale; on fera seulement
une petite erreur; on obtiendrait tc = 2.58.
Exercice 7 : (Proportion d’une population)
u µ désigne la proportion d’une population :
H0 : µ ≤ 0.6 ; Ha : µ > 0.6
a. Un échantillon de taille n = 200 a fournit une proportion d’échantillon de .67. Calculer la
valeur p et conclure, pour un seuil de signification α = 0.05.
L’échantillon est assez grand pour qu’on puisse effectuer le test (n × 0.6 > 10 , n × 0.4 > 10).
La statistique d’échantillon est
p
√
z = 200(0.67 − 0.6)/ 0.6 ∗ (1 − 0.6) ' 2.02
La valeur p est P (Z > 2.02), avec Z une va de loi normale centrée réduite. Donc la valeur p
est environ 0.0217. On accepte donc l’hypothèse Ha .
b. Même question pour une proportion d’échantillon de 0.62.
La statistique d’échantillon est
p
√
z = 200(0.62 − 0.6)/ 0.6 ∗ (1 − 0.6) ' 0.577
4
La valeur p est P (Z > 0.577), avec Z une va de loi normale centrée réduite. Donc la valeur p
est environ 0.28. On ne rejette donc pas l’hypothèse H0 .
c. Même question pour une proportion d’échantillon de 0.57.
La statistique de test est négative, et on effectue un test unilatéral supérieur... Clairement,
les données ne fournissent aucun support pour Ha , et on ne rejette donc pas H0 : on obtient
cette conclusion sans calcul.
Exercice 8
Une machine découpe des tiges en acier, d’une longueur moyenne supposée d’1m. On souhaite
vérifier si la machine est correctement réglée.
988 997 995 989 997 985 1000 995 1002 990
Qu’en pensez-vous au vu des observations ci-dessus (en mm) ? On supposera que la longueur
d’une tige suit une loi normale N (µ, σ 2 ).
On note µ la longueur moyenne des tiges. On va effectuer un test bilatéral, avec un seuil de
signification α = 0.05.
H0 : µ = 1000
Ha : µ 6= 1000
La moyenne d’échantillon x¯ = 993.8. L’écart-type d’échantillon est s¯ ' 5.55. La statistique de
test est donc
√
t = 10(993.8 − 1000)/5.55 ' −3.53
La valeur p (calculée a` l’aide d’une distribution de Student a` 9 degrés de liberté, puisque la
variance de la population est inconnue) est donc P (T > 3.53) + P (T < −3.53) < 0.01. Au seuil
de signification 0.05, on peut accepter Ha , ie la machine est déréglée.
Exercice 9 (Comparaison de moyennes) :
On considère deux populations, d’écarts-types connus σ1 = 2.2 et σ2 = 3.0. On donne les
résultats issus de deux échantillons aléatoires indépendants, issus de deux populations :
1- taille n1 = 50 ; moyenne d’échantillon x¯1 = 9.0.
2- taille n2 = 70 ; moyenne d’échantillon x¯2 = 9.5.
a. Quelle est l’estimation ponctuelle de l’écart entre les moyennes µ1 et µ2 des deux populations ?
L’estimation ponctuelle de µ1 − µ2 est x¯1 − x¯2 = −0.5.
b. On considère le test d’hypothèses suivant : H0 : µ1 − µ2 ≥ 0 ; Ha : µ1 − µ2 < 0.
Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au seuil
α = 0.05 ?
¯1 − X
¯ 2 suit une loi approximativeLes écarts-types des population sont connus. L’estimateur X
2
ment normale, d’espérance µ1 − µ2 et de variance connue σ = σ12 /n1 + σ22 /n2 = .2254. On
¯1 − X
¯ 2 )/σ, de loi normale centrée réduite. La
utilise donc comme statistique de test Z¯ = (X
statistique de test calculée a` partir de l’échantillon est z¯ ' −1.05.
La valeur p est la probabilité qu’une va de loi normale centrée réduite soit inférieure a` z¯.
On trouve 0.1469. Au seuil α = 0.05, on ne rejette donc pas H0 .
Exercice 10 (Comparaison de moyennes) :
On considère deux populations, d’écarts-types inconnus. On donne les résultats issus de deux
échantillons aléatoires indépendants, issus de deux populations :
1- taille n1 = 120 ; moyenne d’échantillon x¯1 = 21.5; écart-type d’échantillon s1 = 3.1.
2- taille n2 = 100 ; moyenne d’échantillon x¯2 = 20.5; écart-type d’échantillon s2 = 2.5.
5
a. Quelle est l’estimation ponctuelle de l’écart entre les moyennes µ1 et µ2 des deux populations ?
Estimation ponctuelle de µ1 − µ2 : x¯1 − x¯2 = 1.
b. On considère le test d’hypothèses suivant : H0 : µ1 − µ2 ≥ 0 ; Ha : µ1 − µ2 < 0.
Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au seuil
α = 0.05 ?
Les échantillons sont suffisamment grands (n1 , n2 ≥ 100) pour que l’on puisse considérer
√
√
¯ 1 − µ1 )/¯
¯ 2 − µ2 )/¯
s1 et n2 (X
s2 suivent approximativement des lois normales centrées
que n1 (X
¯
¯
réduites. Alors X1 − X2 suit approximativement une loi normale d’espérance µ1 − µ2 et de varix1 − x¯2 )/¯
s'
ance s21 /n1 + s22 /n2 ' 0.1426; écart-type s¯ ' 0.378. La statistique de test est z¯ = (¯
2.65. La valeur p est la probabilité qu’une va de loi normale centrée réduite prenne une valeur
plus petite que z¯. On obtient 0.996... Bien sˆ
ur, on conserve H0 . On pouvait obtenir ce résultat
dès le début, puisque les données de l’échantillon favorisent H0 .
c. On considère maintenant le test d’hypothèses suivant : H0 : µ2 −µ1 ≥ 0 ; Ha : µ2 −µ1 <
0. Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au
seuil α = 0.05 ?
La statistique de test est la même, z¯ ' 2.65; cette-fois, la valeur p est la probabilité qu’une
va de loi normale centrée réduite prenne une valeur plus grande que z¯. On obtient 0.004. On
accepte donc Ha .
Exercice 11 (Comparaison de proportions; Anderson) :
Dans un test sur la qualité de deux publicités, chacune a été diffusée dans une zone test
spécifique 6 fois en une semaine. La semaine suivante, une enquête téléphonique a identifié les
personnes qui ont vu les publicités. On a ensuite demandé a` ces personnes d’énoncer le slogan
de la publicité qu’ils avaient vue. L’enquête a fourni les résultats suivants :
- Nombre de personnes ayant vu la publicité A : 150; nombre de personnes se souvenant du
slogan 63.
- Nombre de personnes ayant vu la publicité B : 200; nombre de personnes se souvenant du
slogan 60.
Tester l’hypothèse selon laquelle il n’y a pas d’écart entre les proportions de personnes se
souvenant du slogan des publicités, au seuil de signification 0.05.
La proportion dans l’échantillon A est p¯A = 0.42; dans l’échantillon B : p¯B = 0.3
On définit le test :
H0 : pA = pB ; Ha : pA 6= pB
Si H0 est vraie, pA = pB = p; on estime p par p¯ = (nA p¯A + nB p¯B )/(nA + nB ).
l’estimateur P¯A − P¯B a une distribution proche de N (0, σ 2 ) (application du TCL), avec
2
σ = p(1 − p)(nA + nB )/(nA nB ). On estime σ en rempla¸cant p par p¯.
La statistique de test (qui est distribuée suivant une loi normale centrée réduite) est donc
r
nA nB P¯A − P¯B
¯
p
Z=
nA + nB p¯(1 − p¯)
Pour les données de l’énoncé, on obtient z¯ ' 2.326.
Au seuil α = 0.05, pour un test bilatéral, la zone de rejet est
] − ∞, −zα/2 [ ∪ ]zα/2 , +∞[=] − ∞, −1.96[ ∪ ]1.96, +∞[
6
z¯ est dans la zone de rejet, donc on rejette H0 .
7

Correction

Transcription

Similar documents

Fiche n 2. Tests. - Nicolas Chenavier

Ondes internes en vallÃ©e encaissÃ©e. AtmosphÃ¨re stratifiÃ©e

Hydraulic-Jump - Laboratoire d`Hydraulique Environnementale

Propulsion d`engins spatiaux. Limites de la propulsion chimique

ÃnoncÃ©

DS 10 de physique Partie 1. Le deutÃ©ron Partie 2. La radioactivitÃ© Î±

I. Trajectoire d`un volant de badminton

HASHCAT vs John The Ripper

Le Gallet Le magazine des sapeurs sauveteurs de l`UIISC1

Introduction - FranÃ§ois Bergeron, UQAM