Relation entre deux variables Nuages de points

Transcription

Relation entre deux variables Nuages de points
Cours 11 - Statistiques inférentielles
27 mars 2015
SCI6060 (Hiver 2015)
Cours 11
1/25
Relation entre deux variables
Graphiques de dispersion, corrélation et régression linéaire
SCI6060 - Cours 11
27 mars 2015
SCI6060 (Hiver 2015)
Cours 11
2/25
Existence d’un lien entre deux variables :
vérification visuelle de l’existence du lien
Nuages de points
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
1
Cours 11 - Statistiques inférentielles
27 mars 2015
SCI6060 (Hiver 2015)
Cours 11
3/25
Principe du nuage de points pour
visualiser la relation entre deux indicateurs
1. Soit les données suivantes
Rép.
Transports
($)
Cheveux
(cm)
2. Pour chacun des répondants, on positionne les
paires de données sur un graphique. Le premier point
serait ainsi (90, 0,7), le deuxième serait (90, 0,8), etc.
0,7
2,5
2
90
0,8
2
3
100
0,9
4
100
1,1
5
100
2,0
6
100
0,9
7
100
1,3
8
100
0,7
9
110
2,0
10
110
0,9
Cheveux (cm)
90
1
1,5
1
0,5
0
0
25
50 75 100 125
Transports ($)
3. On examine le nuage de points produit pour voir si un lien entre les deux indicateurs
ressort. Croissent-ils ensemble à un même rythme par exemple? Rien ici qui ressort!
Nuage de points pour deux variables
ayant une relation linéaire « idéale »
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
2
Cours 11 - Statistiques inférentielles
27 mars 2015
Nuage de points pour deux variables
ayant une relation exponentielle « idéale »
A
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
Lien?
3
Cours 11 - Statistiques inférentielles
B
C
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
27 mars 2015
Lien?
Lien?
4
Cours 11 - Statistiques inférentielles
D
27 mars 2015
Lien?
SCI6060 (Hiver 2015)
Cours 11
10/25
Existence d’un lien entre deux variables :
vérification numérique de la force du lien
Analyse de corrélation
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
5
Cours 11 - Statistiques inférentielles
A
B
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
27 mars 2015
SCI6060 (Hiver 2015)
Cours 11
11/25
r = 0
Corrélation = absente
SCI6060 (Hiver 2015)
Cours 11
12/25
r = ‐0,8
Sens = inverse
Corrélation = très forte
6
Cours 11 - Statistiques inférentielles
27 mars 2015
SCI6060 (Hiver 2015)
Cours 11
13/25
C
r = 1
Sens = directe
Corrélation = très forte
SCI6060 (Hiver 2015)
Cours 11
14/25
D
r = 0,2
Sens = direct
Corrélation = faible
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
7
Cours 11 - Statistiques inférentielles
27 mars 2015
SCI6060 (Hiver 2015)
Cours 11
15/25
Exemple de données touristiques
et météorologiques
Statistiques météorologiques : valeurs moyennes entre 1961
et 1991 à Montréal; tirées de MétéoMédia
(http://www.meteomedia.com/meteo/stats/Pages/C02019.htm)
le 14 mars 2007.
Statistiques touristiques : valeurs pour 2006; tirées de la
base de données de Tourisme-Montréal (http://www.tourismemontreal.org/Download/base.xls) le 14 mars 2007.
SCI6060 (Hiver 2015)
Cours 11
16/25
Nombre de demande d'information par mois à des comptoirs touristiques à Montréal
Vérification visuelle
Y a‐t‐il un lien?
35 000
30 000
25 000
20 000
15 000
10 000
5 000
0
62
64
66
68
70
72
74
76
78
Humidité relative (%) par mois
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
8
Cours 11 - Statistiques inférentielles
27 mars 2015
SCI6060 (Hiver 2015)
Cours 11
17/25
Nombre de demandes d'information par mois à des comptoirs touristiques à Montréal
Vérification visuelle
Y a‐t‐il un lien? 35 000
30 000
25 000
20 000
15 000
10 000
5 000
0
10
11
12
13
14
15
16
17
18
Vitesse du vent (km/h) par mois
SCI6060 (Hiver 2015)
Cours 11
18/25
Vérification visuelle
Y a‐t‐il un lien?
Nombre de passagers par mois à l'aéroport Montréal‐Trudeau
1150000
1100000
1050000
1000000
950000
900000
850000
800000
62
64
66
68
70
72
74
76
78
Humidité relative (%) par mois
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
9
Cours 11 - Statistiques inférentielles
27 mars 2015
SCI6060 (Hiver 2015)
Cours 11
19/25
Vérification visuelle
Y a‐t‐il un lien?
Température moyenne (C°) par mois
25
20
15
10
5
0
‐5
‐10
‐15
0
50
100
150
200
250
300
Nombre d'heures d'ensoleillement par mois
SCI6060 (Hiver 2015)
Cours 11
20/25
Vérification chiffrée : Coefficients de corrélation
précipi‐
tations
(mm)
précipitations (mm)
ensoleillement (heures)
humidité relative (%)
vitesse du vent (km/h)
température moyenne (C°)
demandes d'info à des comptoirs touristiques à Montréal
nbre de passagers à l'aéroport Montréal‐
Trudeau
taux d'occupation des hôtels de
Montréal (%)
ensoleil‐
lement
(heures)
tempé‐
humidité vitesse du rature
relative
vent moyen‐
(%)
(km/h)
ne (C°)
demandes nbre de taux d'info à des passagers à d'occupation comptoirs l'aéroport des hôtels de touristiques Montréal‐
Montréal
à Montréal
Trudeau
(%)
1,0
0,3
1,0
0,4
‐0,5
1,0
‐0,6
‐0,8
0,0
1,0
0,6
0,8
‐0,3
‐0,9
1,0
0,6
0,9
‐0,1
‐0,9
0,9
1,0
0,4
0,9
‐0,2
‐0,8
0,7
0,9
1,0
0,5
0,7
‐0,2
‐0,8
0,9
0,8
0,6
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
1,0
10
Cours 11 - Statistiques inférentielles
27 mars 2015
SCI6060 (Hiver 2015)
Cours 11
21/25
Existence d’un lien entre deux variables :
quantification mathématique du lien
Analyse de régression linéaire
simple
B
SCI6060 (Hiver 2015)
Cours 11
22/25
y = -2,4916x + 24,524
r = ‐0,8
relation
Sens = inverseinverse (pente négative)
Corrélation = très forte
corrélation
forte (r=-0,79)
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
11
Cours 11 - Statistiques inférentielles
C
27 mars 2015
SCI6060 (Hiver 2015)
Cours 11
23/25
relation directe (pente positive)
r = 1
Sens = direct
corrélation très forte (r=0,97)
Corrélation = très forte
y = 90854x - 207,47
E
SCI6060 (Hiver 2015)
Cours 11
24/25
r = 1
relation directe (pente positive)
Sens = direct
corrélation très forte (r=0,98)
Corrélation = très forte
y = 2,9856x + 4,4104
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
12
Cours 11 - Statistiques inférentielles
G
27 mars 2015
SCI6060 (Hiver 2015)
Cours 11
25/25
y = -13457x + 32,444
r = ‐0,9
relation
Sens = inverseinverse (pente négative)
Corrélation = très forte
corrélation
très forte (r=-0,93)
SCI6060 - Christine Dufour & Vincent Larivière (Hiver
2015)
13