Relation entre deux variables Nuages de points
Transcription
Relation entre deux variables Nuages de points
Cours 11 - Statistiques inférentielles 27 mars 2015 SCI6060 (Hiver 2015) Cours 11 1/25 Relation entre deux variables Graphiques de dispersion, corrélation et régression linéaire SCI6060 - Cours 11 27 mars 2015 SCI6060 (Hiver 2015) Cours 11 2/25 Existence d’un lien entre deux variables : vérification visuelle de l’existence du lien Nuages de points SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 1 Cours 11 - Statistiques inférentielles 27 mars 2015 SCI6060 (Hiver 2015) Cours 11 3/25 Principe du nuage de points pour visualiser la relation entre deux indicateurs 1. Soit les données suivantes Rép. Transports ($) Cheveux (cm) 2. Pour chacun des répondants, on positionne les paires de données sur un graphique. Le premier point serait ainsi (90, 0,7), le deuxième serait (90, 0,8), etc. 0,7 2,5 2 90 0,8 2 3 100 0,9 4 100 1,1 5 100 2,0 6 100 0,9 7 100 1,3 8 100 0,7 9 110 2,0 10 110 0,9 Cheveux (cm) 90 1 1,5 1 0,5 0 0 25 50 75 100 125 Transports ($) 3. On examine le nuage de points produit pour voir si un lien entre les deux indicateurs ressort. Croissent-ils ensemble à un même rythme par exemple? Rien ici qui ressort! Nuage de points pour deux variables ayant une relation linéaire « idéale » SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 2 Cours 11 - Statistiques inférentielles 27 mars 2015 Nuage de points pour deux variables ayant une relation exponentielle « idéale » A SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) Lien? 3 Cours 11 - Statistiques inférentielles B C SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 27 mars 2015 Lien? Lien? 4 Cours 11 - Statistiques inférentielles D 27 mars 2015 Lien? SCI6060 (Hiver 2015) Cours 11 10/25 Existence d’un lien entre deux variables : vérification numérique de la force du lien Analyse de corrélation SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 5 Cours 11 - Statistiques inférentielles A B SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 27 mars 2015 SCI6060 (Hiver 2015) Cours 11 11/25 r = 0 Corrélation = absente SCI6060 (Hiver 2015) Cours 11 12/25 r = ‐0,8 Sens = inverse Corrélation = très forte 6 Cours 11 - Statistiques inférentielles 27 mars 2015 SCI6060 (Hiver 2015) Cours 11 13/25 C r = 1 Sens = directe Corrélation = très forte SCI6060 (Hiver 2015) Cours 11 14/25 D r = 0,2 Sens = direct Corrélation = faible SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 7 Cours 11 - Statistiques inférentielles 27 mars 2015 SCI6060 (Hiver 2015) Cours 11 15/25 Exemple de données touristiques et météorologiques Statistiques météorologiques : valeurs moyennes entre 1961 et 1991 à Montréal; tirées de MétéoMédia (http://www.meteomedia.com/meteo/stats/Pages/C02019.htm) le 14 mars 2007. Statistiques touristiques : valeurs pour 2006; tirées de la base de données de Tourisme-Montréal (http://www.tourismemontreal.org/Download/base.xls) le 14 mars 2007. SCI6060 (Hiver 2015) Cours 11 16/25 Nombre de demande d'information par mois à des comptoirs touristiques à Montréal Vérification visuelle Y a‐t‐il un lien? 35 000 30 000 25 000 20 000 15 000 10 000 5 000 0 62 64 66 68 70 72 74 76 78 Humidité relative (%) par mois SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 8 Cours 11 - Statistiques inférentielles 27 mars 2015 SCI6060 (Hiver 2015) Cours 11 17/25 Nombre de demandes d'information par mois à des comptoirs touristiques à Montréal Vérification visuelle Y a‐t‐il un lien? 35 000 30 000 25 000 20 000 15 000 10 000 5 000 0 10 11 12 13 14 15 16 17 18 Vitesse du vent (km/h) par mois SCI6060 (Hiver 2015) Cours 11 18/25 Vérification visuelle Y a‐t‐il un lien? Nombre de passagers par mois à l'aéroport Montréal‐Trudeau 1150000 1100000 1050000 1000000 950000 900000 850000 800000 62 64 66 68 70 72 74 76 78 Humidité relative (%) par mois SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 9 Cours 11 - Statistiques inférentielles 27 mars 2015 SCI6060 (Hiver 2015) Cours 11 19/25 Vérification visuelle Y a‐t‐il un lien? Température moyenne (C°) par mois 25 20 15 10 5 0 ‐5 ‐10 ‐15 0 50 100 150 200 250 300 Nombre d'heures d'ensoleillement par mois SCI6060 (Hiver 2015) Cours 11 20/25 Vérification chiffrée : Coefficients de corrélation précipi‐ tations (mm) précipitations (mm) ensoleillement (heures) humidité relative (%) vitesse du vent (km/h) température moyenne (C°) demandes d'info à des comptoirs touristiques à Montréal nbre de passagers à l'aéroport Montréal‐ Trudeau taux d'occupation des hôtels de Montréal (%) ensoleil‐ lement (heures) tempé‐ humidité vitesse du rature relative vent moyen‐ (%) (km/h) ne (C°) demandes nbre de taux d'info à des passagers à d'occupation comptoirs l'aéroport des hôtels de touristiques Montréal‐ Montréal à Montréal Trudeau (%) 1,0 0,3 1,0 0,4 ‐0,5 1,0 ‐0,6 ‐0,8 0,0 1,0 0,6 0,8 ‐0,3 ‐0,9 1,0 0,6 0,9 ‐0,1 ‐0,9 0,9 1,0 0,4 0,9 ‐0,2 ‐0,8 0,7 0,9 1,0 0,5 0,7 ‐0,2 ‐0,8 0,9 0,8 0,6 SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 1,0 10 Cours 11 - Statistiques inférentielles 27 mars 2015 SCI6060 (Hiver 2015) Cours 11 21/25 Existence d’un lien entre deux variables : quantification mathématique du lien Analyse de régression linéaire simple B SCI6060 (Hiver 2015) Cours 11 22/25 y = -2,4916x + 24,524 r = ‐0,8 relation Sens = inverseinverse (pente négative) Corrélation = très forte corrélation forte (r=-0,79) SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 11 Cours 11 - Statistiques inférentielles C 27 mars 2015 SCI6060 (Hiver 2015) Cours 11 23/25 relation directe (pente positive) r = 1 Sens = direct corrélation très forte (r=0,97) Corrélation = très forte y = 90854x - 207,47 E SCI6060 (Hiver 2015) Cours 11 24/25 r = 1 relation directe (pente positive) Sens = direct corrélation très forte (r=0,98) Corrélation = très forte y = 2,9856x + 4,4104 SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 12 Cours 11 - Statistiques inférentielles G 27 mars 2015 SCI6060 (Hiver 2015) Cours 11 25/25 y = -13457x + 32,444 r = ‐0,9 relation Sens = inverseinverse (pente négative) Corrélation = très forte corrélation très forte (r=-0,93) SCI6060 - Christine Dufour & Vincent Larivière (Hiver 2015) 13