שיעור 2 (השלמות) על מתאם

Transcription

שיעור 2 (השלמות) על מתאם
‫מתאם ‪-‬‬
‫קורלציה‬
‫‪1‬‬
‫מתאם פירסון בודק‪ :‬האם יש קשר לינארי‬
‫בין שני משתנים ‪ ,‬ואם כן‪ ,‬מה עוצמתו וכוונו‬
‫אך אם אכן קשר כזה מתקיים‪ ,‬מה נוכל‬
‫להפיק ממנו?‬
‫‪2‬‬
‫אופי הקשר בין המשתנים ‪-‬‬
‫‪33‬‬
‫חוזק הקשר בין המשתנים‬
‫‪-‬‬
‫‪44‬‬
‫ככל שענן ההתפלגות מרוכז יותר‪ ,‬הקשר חזק יותר‬
‫דיאגרמת פיזור להצגת קשר בין שני משתנים‬
‫שלב ראשון ‪ -‬הצגה גראפית של ההתפלגויות‬
‫המשותפות של המשתנים כדי לוודא שאנחנו עומדים‬
‫מול קשר ליניארי‪.‬‬
‫הדרך הטובה ביותר להצגה גראפית של קשר בין‬
‫משתנים אינטרוווליים ומעלה‪:‬‬
‫‪.scatterplots‬‬
‫‪5‬‬
‫‪5‬‬
‫גרף המתאר קשר בין שני המשתנים –‬
‫מה מראה גרף שכזה?‬
‫‬‫‬‫‪-‬‬
‫‪6‬‬
‫ערכי המשתנה הבלתי תלוי מופיעים על הציר האופקי (‪)X‬‬
‫ערכי המשתנה התלוי מופיעים על הציר האנכי (‪)Y‬‬
‫כל המקרים מוצגים על הגרף כנקודות על פי ערכיהם על שני המשתנים‬
‫קשר בין ‪ X‬ל‪Y-‬‬
‫‪80‬‬
‫סביר להתייחס‬
‫אל הקשר כאל‬
‫קשר ליניארי‬
‫‪70‬‬
‫‪50‬‬
‫‪40‬‬
‫‪30‬‬
‫‪9‬‬
‫‪7‬‬
‫‪8‬‬
‫‪7‬‬
‫‪6‬‬
‫‪5‬‬
‫‪4‬‬
‫‪Height‬‬
‫‪X‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Drug‬‬
‫‪Y Weight‬‬
‫‪60‬‬
‫דוגמא‬
‫‪ ‬להלן ציוני ‪ 6‬תלמידים בלשון(‪ )X‬ובמתמטיקה (‪:)Y‬‬
‫‪8‬‬
‫מתימטיקה‬
‫עברית‬
‫‪xi  x‬‬
‫‪6‬‬
‫‪7‬‬
‫‪7‬‬
‫‪9‬‬
‫‪9‬‬
‫‪10‬‬
‫‪5‬‬
‫‪4‬‬
‫‪5‬‬
‫‪5‬‬
‫‪8‬‬
‫‪6‬‬
‫‪-2‬‬
‫‪-1‬‬
‫‪-1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪2‬‬
‫‪x 8‬‬
‫‪y  5.5‬‬
‫‪( yi  y) 2 ( xi  x) 2 ( xi  x)( yi  y) yi  y‬‬
‫‪-0.5‬‬
‫‪-1.5‬‬
‫‪-0.5‬‬
‫‪-0.5‬‬
‫‪2.5‬‬
‫‪0.5‬‬
‫‪1‬‬
‫‪1.5‬‬
‫‪0.5‬‬
‫‪-0.5‬‬
‫‪2.5‬‬
‫‪1‬‬
‫‪4‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪4‬‬
‫‪  12   6‬‬
‫‪0.25‬‬
‫‪2.25‬‬
‫‪0.25‬‬
‫‪0.25‬‬
‫‪6.25‬‬
‫‪0.25‬‬
‫‪  9.5‬‬
‫נוסחת המתאם‬
n
rxy 
 ( x  x)( y
i 1
i
i
 y)
nsx s y
1  r  1
9
‫גודל המתאם‬
‫‪ ‬המתאם נע בין ‪ -1‬ל‪. +1 -‬‬
‫‪ ‬פרשנות לגודל המתאם‬
‫המתאם‬
‫נמוך‬
‫בינוני‬
‫גבוה‬
‫שלילי‬
‫‪ -0.29‬עד ‪-0.10‬‬
‫‪ -0.49‬עד ‪-0.30‬‬
‫‪ -1.00‬עד ‪-0.50‬‬
‫חיובי‬
‫‪ 00.10‬עד ‪0.29‬‬
‫‪ 0.30‬עד ‪0.49‬‬
‫‪ 0.50‬עד ‪1.00‬‬
‫שונות מוסברת‬
‫מה מסביר את השונות במשתנה המנובא?‬
‫‪ ‬לאובייקטים שונים ערכי ‪ Y‬שונים‬
‫‪ ‬מה קובע את המרחק שלהם מהממוצע?‬
‫‪ ‬אם אין קשר בין ‪ X‬ל –‪– Y‬‬
‫‪ X ‬לא מסביר את הפיזור של ‪Y‬‬
‫‪ ‬ננבא את הממוצע של ‪ Y‬לכל ערך ‪X‬‬
‫מה מסביר את השונות במשתנה המנובא?‬
‫‪ ‬אם יש קשר – אפשר יהיה להסביר באמצעות השונות של ‪X‬‬
‫את הפיזור של ‪Y‬‬
‫אחוז השונות המוסברת‬
‫‪ - R 2 ‬אחוז השונות המוסברת מאפשר לנו לדעת כמה‬
‫מהשונות של המשתנה התלוי מוסברת ע"י המשתנה‪ /‬משתנים‬
‫בלתי תלויים‪.‬‬
‫‪ ‬ככל שאחוז השונות המוסברת גבוה יותר‪ ,‬פירושו של דבר ש‪X-‬‬
‫עוזר לנו בניבוי ‪Y‬‬
‫‪14‬‬
‫אחוז השונות המוסברת‬
‫‪ ‬מה זה ‪ ?r2‬זהו ריבוע המתאם‪.‬‬
‫השונות המוסברת (‪ )explained variance‬מתוך השונות הכללית‪.‬‬
‫‪ ‬טווח הערכים של ‪ r2‬בין אפס לאחד‬
‫‪ ‬אפשר להכפיל פי ‪ 100‬ולקבל אחוז השונות המוסברת‬
‫‪ ‬החלק היחסי של השונות הלא מוסברת ‪1 - r2 -‬‬
‫‪15‬‬
‫וכן‪ ,‬יש קשר הדוק ל‪ R-‬של פירסון‬
‫‪ ‬אם נוציא שורש נקבל את מקדם המתאם‬
‫‪r2= 0.3157 ‬‬
‫‪r= 0.56 ‬‬
‫‪ ‬לדוגמא‪ :‬ידוע לנו כי הקשר בין השכלה (בלתי תלוי) לעמדות ליברליות‬
‫(תלוי) הוא ‪.0.7‬‬
‫אחוז השונות המוסברת הוא ‪ .49%‬כך שהשכלה מסבירה ‪ 49%‬מהשוני‬
‫בעמדות הליברליות בין נחקרים‪(.‬את יתר ‪ 51%‬מסבירים משתנים אחרים‪:‬‬
‫אולי גיל‪ ,‬אולי מידת מסורתיות וכו')‪.‬‬
‫‪16‬‬