שיעור 2 (השלמות) על מתאם
Transcription
שיעור 2 (השלמות) על מתאם
מתאם - קורלציה 1 מתאם פירסון בודק :האם יש קשר לינארי בין שני משתנים ,ואם כן ,מה עוצמתו וכוונו אך אם אכן קשר כזה מתקיים ,מה נוכל להפיק ממנו? 2 אופי הקשר בין המשתנים - 33 חוזק הקשר בין המשתנים - 44 ככל שענן ההתפלגות מרוכז יותר ,הקשר חזק יותר דיאגרמת פיזור להצגת קשר בין שני משתנים שלב ראשון -הצגה גראפית של ההתפלגויות המשותפות של המשתנים כדי לוודא שאנחנו עומדים מול קשר ליניארי. הדרך הטובה ביותר להצגה גראפית של קשר בין משתנים אינטרוווליים ומעלה: .scatterplots 5 5 גרף המתאר קשר בין שני המשתנים – מה מראה גרף שכזה? - 6 ערכי המשתנה הבלתי תלוי מופיעים על הציר האופקי ()X ערכי המשתנה התלוי מופיעים על הציר האנכי ()Y כל המקרים מוצגים על הגרף כנקודות על פי ערכיהם על שני המשתנים קשר בין XלY- 80 סביר להתייחס אל הקשר כאל קשר ליניארי 70 50 40 30 9 7 8 7 6 5 4 Height X 3 2 1 Drug Y Weight 60 דוגמא להלן ציוני 6תלמידים בלשון( )Xובמתמטיקה (:)Y 8 מתימטיקה עברית xi x 6 7 7 9 9 10 5 4 5 5 8 6 -2 -1 -1 1 1 2 x 8 y 5.5 ( yi y) 2 ( xi x) 2 ( xi x)( yi y) yi y -0.5 -1.5 -0.5 -0.5 2.5 0.5 1 1.5 0.5 -0.5 2.5 1 4 1 1 1 1 4 12 6 0.25 2.25 0.25 0.25 6.25 0.25 9.5 נוסחת המתאם n rxy ( x x)( y i 1 i i y) nsx s y 1 r 1 9 גודל המתאם המתאם נע בין -1ל. +1 - פרשנות לגודל המתאם המתאם נמוך בינוני גבוה שלילי -0.29עד -0.10 -0.49עד -0.30 -1.00עד -0.50 חיובי 00.10עד 0.29 0.30עד 0.49 0.50עד 1.00 שונות מוסברת מה מסביר את השונות במשתנה המנובא? לאובייקטים שונים ערכי Yשונים מה קובע את המרחק שלהם מהממוצע? אם אין קשר בין Xל –– Y X לא מסביר את הפיזור של Y ננבא את הממוצע של Yלכל ערך X מה מסביר את השונות במשתנה המנובא? אם יש קשר – אפשר יהיה להסביר באמצעות השונות של X את הפיזור של Y אחוז השונות המוסברת - R 2 אחוז השונות המוסברת מאפשר לנו לדעת כמה מהשונות של המשתנה התלוי מוסברת ע"י המשתנה /משתנים בלתי תלויים. ככל שאחוז השונות המוסברת גבוה יותר ,פירושו של דבר שX- עוזר לנו בניבוי Y 14 אחוז השונות המוסברת מה זה ?r2זהו ריבוע המתאם. השונות המוסברת ( )explained varianceמתוך השונות הכללית. טווח הערכים של r2בין אפס לאחד אפשר להכפיל פי 100ולקבל אחוז השונות המוסברת החלק היחסי של השונות הלא מוסברת 1 - r2 - 15 וכן ,יש קשר הדוק ל R-של פירסון אם נוציא שורש נקבל את מקדם המתאם r2= 0.3157 r= 0.56 לדוגמא :ידוע לנו כי הקשר בין השכלה (בלתי תלוי) לעמדות ליברליות (תלוי) הוא .0.7 אחוז השונות המוסברת הוא .49%כך שהשכלה מסבירה 49%מהשוני בעמדות הליברליות בין נחקרים(.את יתר 51%מסבירים משתנים אחרים: אולי גיל ,אולי מידת מסורתיות וכו'). 16