יחידת מיקוד - רגרסיה ליניארית מרובה

Transcription

יחידת מיקוד - רגרסיה ליניארית מרובה
‫יחידת מיקוד ‪ -‬רגרסיה ליניארית מרובה‬
‫הקדמה‪ -‬רגרסיה מרובה בבחינת המתא"ם‬
‫חשוב לציין כי עד היום לא נדרש ידע מעמיק ברגרסיה מרובה בבחינת המתא"ם‪ .‬לכן יש לראות בנושא זה בכלל‪ ,‬וביחידה זו בפרט‪,‬‬
‫הרחבה והעשרה שנועדו לחזק את ההבנה של נושא מתאם ורגרסיה‪ ,‬כמו גם של נושאים מתקדמים יותר בשיטות מחקר‪ ,‬ובעיקר‬
‫מהימנות ותוקף כלי המדידה‪.‬‬
‫מהי רגרסיה מרובה?‬
‫רגרסיה מרובה נועדה לנבא משתנה מנובא מסויים (הנקרא גם קריטריון) בעזרת יותר ממשתנה מנבא אחד‪.‬‬
‫דוגמא‪:‬‬
‫בצה"ל רוצים לנבא מי יהיה " קצין טוב" ויעבור את קורס הקצינים בציון גבוה‪ .‬לצורך הניבוי מקים צה"ל "סוללת מיון" הכוללת ‪3‬‬
‫מבחנים‪ ,‬בכל אחד מהם מקבל המועמד ציון‪ :‬ראיון אישי‪ ,‬מבחן קוגניטיבי ודינאמיקה קבוצתית‪ .‬בניתוח הרגרסיה המרובה‪ ,‬ציוני‬
‫שלושת המבחנים ישמשו משתנים מנבאים לניבוי הקריטריון‪ -‬מידת ההצלחה בקורס הקצינים‪.‬‬
‫למה צריך יותר ממשתנה מנבא אחד?‬
‫בדרך כלל קשרים בין משתנים אינם מלאים‪ ,‬ולכן משתנה אחד אינו מסביר את כלל השונות במשתנה השני‪ ,‬דבר המוביל ליכולת ניבוי‬
‫חלקית‪ .‬במצבים אלה ניתן לשפר את יכולת הניבוי על ידי הוספת משתנים מנבאים נוספים שיסייעו להסביר חלקים נוספים בשונות‬
‫המשתנה המנובא‪.‬‬
‫ה שיפור ביכולת הניבוי נובע בדרך כלל מכך שהמנבאים הנוספים מתייחסים להיבטים של המשתנה המנובא‪ ,‬שלא זכו להתייחסות‬
‫באמצעות המנבא הראשון‪ .‬ברמה סטטיסטית יותר‪ ,‬המשתנים הנוספים "קשורים"‪ ,‬לפחות חלקית‪ ,‬לחלקים אחרים בשונות המשתנה‬
‫המנובא‪.‬‬
‫נמחיש באמצעות הדוגמא‪:‬‬
‫הציון בר איון מתייחס להיבטים אישיותיים המסבירים חלק מהשונות בין קצינים‪ ,‬הדינמיקה הקבוצתית מסייעת בניבוי היבטים בין‪-‬‬
‫אישיים‪ ,‬והציון במבחן הקוגניטיבי מתייחס להיבטים שכליים המסבירים גם הם חלקים אחרים בשונות בין קצינים‪ .‬כל אחד מהמשתנים‬
‫בנפרד מסביר רק חלק מהשונות בין קצי נים (בעצם הם מסבירים חלקים קצת שונים בשונות המשתנה "קצין טוב")‪ .‬שילוב המשתנים‬
‫יהיה יעיל יותר בהסבר כלל השונות בין קצינים‪ ,‬ובשונות המשתנה "קצין טוב"‪.‬‬
‫פתרונות – קורס ההכנה הראשון בישראל לבחינת המתא"ם‬
‫‪www.pitronot.org‬‬
‫שיקולים בבחירת משתנים מנבאים‬
‫שאלה‪:‬‬
‫נניח כי אנו מעוניינים בצירוף משתנה רביעי שיסייע בניבוי ההצלחה בקו רס הקצינים‪ .‬ביכולתנו להשתמש בציוני מבחן כושר גופני או‬
‫בציוני מבחן רורשך‪ .‬במה נבחר?‬
‫שאלה זו קשורה לשיקולים בבחירת משתנים מנבאים ברגרסיה מרובה‪ .‬בעת בחירת משתנים אלה אנו מחפשים את המשתנה‬
‫שתרומתו או "יעילותו" בניתוח הרגרסיה המרובה תהיה הגבוהה ביותר‪ ,‬או במילי ם אחרות‪ ,‬את המשתנה שישפר בצורה המשמעותית‬
‫ביותר את יכולת הניבוי שלנו‪ .‬מהם‪ ,‬אם כן‪ ,‬שיקולים אלה?‬
‫על מנת לבחור במנבאים שיגדילו את יכולת הניבוי יש לקחת בחשבון שני גורמים‪:‬‬
‫‪.1‬‬
‫המתאם בין המשתנה המנבא לקריטריון‪ :‬כמובן שחייב להיות קשר בין המשתנה המנבא לקריטריון‪,‬שיאפשר יכולת ניבוי‪ .‬בגדול‪,‬‬
‫ככל שקשר זה חזק יותר המשתנה המנבא יהיה "מועיל" יותר בניתוח הרגרסיה המרובה‪.‬‬
‫‪.2‬‬
‫המתאם בין המשתנה המנבא למשתנים המנבאים האחרים‪ :‬כאמור‪ ,‬הסיבה להוספת משתנים מנבאים היא הרצון להסביר חלקים‬
‫שונים בשונות הקריטריון הכללית (למשל השונות בין קצינים)‪ .‬הקשר בין המשתנים המנבאים לבין עצמם הוא משמעותי בהקשר‬
‫זה‪ ,‬כפי שנסביר מייד‪ .‬בגדול‪ ,‬ככל שהמתאם בין משתנה מנבא למשתנים מנבאים אחרים הוא קטן יותר המשתנה המנבא יהיה‬
‫"מועיל" יותר בניתוח הרגרסיה המרובה‪.‬‬
‫נחזור לשאלה‪:‬‬
‫אנו מתלבטים בין ציוני מבחן כושר גופני לציוני מב חן רורשך כמשתנה מנבא נוסף בניתוח‪ .‬נניח כי המתאם בין כל אחד ממשתנים אלה‬
‫לבין הקריטריון זהה‪ .‬באיזה מהם נבחר? ובכן‪ ,‬סביר להניח כי כדאי לנו לבחור במשתנה הכושר הגופני‪ .‬מבחן רורשך הוא מבחן‬
‫אישיותי‪ ,‬סביר להניח כי המתאם בינו לבין משתני הראיון והדינמיקה הקבוצתית הו א גבוה וכי הם מכסים חלקים חופפים בשונות‬
‫המשתנה "קצין טוב"‪ .‬הוספת הרורשך לניתוח הרגרסיה המרובה לא תתרום במקרה זה רבות לניבוי שכבר קיים באמצעות המשתנים‬
‫האחרים‪ .‬הכושר הגופני לעומת זאת אינו קשור ליתר המשתנים המנבאים‪ ,‬והמתאם בינו לבינם הוא נמוך‪ .‬משתנה זה מכסה חלק‬
‫אחר בשונות המשתנה "קצין טוב" ולכן הוספת משתנה זה לניתוח הרגרסיה עשויה לתרום משמעותית ליכולת הניבוי‪.‬‬
‫המחשה מספרית וגרפית‬
‫א‪ .‬כושר גופני‪:‬‬
‫נניח שמקדם המתאם הפשוט בין ציון הכושר הגופני (‪ )x1‬לבין הציון בקורס הקצינים (‪ )y‬הוא‪:‬‬
‫‪ 0.6‬‬
‫‪r‬‬
‫)‪. ( y, x1‬‬
‫מכאן ששונות המשתנה "קצין טוב" המוסברת על ידי מבחן הכושר היא‪ 100  0.36  100  36% :‬‬
‫)‪( y , x1‬‬
‫‪2‬‬
‫‪.r‬‬
‫כמו כן ידוע שהקשר בין ציון הכושר הגופני ( ‪ )x‬לבין שאר המשתנים המנבאים*‪ ,‬אותם נסמן כ‪ x -‬הוא‪r( xM , x1)  0.2 :‬‬
‫‪M‬‬
‫‪1‬‬
‫מכאן ששונות המשתנים המנבאים המוסברת על ידי מבחן הכושר היא‪100  0.04 100  4% :‬‬
‫)‪( xM , x1‬‬
‫פתרונות – קורס ההכנה הראשון בישראל לבחינת המתא"ם‬
‫‪www.pitronot.org‬‬
‫‪2‬‬
‫‪.r‬‬
‫‪.‬‬
‫ב‪ .‬מבחן רורשך‪:‬‬
‫ידוע שגם הקשר בין ציון הרורשך (‪ )x2‬לבין ציון קורס הקצינים (‪ )y‬הוא‪:‬‬
‫‪ 0.6‬‬
‫‪r‬‬
‫)‪. ( y, x 2‬‬
‫לכן שונות המשתנה "קצין טוב" המוסברת על ידי ציון הרורשך היא‪ 100  0.36  100  36% :‬‬
‫)‪( y , x1‬‬
‫‪2‬‬
‫‪.r‬‬
‫כמו כן ידוע שהקשר בין ציון הרורשך ( ‪ )x‬לבין שאר המשתנים המנבאים*‪ ,‬אותם נסמן כ‪ x -‬הוא‪r( xM , x 2)  0.8 :‬‬
‫‪M‬‬
‫‪2‬‬
‫מכאן ששונות המשתנים המנבאים המוסברת על ידי מבחן הרורשך היא‪100  0.64 100  64% :‬‬
‫)‪( xM , x1‬‬
‫‪2‬‬
‫‪.‬‬
‫‪.r‬‬
‫*לצורך הפשטות לא נסביר בשלב זה את אופן החישוב של נתונים אלה‪ ,‬המסומנים בכוכבית‪ ,‬אלא נניח כי הם ידועים לנו‪.‬‬
‫נמחיש נתונים אלה בתרשימים‪:‬‬
‫תרשים א'‬
‫כושר גופני‬
‫תרשים ב'‬
‫רורשך‬
‫ציון קורס קצינים ‪Y‬‬
‫יתר המשתנים‬
‫המנבאים‬
‫‪XM‬‬
‫כושר‬
‫גופני‬
‫‪1X‬‬
‫ציון קורס קצינים ‪Y‬‬
‫רורשך‬
‫‪2X‬‬
‫יתר המשתנים‬
‫המנבאים‬
‫‪XM‬‬
‫כפי שניתן לראות מהתרשימים‪ ,‬כל אחד מהמשתנים המנבאים מסביר חלק זהה בשונות הקריטריון‪ ,‬ובכ"ז השונות הכללית המוסברת‬
‫באמצעות תוספת המשתנה שונה‪:‬‬
‫בתרשים א'‪ ,‬קיים קשר חלש בין המשתנים המנבאים (מיוצג ע"י החפיפה המועטה בין הכחול לאדום)‪ .‬מכיוון שכך‪ ,‬ניתן לראות שכל‬
‫אחד מהמשתנים מכסה או מסביר חלקים שונים בשונות המשתנה המנובא (הקריטריון)‪ ,‬ובסה"כ השילוב בין שניהם מסביר חלק גדול‬
‫יחסית משונות הקריטריון (השילוב מיוצג ע"י כלל השטח הצבעוני‪ -‬אדום‪ ,‬כחול‪ ,‬סגול בתוך העיגול הלבן)‪ .‬ניתן לומר כי יעילות‬
‫המשתנה "כושר גופני" או תרומתו ליכולת הניבוי גדולה יחסית במצב זה‪.‬‬
‫בתרשים ב'‪ ,‬קיים קשר חזק בין המשתנים המנבאים (מיוצג ע"י החפיפה הרבה בין הכחול לאדום)‪ .‬מכיוון שכך‪ ,‬ניתן לראות‬
‫שהמשתנים מכסים או מסבירים חלקים דומים יחסית בשו נות המשתנה המנובא (הקריטריון)‪ ,‬ובסה"כ השילוב בין שניהם מסביר חלק‬
‫שאינו גדול בהרבה מאותו חלק בשונות הקריטריון שהסבירו יתר המשתנים המנובאים גם לפני תוספת משתנה הרורשך (השילוב‬
‫מיוצג ע"י כלל השטח הצבעוני‪ -‬אדום‪ ,‬כחול‪ ,‬סגול בתוך העיגול הלבן‪ .‬ניתן לראות ששטח זה קטן משמעותית ביחס לתרשים א')‪ .‬ניתן‬
‫לומר כי יעילות המשתנה "רורשך"‪ ,‬או תרומתו ליכולת הניבוי קטנה יחסית במצב זה‪.‬‬
‫פתרונות – קורס ההכנה הראשון בישראל לבחינת המתא"ם‬
‫‪www.pitronot.org‬‬
‫סיכום‪ -‬מהו משתנה מנבא טוב ברגרסיה מרובה?‬
‫כפי שאמרנו והסברנו בחלק זה‪ ,‬משתנה מנבא טוב ברגרסיה מרובה הוא משתנה שהמתאם בינו לבין הקריטריון הוא גבוה ככל‬
‫האפשר והמתאם בינו לבין יתר המשתנים הוא קטן ככל האפשר‪.‬‬
‫חישוב מקדם המתאם המרובה‪:‬‬
‫נוסחת מקדם המתאם המרובה‪:‬‬
‫נוסחה זו הנה הנוסחה הבסיסית לחישוב מקדם המתאם המרובה‪ .‬היא מבוססת על המתאמים הפנימיים בין המנבאים והמתאמים‬
‫בינם לבין הקריטריון (בנוסחא זו שני מנבאים ‪ 1‬ו‪ 2-‬והיא הבסיס לנוסחא בה יותר מנבאים)‪:‬‬
‫‪ry21  ry22  2  ry1  ry 2  r12‬‬
‫‪2‬‬
‫‪1  r12‬‬
‫‪‬‬
‫‪R y2.12‬‬
‫ניתן לסכם אם כן ולומר כי שני הגורמים‪ -‬המתאם בין המנבאים לקריטריון והמתאם בין המנבאים לבין עצמם‪ -‬משפיעים בכיוונים שונים‬
‫על תוצאת הנוסחה‪ .‬ככל שמצד אחד יגדלו המתאמים הנפרדים ומצד שני יקטן המתאם בין המנבאים‪ ,‬תוצאת הנוסחה‪ ,‬ולכן מקדם‬
‫המתאם המרובה‪ ,‬יהיו גדולים יותר‪.‬‬
‫כמו ברגרסיה פשוטה‪ ,‬המתאם המרובה בריבוע מייצג את אחוז השונות המוסברת מהמשתנה המנובא‪ .‬חשוב לשים לב‪ ,‬כי לרוב‬
‫המתאם המרובה בריבוע לא שווה לסכום המתאמים המרובעים של כל משתנה מנבא עם המשתנה המנובא בנפרד‪ ,‬מלבד המקרה‬
‫יוצא הדופן בו אין כלל מתאם בין המשתנים המנבאים‪ .‬במקרה קיצון זה‪ ,‬המתאם המרובה בריבוע יהיה שווה לסכום המתאמים‬
‫המרובעים של כל משתנה בנפרד‪.‬‬
‫משוואת הרגרסיה המרובה‪:‬‬
‫כמו ברגרסיה פשוטה‪ ,‬גם ברגרסיה מרובה ניתן ליצור נוסחה שתאפשר ניבוי הקריטר יון (בדוגמה שלנו ציון קורס קצינים)‪ ,‬מתוך שילוב‬
‫כלל המשתנים המנבאים‪ .‬להלן משוואת הרגרסיה המרובה עבור ‪ i‬משתנים מנבאים‪:‬‬
‫~‬
‫‪y  b1 x1 b2 x2  bi xi...  a‬‬
‫פתרונות – קורס ההכנה הראשון בישראל לבחינת המתא"ם‬
‫‪www.pitronot.org‬‬
‫במקרה זה לכל אחד מערכי המשתנים המנבאים‪ ,‬יינתן מקדם שיפוע המתאים לו‪ ,‬הקרוי בטא ‪ .‬לאחר כפל ערכי כל אחד מהמשתנים‬
‫המנבא ים במקדם השיפוע המתאים לו‪ ,‬וסכימת המכפלות‪ ,‬יש להוסיף קבוע (כמו במשוואת הרגרסיה הפשוטה)‪ .‬מקדמי השיפוע עבור‬
‫כל אחד מהמנבאים מושפעים ממספר גורמים‪ :‬יחידות המדידה של המשתנים‪ ,‬סטיות התקן שלהם‪ ,‬ועוצמת המתאמים בין המשתנים‪.‬‬
‫כל מקדם שיפוע מייצג את השינוי במנובא עבור כל שינוי של יחידה באותו מנבא‪ ,‬כאשר כל שאר המנבאים מוחזקים קבועים‪ .‬כלומר‪,‬‬
‫ההשפעה הייחודית של כל מנבא‪ .‬בניגוד לרגרסיה פשוטה‪ ,‬לא ניתן להסיק על כיוון הקשר בין משתנה מנבא יחיד למשתנה המנובא‬
‫מתוך מקדם השיפוע בטא‪ .‬כמו כן‪ ,‬על כיוון הקשר בין המנבאים עצמם ניתן להסיק מתוך בטא רק כשהקשר מושלם‪ .‬בדומה לרגרסיה‬
‫פשוטה‪ ,‬קו הרגרסיה של מתאם מרובה גם הוא נענה לקריטריון הריבועים הפחותים‪ .‬כלומר‪ ,‬סכום הסטיות של הערכים האמיתיים של‬
‫‪( Y‬המשתנה המנובא) מהקו שווה לאפס‪ ,‬וסכום ריבועי הסטיות של הערכים האמיתיים של ‪ Y‬מהקו הוא מינימלי‪.‬‬
‫*אופ ן החישוב אינו משמעותי להבנה‪ ,‬משום שהוא סטטיסטי בעיקרו‪ ,‬ואינו שייך לחומר הלימוד של תואר ראשון בפסיכולוגיה‪ ,‬ולכן לא‬
‫נעסוק בו ביחידה זו‪.‬‬
‫לסיכום‪ :‬מהי רגרסיה מרובה ומה חשוב לזכור ביחס אליה?‬
‫רגרסיה מרובה משמשת למצב בו סביר להניח ששימוש ביותר ממשתנה מנבא אחד ישפ ר את יעילות הניבוי של משתנה מנובא‬
‫(קריטריון) מסוים‪.‬‬
‫בעת בחירת המשתנים המנבאים המרובים‪ ,‬יש לשאוף לבחור במשתנים הקשורים באופן חזק למשתנה המנובא‪ ,‬ואינם קשורים‬
‫ביניהם‪.‬‬
‫את עוצמת הקשר‪ ,‬או מידת הודאות בניבוי‪ ,‬ניתן לחשב על ידי שימוש בנוסחת מקדם המתאם המרובה‪.‬‬
‫את הניבוי עצמו‪ ,‬כלומר ערך ספציפי המנובא ע"ב מספר משתנים מנבאים‪ ,‬ניתן לחשב מתוך משוואת הרגרסיה המרובה‪ ,‬המאופיינת‬
‫במקדם שיפוע נפרד לערכי כל אחד מהמשתנים המנבאים‪.‬‬
‫פתרונות – קורס ההכנה הראשון בישראל לבחינת המתא"ם‬
‫‪www.pitronot.org‬‬