יחידת מיקוד - רגרסיה ליניארית מרובה
Transcription
יחידת מיקוד - רגרסיה ליניארית מרובה
יחידת מיקוד -רגרסיה ליניארית מרובה הקדמה -רגרסיה מרובה בבחינת המתא"ם חשוב לציין כי עד היום לא נדרש ידע מעמיק ברגרסיה מרובה בבחינת המתא"ם .לכן יש לראות בנושא זה בכלל ,וביחידה זו בפרט, הרחבה והעשרה שנועדו לחזק את ההבנה של נושא מתאם ורגרסיה ,כמו גם של נושאים מתקדמים יותר בשיטות מחקר ,ובעיקר מהימנות ותוקף כלי המדידה. מהי רגרסיה מרובה? רגרסיה מרובה נועדה לנבא משתנה מנובא מסויים (הנקרא גם קריטריון) בעזרת יותר ממשתנה מנבא אחד. דוגמא: בצה"ל רוצים לנבא מי יהיה " קצין טוב" ויעבור את קורס הקצינים בציון גבוה .לצורך הניבוי מקים צה"ל "סוללת מיון" הכוללת 3 מבחנים ,בכל אחד מהם מקבל המועמד ציון :ראיון אישי ,מבחן קוגניטיבי ודינאמיקה קבוצתית .בניתוח הרגרסיה המרובה ,ציוני שלושת המבחנים ישמשו משתנים מנבאים לניבוי הקריטריון -מידת ההצלחה בקורס הקצינים. למה צריך יותר ממשתנה מנבא אחד? בדרך כלל קשרים בין משתנים אינם מלאים ,ולכן משתנה אחד אינו מסביר את כלל השונות במשתנה השני ,דבר המוביל ליכולת ניבוי חלקית .במצבים אלה ניתן לשפר את יכולת הניבוי על ידי הוספת משתנים מנבאים נוספים שיסייעו להסביר חלקים נוספים בשונות המשתנה המנובא. ה שיפור ביכולת הניבוי נובע בדרך כלל מכך שהמנבאים הנוספים מתייחסים להיבטים של המשתנה המנובא ,שלא זכו להתייחסות באמצעות המנבא הראשון .ברמה סטטיסטית יותר ,המשתנים הנוספים "קשורים" ,לפחות חלקית ,לחלקים אחרים בשונות המשתנה המנובא. נמחיש באמצעות הדוגמא: הציון בר איון מתייחס להיבטים אישיותיים המסבירים חלק מהשונות בין קצינים ,הדינמיקה הקבוצתית מסייעת בניבוי היבטים בין- אישיים ,והציון במבחן הקוגניטיבי מתייחס להיבטים שכליים המסבירים גם הם חלקים אחרים בשונות בין קצינים .כל אחד מהמשתנים בנפרד מסביר רק חלק מהשונות בין קצי נים (בעצם הם מסבירים חלקים קצת שונים בשונות המשתנה "קצין טוב") .שילוב המשתנים יהיה יעיל יותר בהסבר כלל השונות בין קצינים ,ובשונות המשתנה "קצין טוב". פתרונות – קורס ההכנה הראשון בישראל לבחינת המתא"ם www.pitronot.org שיקולים בבחירת משתנים מנבאים שאלה: נניח כי אנו מעוניינים בצירוף משתנה רביעי שיסייע בניבוי ההצלחה בקו רס הקצינים .ביכולתנו להשתמש בציוני מבחן כושר גופני או בציוני מבחן רורשך .במה נבחר? שאלה זו קשורה לשיקולים בבחירת משתנים מנבאים ברגרסיה מרובה .בעת בחירת משתנים אלה אנו מחפשים את המשתנה שתרומתו או "יעילותו" בניתוח הרגרסיה המרובה תהיה הגבוהה ביותר ,או במילי ם אחרות ,את המשתנה שישפר בצורה המשמעותית ביותר את יכולת הניבוי שלנו .מהם ,אם כן ,שיקולים אלה? על מנת לבחור במנבאים שיגדילו את יכולת הניבוי יש לקחת בחשבון שני גורמים: .1 המתאם בין המשתנה המנבא לקריטריון :כמובן שחייב להיות קשר בין המשתנה המנבא לקריטריון,שיאפשר יכולת ניבוי .בגדול, ככל שקשר זה חזק יותר המשתנה המנבא יהיה "מועיל" יותר בניתוח הרגרסיה המרובה. .2 המתאם בין המשתנה המנבא למשתנים המנבאים האחרים :כאמור ,הסיבה להוספת משתנים מנבאים היא הרצון להסביר חלקים שונים בשונות הקריטריון הכללית (למשל השונות בין קצינים) .הקשר בין המשתנים המנבאים לבין עצמם הוא משמעותי בהקשר זה ,כפי שנסביר מייד .בגדול ,ככל שהמתאם בין משתנה מנבא למשתנים מנבאים אחרים הוא קטן יותר המשתנה המנבא יהיה "מועיל" יותר בניתוח הרגרסיה המרובה. נחזור לשאלה: אנו מתלבטים בין ציוני מבחן כושר גופני לציוני מב חן רורשך כמשתנה מנבא נוסף בניתוח .נניח כי המתאם בין כל אחד ממשתנים אלה לבין הקריטריון זהה .באיזה מהם נבחר? ובכן ,סביר להניח כי כדאי לנו לבחור במשתנה הכושר הגופני .מבחן רורשך הוא מבחן אישיותי ,סביר להניח כי המתאם בינו לבין משתני הראיון והדינמיקה הקבוצתית הו א גבוה וכי הם מכסים חלקים חופפים בשונות המשתנה "קצין טוב" .הוספת הרורשך לניתוח הרגרסיה המרובה לא תתרום במקרה זה רבות לניבוי שכבר קיים באמצעות המשתנים האחרים .הכושר הגופני לעומת זאת אינו קשור ליתר המשתנים המנבאים ,והמתאם בינו לבינם הוא נמוך .משתנה זה מכסה חלק אחר בשונות המשתנה "קצין טוב" ולכן הוספת משתנה זה לניתוח הרגרסיה עשויה לתרום משמעותית ליכולת הניבוי. המחשה מספרית וגרפית א .כושר גופני: נניח שמקדם המתאם הפשוט בין ציון הכושר הגופני ( )x1לבין הציון בקורס הקצינים ( )yהוא: 0.6 r ). ( y, x1 מכאן ששונות המשתנה "קצין טוב" המוסברת על ידי מבחן הכושר היא 100 0.36 100 36% : )( y , x1 2 .r כמו כן ידוע שהקשר בין ציון הכושר הגופני ( )xלבין שאר המשתנים המנבאים* ,אותם נסמן כ x -הואr( xM , x1) 0.2 : M 1 מכאן ששונות המשתנים המנבאים המוסברת על ידי מבחן הכושר היא100 0.04 100 4% : )( xM , x1 פתרונות – קורס ההכנה הראשון בישראל לבחינת המתא"ם www.pitronot.org 2 .r . ב .מבחן רורשך: ידוע שגם הקשר בין ציון הרורשך ( )x2לבין ציון קורס הקצינים ( )yהוא: 0.6 r ). ( y, x 2 לכן שונות המשתנה "קצין טוב" המוסברת על ידי ציון הרורשך היא 100 0.36 100 36% : )( y , x1 2 .r כמו כן ידוע שהקשר בין ציון הרורשך ( )xלבין שאר המשתנים המנבאים* ,אותם נסמן כ x -הואr( xM , x 2) 0.8 : M 2 מכאן ששונות המשתנים המנבאים המוסברת על ידי מבחן הרורשך היא100 0.64 100 64% : )( xM , x1 2 . .r *לצורך הפשטות לא נסביר בשלב זה את אופן החישוב של נתונים אלה ,המסומנים בכוכבית ,אלא נניח כי הם ידועים לנו. נמחיש נתונים אלה בתרשימים: תרשים א' כושר גופני תרשים ב' רורשך ציון קורס קצינים Y יתר המשתנים המנבאים XM כושר גופני 1X ציון קורס קצינים Y רורשך 2X יתר המשתנים המנבאים XM כפי שניתן לראות מהתרשימים ,כל אחד מהמשתנים המנבאים מסביר חלק זהה בשונות הקריטריון ,ובכ"ז השונות הכללית המוסברת באמצעות תוספת המשתנה שונה: בתרשים א' ,קיים קשר חלש בין המשתנים המנבאים (מיוצג ע"י החפיפה המועטה בין הכחול לאדום) .מכיוון שכך ,ניתן לראות שכל אחד מהמשתנים מכסה או מסביר חלקים שונים בשונות המשתנה המנובא (הקריטריון) ,ובסה"כ השילוב בין שניהם מסביר חלק גדול יחסית משונות הקריטריון (השילוב מיוצג ע"י כלל השטח הצבעוני -אדום ,כחול ,סגול בתוך העיגול הלבן) .ניתן לומר כי יעילות המשתנה "כושר גופני" או תרומתו ליכולת הניבוי גדולה יחסית במצב זה. בתרשים ב' ,קיים קשר חזק בין המשתנים המנבאים (מיוצג ע"י החפיפה הרבה בין הכחול לאדום) .מכיוון שכך ,ניתן לראות שהמשתנים מכסים או מסבירים חלקים דומים יחסית בשו נות המשתנה המנובא (הקריטריון) ,ובסה"כ השילוב בין שניהם מסביר חלק שאינו גדול בהרבה מאותו חלק בשונות הקריטריון שהסבירו יתר המשתנים המנובאים גם לפני תוספת משתנה הרורשך (השילוב מיוצג ע"י כלל השטח הצבעוני -אדום ,כחול ,סגול בתוך העיגול הלבן .ניתן לראות ששטח זה קטן משמעותית ביחס לתרשים א') .ניתן לומר כי יעילות המשתנה "רורשך" ,או תרומתו ליכולת הניבוי קטנה יחסית במצב זה. פתרונות – קורס ההכנה הראשון בישראל לבחינת המתא"ם www.pitronot.org סיכום -מהו משתנה מנבא טוב ברגרסיה מרובה? כפי שאמרנו והסברנו בחלק זה ,משתנה מנבא טוב ברגרסיה מרובה הוא משתנה שהמתאם בינו לבין הקריטריון הוא גבוה ככל האפשר והמתאם בינו לבין יתר המשתנים הוא קטן ככל האפשר. חישוב מקדם המתאם המרובה: נוסחת מקדם המתאם המרובה: נוסחה זו הנה הנוסחה הבסיסית לחישוב מקדם המתאם המרובה .היא מבוססת על המתאמים הפנימיים בין המנבאים והמתאמים בינם לבין הקריטריון (בנוסחא זו שני מנבאים 1ו 2-והיא הבסיס לנוסחא בה יותר מנבאים): ry21 ry22 2 ry1 ry 2 r12 2 1 r12 R y2.12 ניתן לסכם אם כן ולומר כי שני הגורמים -המתאם בין המנבאים לקריטריון והמתאם בין המנבאים לבין עצמם -משפיעים בכיוונים שונים על תוצאת הנוסחה .ככל שמצד אחד יגדלו המתאמים הנפרדים ומצד שני יקטן המתאם בין המנבאים ,תוצאת הנוסחה ,ולכן מקדם המתאם המרובה ,יהיו גדולים יותר. כמו ברגרסיה פשוטה ,המתאם המרובה בריבוע מייצג את אחוז השונות המוסברת מהמשתנה המנובא .חשוב לשים לב ,כי לרוב המתאם המרובה בריבוע לא שווה לסכום המתאמים המרובעים של כל משתנה מנבא עם המשתנה המנובא בנפרד ,מלבד המקרה יוצא הדופן בו אין כלל מתאם בין המשתנים המנבאים .במקרה קיצון זה ,המתאם המרובה בריבוע יהיה שווה לסכום המתאמים המרובעים של כל משתנה בנפרד. משוואת הרגרסיה המרובה: כמו ברגרסיה פשוטה ,גם ברגרסיה מרובה ניתן ליצור נוסחה שתאפשר ניבוי הקריטר יון (בדוגמה שלנו ציון קורס קצינים) ,מתוך שילוב כלל המשתנים המנבאים .להלן משוואת הרגרסיה המרובה עבור iמשתנים מנבאים: ~ y b1 x1 b2 x2 bi xi... a פתרונות – קורס ההכנה הראשון בישראל לבחינת המתא"ם www.pitronot.org במקרה זה לכל אחד מערכי המשתנים המנבאים ,יינתן מקדם שיפוע המתאים לו ,הקרוי בטא .לאחר כפל ערכי כל אחד מהמשתנים המנבא ים במקדם השיפוע המתאים לו ,וסכימת המכפלות ,יש להוסיף קבוע (כמו במשוואת הרגרסיה הפשוטה) .מקדמי השיפוע עבור כל אחד מהמנבאים מושפעים ממספר גורמים :יחידות המדידה של המשתנים ,סטיות התקן שלהם ,ועוצמת המתאמים בין המשתנים. כל מקדם שיפוע מייצג את השינוי במנובא עבור כל שינוי של יחידה באותו מנבא ,כאשר כל שאר המנבאים מוחזקים קבועים .כלומר, ההשפעה הייחודית של כל מנבא .בניגוד לרגרסיה פשוטה ,לא ניתן להסיק על כיוון הקשר בין משתנה מנבא יחיד למשתנה המנובא מתוך מקדם השיפוע בטא .כמו כן ,על כיוון הקשר בין המנבאים עצמם ניתן להסיק מתוך בטא רק כשהקשר מושלם .בדומה לרגרסיה פשוטה ,קו הרגרסיה של מתאם מרובה גם הוא נענה לקריטריון הריבועים הפחותים .כלומר ,סכום הסטיות של הערכים האמיתיים של ( Yהמשתנה המנובא) מהקו שווה לאפס ,וסכום ריבועי הסטיות של הערכים האמיתיים של Yמהקו הוא מינימלי. *אופ ן החישוב אינו משמעותי להבנה ,משום שהוא סטטיסטי בעיקרו ,ואינו שייך לחומר הלימוד של תואר ראשון בפסיכולוגיה ,ולכן לא נעסוק בו ביחידה זו. לסיכום :מהי רגרסיה מרובה ומה חשוב לזכור ביחס אליה? רגרסיה מרובה משמשת למצב בו סביר להניח ששימוש ביותר ממשתנה מנבא אחד ישפ ר את יעילות הניבוי של משתנה מנובא (קריטריון) מסוים. בעת בחירת המשתנים המנבאים המרובים ,יש לשאוף לבחור במשתנים הקשורים באופן חזק למשתנה המנובא ,ואינם קשורים ביניהם. את עוצמת הקשר ,או מידת הודאות בניבוי ,ניתן לחשב על ידי שימוש בנוסחת מקדם המתאם המרובה. את הניבוי עצמו ,כלומר ערך ספציפי המנובא ע"ב מספר משתנים מנבאים ,ניתן לחשב מתוך משוואת הרגרסיה המרובה ,המאופיינת במקדם שיפוע נפרד לערכי כל אחד מהמשתנים המנבאים. פתרונות – קורס ההכנה הראשון בישראל לבחינת המתא"ם www.pitronot.org