פתרון לחוברת III

Transcription

פתרון לחוברת III
‫מרתון בקורס‪:‬‬
‫מבוא לסטטיסטיקה ב'‬
‫חוברת ‪III‬‬
‫סטודנטים יקרים‪,‬‬
‫אנו גאים להציג בפניכם חוברת זו‪ ,‬המהווה חלק קטן ממערך הולך וגדל של‬
‫חומר עזר לסטודנטים באתר ‪.Openbook‬‬
‫מצאתם טעות? נא שלחו הודעה לכתובת המייל ‪[email protected]‬‬
‫בברכת הצלחה במבחנים ובכל התואר !‬
‫המרכז לקידום אקדמי ‪.OpenBook‬‬
‫המרכז לקידום אקדמי אינו אחראי לטיב הפתרונות המוצגים בחוברת ולטעויות במקרה שקיימות‪.‬‬
‫כל הזכויות שמורות למרכז לקידום אקדמי ‪ Openbook‬בלבד‪.‬‬
‫אין להפיץ‪ ,‬למכור או להעתיק חלק או את כל החוברת‪.‬‬
‫תאריך עדכון‪ :‬יוני ‪2015‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪2‬‬
‫יחידה ‪14‬‬
‫מבחנים א‪ -‬פרמטריים‬
‫עסקנו עד פרק זה במבחנים על ‪ t‬ו‪ z-‬המבוססים על הנחות לגבי האוכלוסייה ממנה נדגמו הפריטים‪.‬‬
‫משפחת המבחנים הא‪ -‬פרמטרים נועדו לתת מענה למצבים בהם לא ניתן להניח הנחות על‬
‫האוכלוסייה‪.‬‬
‫רוב המבחנים הא‪ -‬פרמטריים מבוססים דירוגים‪ ,‬דירוג מספרים מתמקד במיקום כל ערך יחסית‬
‫לערכים האחרים ולא בעוצמתו (הערך של המספר)‪ .‬דירוגים מתייחסים אך ורק לתכונת הסדר של‬
‫המספרים‪ ,‬לכן דורשים סולם סדר לפחות‪.‬‬
‫המבחנים הא‪-‬פרמטריים מחולקים ל‪:‬‬
‫‪ .1‬מבחנים לבדיקת השערות על משתנה מקרי אחד ( מבחן הבינום‪ ,‬מבחן טיב ההתאמה )‬
‫‪ .2‬מבחנים לבדיקת השערות על שני משתנים מקריים(‪ 2‬מדגמים)‪:‬‬
‫א‪ .‬בלתי תלויים ( מבחן וילקוקסון למדגמים בלתי תלויים‪ ,‬מבחן פישר )‬
‫ב‪ .‬תלויים – מזווגים ( מבחן הסימן‪ ,‬מבחן וילקוקסון למדגמים מזווגים‪ ,‬מבחן מקנמר)‪.‬‬
‫מדגם אחד‬
‫התפלגות בינומית ומבחן הבינום‬
‫אנו נשתמש במבחן זה כאשר המשתנה בינומי באוכלוסייה‪ ,‬המדגם קטן ולא עומד בתנאי הקירוב‬
‫לנורמלי ( ‪ .) np, nq  10‬לכן נשתמש בנוסחת הבינום‪.‬‬
‫תנאים‪:‬‬
‫(‪ )1‬מדגם אחד‬
‫(‪ )2‬משתנה בינומי באוכלוסייה‬
‫(‪ )3‬תנאי קירוב לנורמלי לא מתקיים ‪np<10 , nq<10‬‬
‫חישוב‪:‬‬
‫נחשב את אלפא מינימום‪ p.v   min  P  X  k  :‬כאשר ‪ k‬התוצאה שהתקבלה במדגם‪ ,‬ע"י‬
‫טבלת ההסתברות הבינומית או נוסחת הבינום‪.‬‬
‫נשים לב שבטבלה נתון ערך מצטבר ולכן נתון‪P  X  k  :‬‬
‫באופן כללי‪:‬‬
‫במצב שבו ההסתברות להצלחה בניסיון מסוים היא ‪ p‬וההסתברות לכישלון היא ‪ .q = 1-p‬הסיכוי‬
‫‪ n  k nk‬‬
‫להצליח ‪ k‬פעמים מתוך ‪ n‬ניסיונות ב"ת שווה ל‪:‬‬
‫‪ p q‬‬
‫‪k ‬‬
‫אלה הם ניסיונות ‪ :Bernoulli‬ניסיונות ב"ת‪ ,‬כאשר לכל ניסיון ‪ 2‬תוצאות אפשריות‪.‬‬
‫אם נחשב פונקציית הסתברות של ‪( k‬מספר הצלחות מתוך ‪ n‬ניסיונות)‪ ,‬נקבל התפלגות בינומית‪.‬‬
‫הכרעה‪:‬‬
‫‪‬‬
‫נדחה את ‪ H 0‬אם ‪( p.v  ‬או‬
‫‪2‬‬
‫‪www.OpenBook.co.il‬‬
‫(‬
‫|‬
‫‪[email protected]‬‬
‫‪3‬‬
‫שאלה ‪1‬‬
‫משווק ביצים טוען שרק ‪ 10%‬מהביצים שהוא משווק סדוקות‪ .‬הקונים טוענים שאחוז הסדוקות גבוה‬
‫יותר‪ .‬נלקח מדגם של ‪ 15‬ביצים ונמצאו ‪ 5‬ביצים סדוקות‪ .‬מהי מסקנתך ברמת מובהקות ‪?0.05‬‬
‫פתרון‬
‫‪y ~ B 15,0.1‬‬
‫‪H 0 : p  0.1‬‬
‫‪y ~ B 15, p  0.1‬‬
‫‪H1 : p  0.1‬‬
‫הנחות‪ n  p  15  0.1  1.5  10 :‬ולכן לא נשתמש בקירוב הנורמלי לבינומי אלא במבחן הבינום‪.‬‬
‫נבדוק מה ההסתברות לדחות את‬
‫‪H0‬‬
‫על סמך תוצאות המבחן‬
‫‪ min  P  y  5 | H 0true   1  P  y  4   1  0.9873  0.0127‬‬
‫החישוב התבסס על הטבלה‬
‫של התפלגות בינומית מצטברת כאשר ‪p=0.1, x=4,n=15‬‬
‫כלל ההכרעה אם‬
‫‪    min‬נדחה ‪H 0‬‬
‫אחרת נקבל‪.‬‬
‫עבור ‪ 0.05>0.0127 ,   0.05‬אז נדחה ‪ , H 0‬כלומר אחוז הסדוקות גדול מ‪ 10%-‬בר"מ ‪.0.05‬‬
‫שאלה ‪2‬‬
‫בסקר קודם נמצא כי ‪ 40%‬מהציבור בישראל מרוצה מפעולות הממשלה‪ .‬כדי לבדוק אם חלה ירידה‬
‫בשביעות רצון של הציבור מפעולות הממשלה‪ ,‬נדגמו ‪ 20‬נשאלים ונמצא כי ‪ 6‬מתוכם היו מרוצים‪ .‬בחן‬
‫את ההשערה בר"מ ‪?0.05‬‬
‫פתרון‬
‫‪p  0.4‬‬
‫נתונים‪n  20 :‬‬
‫השערות‪:‬‬
‫‪  0.05‬‬
‫‪H 0 : p  0.4‬‬
‫‪H1 : p  0.4‬‬
‫תנאים‪:‬‬
‫(‪ )1‬מדגם אחד‬
‫(‪ )2‬משתנה בינומי באוכלוסייה‬
‫(‪ )3‬ת‪.‬ק‪.‬ל לא מתקיים‪:‬‬
‫‪n  p  0.4  20  8‬‬
‫‪n  q  0.6  20  12‬‬
‫לכן מבחן הבינום‬
‫חישוב ' ‪ : ‬נתון‪ x  0.6, n  20, p  0.4 :‬ולכן ‪ '  P  x  6   0.2500  0.05 :‬‬
‫חישוב באמצעות הטבלה של ההסתברות הבינומית המצטברת עבור ‪p‬ים שונים בעמוד ‪ 45‬בחוברת‬
‫כאשר‪. x  0.6, n  20, p  0.4 :‬‬
‫החלטה‪ :‬קבלת ‪H 0‬‬
‫מסקנ ה‪ :‬לא ניתן לקבל את הטענה שחלה ירידה בשביעות רצון בר"מ ‪0.05‬‬
‫שאלה ‪ 3‬ממבחן‬
‫כדי לבדוק אם מטבע מסוים הוא תקין מטילים אותו ‪ 8‬פעמים‪.‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪4‬‬
‫אם הוא נופל על "ראש" ‪ 2,3,4,5‬או ‪ 6‬פעמים מחליטים שהמטבע תקין‪ ,‬אחרת מזויף‪.‬‬
‫א‪ .‬מהי רמת המובהקות של המבחן?‬
‫ב‪ .‬אם האלטרנטיבה שההסתברות ל"ראש" במטבע זה היא ‪ ,0.4‬מהי עצמת המבחן?‬
‫פתרון‬
‫מדובר בבדיקת השערות על פרופורציה על סמך מדגם בגודל ‪ 8‬שלא מאפשר שימוש בקרוב הנורמלי‬
‫כי ‪ np=4<10‬ולכן יש להשתמש בהתפלגות הבינומית‪ .‬מבחן הבינום‪ .‬השערות‪:‬‬
‫‪H 0 : p  0.5, H1 : p  0.5‬‬
‫סעיף א נתון אזור הדחיה ויש לחשב את רמת המובהקות של המבחן שהוצע‪:‬‬
‫בהנחת‬
‫‪H0‬‬
‫‪ X ~ Bin 8,0.5  :‬מספר הפעמים שהמטבע נפל על "ראש"‪.‬‬
‫אזור הדחייה הוא דחה את השערת האפס כאשר‪ X  0,1, 7,8 :‬לכן‪:‬‬
‫‪  P  X  0,1, 7,8 | p 0.5  ‬‬
‫‪ P  X  1  P  X  7   P  X  1  1  P  X  6   0.035  1  0.965   0.07‬‬
‫החישוב התבצע מהטבלה בסוף הספר לבינומי‪.‬‬
‫‪1    P  X  0,1, 7,8 | p  0.4  ‬‬
‫סעיף ב‬
‫‪8‬‬
‫‪8‬‬
‫‪8‬‬
‫‪8‬‬
‫‪   0.40  0.68    0.41  0.67    0.47  0.61    0.48  0.60  0.1148‬‬
‫‪0‬‬
‫‪1‬‬
‫‪7‬‬
‫‪8‬‬
‫שאלה ‪( 4‬פתרון מלא ומוקלט באתר ‪)www.openbook.co.il‬‬
‫נתוני משרד הבריאות מראים כי ‪ 80%‬מהמעשנים שמנסים להיגמל מעישון חוזרים לעשן‪.‬‬
‫מרכז לגמילה מעישון טוען שפיתח שיטת גמילה חדשה ולפיה אחוז החוזרים לעשן נמוך מ‪.80% -‬‬
‫לצורך בדיקת הטענה נלקח מדגם מקרי של ‪ 15‬מעשנים שעברו את שיטת הגמילה החדשה‪.‬‬
‫לאחר חצי שנה בדקו כמה מבין ה‪ 15 -‬חזרו לעשן‪.‬‬
‫הוחלט לקבל את טענת המרכז לגמילה אם מספר האנשים שחזרו לעשן הוא לכל היותר ‪.8‬‬
‫‪ .1‬מהי רמת המובהקות של המבחן המוצע?‬
‫‪ . 2‬מהי עצמת המבחן המוצע אם ההסתברות לחזור לעשן לאחר גמילה בשיטה החדשה היא ‪?0.5‬‬
‫פתרון‬
‫‪𝐻0 : 𝑝 = 0.8‬‬
‫‪𝐻1 : 𝑝 < 0.8‬‬
‫)𝑝 ‪ 𝑋~𝐵𝑖𝑛(15,‬מספר המעשנים שחזרו לעשן‬
‫‪𝛼 = 𝑃𝑝=0.8 (𝑋 ≤ 8) = 0.0181‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪5‬‬
)2( ‫סעיף‬
𝐻1 : 𝑝 = 0.5
1 − 𝛽 = 𝑃𝑝=0.5 (𝑋 ≤ 8) = 0.696
6
[email protected]
|
www.OpenBook.co.il
‫מבחן חי בריבוע לטיב התאמה )‪Chi-square for goodness of fit (2‬‬
‫משתמשים במבחן זה כשמעוניינים לדעת אם משתנה מתפלג בצורה מסוימת‪.‬‬
‫𝑖𝑂 – ערך בטבלה הנצפית ‪ – 𝐸𝑖 ,‬מה אנו מצפים שיהיה‬
‫‪ - H 0‬יאמר מה המודל שאליו נכוון‪.‬‬
‫אנו נתעסק רק עם מבחן דו צדדי – ולכן תמיד יהיה שוויון ב ‪ H 0‬ואי שוויון ב ‪. H1‬‬
‫למעשה מבחן זה‪ ,‬דומה למדד קרמר שנלמד בקורס מבוא לסטטיסטיקה א'‪ ,‬המתבסס על ההבדל בין‬
‫טבלה נצפית ‪, Oi‬לטבלה צפויה של חוסר קשר ‪. Ei‬‬
‫בדיקה זו נעשית באמצעות‬
‫‪2‬‬
‫כאשר ‪ H 0‬תמיד יניח שלא קיים הבדל בין ‪ Oi‬ל‪ , Ei -‬כלומר שיש‬
‫התאמה‪ ,‬ו‪ H1 -‬תמיד יניח שלא קיימת התאמה‪.‬‬
‫השערות במבחן טיב התאמה‪H 0 : p1  p10 , p2  p20 , , pk  pk0 :‬‬
‫כלומר ההשערה היא תמיד דו צדדית כאשר בודקים באמצעות‬
‫‪2‬‬
‫(‪ k‬קטגוריות)‪.‬‬
‫‪H1 : other‬‬
‫את הפער בין ‪ Oi‬ל‪. Ei -‬‬
‫‪(Oi  Ei )2‬‬
‫‪ ‬‬
‫‪Ei‬‬
‫‪i 1‬‬
‫‪n‬‬
‫חישוב הסטטיסטי‪:‬‬
‫‪2‬‬
‫אם הסטטיסטי הנ"ל קטן מהערך הקריטי אזי נאמר שהפער קטן ונקבל את ‪. H 0‬‬
‫אם הסטטיסטי הנ"ל גדול מהערך הקריטי אזי נדחה את ‪ H 0‬ונאמר שלא קיימת התאמה למודל‬
‫שהוצא ע"י החוקר‪.‬‬
‫התפלגות סטטיסטי זה היא חי בריבוע עם ‪ k-1‬דרגות חופש‪ ,‬כאשר ‪ k‬יוגדר כמספר התאים‪ ,‬והוא‬
‫יקרא ערך קריטי‪.‬‬
‫ככל שההבדל בין הטבלה הצפויה לנצפית גבוהה יותר‪ ,‬ניטה לדחות את השערת האפס‪ ,‬לגבי צורת‬
‫ההתפלגות המקורית‪.‬‬
‫כלל ההכרעה יהיה ‪ :‬דחה את ‪ ,H0‬אם‬
‫‪2‬‬
‫מחושב >‬
‫‪2‬‬
‫קריטי‪.‬‬
‫‪ 2   2 k 1,‬‬
‫דוגמא‪ :‬בניסוי הוטלה קובייה ‪ 300‬פעמים ונספרו שכיחות התוצאות‪ .‬התקבלה הטבלה הבאה‪:‬‬
‫תוצאה‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫‪6‬‬
‫שכיחות‬
‫‪54‬‬
‫‪36‬‬
‫‪30‬‬
‫‪50‬‬
‫‪70‬‬
‫‪60‬‬
‫האם ניתן לומר שהקובייה הוגנת בדוק ר"מ ‪0.05‬‬
‫זהו מבין לטיב התאמה‪ .‬נבדוק את השכיחות הצפויה‬
‫תוצאה‬
‫‪2‬‬
‫‪1‬‬
‫‪4‬‬
‫‪3‬‬
‫קובייה הוגנת‬
‫‪1‬‬
‫‪6‬‬
‫שכיחות צפויה‬
‫𝑝∙𝑛= 𝐸‬
‫‪1‬‬
‫‪∙ 300 = 50‬‬
‫‪6‬‬
‫‪50‬‬
‫שכיחות נצפת‬
‫‪54‬‬
‫‪36‬‬
‫‪30‬‬
‫𝑖𝐸 ‪𝑂𝑖 −‬‬
‫‪4‬‬
‫‪-14‬‬
‫‪-20‬‬
‫‪6‬‬
‫‪5‬‬
‫‪1‬‬
‫‪6‬‬
‫‪1‬‬
‫‪6‬‬
‫‪1‬‬
‫‪6‬‬
‫‪1‬‬
‫‪6‬‬
‫‪1‬‬
‫‪6‬‬
‫‪50‬‬
‫‪50‬‬
‫‪50‬‬
‫‪50‬‬
‫‪50‬‬
‫‪70‬‬
‫‪60‬‬
‫‪0‬‬
‫‪20‬‬
‫‪10‬‬
‫המבחן בודק את ההפרשים – החלוקה הצפויה לבין החלוקה שהתקבלה‪ .‬המבחן בודק האם חלוקה‬
‫של התפלגות שהתקבלה בפועל תואמת איזה התפלגות תאורטית זה דומה פה לאחידה‪.‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪7‬‬
‫‪2 6 1‬‬
‫‪  2   0.05‬במדגם אז נדחה ‪H 0‬‬
‫‪ 11.07‬‬
‫כלל ההכרעה‪ :‬חד צדדי ימני‪ .‬אם‬
‫אחרת נקבל‪.‬‬
‫חישוב סטטיסטי‪:‬‬
‫‪2‬‬
‫‪ 22.24‬‬
‫‪60  50 ‬‬
‫‪‬‬
‫‪50‬‬
‫‪2‬‬
‫‪ 70  50 ‬‬
‫‪‬‬
‫‪50‬‬
‫מכיוון ש ‪ 22.24>11.07‬נדחה‬
‫‪H0‬‬
‫‪2‬‬
‫‪50  50 ‬‬
‫‪‬‬
‫‪2‬‬
‫‪30  50 ‬‬
‫‪‬‬
‫‪50‬‬
‫‪50‬‬
‫‪2‬‬
‫‪ 36  50 ‬‬
‫‪‬‬
‫‪2‬‬
‫‪50‬‬
‫‪ 54  50 ‬‬
‫‪ ‬‬
‫‪2‬‬
‫‪50‬‬
‫ברמת מובהקות ‪0.05‬‬
‫אופן החישוב‬
‫א‪ -‬נסח השערות‪ :‬התפלגות מסוימת‪ , Ho:‬אחרת‪H1:‬‬
‫ב‪ -‬בנה טבלת שכיחויות המכילה‪:‬‬
‫‪.I‬‬
‫‪ -Oi‬שכיחות נצפית של ערך ‪i‬‬
‫‪.II‬‬
‫‪ Ei‬שכיחות צפויה תחת הנחת ‪ Ho‬של ערך ‪ i‬כאשר ‪Ei=np‬‬
‫ג‪ -‬חשב את סטטיסטי המבחן‪:‬‬
‫‪(𝑂𝑖−𝐸𝑖)2‬‬
‫𝑖𝐸‬
‫‪𝜒 2 = ∑𝑘𝑖=1‬‬
‫ד‪ -‬כלל ההכרעה‪ :‬דחה ‪ Ho‬עבור ערכים מספיק גדולים של סטטיסטי המבחן‪.‬‬
‫דחה את ‪ ho‬אם ‪ χ2‬מחושב < ‪χ2‬קריטי ‪𝜒2 > 𝜒𝛼2 (𝑘 − 1) ,‬‬
‫שאלה ‪ 1‬ממבחן‬
‫שתי קוביות הוטלו ‪ 180‬פעם‪ .‬בכל הטלה נרשם ההפרש בין התוצאות בערכו המוחלט‪ .‬לאחר מכן‬
‫נרשמה התפלגות השכיחויות של הפרשים מוחלטים אלו‪ .‬התקבלו הנתונים הבאים‪:‬‬
‫‪ 5‬סה"כ‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫‪0‬‬
‫הפרש‬
‫מספר הטלות ‪180 5 15 32 55 45 28‬‬
‫א‪ .‬האם התפלגות התוצאות הנתונה מתיישבת עם ההשערה‪ ,‬שהקוביות הוגנות? בדוק ברמת‬
‫מובהקות ‪.0.05‬‬
‫ב‪ .‬האם ניתן להגיע לאותה מסקנה גם עבור רמת מובהקות הנמוכה מ‪ ?0.05-‬הסבר‪.‬‬
‫פתרון‬
‫‪6‬‬
‫‪10‬‬
‫‪8‬‬
‫‪6‬‬
‫‪4‬‬
‫‪2‬‬
‫א‪.‬‬
‫‪, p2 ‬‬
‫‪, p3 ‬‬
‫‪, p4 ‬‬
‫‪, p5 ‬‬
‫‪, p6 ‬‬
‫‪36‬‬
‫‪36‬‬
‫‪36‬‬
‫‪36‬‬
‫‪36‬‬
‫‪36‬‬
‫‪ H 0 : p1 ‬אחרת ‪H1 :‬‬
‫תוצאה‬
‫‪0‬‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫𝒊𝑶‬
‫‪28‬‬
‫‪45‬‬
‫‪55‬‬
‫‪32‬‬
‫‪15‬‬
‫‪5‬‬
‫𝒊𝒑‬
‫‪6/36‬‬
‫‪10/36‬‬
‫‪8/36‬‬
‫‪6/36‬‬
‫‪4/36‬‬
‫‪2/36‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪8‬‬
‫‪30‬‬
‫𝒊𝑬‬
‫‪40‬‬
‫‪50‬‬
‫‪30‬‬
‫‪(Oi  Ei )2‬‬
‫‪2‬‬
‫‪ 10.14   0.05‬‬
‫‪(5)  11.070‬‬
‫‪Ei‬‬
‫‪20‬‬
‫‪10‬‬
‫‪6‬‬
‫‪2  ‬‬
‫‪i 1‬‬
‫לא דוחים את השערת האפס ברמת מובהקות ‪, 0.05‬הקוביות הוגנות‪.‬‬
‫ב‪ .‬ברמת מובהקות קטנה מ‪ 0.05 -‬אזור הדחיה קטן ולכן המסקנה לא תשתנה ‪ -‬השערת האפס לא‬
‫תידחה ‪.‬‬
‫שאלה ‪2‬‬
‫מעונינים לבדוק האם גובה הוא משתנה מקרי המתפלג נורמלית עם תוחלת של ‪ 178‬וס"ת ‪ .4‬לשם‬
‫כך נדגמו ‪ 1000‬אנשים והתקבלו התוצאות הבאות‪:‬‬
‫גובה בס"מ‬
‫מתחת ‪170‬‬
‫‪170-174‬‬
‫‪174-178‬‬
‫‪178-182‬‬
‫‪182-186‬‬
‫מעל ‪186‬‬
‫מספר נבדקים‬
‫‪25‬‬
‫‪138‬‬
‫‪315‬‬
‫‪385‬‬
‫‪102‬‬
‫‪35‬‬
‫בדוק את ההשערה בר"מ ‪?0.05‬‬
‫פתרון‬
‫מעוניינים לבדוק על צורת התפלגות באוכלוסיה => מבחן ‪ 𝜒2‬לטיב התאמה‪.‬‬
‫השערות‪:‬‬
‫‪ 𝐻0‬גובה הוא משתנה שמתפלג נורמלית עם תוחלת ‪ 178‬וס"ת ‪4‬‬
‫‪𝐻1‬אחרת‬
‫נעתיק את הטבלה ונוסיף ‪ 2‬שורות‬
‫𝑖𝑂‬
‫𝑖𝑃‬
‫𝑁 ⋅ 𝑖𝑃 = 𝑖𝐸‬
‫מתחת‬
‫‪170‬‬
‫‪25‬‬
‫‪0.0228‬‬
‫‪22.8‬‬
‫‪Pi‬‬
‫ו‪-‬‬
‫‪Ei  Pi  N‬‬
‫‪170-174‬‬
‫‪174-178‬‬
‫‪178-182‬‬
‫‪182-186‬‬
‫מעל ‪186‬‬
‫‪N‬‬
‫‪138‬‬
‫‪0.1359‬‬
‫‪135.9‬‬
‫‪315‬‬
‫‪03413‬‬
‫‪341.3‬‬
‫‪38‬‬
‫‪0.3413‬‬
‫‪341.3‬‬
‫‪102‬‬
‫‪0.1359‬‬
‫‪135.9‬‬
‫‪35‬‬
‫‪0.0228‬‬
‫‪22.8‬‬
‫‪1000‬‬
‫‪1‬‬
‫‪1000‬‬
‫איך נמצא את ערכי 𝑖𝑃 ? הרי‬
‫‪‬‬
‫‪‬‬
‫‪ , X ~ N   178,  2  42‬נחשב כל שטח‪:‬‬
‫‪186  178 ‬‬
‫‪‬‬
‫‪P  X  186   P  Z ‬‬
‫‪  P  Z  2   1    2   0.0228‬‬
‫‪4‬‬
‫‪‬‬
‫‪‬‬
‫‪186  178 ‬‬
‫‪‬‬
‫‪P  X  186   P  X  186   P  Z ‬‬
‫‪  P  Z  2   1    2   0.0228‬‬
‫‪4‬‬
‫‪‬‬
‫‪‬‬
‫‪186  178 ‬‬
‫‪182  178 ‬‬
‫‪‬‬
‫‪‬‬
‫‪P 182  X  186  P  Z ‬‬
‫‪  PZ ‬‬
‫‪  P  Z  2   P  Z  1 ‬‬
‫‪4‬‬
‫‪4‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪   2    1  0.9772  0.8413  0.1359‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪9‬‬
‫שרטוט‬
‫חישוב סטטיסטי‪:‬‬
‫‪2‬‬
‫‪ ...  22.93  11.070‬‬
‫החלטה‪ :‬נדחה‬
‫‪ 315  341.3‬‬
‫‪‬‬
‫‪341.3‬‬
‫‪2‬‬
‫‪138  135.9‬‬
‫‪‬‬
‫‪135.9‬‬
‫‪2‬‬
‫‪ 25  22.8‬‬
‫‪ ‬‬
‫‪2‬‬
‫‪22.5‬‬
‫‪H0‬‬
‫מסקנה ‪ :‬לא ניתן לקבל את הטענה שגובה מתפלג נורמלית עם תוחלת ‪ 178‬וס"ת בר"מ ‪0.05‬‬
‫סעיף משאלה ‪ 3‬ממבחן‬
‫הטילו זוג קוביות משחק ‪ 72‬פעמים והתקבלו התוצאות הבאות‪:‬‬
‫סכום התוצאות בכל הטלה ‪10-12 8-9 6-7 2-5‬‬
‫‪8 26 23 15‬‬
‫מספר ההטלות‬
‫האם התוצאות מעידות על קו ביות הוגנות ברמת מובהקות ‪ ?0.05‬רשום מהו המבחן בו אתה‬
‫משתמש‪.‬‬
‫פתרון‬
‫נשתמש במבחן טיב התאמה כדי לבדוק האם התוצאות שהתקבלו מתאימות להתפלגות עבור זוג‬
‫קוביות הוגנות‪ .‬ניזכר כי התפלגות של סכום התוצאות בהטלת שתי קוביות הוגנות היא‪:‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫‪6‬‬
‫‪7‬‬
‫‪8‬‬
‫‪9 10 11 12‬‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪6‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫‪5‬‬
‫‪5‬‬
‫‪36 36 36 36 36 36 36 36 36 36 36‬‬
‫מכאן ניתן לבנות את טבלת התוצאות הצפויות המתאימה לטבלה המוצגת בשאלה‪:‬‬
‫‪X‬‬
‫‪p‬‬
‫סכום התוצאות בכל הטלה ‪10-12 8-9 6-7 2-5‬‬
‫תוצאה נצפית ) 𝑖𝑂(‬
‫‪8 26 23 15‬‬
‫‪12 18 22 20‬‬
‫תוצאה צפויה ( 𝑖𝐸)‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪10‬‬
‫‪(Oi  Ei )2‬‬
‫‪2‬‬
‫‪ 6.18  0.05‬‬
‫כעת נחשב את ערך הסטטיסטי במדגם‪(3)  7.815 ,‬‬
‫‪Ei‬‬
‫‪2  ‬‬
‫‪i 1‬‬
‫‪2‬‬
‫‪ .  0.05‬הערך שהתקבל במדגם קטן מהערך הקריטי לכן לא‬
‫הערך הקריטי המתאים הוא ‪(3)  7.815‬‬
‫נדחה את השערת האפס‪ ,‬ונסיק כי הקוביות הוגנות בר"מ ‪.0.05‬‬
‫שאלה ‪4‬‬
‫סדרת הגמר של ה‪ NBA-‬מתנהלת בשיטה "הטוב מבין שבע"‪ .‬כלומר‪ ,‬מתקיימים משחקים עד אשר‬
‫אחת מן הקבוצות מנצחת ב‪ 4-‬משחקים‪ .‬להלן נתונים על מספר המשחקים ששוחקו בסדרת הגמר‬
‫במשך ‪ 50‬שנה‪.‬‬
‫מספר המשחקים מספר השנים‬
‫‪9‬‬
‫‪4‬‬
‫‪11‬‬
‫‪5‬‬
‫‪8‬‬
‫‪6‬‬
‫‪22‬‬
‫‪7‬‬
‫בדוק את ההשערה כי משחק בסדרת הגמר הוא ניסוי ברנולי בלתי תלוי עם הסתברות שווה לניצחון‬
‫של כל אחת מהקבוצות‪ ,‬ברמת מובהקות ‪.0.05‬‬
‫פתרון‬
‫בשאלה זו נשתמש במבחן טיב התאמה כדי לבדוק את ההשערה המבוקשת‪.‬‬
‫נחשב את ההסתברות לסדרת גמר בת ‪ 6,5,4‬או ‪ 7‬משחקים‪ ,‬תחת ההנחה שתוצאת כל משחק אינה‬
‫תלויה בתוצאות המשחקים האחרים וההסתברות לניצחון של כל אחת מהקבוצות היא ‪.0.5‬‬
‫‪2‬‬
‫‪1‬‬
‫‪ -  ‬בחירת הקבוצה שתזכה בסדרה‬
‫‪6  5  4‬‬
‫‪ 3  2  1‬‬
‫‪ -   ,   ,  ‬בחירת המשחקים בהם תפסיד‪ .‬הקבוצה הזוכה – במשחק האחרון היא חייבת‬
‫לנצח‪.‬‬
‫‪ 2‬‬
‫‪P  X  4      0.54  0.125‬‬
‫‪1‬‬
‫‪ 2  4‬‬
‫‪P  X  5         0.55  0.25‬‬
‫‪1 1‬‬
‫‪ 2  5‬‬
‫‪P  X  6         0.56  0.3125‬‬
‫‪1  2‬‬
‫‪ 2 6‬‬
‫‪P  X  7         0.57  0.3125‬‬
‫‪ 1  3‬‬
‫לפי הסתברויות אלה נחשב את השכיחות הצפויה של מספר המשחקים‪ ,‬המוצגת בטבלה הבאה‪:‬‬
‫‪7‬‬
‫‪6‬‬
‫‪5‬‬
‫‪4‬‬
‫מס' משחקים‬
‫‪22‬‬
‫‪8‬‬
‫‪11‬‬
‫𝑖𝑂 שכיחות נצפית ‪9‬‬
‫𝑖𝐸 שכיחות צפויה ‪15.625 15.625 12.5 6.25‬‬
‫נחשב את ערך חי‪-‬בריבוע‪:‬‬
‫‪2‬‬
‫‪ 7.712‬‬
‫‪ 22  15.625‬‬
‫‪‬‬
‫‪15.625‬‬
‫‪www.OpenBook.co.il‬‬
‫‪2‬‬
‫‪8  15.625‬‬
‫‪‬‬
‫‪15.625‬‬
‫‪2‬‬
‫‪11  12.5‬‬
‫‪‬‬
‫‪12.5‬‬
‫|‬
‫‪2‬‬
‫‪ 9  6.25‬‬
‫‪ ‬‬
‫‪2‬‬
‫‪6.25‬‬
‫‪[email protected]‬‬
‫‪11‬‬
‫‪2‬‬
‫‪.  0.05‬‬
‫רמת המובהקות המבוקשת היא ‪ .0.05‬מטבלה ‪ II‬נקבל כי הערך הקריטי הוא ‪(3)  7.815‬‬
‫ערך חי בריבוע שהתקבל קטן מהערך הקריטי ולכן לא נדחה את השערת האפס בר"מ ‪ ,0.05‬כלומר‪,‬‬
‫כל משחק בסדרת הגמר הוא ניסוי ברנולי בלתי תלוי עם הסתברות שווה לניצחון של כל אחת‬
‫מהקבוצות‪.‬‬
‫שאלה ‪5‬‬
‫בבית חולים אספו את הנתונים הבאים על מספר הלידות בארבעה רבעונים עוקבים‪:‬‬
‫רבעון‪:‬‬
‫מס' לידות‪:‬‬
‫ינואר‪-‬מרץ‬
‫אפריל –יוני‬
‫יולי‪-‬ספטמבר‬
‫‪110‬‬
‫‪67‬‬
‫‪53‬‬
‫אוקטובר‪-‬דצמבר‬
‫‪40‬‬
‫א‪.‬‬
‫בחנו את ההשערה שיחס השכיחויות הוא ‪ 1:1:1:2‬בהתאמה‪ ,‬בר"מ של ‪?0.05‬‬
‫ב‪.‬‬
‫בחנו את ההשערה כי ברבעון הראשון מתקיימות ‪ 30%‬מהלידות‪ ,‬כנגד‬
‫האלטרנטיבה שאין זה כך ברמת מובהקות של ‪( ?0.01‬הסבר אם ניתן לבדוק זאת‬
‫לפי מבחן סטטיסטי אחר)‪.‬‬
‫בשאלה בודקים את צורת התפלגות האוכלוסיה ולכן => ‪  2‬לטיב התאמה‬
‫השערות‪:‬‬
‫‪ : H o‬יחס השכיחויות הינו ‪1:1:1:2‬‬
‫‪ : H1‬יחס השכיחויות אחר‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪12‬‬
13
[email protected]
|
www.OpenBook.co.il
14
[email protected]
|
www.OpenBook.co.il
‫שאלה ‪ 6‬ממבחן‬
‫מרצה בקורס "מבוא למקרו" טוען כי הציונים של ‪ 500‬תלמידיו במבחן הסיום מתפלגים נורמלית עם‬
‫תוחלת ‪ 70‬וסטיית תקן ‪.5‬‬
‫הציונים שהתקבלו הם‪:‬‬
‫שכיחות‬
‫ציונים‬
‫‪1‬‬
‫‪40-55‬‬
‫‪67‬‬
‫‪56-65‬‬
‫‪344‬‬
‫‪66-75‬‬
‫‪85‬‬
‫‪76-85‬‬
‫‪3 86-100‬‬
‫בדוק את טענת המרצה ברמת מובהקות ‪.0.05‬‬
‫שאלה ‪( 7‬פתרון מלא ומוקלט באתר ‪)www.openbook.co.il‬‬
‫רצו לבדוק האם סיכוי ללידת בן הוא ‪0.5‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪15‬‬
‫בקרב ‪ 300‬משפחות עם ‪ 2‬ילדים התקבלו התוצאות הבאות‪:‬‬
‫שני בנים‬
‫שתי בנות‬
‫בן אחד ובת אחת‬
‫‪68‬‬
‫‪152‬‬
‫‪80‬‬
‫מספר משפחות‬
‫האם ניתן להגיד ברמת מובהקות ‪ 0.01‬כי התוצאות מעידות על כך שהסיכוי ללידת בן הוא ‪? 0.5‬‬
‫נמק‪.‬‬
‫פתרון‬
‫מבחן טיב התאמה‪:‬‬
‫ניסוח השערות‪ :𝐻0 :‬הסיכוי ללידת בן הוא ‪0.5‬‬
‫‪ :𝐻1‬הסיכוי ללידת בן איננו ‪0.5‬‬
‫‪(Oi  Ei )2‬‬
‫התפלגות הדגימה‪ :‬בהנחת ‪~  2 (2) , H 0‬‬
‫‪‬‬
‫‪E‬‬
‫‪i 1‬‬
‫‪i‬‬
‫‪3‬‬
‫קביעת רמת המובהקות‪.   0.01 :‬‬
‫קביעת אזורי דחייה וקבלה‪ :‬קבל אם ‪ .  2  9.21‬דחה אם ‪.  2  9.21‬‬
‫‪Oi‬‬
‫‪Pi‬‬
‫‪Ei  n  Pi‬‬
‫‪www.OpenBook.co.il‬‬
‫שני בנים‬
‫בן אחד ובת אחת‬
‫שתי בנות‬
‫סה"כ‬
‫‪80‬‬
‫‪152‬‬
‫‪68‬‬
‫‪300‬‬
‫‪1 1 1‬‬
‫= ∙‬
‫‪2 2 4‬‬
‫‪0.5‬‬
‫‪0.25‬‬
‫‪1‬‬
‫‪1‬‬
‫‪∙ 300‬‬
‫‪4‬‬
‫‪= 75‬‬
‫‪150‬‬
‫‪75‬‬
‫‪300‬‬
‫|‬
‫‪[email protected]‬‬
‫‪16‬‬
‫‪(Oi  Ei ) 2‬‬
‫‪Ei‬‬
‫‪0.0267 (80 − 75)2‬‬
‫‪75‬‬
‫‪1‬‬
‫=‬
‫‪3‬‬
‫חישוב הסטטיסטי וההכרעה‪= 𝟏. 𝟎𝟏𝟑 < 𝟗. 𝟐𝟏:‬‬
‫‪0.6533‬‬
‫𝟐) 𝒊𝑬‪(𝑶𝒊 −‬‬
‫𝒊𝑬‬
‫𝟑‬
‫𝟏=𝒊∑‬
‫‪ 2  1.013‬‬
‫𝟐‬
‫= 𝝌‬
‫נקבל את ‪ ,𝐻0‬כלומר ניתן לומר ברמת מובהקות ‪ 0.01‬שהסיכוי ללידת בן הוא ‪0.5‬‬
‫שאלה ‪8‬‬
‫עיתונאי פוליטי טוען כי בבחירות הבאות תהיה פרופורציית המצביעים למפלגות השונות כדלהלן‪0.4 :‬‬
‫יצביעו עבור מפלגה ‪ 0.3 , A‬יצביעו עבור מפלגה ‪ B‬וכל השאר יתחלקו באופן שווה בין מפלגות ‪C‬ו‪.D -‬‬
‫כדי לבדוק את השערת העיתונאי נלקח מדגם של ‪ 200‬אנשים‪ .‬כל משתתף במדגם נשאל על אופן‬
‫הצבעתו והתקבלו התוצאות הבאות‪ 85 :‬טענו כי יצביעו עבור מפלגה ‪ 50 ,A‬טענו כי יצביעו עבור‬
‫מפלגה ‪30 , B‬עבור מפלגה ‪ C‬והשאר עבור מפלגה ‪.D‬‬
‫א‪ .‬האם לאור התוצאות השערת העיתונאי מתקבלת ברמת מובהקות ‪ ? 0.05‬נמק‪.‬‬
‫ב‪ .‬עיתונאי אחר טוען כי שיעור ההצבעה עבור מפלגה ‪ B‬יהיה שונה מ‪ . 0.3 -‬האם לאור תוצאות‬
‫המדגם ניתן לקבל את טענתו ברמת מובהקות ‪? 0.01‬‬
‫נמק בעזרת מבחן טיב התאמה‪.‬‬
‫האם ניתן לבדוק את ההשערה בעזרת מבחן סטטיסטי אחר שלמדת ?‬
‫פתרון‬
‫א‪ .‬מבחן טיב התאמה‪:‬‬
‫קביעת ההשערות‪ : H 0 :‬פרופורציית המצביעים למפלגות תהיה כפי שטוען העיתונאי‬
‫‪ : H1‬פרופורציית המצביעים למפלגות תהיה שונה מזו שטוען העיתונאי‬
‫‪(Oi  Ei )2‬‬
‫התפלגות הדגימה‪ :‬בהנחת ‪~  2 (3) , H 0‬‬
‫‪‬‬
‫‪Ei‬‬
‫‪i 1‬‬
‫‪4‬‬
‫קביעת רמת המובהקות‪.   0.05 :‬‬
‫קביעת אזורי דחייה וקבלה‪ :‬קבל אם ‪ .  2  7.815‬דחה אם ‪.  2  7.815‬‬
‫מפלגה‬
‫‪A‬‬
‫‪B‬‬
‫‪C‬‬
‫‪D‬‬
‫‪Oi‬‬
‫‪85‬‬
‫‪50‬‬
‫‪30‬‬
‫‪35‬‬
‫‪Pi‬‬
‫‪0.4‬‬
‫‪0.3‬‬
‫‪0.15‬‬
‫‪0.15‬‬
‫‪Ei  n  Pi‬‬
‫‪80‬‬
‫‪60‬‬
‫‪30‬‬
‫‪30‬‬
‫‪(Oi  Ei ) 2‬‬
‫‪Ei‬‬
‫‪0.3125‬‬
‫‪1.667‬‬
‫‪0‬‬
‫‪0.833‬‬
‫‪(Oi  Ei )2‬‬
‫חישוב הסטטיסטי וההכרעה‪ 2.8125  7.815 :‬‬
‫‪‬‬
‫‪Ei‬‬
‫‪i 1‬‬
‫‪4‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪ 2  2.8125‬‬
‫‪. 2 ‬‬
‫‪[email protected]‬‬
‫‪17‬‬
‫נקבל את ‪ , H 0‬כלומר ניתן לומר ברמת מובהקות ‪ 0.05‬שפרופורציית המצביעים למפלגות תהיה כפי‬
‫שטוען העיתונאי‪.‬‬
‫ב‪ .‬קביעת ההשערות‪H1 : p  0.3; H 0 : p  0.3 :‬‬
‫קביעת רמת המובהקות‪.   0.01 :‬‬
‫‪(Oi  Ei )2‬‬
‫התפלגות הדגימה‪ :‬בהנחת ‪~  2 (1) , H 0‬‬
‫‪‬‬
‫‪Ei‬‬
‫‪i 1‬‬
‫‪2‬‬
‫קביעת רמת המובהקות‪.   0.05 :‬‬
‫קביעת אזורי דחייה וקבלה‪ :‬קבל אם ‪ .  2  6.635‬דחה אם ‪.  2  6.635‬‬
‫מפלגה ‪B‬‬
‫מפלגה‬
‫אחרת‬
‫‪Oi‬‬
‫‪50‬‬
‫‪150‬‬
‫‪Pi‬‬
‫‪0.3‬‬
‫‪0.7‬‬
‫‪Ei  n  Pi‬‬
‫‪60‬‬
‫‪140‬‬
‫‪(Oi  Ei )2‬‬
‫‪Ei‬‬
‫‪1.667‬‬
‫‪0.714‬‬
‫‪ 2  2.38‬‬
‫‪(Oi  Ei )2‬‬
‫חישוב הסטטיסטי וההכרעה‪ 2.38  6.635 :‬‬
‫‪‬‬
‫‪Ei‬‬
‫‪i 1‬‬
‫‪4‬‬
‫‪. 2 ‬‬
‫נקבל את ‪ , H 0‬כלומר לא ניתן לומר ברמת מובהקות ‪ 0.01‬כי שיעור ההצבעה עבור מפלגה ‪ B‬שונה‬
‫מ‪. 0.3-‬‬
‫ניתן לבדוק את ההשערה גם בעזרת מבחן ‪( Z‬מבחן דו צדדי)על פרופורציה אחת‪.‬‬
‫שאלה ‪9‬‬
‫הועלה חשד שסביבון חדשני איננו הוגן‪ .‬לבדיקת הטענה הסביבון הוטל ‪ 80‬פעם ונמצא כי ‪ 24‬פעם‬
‫התקבלה התוצאה "נס"‪ 8 ,‬פעם התוצאה "גדול" ‪ 30 ,‬פעם התוצאה "היה" ו‪ 18 -‬פעם התוצאה "פה"‪.‬‬
‫פתרון‬
‫מבחן טיב התאמה‪ .‬הסביבון הוגן ‪ H0 :‬הסביבון אינו הוגן ‪H1 :‬‬
‫‪i  1, 2,3, 4‬‬
‫‪1‬‬
‫‪4‬‬
‫‪ H 0 : pi ‬אחרת ‪H1 :‬‬
‫תוצאה‬
‫נס‬
‫גדול‬
‫היה‬
‫פה‬
‫‪Oi‬‬
‫‪24‬‬
‫‪8‬‬
‫‪30‬‬
‫‪18‬‬
‫‪pi‬‬
‫‪0.25‬‬
‫‪0.25‬‬
‫‪0.25‬‬
‫‪0.25‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪18‬‬
20
20
4
2  
i 1
20
20
Ei
(Oi  Ei )2
2
 13.2   0.05
(3)  7.815
Ei
.‫לא ניתן לומר שהסביבון הוגן‬, 0.05 ‫דוחים את השערת האפס ברמת מובהקות‬
19
[email protected]
|
www.OpenBook.co.il
‫מבחנים א – פרמטריים לשני מדגמים‬
‫שני מדגמים מזווגים = תלויים‬
‫במדגמים תלויים אנו נחשב הפרש בין ‪ 2‬המדגמים‪.‬‬
‫מדגמים תלויים – לפני‪/‬אחרי שימוש בתרופה וכו‬
‫דיכוטומיים – טבלה ‪ .2*2‬תשובות כן‪/‬לא‬
‫במבחן א – פרמטריים למדגמים תלויים מתעלמים מחישוב זוגות שלא חל שינוי – בהם ההפרש=‪.0‬‬
‫מבחן הסימן‬
‫כאשר מדובר בשני מדגמים תלויים (מזווגים) אך לא ניתן לחשב הפרשים או שלא נתונים ההפרשים‬
‫אלא רק מספר העליות או הירידות (או ללא שינוי)‬
‫א‪ .‬בודקים בכמה מקרים יש עליה (‪ )+‬ירידה (‪ )-‬או ללא שינוי (‪.)0‬‬
‫ב‪ .‬מתעלמים בחישוב מזוגות שלא חל בהם שינוי (לא נכללים בחישוב‪.) n‬‬
‫ג‪ .‬שיטת הבדיקה זהה לחלוטין למבחן הבינום כאשר תמיד תחת ‪p=0.5 .‬‬
‫השערות‪:‬‬
‫לא קיים הבדל בין (‪ )+‬ל (‪H 0 )-‬‬
‫‪H 0 : p()  p()  0.5‬‬
‫נדחה את ‪ 𝐻0‬אם ‪Pv  ‬‬
‫שלבי מבחן הסימן‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫להבחין במקרה‬
‫לנסח את ההשערות (מבחן שמאלי‪ ,‬ימני‪ ,‬דו צדדי)‬
‫לבנות טבלת הסימנים‬
‫לקבל את ההחלטה‪ :‬דחה ‪ 𝐻0‬אם‪:‬‬
‫‪ .a‬חד צדדי‪𝑃 (𝑋 ≥ 𝑘) = 1 − P  X  k   1  P  X  k  1   :‬‬
‫𝛼 ≤ )‪𝑃(𝑋 ≤ 𝑘 − 1‬‬
‫‪ .i‬מבחן ימני – ‪ k‬הוא מספר ה"‪"+‬‬
‫‪ .ii‬מבחן שמאלי – ‪ k‬הוא מספר ה"‪"-‬‬
‫‪ .b‬דו‪-‬צדדי‪ k( 2 ⋅ 𝑃(𝑋 ≤ 𝑘) ≤ 𝛼 :‬הנמוך מבין ה‪ "-" -‬או "‪)"+‬‬
‫שאלה ‪ 1‬ממבחן‬
‫פסיכולוג א' ביצע סקר‪ ,‬שהקיף ‪ 14‬משפחות של חיילים‪ ,‬ששבוע קודם לכן השתחררו משירות‬
‫מילואים ממושך‪ .‬הוא בדק את מידת ההבנה החינוכית של האב לבנו בהשוואה לזו של האם‪.‬‬
‫התוצאות הראו‪ ,‬שב‪ 11 -‬משפחות עלתה ההבנה החינוכית של האם על זו של האב‪ ,‬וב‪ 3 -‬משפחות‬
‫– ההפך‪ .‬מה אפשר להסיק מתוצאות אלה ברמת מובהקות ‪?2.5%‬‬
‫פתרון‪:‬‬
‫מבחן הסימן ‪.‬‬
‫אין הבדל במידת ההבנה החינוכית בין האב לאם ‪, 𝐻0 :‬‬
‫יש הבדל במידת ההבנה החינוכית בין האב לאם‪𝐻1 :‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪20‬‬
‫בהנחת השערת האפס‬
‫‪1‬‬
‫) ‪ - X ~ B(14,‬מס' ה‪. + -‬‬
‫‪2‬‬
‫‪1‬‬
‫‪2‬‬
‫‪H0 : p ‬‬
‫‪,‬‬
‫‪1‬‬
‫‪2‬‬
‫‪H1 : p ‬‬
‫במדגם התקבלו ‪ )+( 11‬ולכן ‪:‬‬
‫‪2 P( X  11)  2(1  P( X  10))  2  0.029  0.058  0.025‬‬
‫או שנשתמש ב‪ k‬הנמוך מבין ה‪2 ⋅ 𝑃(𝑋 ≤ 3) = 2 ∙ 0.029 = 0.058 > 0.025 – 2‬‬
‫לכן לא דוחים את השערת האפס ולא הוכח שיש הבדל במידת ההבנה החינוכית בין האב לאם ברמת‬
‫מובהקות ‪0.025‬‬
‫שאלה ‪( 2‬פתרון מלא ומוקלט באתר ‪)www.openbook.co.il‬‬
‫חוקר במשרד התחבורה טוען כי נהגים ותיקים מבצעים פחות עבירות תנועה מנהגים חדשים‪ .‬לצורך‬
‫בדיקת הטענה נלקח מדגם מקרי של ‪ 16‬נהגים‪ ,‬ונספרו מספר עבירות התנועה שלהם בשנה‬
‫הראשונה לקבלת הרישיון וכעבור עשר שנים‪ .‬התוצאות הראו כי אצל ‪ 11‬נהגים מספר העבירות‬
‫בשנה העשירית היה קטן ממספר העבירות בשנה הראשונה ואילו אצל ‪ 5‬נהגים מספר העבירות‬
‫בשנה העשירית היה גדול ממספר העבירות בשנה הראשונה לקבלת הרישיון‪ .‬האם התוצאות‬
‫מאששות את טענת החוקר ברמת מובהקות של ‪5%‬‬
‫פתרון‬
‫המדגמים הם תלויים‪ ,‬משתנה שמי דיכוטומיים‪.‬‬
‫נעשה יותר‪/‬פחות עבירות תנועה => מבחן הסימן!‬
‫כי לא ניתן לחשב הפרש או לא נתון הפרש אלא רק מספר העליות או הירידות או ללא שינוי‪.‬‬
‫נתון ‪n=16‬‬
‫(‪ = )+‬נהגים וותיקים עושים פחות עבירות תנועה מחדשים‬
‫(‪ – )-‬נהגים ותיקים עושים יותר עבירות תנועה מנהגים חדשים‬
‫השערות‪H 0 : p()  p()  0.5 :‬‬
‫‪,‬‬
‫כלל ההכרעה‪ :‬קבלת ‪𝛼 ′ > 0.05 : 𝐻0‬‬
‫‪ ,‬דחיית ‪𝛼 ′ ≤ 0.05 : 𝐻0‬‬
‫‪H1 p(+)>0.5‬‬
‫חישוב ‪ 𝜶′‬כאשר נתון‪n=16,p=0.5, (+)=11,(-)=5 :‬‬
‫‪𝛼 ′ = 𝑝[(+) ≥ 11] = 1 − 𝑝[(+) ≤ 10] = 1 − 0.895 = 0.105 > 0.05‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪21‬‬
‫שאלה ‪( 3‬פתרון מלא ומוקלט באתר ‪)www.openbook.co.il‬‬
‫לבדיקת הטענה ‪ ,‬שהחדרה לשוק של נוזל כביסה חדש באמצעות חלוקת דוגמיות מעלה את מידת‬
‫הצריכה במוצר‪ ,‬נשאלו ‪ 50‬נבדקים על מידת השימוש במוצר לפני חלוקת הדוגמיות‪ ,‬ושבוע לאחר‬
‫השימוש בדוגמיות‪ .‬התוצאות שהתקבלו היו‪:‬‬
‫‪ 21‬אנשים השתמשו במוצר לפני קבלת הדוגמית וגם לאחר החלוקה‪.‬‬
‫‪ 7‬אנשים השתמשו במוצר לפני קבלת הדוגמית אך לא השתמשו בו לאחר החלוקה‪.‬‬
‫‪ 14‬אנשים לא השתמשו במוצר לפני קבלת הדוגמית אך השתמשו בו לאחר החלוקה‪.‬‬
‫ו‪ 8 -‬אנשים לא השתמשו במוצר לפני קבלת הדוגמית וגם לא לאחר מכן‬
‫מהי מסקנת המחקר ברמת מובהקות ‪ ?0.05‬נמק‪.‬‬
‫פתרון‬
‫שני מדגמים תלויים‪ ,‬משתנים דיכוטומיים‪ ,‬מבחן חד צדדי‪ ,‬מבחן הסימן‬
‫לחלוקת דוגמיות אין השפעה על עליית מידת הצריכה ‪H0 :‬‬
‫חלוקת הדוגמיות מעלה את מידת הצריכה ‪H1 :‬‬
‫לחלוקת דוגמיות אין השפעה על עליית מידת הצריכה ‪H 0 : p  0.5‬‬
‫חלוקת הדוגמיות מעלה את מידת הצריכה ‪H1 : p  0.5‬‬
‫‪n = 7 +14 = 21‬‬
‫)‪ X~Bin(21,p‬מספר האנשים שהשתמשו לפני אך לא השתמשו אחרי‪.‬‬
‫לפני‬
‫השתמשו‬
‫‪www.OpenBook.co.il‬‬
‫לא השתמשו‬
‫|‬
‫‪[email protected]‬‬
‫‪22‬‬
‫השתמשו‬
‫‪21‬‬
‫‪14‬‬
‫‪35‬‬
‫לא השתמשו‬
‫‪7‬‬
‫‪8‬‬
‫‪15‬‬
‫‪28‬‬
‫‪22‬‬
‫‪50‬‬
‫אחרי‬
‫‪𝑝(𝑋 ≤ 7 |𝐻0) = 0.095 > 0.05‬‬
‫לכן השערת האפס אינה נדחית‬
‫לא ניתן לומר שחלוקת הדוגמיות מעלה את כמות הצריכה‬
‫שאלה ‪4‬‬
‫‪ 15‬זוגות נשואים טופלו בשני סוגי טיפולים‪ :‬טיפול פרטני לאחד מבני הזוג וטיפול קבוצתי לבן הזוג‬
‫השני‪ .‬פסיכולוגים נדרשו לבצע הערכות להצלחת הטיפול לכל אחד מבני הזוג בנפרד ולציין ב‪ )+( -‬אם‬
‫הטיפול הפרטני היה מוצלח יותר וב‪ )-( -‬אם הטיפול הקבוצתי היה מוצלח יותר‪.‬‬
‫לבדיקת טענת הפסיכולוגים‪ ,‬שהטיפול הפרטני עדיף‪ ,‬נקבע כי אם יהיו לפחות ‪ 11‬זוגות‪ ,‬שבהם‬
‫הטיפול הפרטני מוצלח יותר‪ ,‬השערת האפס תידחה‪.‬‬
‫א‪ .‬מהי רמת המובהקות של המבחן המוצע ?‬
‫ב‪ .‬מהי עצמת המבחן אם ידוע כי טיפול פרטני יעיל יותר מטיפול קבוצתי ב‪ 80% -‬מהמקרים‪.‬‬
‫ג‪ .‬אם נמצא כי רק אצל ‪ 3‬זוגות‪ ,‬הטיפול הקבוצתי היה מוצלח יותר מהטיפול הפרטני‪ ,‬מה‬
‫?תהיה מסקנתך ברמת מובהקות ‪0.05‬‬
‫פתרון‬
‫א‪ .‬מדובר במבחן הסימן‪ ,‬שאזור הדחייה בו הוא ‪ – X( X  11‬מס' הזוגות שבהם הטיפול הפרטני‬
‫מוצלח יותר)‪ .‬תחת הנחת השערת האפס‪( p=0.5 ,‬הטיפולים שווי ערך) ולכן‪:‬‬
‫‪  P( X  11)  1  P( X  10 )  1  0.941  0.059‬‬
‫ב‪ .‬בהנחת ‪ ,)p=0.8 ( H 1‬עבור מדגם בגודל ‪( :15‬מסתכלים בטבלה בעמוד ‪)49‬‬
‫‪1    P( X  11)  1  P( X  10 )  1  0.1642  0.8358‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪23‬‬
‫ג‪ .‬מבחן הסימן‪:‬‬
‫הטיפול הפרטני אינו עדיף על הטיפול הקבוצתי ‪, H 0 :‬‬
‫הטיפול הפרטני עדיף על הטיפול הקבוצתי ‪H1 :‬‬
‫בהנחת השערת האפס )‪ - X~B(15,0.5‬מס' המינוסים ‪.‬‬
‫אם טענת ‪ H1‬נכונה‪ ,‬נצפה למעט מינוסים‪.‬‬
‫במדגם התקבלו ‪ 3‬מינוסים ולכן ‪P( X  3)  0.018  0.05 :‬‬
‫לכן דוחים את השערת האפס והוכח שהטיפול הפרטני עדיף על הטיפול הקבוצתי ברמת מובהקות‬
‫‪.0.05‬‬
‫שאלה ‪ 5‬סעיף ממבחן‬
‫חוקר במשרד התחבורה טוען‪ ,‬שנהגים ותיקים מבצעים פחות עבירות תנועה מנהגים חדשים‪ .‬לצורך‬
‫בדיקת הטענה נלקח מדגם מקרי של ‪ 16‬נהגים‪ ,‬ונספרו מספר עבירות התנועה שלהם בשנה‬
‫הראשונה לקבלת הרישיון (שבה היו נהגים חדשים) וכעבור עשר שנים כשהיו כבר נהגים ותיקים‪.‬‬
‫התוצאות הראו שאצל ‪ 12‬נהגים מספר העבירות בשנה העשירית היה קטן ממספר העבירות בשנה‬
‫הראשונה ואילו אצל ‪ 4‬נהגים מספר העבירות בשנה העשירית היה גדול ממספר העבירות בשנה‬
‫הראשונה לקבלת רישיון הנהיגה‪.‬‬
‫‪ )1‬מה המבחן בו תשתמש לבדיקת טענת החוקר?‬
‫‪ )2‬האם תקבל את טענת החוקר ברמת מובהקות ‪?0.05‬‬
‫סעיף ‪1‬‬
‫המדגמים הם תלויים‪ ,‬משתנה שמי דיכוטומיים‪.‬‬
‫נעשה יותר‪/‬פחות עבירות תנועה => מבחן הסימן!‬
‫כי לא ניתן לחשב הפרש או לא נתון הפרש אלא רק מספר העליות‬
‫או הירידות או ללא שינוי‪.‬‬
‫סעיף ‪2‬‬
‫נתון ‪n=16‬‬
‫(‪ = )+‬נהגים וותיקים עושים פחות עבירות תנועה מחדשים‬
‫(‪ – )-‬נהגים ותיקים עושים יותר עבירות תנועה מנהגים חדשים‬
‫נסתכל על ההפרש בין מספר עבירות התנועה של כל אחד מהנהגים כנהג צעיר לבין מספר העבירות‬
‫כנהג ותיק‪ .‬יהי ‪ X‬מספר ההפרשים החיוביים‪ ,‬לפי השערת האפס )‪.X~B(16,0.5‬‬
‫נחשב את ההסתברות לקבל תוצאה כמו זו שהתקבלה במדגם או קיצונית ממנה‪,‬‬
‫‪P  X  12   1  P  X  11  1  0.962  0.038‬‬
‫הסתברות זו קטנה מרמת המובהקות ‪ , 0.05‬ולכן נדחה את השערת האפס ונסיק כי נהגים ותיקים‬
‫מבצעים פחות עבירות תנועה מנהגים ותיקים‪.‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪24‬‬
‫מבחן וילקוקסון למדגמים מזווגים תלויים‬
‫זהו מבחן המקביל למבחן ‪ t‬למדגמים תלויים‪.‬‬
‫כאשר מדובר בשני מדגמים תלויים (מזווגים)‪ ,‬ואין הנחת התפלגות נורמלית‪ ,‬מדגם קטן‪ ,‬וניתן לחשב‬
‫הפרשים‪ .‬במבחן הסימן‪ -‬לא שמנו לב לגודל המוחלט של ההפרש כדי להתגבר על בעיה זו הציע‬
‫וילקוקסון בשנת ‪ 1945‬את המבחן הזה‪ .‬מתחשבים בגודל המוחלט של ההפרש ולא רק בכוונו‪ .‬לצורך‬
‫חישוב מבחן זה יש לערוך טבלת דירוגים‪.‬‬
‫כאשר שני המשתנים תלויים‪ ,‬המידע הוא ‪ n‬זוגות של תצפיות‪ ,‬אין הנחת נורמליות‪ ,‬מדרגים את‬
‫הערך המוחלט של ההפרשים‪ , 𝐷 = 𝑋2 − 𝑋1 .‬מתעלמים מזוגות שהפרשם אפס‪.‬‬
‫אלגוריתם לחישוב מבחן וילקוקסון למזווגים‬
‫‪.1‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪.4‬‬
‫‪.5‬‬
‫‪.6‬‬
‫‪.7‬‬
‫כמו במבחן ‪ t‬למדגמים תלויים‪ ,‬עבור כל נבדק‪ /‬זוג מחשבים את ההפרש בין שתי התצפיות‬
‫𝑖𝑦 ‪( 𝑑𝑖 = 𝑥𝑖 −‬כאשר קיבלנו הפרש=‪ 0‬הנבדקים בעלי ‪ d=0‬נזרקים מהניתוח ומתקנים את‬
‫גודל ה‪ n‬בה תאם למספר זוגות להם קיים הפרש בין שתי תצפיות‪.‬‬
‫מדרגים את הערכים המוחלטים | 𝑖𝑑| ‪ ,‬צריך לנטרל אפס‬
‫נדרג את הערך מוחלט מ‪(1-‬הנמוך) אם יש ערכים שווים הדרוג יהיה ממוצע הדרוגים‬
‫נסמן בנפרד דרוגים שבמקור שליליים מדירוגים שבמקור חיוביים ע"י הוספת ‪ 2‬שורות‬
‫נוספות ‪ w‬המציין דירוגים שבמקור שליליים‪ ,‬ו ‪ w ‬שמציין דירוגים שבמקור חיוביים‪.‬‬
‫סוכמים בנפרד את הדירוגים שמקורם בהפרש חיובי‪ ,‬ובנפרד את הדירוגים שמקורם‬
‫בהפרש שלילי‪.‬‬
‫בוחרים את הקטן שמבין שני הסכומים ומגדירים אותו כ‪ w -‬זהו הסטטיסטי של מבחן זה‬
‫בודקים אם הסטטיסטי ‪ w‬קטן או שווה לערך הקריטי המופיע בטבלה המתאימה עבור ‪‬‬
‫נתונה‪ ,‬ואז נדחה‪/‬נקבל את ‪( H 0‬אנו דוחים כאשר ערך הסטטיסטי קטן או שווה לערך‬
‫הקריטי המופיע בטבלה)‬
‫כלל ההכרעה‪ :‬נסתכל על ‪ w‬הקטן במבחן‪ .‬אם ‪ w  c‬אז נדחה ‪. H 0‬‬
‫‪ – C‬ערך קריטי בטבלה בעמוד ‪ 51‬ערכים קריטיים של ‪ W‬למבחן וילקוקסון למדגמים מזווגים‪.‬‬
‫הכרעה‪ :‬דחה את ‪ H 0‬אם ‪ W  c‬לפי הטבלה של חד ‪ /‬דו צדדי‬
‫שאלה ‪1‬‬
‫הטבלה הבאה מציגה את מספר שעות השינה לאחר קבלת תרופה מסוימת‪ ,‬ומספר שעות השינה‬
‫לפני קבלתה‪ ,‬של ‪ 9‬חולים שקיבלו תרופה מסויימת‪.‬‬
‫מספר שעות השינה לפני‬
‫קבלת התרופה‬
‫‪7‬‬
‫‪5‬‬
‫‪6.5‬‬
‫‪6.5‬‬
‫‪7‬‬
‫‪5‬‬
‫‪4.5‬‬
‫‪8‬‬
‫‪8‬‬
‫מספר שעות השינה‬
‫אחרי קבלת התרופה‬
‫‪8‬‬
‫‪7‬‬
‫‪6‬‬
‫‪8‬‬
‫‪7‬‬
‫‪8‬‬
‫‪8.5‬‬
‫‪7‬‬
‫‪9‬‬
‫האם לתרופה השפעה חיובית על מספר שעות השינה‪ ,‬כאשר לא ניתן להניח התפלגות נורמלית‬
‫של שעות השינה ? נסח את ההשערות‪ ,‬הסבר מהו המבחן המתאים ובדוק ברמת מובהקות ‪.0.05‬‬
‫פתרון‬
‫מבחן וילקוקסון למדגמים תלויים‪.‬‬
‫לתרופה אין השפעה חיובית על מספר שעות השינה ‪H 0 :‬‬
‫לתרופה יש השפעה חיובית על מספר שעות השינה ‪H1 :‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪25‬‬
‫‪r‬‬
‫‪r‬‬
‫‪rd‬‬
‫‪3‬‬
‫‪3‬‬
‫‪1‬‬
‫‪7‬‬
‫‪6‬‬
‫‪6‬‬
‫‪2‬‬
‫‪5‬‬
‫‪7‬‬
‫‪1‬‬
‫‪-0.5‬‬
‫‪6.5‬‬
‫‪6‬‬
‫‪5‬‬
‫‪5‬‬
‫‪1.5‬‬
‫‪6.5‬‬
‫‪8‬‬
‫‪-‬‬
‫‪-‬‬
‫‪-‬‬
‫‪7‬‬
‫‪7‬‬
‫‪7‬‬
‫‪7‬‬
‫‪3‬‬
‫‪5‬‬
‫‪8‬‬
‫‪8‬‬
‫‪8‬‬
‫‪4‬‬
‫‪4.5‬‬
‫‪8.5‬‬
‫‪3‬‬
‫‪-1‬‬
‫‪8‬‬
‫‪7‬‬
‫‪3‬‬
‫‪1‬‬
‫‪8‬‬
‫‪9‬‬
‫‪3‬‬
‫‪3‬‬
‫‪w  4‬‬
‫‪di‬‬
‫‪8‬‬
‫‪1‬‬
‫‪-‬‬
‫לפני קבלת‬
‫התרופה‬
‫אחרי קבלת‬
‫התרופה‬
‫‪w  32‬‬
‫הערך הקריטי מטבלה ‪ 5‬עמ' ‪ ( 102‬או עמ' ‪ 53‬בחוברת הקורס) עבור ‪ n=8‬ברמת מובהקות ‪0.05‬‬
‫הוא ‪ 4 > 6‬ולכן דוחים את השערת האפס‪ .‬כלומר ניתן לומר שלתרופה יש השפעה חיובית על מספר‬
‫שעות השינה‪.‬‬
‫שאלה‪( 2‬פתרון מלא ומוקלט באתר ‪)www.openbook.co.il‬‬
‫במחקר מסוים נבדק יבול הקפה (מספר שקים בחודש) ב ‪ 7‬חוות קטנות‬
‫לפני ואחרי שימוש בשיטת טיפול חדשנית נגד פטרייה מזיקה‪:‬‬
‫חווה‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫‪6‬‬
‫‪7‬‬
‫לפני‬
‫‪5‬‬
‫‪6‬‬
‫‪7‬‬
‫‪8‬‬
‫‪4‬‬
‫‪3‬‬
‫‪6‬‬
‫אחרי‬
‫‪10‬‬
‫‪9‬‬
‫‪9‬‬
‫‪8‬‬
‫‪13‬‬
‫‪8‬‬
‫‪9‬‬
‫ידוע שהיבול אינו מתפלג נורמלית‪.‬‬
‫בדוק את ההשערה שהתפלגות היבול לאחר הטיפול שונה מהתפלגות היבול לפני הטיפול ברמת‬
‫מובהקות ‪ .0.05‬נמק‬
‫מבחן וילקוקסון למדגמים תלויים‪:‬‬
‫התפלגות יבול הקפה לפני הטיפול שווה להתפלגות יבול הקפה אחרי הטיפול ‪H0:‬‬
‫התפלגות יבול הקפה לפני הטיפול שונה מהתפלגות יבול הקפה אחרי הטיפול ‪H1:‬‬
‫נסמן‪:‬‬
‫יבול הקפה אחרי הטיפול ‪X2 :‬‬
‫יבול הקפה לפני הטיפול ‪X1 :‬‬
‫‪D = X1 - X2‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪26‬‬
‫בדיקה‪= 21 = 21 + 0 :‬‬
‫‪6∙7‬‬
‫‪2‬‬
‫=‬
‫)‪𝑛(𝑛+1‬‬
‫‪2‬‬
‫= ‪𝑤− + 𝑤+‬‬
‫הסטטיסטי הוא ‪𝑤+ :‬‬
‫כלל הכרעה‪ :‬הערך הקריטי עבור מבחן דו צדדי ‪ n=6‬בר"מ ‪ 0.05‬הוא ‪.1‬‬
‫נדחה ‪ 𝐻0‬ברמת מובהקות ‪ 0.05‬אם ‪𝑊 ≤ 1‬‬
‫החלטה‪ W=0<1 :‬ולכן דוחים את השערת האפס‪.‬‬
‫כלומר ברמת מובהקות ‪ 0.05‬ניתן לומר התפלגות יבול הקפה לפני הטיפול שונה מהתפלגות יבול‬
‫הקפה אחרי הטיפול‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪27‬‬
‫מבחן מקנמר‬
‫נשתמש במבחן זה כאשר‪ :‬מדגמים תלויים מזווגים‪ ,‬שמיים (בינומיים)‪ ,‬דיכוטומיים (כן‪/‬לא) ותלויים‪,‬‬
‫טבלה דו ממדית (‪ )2*2‬לנתונים שמיים ‪ ,‬מבחן דו צדדי‪ .‬המבחן עושה שימוש בטיב התאמה עם ‪2‬‬
‫קטגוריות‪ .‬אמרנו שאם אין השפעה – מה זה השפעה? הפרש =‪ 0‬אז מתעלמים לכן אם לפני אין‬
‫שינוי ואחרי אינן שינוי – נתעלם? ואם לפני יש שינוי ואחרי יש שינוי נתעלם? לכן נמחק את התוצאות‬
‫הלא רלוונטיות‪.‬‬
‫הסטטיסטי נקבע ע"י השכיחויות של התאים‪/‬מקרים ששינו את דעתם ‪ .B+C‬מתחלק ל‪ 2‬חלקים‪:‬‬
‫‪ .1‬כשההשערה דו צדדית ו‪ B+C>20 -‬משתמשים בהתפלגות חי בריבוע עם דרגת חופש‬
‫‪(B C)2‬‬
‫אחת‪ .‬סטטיסטי המבחן ‪~ 21‬‬
‫‪BC‬‬
‫‪2‬‬
‫‪ .  ‬נדחה את‬
‫‪H0‬‬
‫אם‬
‫‪ ‬‬
‫‪2‬‬
‫‪ 1‬‬
‫‪2‬‬
‫‪ .2‬כשההשערה חד צדדית או ‪ B  C  20‬משתמשים בהתפלגות בינומית‪ .‬משתמשים‬
‫במבחן הסימן ‪ .B+C=n‬דחה ‪ H 0‬אם ‪p.v  ‬‬
‫טבלת שכיחויות ‪:2*2‬‬
‫ערך ‪1‬‬
‫ערך ‪1‬‬
‫ערך ‪2‬‬
‫יש שינוי‬
‫אין שינוי‬
‫אין שינוי‬
‫סך הנבדקים בעלי ערך ‪ 2‬אחרי‬
‫סך הנבדקים בעלי ערך ‪2‬‬
‫לפני (בעבר)‬
‫‪ = N‬סך הנבדקים הכולל‬
‫‪C‬‬
‫סך הנבדקים בעלי ערך ‪1‬‬
‫לפני (בעבר)‬
‫סך הנבדקים בעלי ערך ‪ 1‬אחרי‬
‫‪B‬‬
‫יש שינוי‬
‫ערך ‪2‬‬
‫נסמן ב‪ B-‬ו‪ C-‬את ‪ 2‬התאים שחל‬
‫בהם שינוי‬
‫לאחר מכן בודקים באמצעות התפלגות‬
‫‪2‬‬
‫האם קיים פער בין ‪ B‬ל‪.C-‬‬
‫שאלה ‪ 1‬ממבחן‬
‫פסיכולוג ב' ביצע סקר‪ ,‬שהקיף ‪ 65‬חיילי מילואים‪ .‬הוא בדק את מידת ההבנה החינוכית שלהם לפני‬
‫שירות המילואים ולאחריו‪ ,‬וקיבל את התוצאות האלה‪:‬‬
‫מה אפשר להסיק מתוצאות אלה בר"מ ‪?2.5%‬‬
‫פתרון‬
‫למילואים אין השפעה על מידת ההבנה החינוכית‬
‫‪H0 :‬‬
‫למילואים יש השפעה על מידת ההבנה החינוכית ‪H1 :‬‬
‫‪(10  30)2‬‬
‫‪2‬‬
‫‪ ‬‬
‫‪ 10   0.025‬‬
‫‪ 5.024‬‬
‫‪10  30‬‬
‫‪2‬‬
‫לכן דוחים את ‪ , H 0‬הוכח כי למילואים יש השפעה על מידת ההבנה החינוכית בר"מ ‪0.025‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪28‬‬
‫שאלה ‪2‬‬
‫לפני עימות רדיופוני שבא לקבוע מי מבין שני מועמדים פופולרי יותר בקרב בני הנוער‪ ,‬נדרשו ‪300‬‬
‫בני נוער להכריע בין שניהם‪ .‬לאחר העימות נשאלו אותם בני נוער בשנית‪ .‬להלן התוצאות‪:‬‬
‫לפני‬
‫מועמד ‪1‬‬
‫מועמד ‪2‬‬
‫אחרי‬
‫מועמד‪1‬‬
‫‪102‬‬
‫‪23‬‬
‫מועמד ‪2‬‬
‫‪18‬‬
‫‪157‬‬
‫האם שדרן רדיו יכול לקבוע ברמת מובהקות של ‪ 5%‬שקיים הבדל בין שני המועמדים במספר הקולות‬
‫שסחפו לטובתם?‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪29‬‬
‫שאלה ‪3‬‬
‫חברה מייצרת אבקת כביסה רוצה לבדוק אם פרסום באמצעות חלוקת דוגמיות משפיע על קניית‬
‫מוצרים בקרב הלקוחות‪ .‬לשם כך נדגמו מקרית ‪ 50‬אנשים שנשאלו אם הם משתמשים באבקת‬
‫כביסה מסוימת לפני ואחרי החלוקה‪ .‬נמצא כי ‪ 21‬מתוכם השתמשו באבקת הכביסה בעבר‪ ,‬כש‪15 -‬‬
‫מתוך ה‪ 21 -‬המשיכו להשתמש גם לאחר חלוקת הדוגמיות‪ ,‬ובנוסף הצטרפו ‪ 19‬משתמשים חדשים‬
‫באבקה לאחר חלוקת הדוגמיות‪.‬‬
‫א‪.‬‬
‫בדוק בר"מ ‪ 0.01‬את ההשפעה שיש לשיטת פרסום זו על השימוש במוצר‪.‬‬
‫ב‪.‬‬
‫בדוק בר"מ ‪ 0.01‬אם שיטת הפרסום מעלה את השימוש במוצר‪.‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪30‬‬
31
[email protected]
|
www.OpenBook.co.il
‫שאלה ‪4‬‬
‫חוקר ביקש לבדוק האם מצב משפחתי משפיע על עבירות תנועה‪ .‬הוא דגם מקרית ‪ 80‬אנשים‬
‫רווקים‪ /‬ות העומדים להינשא בשנה הקרובה ומצא כי ‪ 30‬מתוכם ביצעו עבירות תנועה בשנה‬
‫האחרונה‪ .‬כעבור שנה‪ ,‬כאשר היו כבר נשואים‪ ,‬הוא גילה כי מתוך ה ‪ 7 ,30-‬המשיכו לבצע עבירות‪,‬‬
‫וכמו כן נוספו ‪ 9‬עבריינים נוספים ( שבעבר לא ביצעו עבירות תנועה )‪ .‬בדוק את הטענה ברמת‬
‫מובהקות ‪ 0.01‬ונמק בחירתך במבחן הסטטיסטי המתאים‪.‬‬
‫פתרון שאלה ‪4‬‬
‫כיוו ן שמדובר בטבלה דו מימדית‪ ,‬בה ישנו משתנה שמי‪ ,‬ומדובר במדגמים תלויים ( לפני ואחרי )‬
‫והמבחן דו צדדי אז המבחן המבוקש הוא מבחן מקנמר‪.‬‬
‫רווק ‪-‬לפני‬
‫עבריין לא עבריין‬
‫‪16‬‬
‫‪9‬‬
‫‪7‬‬
‫נשוי עבריין‬
‫‪64‬‬
‫‪41‬‬
‫אחרי לא עבריין ‪23‬‬
‫‪80‬‬
‫‪50‬‬
‫‪30‬‬
‫ניסוח השערות ‪ :‬מצב משפחתי לא משפיע על עבירות תנועה ‪H 0 :‬‬
‫למצב המשפחתי השפעה על עבירות התנועה ‪H1 :‬‬
‫שלב ‪~  (1) : 1‬‬
‫‪2‬‬
‫לכן ‪B  9 :‬‬
‫‪ B  C 2‬‬
‫‪BC‬‬
‫‪C  23‬‬
‫בדוגמה זו יש להתייחס רק למספר האנשים שחל אצלם שינוי‪.‬‬
‫שלב שני ‪ :‬כלל הכרעה ‪ :‬דחה ‪ H 0‬עבור כל‬
‫‪2‬‬
‫‪ ‬מחושב הגדול מ ‪ ( 6.635‬המתאים לר"מ ‪.) 0.01‬‬
‫‪2‬‬
‫‪9  23 ‬‬
‫‪2‬‬
‫‪B  C ‬‬
‫‪196‬‬
‫שלב שלישי ‪ :‬חישוב ‪  2‬מחושב ‪ 6.125  6.635 :‬‬
‫‪BC‬‬
‫‪9  23‬‬
‫‪32‬‬
‫המסקנה‪ :‬קבל ‪ H 0‬ולא ניתן לומר שלמצב המשפחתי השפעה על עבירות תנועה‪.‬‬
‫‪‬‬
‫‪‬‬
‫ולכן‬
‫שאלה ‪5‬‬
‫כדי לבדוק אם להורמון מסוים יש השפעה כלשהי על יכולת החשיבה‪ ,‬נבחרו ‪ 50‬אנשים באופן מקרי‬
‫ונערכה להם בחינה‪ .‬לאחר מכן קבלו כל הנחקרים את ההורמון ונערך להם מבחן נוסף‪ .‬התוצאות‬
‫שהתקבלו הראו כי מתוך ‪ 36‬האנשים שעברו את בהצלחה את המבחן הראשון‪ 20 ,‬עברו גם את‬
‫ה שני בהצלחה‪ .‬כמו כן מחצית האנשים שנכשלו במבחן הראשון נכשלו גם בשני‪.‬‬
‫האם ניתן לומר‪ ,‬בר"מ ‪ 0.025‬שלהורמון יש השפעה כלשהי על יכולת החשיבה? הסבר ונמק‪.‬‬
‫פתרון שאלה ‪5‬‬
‫מבחן מקנמר‪:‬‬
‫נכשלו‬
‫‪B = 16‬‬
‫‪7‬‬
‫‪23‬‬
‫עברו‬
‫מבחן ‪ / I‬מבחן ‪II‬‬
‫‪20‬‬
‫עברו‬
‫‪C=7‬‬
‫נכשלו‬
‫‪27‬‬
‫סה"כ‬
‫השערות‪ :‬להורמון אין השפעה על יכולת החשיבה ‪H 0 :‬‬
‫סה"כ‬
‫‪36‬‬
‫‪14‬‬
‫‪50‬‬
‫להורמון יש השפעה על יכולת החשיבה ‪H1 :‬‬
‫‪( B  C )2‬‬
‫הנחות‪~  2 (1) :‬‬
‫‪BC‬‬
‫‪B  C  23  20 ‬‬
‫רמת מובהקות ואזורי דחייה וקבלה‪ :‬רמת מובהקות ‪ ,0.025‬מבחן דו צדדי‪.  0.025 (1)  5.024 ,‬‬
‫‪2‬‬
‫דחה ‪ H 0‬אם‬
‫‪.   5.024‬‬
‫‪www.OpenBook.co.il‬‬
‫‪2‬‬
‫|‬
‫‪[email protected]‬‬
‫‪32‬‬
‫‪( B  C )2 (16  7) 2 81‬‬
‫‪ ‬‬
‫‪‬‬
‫‪‬‬
‫חישוב הסטטיסטי‪ 3.521  5.024 :‬‬
‫‪BC‬‬
‫‪16  7‬‬
‫‪23‬‬
‫‪2‬‬
‫החלטה‪ :‬לכן מקבלים את השערת האפס‪ ,‬הוכח כי להורמון אין השפעה על יכולת החשיבה בר"מ‬
‫‪.0.05‬‬
‫שני מדגמים בלתי תלויים‬
‫מבחן וילקוקסון לשני מדגמים בלתי תלויים‬
‫מבחן זה מקביל למבחן ‪ t‬למדגמים ב"ת‪ .‬המשתנים סידוריים או מנה ולא ניתן להניח נורמליות או‬
‫שוויון שונויות‪.‬‬
‫הבסיס התיאורטי למבחן‪ :‬נניח שיש לנו שני מדגמים (ערכי ‪ x‬וערכי ‪ )y‬הלקוחים משתי התפלגויות‪.‬‬
‫‪ :H0‬אין הבדל‬
‫‪ :H1‬יש הבדל‬
‫שלבים בחישוב סטטיסטי המבחן‪:‬‬
‫‪ )1‬מדרגים את כל הערכים בסדר עולה מהנמוך לגבוה ללא הבחנה לקבוצה אליה שייכים (‪n=n1+n2‬‬
‫מס' הנבדקים הוא סכום מספר הנבדקים בשתי הקבוצות)‪.‬‬
‫‪ )2‬מסכמים את הדירוגים של כל קבוצה בנפרד‪ ,‬הסכום של הקבוצה הקטנה יסומן ‪ W A‬ואילו של‬
‫הקבוצה הגדולה ‪( W B‬מספיק לחשב רק את ‪ .)W A‬אם ‪ ,n1=n2‬לא משנה איזה קבוצה בוחרים‪.‬‬
‫‪ )3‬ההתפלגות של ‪ W A‬תחת ‪ )p(x>y)=1/2( H0‬ניתנת לחישוב עבור ‪ n1‬ו‪ n2-‬נתונים‪.‬‬
‫שוב מישהו עשה את העבודה בשבילנו וריכז את הערכים הקריטיים בטבלה‪.‬‬
‫הטבלת מציגה את הערכים הקריטיים של ‪ W A‬עבור ‪-‬ות נבחרות ובהתאם לגודלם של ‪ n1‬ו‪.n2-‬‬
‫ע"מ לדחות את ‪ H0‬הסטטיסטי ‪ W A‬צריך להיות קטן או שווה ל‪( W L-‬הערך הקריטי בזנב התחתון) או‬
‫לחלופין גדול או שווה ל‪( W U-‬הערך הקריטי בזנב העליון)‪.‬‬
‫)‪n1 (n1  1‬‬
‫‪2‬‬
‫הסטטיסטי ‪ U‬מחושב‪:‬‬
‫)‪n2 (n2  1‬‬
‫‪U 2  W2 ‬‬
‫‪2‬‬
‫‪U1  W1 ‬‬
‫)‪U=min(U1,U2‬‬
‫עקרונות ‪ :‬לשם קביעת כלל הכרעה משתמשים ב‪ 2-‬מצבים‪:‬‬
‫‪ .1‬כאשר ‪ n1 , n2  8‬משתמשים בטבלה ‪ 3‬הנותנת‬
‫‪‬‬
‫מינימלית‪.‬‬
‫במבחן חד צדדי דחה את ‪ H 0‬כאשר ‪Pv  P U  u    -‬‬
‫במבחן דו צדדי דחה את ‪ H 0‬כאשר ‪ P U  u    -‬או ‪2P U  u   ‬‬
‫‪2‬‬
‫‪ .2‬כאשר ‪ n1‬או ‪n 2‬‬
‫גדולים מ‪ 8-‬משתמשים בטבלה ‪ 4‬הנותנת ערך קריטי‪ .‬דחה את ‪H 0‬‬
‫כאשר‬
‫‪u  uc‬‬
‫שאלה ‪ 1‬ממבחן‬
‫מרכז הוראה שבקורס שלו קיימת הנחיה דרך הלוויין ("אופק") החליט לבדוק האם יש הבדל בין‬
‫הנחיה זו והנחיה רגילה בכיתה‪ .‬לצורך כך הוא בחר ‪ 20‬סטודנטים‪ 10 ,‬מהם למדו ב"אופק" ו‪10-‬‬
‫בהנחיה רגילה‪ .‬ציוניהם בסוף הקורס נתונים בטבלה הבאה‪:‬‬
‫(לא ניתן להניח התפלגות נורמלית של הציונים)‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪33‬‬
‫‪10‬‬
‫‪9‬‬
‫‪8‬‬
‫‪7‬‬
‫‪6‬‬
‫‪5‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫מספר תלמיד בקבוצתו ‪1‬‬
‫‪89 81‬‬
‫‪53 49 48 37 25 18‬‬
‫‪6 35‬‬
‫"אופק"‬
‫‪93 98 100 91 75 61 64‬‬
‫‪9 57 34‬‬
‫רגילה‬
‫בדוק את השערת המרכז ברמת מובהקות ‪,0.02‬‬
‫א‪ .‬בהנחה כי אלו ‪ 10‬זוגות של סטודנטים שהותאמו לפי ביצועיהם בקורסים קודמים‪.‬‬
‫ב‪ .‬בהנחה כי הסטודנטים נבחרו וחולקו באופן מקרי לשתי קבוצות‬
‫בכל סעיף ציין את המבחן בו בחרת להשתמש ונמק בחירה זו‪.‬‬
‫סעיף א‬
‫נשתמש במבחן וילקוקסון למדגמים מזווגים‪ ,‬כי הסטודנטים חולקו לשתי קבוצות המותאמות לפי‬
‫ביצועיהם בקורסים קודמים ולכן הם תלויים‪.‬‬
‫ההפרשים בין הציונים ודירוגם נתונים בטבלה הבאה‪:‬‬
‫‪89 81‬‬
‫‪53 49 48 37 25 18‬‬
‫‪6 35‬‬
‫"אופק"‬
‫‪93 98 100 91 75 61 64‬‬
‫‪9 57 34‬‬
‫רגילה‬
‫‪9 -51‬‬
‫‪1‬‬
‫הפרש‬
‫‪-4 -17 -47 -42 -27 -24 -39‬‬
‫‪3‬‬
‫דרגות ‪1 +‬‬
‫‪𝑤+ = 4‬‬
‫‪2‬‬
‫‪4‬‬
‫‪9‬‬
‫‪8‬‬
‫‪6‬‬
‫‪5‬‬
‫‪7‬‬
‫‪10‬‬
‫דרגות ‪-‬‬
‫‪𝑤− = 51‬‬
‫הערך הקריטי עבור מבחן דו‪-‬צדדי ברמת מובהקות ‪ 0.02‬עם ‪ ,n=10‬לפי טבלה ערכים קריטיים של ‪W‬‬
‫למבחן וילקוקסון למדגמים מזווגים‪ ,‬הוא ‪.5‬‬
‫‪ 𝑤+ = 4‬לכן נדחה את השערת האפס ונסיק כי יש הבדל בין שתי צורות הנחיה‪.‬‬
‫סעיף ב‬
‫בסעיף זה לא בוצעה התאמה בין הסטודנטים בשתי הקבוצות‪ ,‬לכן נשתמש במבחן וילקוקסון‬
‫למדגמים ב"ת‪.‬‬
‫בטבלה הבאה רשומים הציונים לפי גודלם ודרגותיהם‪:‬‬
‫"אופק"‬
‫רגילה‬
‫דרגות‬
‫"אופק"‬
‫דרגות‬
‫רגילה‬
‫‪18‬‬
‫‪6‬‬
‫‪25‬‬
‫‪9‬‬
‫‪1‬‬
‫‪53‬‬
‫‪34‬‬
‫‪3‬‬
‫‪2‬‬
‫‪35‬‬
‫‪37‬‬
‫‪48‬‬
‫‪49‬‬
‫‪4‬‬
‫‪81‬‬
‫‪57‬‬
‫‪6‬‬
‫‪7‬‬
‫‪8‬‬
‫‪5‬‬
‫‪9‬‬
‫‪61‬‬
‫‪64‬‬
‫‪75‬‬
‫‪15‬‬
‫‪10‬‬
‫‪11‬‬
‫‪12‬‬
‫‪13‬‬
‫‪89‬‬
‫‪91‬‬
‫‪14‬‬
‫‪93‬‬
‫‪98‬‬
‫‪100‬‬
‫‪16‬‬
‫‪17‬‬
‫‪18‬‬
‫‪19‬‬
‫‪20‬‬
‫‪𝑤1‬‬
‫‪= 79‬‬
‫‪𝑤2‬‬
‫‪= 131‬‬
‫נחשב את ערך הסטטיסטי ‪.u‬‬
‫‪n1  n1  1‬‬
‫‪10 11‬‬
‫‪ 79 ‬‬
‫‪ 24‬‬
‫‪2‬‬
‫‪2‬‬
‫‪u1  w1 ‬‬
‫‪n2  n2  1‬‬
‫‪10 11‬‬
‫‪ 131 ‬‬
‫‪ 76‬‬
‫‪2‬‬
‫‪2‬‬
‫‪u2  w2 ‬‬
‫‪ u  min u1 , u2   24‬‬
‫הערך הקריטי עבור ‪ n1  n2  10‬ו‪   0.02 -‬דו צדדי הוא ‪.19‬‬
‫הערך שהתקבל גדול מהערך הקריטי לכן בר"מ ‪ 0.02‬לא נדחה את השערת האפס ונסיק כי אין הבדל‬
‫בין שתי צורות ההנחיה‪.‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪34‬‬
‫שאלה ‪ 2‬ממבחן‬
‫פתרון‬
‫שאלה ‪( 3‬פתרון מלא ומוקלט באתר ‪)www.openbook.co.il‬‬
‫במחקר על משך הזמן של ביצוע חישובים מתמטיים בעקבות אכילת ממתקים‪ ,‬הנבדקים חולקו‬
‫אקראית לשתי קבוצות )קבוצה אחת קיבלה ממתקים והקבוצה השנייה לא קיבלה( לכל אחד‬
‫מהמשתתפים נמדד משך הזמן של פתרון שאלות מתמטיות‪ .‬התוצאות מוצגות להלן‪:‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪35‬‬
‫ללא ממתקים‬
‫‪2.7‬‬
‫‪5.1‬‬
‫‪2.51‬‬
‫‪6.23‬‬
‫‪4.1‬‬
‫‪7.8‬‬
‫עם ממתקים‬
‫‪2.52‬‬
‫‪5.3‬‬
‫‪3.5‬‬
‫‪2.9‬‬
‫‪4.45‬‬
‫‪2.3‬‬
‫‪3.7‬‬
‫בדוק ברמת מובהקות ‪ , 0.05‬האם לאכילת ממתקים יש השפעה כלשהי על משך זמן הביצוע של‬
‫חישובים מתמטיים‪ ,‬כאשר לא ניתן להניח שמשך הזמן מתפלג נורמלית?‬
‫נמק‪.‬‬
‫פתרון‬
‫מבחן וילקוקסון למדגמים בלתי תלויים‪:‬‬
‫‪ : 𝐻0‬לאכילת ממתקים אין השפעה כלשהי על משך זמן הביצוע של חישובים מתמטיים‬
‫‪ : 𝐻1‬לאכילת ממתקים יש השפעה כלשהי על משך זמן הביצוע של חישובים מתמטיים‬
‫במבחן דו צדדי דחה את השערת האפס אם ‪2P U  u   ‬‬
‫)‪𝑛1 (𝑛1 + 1‬‬
‫‪7∙8‬‬
‫‪= 56 −‬‬
‫‪= 28‬‬
‫‪2‬‬
‫‪2‬‬
‫)‪𝑛2 (𝑛2 + 1‬‬
‫‪6∙7‬‬
‫‪𝑈2 = 𝑊2 −‬‬
‫‪= 35 −‬‬
‫‪= 14‬‬
‫‪2‬‬
‫‪2‬‬
‫‪𝑈1 = 𝑊1 −‬‬
‫‪𝑈 = 𝑀𝑖𝑛 (14,28) = 14‬‬
‫בטבלה עבור ‪𝑛1 = 6, 𝑛2 = 7‬‬
‫‪2𝑃 (𝑈 ≤ 14) = 2 ∙ 0.183 = 0.366 > 0.05‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪36‬‬
‫שאלה ‪( 4‬פתרון מלא ומוקלט באתר ‪)www.openbook.co.il‬‬
‫בשתי חנויות של רשת גדולה נרשמו המכירות של מעילי רוח (להלן ‪ )X‬במשך מס' ימים‬
‫יום‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫‪6‬‬
‫‪7‬‬
‫‪8‬‬
‫חנות א‬
‫‪80‬‬
‫‪78‬‬
‫‪60‬‬
‫‪90‬‬
‫‪64‬‬
‫‪58‬‬
‫‪76‬‬
‫‪84‬‬
‫חנות ב‬
‫‪62‬‬
‫‪66‬‬
‫‪60‬‬
‫‪76‬‬
‫‪68‬‬
‫‪56‬‬
‫‪54‬‬
‫א‪ .‬בדוק את ההשערה ששונות ‪ X‬בחנות א' שונה משונות ‪ X‬בחנות ב' ברמת מובהקות‬
‫‪ ,0.1‬בהנחה ש‪ X-‬מתפלג נורמלית‪ .‬נמק‪.‬‬
‫ב‪ .‬בדוק את ההשערה שהתפלגות ‪ X‬בחנות א' שונה מהתפלגות ‪ X‬בחנות ב' ברמת‬
‫מובהקות ‪ ,0.05‬כאשר אי אפשר להניח ש‪ X-‬מתפלג נורמלית‪.‬‬
‫נסמן‪:‬‬
‫‪ - 𝑋1‬מכירות של מעיל רוח בחנות א'‬
‫‪ - 𝑋2‬מכירות של מעיל רוח בחנות ב'‬
‫מבחן להשוואת שתי שונויות‪:‬‬
‫קביעת ההשערות‪:‬‬
‫‪=1‬‬
‫‪𝜎12‬‬
‫‪𝜎22‬‬
‫‪𝐻0 :‬‬
‫;‪≠1‬‬
‫‪𝜎12‬‬
‫‪𝜎22‬‬
‫‪𝐻1 :‬‬
‫הנחות‪:‬‬
‫) ‪𝑋1 ~𝑁(𝜇1 , 𝜎12‬‬
‫;‬
‫) ‪𝑋2 ~𝑁(𝜇2 , 𝜎22‬‬
‫כאשר ‪ 𝑋1‬ו‪ 𝑋2 -‬ב"ת‬
‫בהנחה ש ‪ 𝐻0‬נכונה‪~𝐹(7,6) :‬‬
‫‪2‬‬
‫̂𝑆‬
‫‪1‬‬
‫‪2‬‬
‫̂𝑆‬
‫‪2‬‬
‫רמת מובהקות ואזור דחייה‪,‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪37‬‬
‫‪𝛼 = 0.1 , 𝑛1 = 8 , 𝑛2 = 7‬‬
‫דחה ‪ 𝐻0‬אם‪𝐹 > 𝑓𝛼 = 𝑓0.05 (7,6) = 4.21 :‬‬
‫‪2‬‬
‫‪1‬‬
‫או ‪= 3.87 = 0.258‬‬
‫‪1‬‬
‫𝑓 = )‪𝐹 < 𝑓0.95 (7,6‬‬
‫)‪0.05 (6,7‬‬
‫חישוב סטטיסטי וכלל הכרעה‪:‬‬
‫חנות א' ‪∑8𝑖=1 𝑥𝑖 = 590‬‬
‫‪∑8𝑖=1 𝑥𝑖2 = 44,476‬‬
‫‪= 137.642‬‬
‫חנות ב' ‪∑7𝑖=1 𝑥𝑖 = 442‬‬
‫‪𝑥̅ = 73.75‬‬
‫‪44,476 − 8 ∙ 73.752‬‬
‫‪8−1‬‬
‫‪∑7𝑖=1 𝑥𝑖2 = 28,252‬‬
‫‪= 57.269‬‬
‫‪𝑥̅ = 63.142‬‬
‫‪28,252 − 7 ∙ 63.1422‬‬
‫‪7−1‬‬
‫‪137.642‬‬
‫‪= 2.403 < 4.21‬‬
‫‪57.269‬‬
‫‪2‬‬
‫= ‪𝑆̂1‬‬
‫‪2‬‬
‫= ‪𝑆̂2‬‬
‫= 𝐹 < ‪0.258‬‬
‫לכן נקבל את ‪ , 𝐻0‬כלומר ניתן לומר בר"מ ‪ 0.1‬שאין הבדל בין השונויות‪.‬‬
‫סעיף ב'‬
‫מבחן וילקוקסון למדגמים בלתי תלויים‪:‬‬
‫‪ : 𝐻0‬התפלגות ‪ X‬בחנות א שווה להתפלגות ‪ X‬בחנות ב‬
‫‪ : 𝐻1‬התפלגות ‪ X‬בחנות א שונה מהתפלגות ‪ X‬בחנות ב‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪38‬‬
‫)‪𝑛1 (𝑛1 + 1‬‬
‫‪8∙9‬‬
‫‪= 79 −‬‬
‫‪= 43‬‬
‫‪2‬‬
‫‪2‬‬
‫‪𝑈1 = 𝑊1 −‬‬
‫)‪𝑛2 (𝑛2 + 1‬‬
‫‪7∙8‬‬
‫‪= 41 −‬‬
‫‪= 13‬‬
‫‪2‬‬
‫‪2‬‬
‫‪𝑈2 = 𝑊2 −‬‬
‫‪𝑈 = 𝑀𝑖𝑛 (13,43) = 13‬‬
‫בטבלה עבור ‪𝑛1 = 7, 𝑛2 = 8‬‬
‫‪2𝑃(𝑈 ≤ 13) = 2 ∙ 0.047 = 0.094 > 0.05‬‬
‫החלטה‪ :‬לא דוחים את השערת האפס‪ ,‬לאור התוצאות בר"מ ‪ ,0.05‬לא ניתן לומר‬
‫שהתפלגות ‪ X‬בחנות א' שונה מהתפלגות ‪ X‬בחנות ב'‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪39‬‬
‫מבחן פישר‬
‫שני משתנים ב"ת‪ ,‬שמיים (בינומיים) ודיכוטומיים(‪ 2*2‬בעד ונגד)‪ .‬מחליף את מבחן ‪ Z‬להפרש בין‬
‫פרופורציות‪.‬‬
‫מבחן שנכנס לשימוש כאשר המדגמים בלתי תלויים‪ ,‬והמשתנה בינומי ב‪ 2-‬האוכלוסיות‬
‫‪n  pˆ1 , n  qˆ1  10‬‬
‫המדגמים קטנים ולא עומדים בתנאי הקירוב לנורמלי(לפחות ‪ 1‬מהם)‪:‬‬
‫‪n  pˆ 2 , n  qˆ2  10‬‬
‫הסטטיסטי נקבע ע"י השכיחות ‪ A‬שנצפה שערכה צריך להיות נמוך מבין התאים בכישלון (‪ A‬הוא‬
‫התא בו אמור להיות שיפור אך אין)‪ ,‬נחשב את רמת המובהקות המינימלית ' ‪ ‬שהיא ההסתברות‬
‫לקבל את תוצאתה המדגם ב‪ A-‬או קיצונית לה(קטנה יותר) ‪. Pv  P  A  a ‬‬
‫‪‬‬
‫נדחה ‪ H 0‬אם ‪ Pv  ‬או אם‬
‫‪2‬‬
‫‪( p.v ‬זהה למבחן הבינום והסימן)‬
‫טבלת שכיחויות ‪:2*2‬‬
‫הצלחה‬
‫כישלון‬
‫קבוצה ‪1‬‬
‫סך הנבדקים בקבוצה ה‪1-‬‬
‫סך הנבדקים בקבוצה ה‪2-‬‬
‫קבוצה ‪2‬‬
‫סך ההצלחות‬
‫‪www.OpenBook.co.il‬‬
‫סך הכישלונות‬
‫|‬
‫‪ = N‬סך הנבדקים בשתי הקבוצות‬
‫‪[email protected]‬‬
‫‪40‬‬
‫שאלה ‪1‬‬
‫רוצים לבדוק האם הנחיה מוגברת מעלה את הסיכוי להצליח בבחינה בקורס סטטיסטיקה ב'‪ .‬לשם כך‬
‫נבחרו ‪ 6‬תלמידים שלמדו בהנחיה מוגברת ומתוכם ‪ 5‬עברו את הבחינה‪ .‬כמו כן‪ 5 ,‬תלמידים שלא‬
‫עברו הנחיה מוגברת נבחרו‪ ,‬כשמתוכם ‪ 3‬עברו את הבחינה‪ .‬בחן את ההשערה שהנחיה מוגברת‬
‫משפרת את הסיכוי להצליח בבחינה בר"מ ‪.0.05‬‬
‫פתרון‬
‫מבחן פישר‬
‫תנאים‪:‬‬
‫(‪ )1‬מדובר במדגמים בלתי תלויים‬
‫(‪ )2‬טבלה דו מימדית משתנה בינומי (עבר או לא עבר)‬
‫(‪ )3‬תק"ל לא מתקיים ‪nq, np  10‬‬
‫אחרת ‪ , H 0 :‬הנחיה מוגברת מעלה את הסיכוי להצליח בבחינה ‪H1 :‬‬
‫כלל ההכרעה‪ :‬קבלת ‪ H 0‬כאשר ‪p.v   '  0.05‬‬
‫נדחה ‪ H 0‬כאשר ‪p.v   '  0.05‬‬
‫קב' ‪ 1‬עם הנחיה‬
‫קב' ‪ 2‬ללא הנחיה‬
‫סה"כ‬
‫כישלון‬
‫‪A=1‬‬
‫‪C=2‬‬
‫‪3‬‬
‫הצלחה‬
‫‪B=5‬‬
‫‪D=3‬‬
‫‪8‬‬
‫‪6‬‬
‫‪5‬‬
‫‪11‬‬
‫‪ 3  8   3  8 ‬‬
‫‪      ‬‬
‫‪1 5‬‬
‫‪0 6‬‬
‫‪ '  P  A  1         0.42  0.05‬‬
‫‪11‬‬
‫‪ ‬‬
‫‪6‬‬
‫נקבל את השערת האפס‪ ,‬הנחיה מוגברת לא משפרת את הסיכוי להצליח בבחינה בר"מ‬
‫‪0.05‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪41‬‬
‫שאלה ‪2‬‬
‫לבדיקת יעילותו של מסיר כתמים חדש‪ ,‬השתמשו בו להסרת כתמים קשים מ‪ 10 -‬חולצות‪ .‬את‬
‫התוצאות השוו מול מסיר כתמים ישן‪ ,‬בו השתמשו להסרת כתמים מ‪ 15 -‬חולצות אחרות‪ .‬התוצאות‬
‫הראו שב‪ 2 -‬חולצות שטופלו במסיר הכתמים החדש וב‪ 7 -‬חולצות שטופלו במסיר הכתמים הישן‪,‬‬
‫נותרו הכתמים‪ .‬האם ניתן לומר שמסיר הכתמים החדש יעיל יותר מהישן בר"מ ‪?0.05‬‬
‫פתרון‬
‫מבחן פישר‬
‫תנאים‪:‬‬
‫(‪ )1‬מדובר במדגמים בלתי תלויים‬
‫(‪ )2‬טבלה דו מימדית משתנה בינומי (הכתם הוסר או לא)‬
‫(‪ )3‬תק"ל לא מתקיים ‪n1  10, n2  5, np  10‬‬
‫אחרת ‪ , H 0 :‬מסיר חדש יעיל יותר מהישן ‪H1 :‬‬
‫כלל ההכרעה‪ :‬קבלת ‪ H 0‬כאשר ‪p.v   '  0.05‬‬
‫נדחה ‪ H 0‬כאשר ‪p.v   '  0.05‬‬
‫מסיר חדש‬
‫מסיר ישן‬
‫סה"כ‬
‫כתם הוסר‬
‫‪B=8‬‬
‫‪D=8‬‬
‫‪16‬‬
‫כתם נשאר‬
‫‪A=2‬‬
‫‪C=7‬‬
‫‪9‬‬
‫‪10‬‬
‫‪15‬‬
‫‪25‬‬
‫‪ 9 16   9 16   9 16 ‬‬
‫‪          ‬‬
‫‪2 8‬‬
‫‪1 9‬‬
‫‪0 10‬‬
‫‪463,320  102,960  8, 008‬‬
‫‪574, 288‬‬
‫‪ '  P  A  2            ‬‬
‫‪‬‬
‫‪ 0.1757  0.05‬‬
‫‪3, 268, 760‬‬
‫‪3, 268, 760‬‬
‫‪ 25 ‬‬
‫‪ ‬‬
‫‪ 10 ‬‬
‫לכן לא ניתן להסיק שהמסיר החדש יעיל יותר מהמסיר הישן בר"מ ‪0.05‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪42‬‬
‫שאלה ‪ 3‬ממבחן (פתרון מלא ומוקלט באתר ‪)www.openbook.co.il‬‬
‫כדי לבדוק אם חיסון חדש לכלבים מסייע בהפחתת ההדבקות במחלה מסוימת‪ ,‬נערך ניסוי שבו ‪10‬‬
‫כלבים קיבלו חיסון ו‪ 8-‬לא קיבלו חיסון‪ .‬מבין הכלבים שחוסנו כלב אחד נדבק במחלה‪ ,‬ומבין הכלבים‬
‫שלא חוסנו ‪ 5‬נדבקו במחלה‪ .‬מהו המבחן הסטטיסטי המתאים ביותר לבדיקת השערת המחקר‪ ,‬נסח‬
‫את ההשערות והסק מסקנה ברמת מובהקות ‪.0.05‬‬
‫פתרון‬
‫שני מדגמים בלתי תלויים‪ ,‬משתנים דיכוטומיים‪ ,‬מבחן פישר‪.‬‬
‫‪H0‬‬
‫‪H1‬‬
‫‪ :‬החיסון החדש לא מסייע בהפחתת ההדבקות במחלה‬
‫‪ :‬החיסון החדש מסייע בהפחתת ההדבקות במחלה‬
‫לא נדבקו נדבקו סה"כ‬
‫‪10‬‬
‫‪A=1‬‬
‫קיבלו חיסון ‪B=9‬‬
‫‪8‬‬
‫לא קיבלו‬
‫‪C=5‬‬
‫‪D=3‬‬
‫‪18‬‬
‫‪6‬‬
‫‪12‬‬
‫סה"כ‬
‫אם החיסון מסייע בהפחתת ההדבקות במחלה‪ ,‬אז נצפה שבקרב אלו שקיבלו חיסון ידבקו פחות‪ ,‬לכן‬
‫‪ – A=1‬מספר הכלבים שקיבלו חיסון ונדבקו במחלה‪.‬‬
‫רמת מובהקות ואזורי דחייה וקבלה‪ ,   0.05 :‬דחה ‪ H 0‬אם ‪P  A  1  0.05‬‬
‫חישוב הסטטיסטי‪ :‬טבלה עבור ‪:A=0‬‬
‫לא נדבקו נדבקו סה"כ‬
‫‪10‬‬
‫‪A=0‬‬
‫קיבלו חיסון ‪B=10‬‬
‫‪8‬‬
‫לא קיבלו‬
‫‪C=6‬‬
‫‪D=2‬‬
‫‪18‬‬
‫‪6‬‬
‫‪12‬‬
‫סה"כ‬
‫‪ 6   12   6   12 ‬‬
‫‪ 0   10    1   9 ‬‬
‫‪P  A  1  P  A  0   P  A  1           0.0317  0.05‬‬
‫‪ 18 ‬‬
‫‪ 10 ‬‬
‫‪ ‬‬
‫החלטה‪ :‬לכן דוחים את השערת האפס‪ ,‬וניתן לומר שהחיסון מסייע בהפחתת ההדבקות במחלה‬
‫ברמת מובהקות ‪0.05‬‬
‫שאלה ‪4‬‬
‫טיפול רפואי מסוים נוסה על קבוצה של ‪ 7‬מתוך ‪ 12‬חולים‪ ,‬שנבחרו לניסוי‪ .‬מתוך אלו שקיבלו טיפול ‪5‬‬
‫הבריאו לאחר שנה‪ ,‬ואילו מתוך אלו שלא קיבלו טיפול הבריאו רק שניים‪.‬‬
‫א‪ .‬בדוק את ההשערה‪ ,‬שלטיפול אין כל השפעה‪ ,‬לעומת ההשערה האלטרנטיבית‪ ,‬שהטיפול משפר‬
‫ברמת מובהקות של ‪.0.1‬‬
‫שלב ‪ : 1‬אם לא מקבלים טבלה דיכוטומית ( ‪ ) 2*2‬יש לבנות טבלה לפי נתוני השאלה‪.‬‬
‫לא הבריאו‬
‫הבריאו‬
‫סה"כ‬
‫קיבלו טיפול‬
‫‪B =5‬‬
‫‪A =2‬‬
‫‪A+B = 7‬‬
‫לא קיבלו טיפול‬
‫‪D =2‬‬
‫‪C=3‬‬
‫‪C+D = 5‬‬
‫סה"כ‬
‫‪B+D = 7‬‬
‫‪A+C = 5‬‬
‫‪12‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪43‬‬
‫דרך הבנייה ‪ A :‬יהיה תמיד מספר הניסויים שעברו את התהליך והוא לא שיפר ( כאן מדובר בטיפול‬
‫רפואי )‪ .‬ככל ש ‪ A‬יהיה יותר קטן ‪ ,‬ההסתברות לדחות את השערת האפס תגדל ‪ ,‬שכן ככל ש ‪ A‬קטן‬
‫יותר‪ ,‬המשמעות היא שהיו מעט מקרים שעברו טיפול מסוים ולא הושפעו ממנו‪.‬‬
‫הטבלה תהיה תמיד בצורה זו ‪:‬‬
‫‪B‬‬
‫‪A‬‬
‫‪D‬‬
‫‪C‬‬
‫שלב שני ‪ :‬ניסוח ההשערות ‪:‬‬
‫הטיפול לא משפיע‬
‫‪H0 :‬‬
‫לטיפול יש השפעה חיובית ‪H 1 :‬‬
‫‪ A  C  B  D ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫הנוסחה מבוססת על ההתפלגות ההיפר גיאומטרית והנה ‪ A  B  :‬‬
‫‪ N ‬‬
‫‪‬‬
‫‪‬‬
‫‪ A B‬‬
‫שלב שלישי ‪ :‬הצבה בנוסחה‪ .‬יש לחשב את ההסתברות לקבל ערך ‪ A=2‬או קטן ממנו‪.‬‬
‫‪ 5  7   5  7   5  7 ‬‬
‫‪          ‬‬
‫‪0 7‬‬
‫‪1 6‬‬
‫‪2 5‬‬
‫‪1  35  210‬‬
‫‪P( A  2)  P( A  0)  P( A  1)  P( A  2)           ‬‬
‫‪ 0.31‬‬
‫‪792‬‬
‫‪12 ‬‬
‫‪ ‬‬
‫‪7‬‬
‫והסתברות זו גדולה מ ‪ 0.05‬ולכן לא נדחה את השערת האפס‪ ,‬והטיפול הרפואי אינו משפיע‪.‬‬
‫שאלה ‪5‬‬
‫לבדיקת יעילותו של טיפול למניעת אבנית‪ ,‬ניתן טיפול ל ‪ 10-‬קומקומים שנבחרו באופן מקרי מיצרנים‬
‫שונים‪ ,‬ו ‪ 15-‬קומקומים אחרים‪ ,‬שגם הם נבחרו אקראית‪ ,‬שימשו כקבוצת ביקורת‪ .‬בכל קומקום‬
‫הרתיחו מים ‪ 10‬פעמים‪ .‬התוצאות הראו‪ ,‬שב ‪ 2-‬קומקומים מבין הקומקומים שעברו את הטיפול‪ ,‬ו ב‬
‫‪ 7‬קומקומים שלא עברו את הטיפול‪ ,‬נוצרה אבנית‪.‬‬‫א‪ .‬נסח את ההשערות וחשב את ההסתברות לקבל תוצאה כפי שנתקבלה או קיצונית ממנה תחת‬
‫השערת האפס‪.‬‬
‫ב‪ .‬האם‪ ,‬לאור התוצאות‪ ,‬ניתן לומר שהטיפול יעיל‪ ,‬ברמת מובהקות ‪? 0.05‬‬
‫פתרון שאלה ‪5‬‬
‫א‪ .‬מבחן פישר‪ .‬תנאים‪:‬‬
‫(‪ )1‬מדובר במדגמים בלתי תלויים‬
‫(‪ )2‬טבלה דו מימדית משתנה בינומי (האבנית הוסרה או לא)‬
‫(‪ )3‬תק"ל לא מתקיים ‪n1  10, n2  5, np  10‬‬
‫הטיפול אינו מונע אבנית ‪ , H 0 :‬הטיפול יעיל ‪H1 :‬‬
‫כלל ההכרעה‪ :‬קבלת ‪ H 0‬כאשר ‪p.v   '  0.05‬‬
‫נדחה ‪ H 0‬כאשר ‪p.v   '  0.05‬‬
‫עם טיפול‬
‫‪www.OpenBook.co.il‬‬
‫ללא אבנית‬
‫‪B=8‬‬
‫עם אבנית‬
‫‪A=2‬‬
‫|‬
‫‪10‬‬
‫‪[email protected]‬‬
‫‪44‬‬
‫ללא טיפול‬
‫סה"כ‬
‫‪D=8‬‬
‫‪16‬‬
‫‪15‬‬
‫‪25‬‬
‫‪C=7‬‬
‫‪9‬‬
‫‪ 9 16   9 16   9 16 ‬‬
‫‪          ‬‬
‫‪2 8‬‬
‫‪1 9‬‬
‫‪0 10‬‬
‫‪463,320  102,960  8, 008 574, 288‬‬
‫‪ '  P  A  2            ‬‬
‫‪‬‬
‫‪ 0.1757  0.05‬‬
‫‪3, 268, 760‬‬
‫‪3, 268, 760‬‬
‫‪ 25 ‬‬
‫‪ ‬‬
‫‪ 10 ‬‬
‫לכן לא ניתן להסיק שהמסיר החדש יעיל יותר מהמסיר הישן בר"מ ‪0.05‬‬
‫שאלה ‪6‬‬
‫כדי לבדוק אם תרגול נוסף משפר את הצלחת הסטודנטים בקורס "מבוא לסטטיסטיקה" נבחר מדגם‬
‫מקרי של סטודנטים המשתתפים בקורס ובו נמצא כי ‪:‬‬
‫‪ 8‬סטודנטים השתתפו בתרגול ועברו את הבחינה‬
‫‪ 2‬סטודנטים השתתפו בתרגול ונכשלו בבחינה‬
‫‪ 2‬סטודנטים לא השתתפו בתרגול ועברו את הבחינה‬
‫‪ 3‬סטודנטים לא השתתפו בתרגול ונכשלו בבחינה‬
‫א‪ .‬נסח את ההשערות וחשב את ההסתברות לקבל תוצאה כפי שנתקבלה או קיצונית ממנה תחת‬
‫השערת האפס‪.‬‬
‫ב‪ .‬האם‪ ,‬לאור התוצאות‪ ,‬ניתן לומר שתרגול נוסף משפר את הצלחת הסטודנטים בקורס‪ ,‬ברמת‬
‫מובהקות ‪? 0.05‬‬
‫ב‪ .‬התוצאה גדולה מ ‪ 0.05‬ולכן לא ניתן לד חות את השערת האפס ולא ניתן לומר שהטיפול יעיל‪.‬‬
‫פתרון שאלה ‪6‬‬
‫א‪ .‬מבחן פישר‬
‫תרגול נוסף אינו משפר את הצלחות הסטודנטים ‪ , H 0 :‬תרגול נוסף משפר את ההצלחה ‪H1 :‬‬
‫‪8‬‬
‫‪A=2‬‬
‫‪2‬‬
‫‪3‬‬
‫‪ 5 10   5 10   5 10 ‬‬
‫‪          ‬‬
‫‪2 8‬‬
‫‪1 9‬‬
‫‪0 10‬‬
‫‪P( A  2)            0.167‬‬
‫‪ 15 ‬‬
‫‪ ‬‬
‫‪10 ‬‬
‫‪ 5 10   5 10   5 10 ‬‬
‫‪          ‬‬
‫‪2 8‬‬
‫‪1 9‬‬
‫‪0 10‬‬
‫ב‪ P( A  2)            0.167  0.05 .‬לכן לא דוחים את השערת‬
‫‪15 ‬‬
‫‪ ‬‬
‫‪10 ‬‬
‫האפס ‪ ,‬לא ניתן לומר ברמת מובהקות ‪ 0.05‬שהתרגול הנוסף משפר ‪.‬‬
‫‪www.OpenBook.co.il‬‬
‫|‬
‫‪[email protected]‬‬
‫‪45‬‬
46
[email protected]
|
www.OpenBook.co.il