פתרון לחוברת II
Transcription
פתרון לחוברת II
:מרתון בקורס 'מבוא לסטטיסטיקה ב II חוברת www.OpenBook.co.il 1 | [email protected] סטודנטים יקרים, אנו גאים להציג בפניכם חוברת זו ,המהווה חלק קטן ממערך הולך וגדל של חומר עזר לסטודנטים באתר .Openbook מצאתם טעות? נא שלחו הודעה לכתובת המייל [email protected] בברכת הצלחה במבחנים ובכל התואר ! המרכז לקידום אקדמי .OpenBook המרכז לקידום אקדמי אינו אחראי לטיב הפתרונות המוצגים בחוברת ולטעויות במקרה שקיימות. כל הזכויות שמורות למרכז לקידום אקדמי Openbookבלבד. אין להפיץ ,למכור או להעתיק חלק או את כל החוברת. תאריך עדכון :יוני 2015 [email protected] | www.OpenBook.co.il 2 יחידה 13בדיקת השערות הרציונל של ההסקה הסטטיסטית: אם ברצוננו לבדוק אם שיטת הלימוד של המרכז לקידום אקדמי OpenBookמשפרת ציוניהם של הסטודנטים בקורס סטטיסטיקה ב ,נדגום מספר סטודנטים ונלמד אותם בשיטה החדשה – נבדוק אם הממוצע החדש שלהם רחוק מספיק מהממוצע של כל יתר הסטודנטים שלא למדו בשיטת הלימוד של OpenBookכיצד נדע מה זה רחוק מדי? נלקח מדגם של 100סטודנטים וקיבלתי ממוצע מדגם , x 73סטיית התקן היא 10 :מה יש לנו פה? המרכז לקידום אקדמי OpenBookטוען שהו א יכול לשפר את ממוצע האוכלוסייה ,מהו המצב הקיים? בדקנו במחשבי האוניברסיטה וקיבלנו . 70ולכן :המצב הקיים אנו רושמים כ , H 0 :טענת החוקר אנו מסומנת ב H1 ולכן מה יש לנו? H 0 : 70 H1 : 70 המרכז לקידום אקדמי OpenBookמנסה להעלות את הציון ,ולכן אנו מקציבים לו את רמת המובהקות שאם ייפול בה הממוצע החדש אז אנחנו נקבל את הטענה ששיטת הלימוד של המרכז לקידום אקדמי OpenBookמגדילה את הממוצע .השטח הזה בקצה הפעמון – אם הציון יהיה מספיק קיצוני אז החברה צודקת! הנקודה שמפרידה בין האזור שאנו מקבלים את השערת החוקר לבין דוחים אותה זה אזור הקריטי כי הוא מכריע אם נקבל או נדחה ! x 70 xc , Zx מבחן חד צדדי ימני על תוחלת אחת ושונות ידועה ולכן: 10 / 100 / n x 71.645הממוצע 73נמצא באזור דחיית H0 ולכן נקבל את H1 1.645 ולכן ,ברמת מובהקות 0.05נקבל את טענת המרכז לקידום אקדמי OpenBookואכן המרכז לקידום אקדמי OpenBookמעלה את הממוצע האוכלוסייה. [email protected] | www.OpenBook.co.il 3 מבחן סטטיסטי נקרא גם מבחן מובהקות ,מורכב מ 7-שלבים: .1נתונים: איסוף נתונים בשאלה: ? ?, ?, n ?, x ?, .2ניסוח השערות השערה הינה היגד על פרמטר של האוכלוסייה ,תמיד תעסוק באוכלוסייה ולא במדגם! במבחן סטטיסטי מנסחים שתי השערות -ממצות ומוציאות .אנו למעשה מקבלים אחת כנכונה באופן זמני ובודקים אותה ,מכיוון שההשערות מוציאות וממצות -קבלה של אחת תגרור דחייה של השנייה. -Hoהשערת האפס .זו השערה המייצגת את נקודת המוצא ,המצב הקיים כיום ,והיא מתארת את מה שידוע נכון להיום על ערכו של הפרמטר באוכלוסייה. -H1השערת החוקר -אותה אנו לעולם לא בודקים .זו השערה המייצגת את טענת החוקר ,את מה שהחוקר רוצה להוכיח. השערת החוקר יכולה להיות מנוסחת ב 2אופנים( :) H1 השערה דו צדדית -החוקר משער שחל שינוי בערך של הפרמטר אך ללא ידיעת כיוון השינוי. השערה חד צדדית -החוקר גם משער שחל שינוי בערכו של הפרמטר וגם הוא מצפה לכיוון מסוים של שינוי (עליה/ירידה). מבחינים בין: השערה חד צדדי ימני(חיובי) – החוקר משער שחלה עליה בערכו של הפרמטר ביחס לקיים c . השערה חד צדדי שמאלי(שלילי) – החוקר משער שחלה ירידה בערכו של הפרמטר ביחס לקיים. c השערה דו צדדית השערה חד צדדית שמאלית השערה חד צדדית ימנית H0 : C H0 : C H0 : C H1 : C H1 : C H1 : C כאשר הוא פרמטר של האוכלוסייה או ההתפלגות העומדת לבדיקה ,ואילו Cהוא קבוע. כללים לניסוח השערות 2 ולא p , xולא 2 , pולא sוכו א .השערות ינוסחו תמיד לפי הפרמטרים קרי ב .בהשערת האפס יופיע תמיד שוויון. ג .השערת החוקר(סוג ההשערה) נקבע /מנוסחת אך ורק על פי הניסוח המילולי של טענת החוקר בשאלה ואינה נקבעת על פי תוצאת המדגם. .3הנחות אנו מניחים הנחות על התפלגות הדגימה באופן מלא כדי שנוכל לומר משהו על ההסתברות לקבל תוצאה מסוימת .ההנחות משתנות בין המבחנים הסטטיסטיים .הנחה אחת שקיימת בכולם היא שהמדגם מקרי. .4שרטוט ההשערות קביעת רמת מובהקות ואזורי דחייה וקבלה רמת הסיכון מכונה רמת מובהקות ומסומנת באות - רמת אלפא רמת מובהקות זה השטח (שכיחות) האזור הזנב של ההתפלגות הנורמלית .שטח מייצג טעות ומשמעותו לדחות את השערת האפס למרות שהיא נכונה. [email protected] | www.OpenBook.co.il 4 החוקר קובע כלל הכרעה – כלל ההכרעה מחלק את ההתפלגות הסטטיסטית ל 2-אזורים: אזור דחייה H0 -אם הסטטיסטי יפול באזור זה נדחה את .Hoבהסתברות . כל תוצאה שבאזור הדחייה של H0 תיקרא תוצאה מובהקת סטטיסטית – המעידה על כך שחל שינוי אמיתי של הפרמטר באוכלוסייה. אזור הקבלה - H 0האזור המשלים לו .אם הסטטיסטי יפול באזור זה נקבל את .Hoתחום הערכים של סטטיסטי המבחן בו מחליטים שלא לדחות את . H 0בהסתברות . 1 כל תוצאת מדגם שנמצאת/נופלת באזור זה נקראת תוצאה לא מבוקרת סטטיסטית -הכוונה היא שכל התוצאות הנ"ל אינן מעידות על כך שחל שינוי אמיתי של הפרמטר באוכלוסייה. לערך המפריד בין אזור הדחיה והקבלה של H 0 קוראים ערך קריטי. סוג ההשערה קובע באיזה צד בהתפלגות יש להציב את הגבול של כלל ההכרעה .והמיקום המדויק שלו קובע אותו רמת המובהקות – אזור/שטח דחיית במבחן חד כווני ימני H1 : 0 H0 וזה . אזור הדחייה ימוקם בצד ימין של התפלגות הממוצעים .אם ממוצע המדגם חריג כלפי מעלה ,נחליט לדחות את . H 0 במבחן חד כווני שמאלי H1 : 0 אזור הדחייה ימוקם בצד שמאל של התפלגות הממוצעים, ואם ממוצע המדגם חריג כלפי מטה ,נחליט לדחות את H 0 במבחן דו – כווני 0 . H1 : שני אזורי הדחייה משני צידי ההתפלגות .אם ממוצע המדגם חריג כלפי מעלה או מטה נחליט לדחות את . H 0 .5חישוב הסטטיסטי חישוב של תוצאת המדגם בהתפלגות הנתונה. .6החלטה תוצאה שנופלת באזור הדחיה תיקרא תוצאה מובהק -כלומר שהמדגם לא נלקח מהאוכלוסייה המקורית אלא מהאוכלוסייה האלטרנטיבית. תוצאה שנופלת באזור הקבלה תיקרא תוצאה בלתי מובהקת -כלומר שהמדגם נלקח מהאוכלוסייה המקורית. אנו דוחים/מקבלים את Hoבלבד משום שהיא זו שקיבלנו זמנית כנכונה ובדקנו. .7מסקנה [email protected] | www.OpenBook.co.il 5 טעויות במבחן השערות בכל החלטה של החוקר יש סיכוי לטעות אם זה לקבל את H 0 או לדחות .הטעויות האפשריות במבחן מוצגות בטבלה הבאה: החלטת החוקר :קבלת החלטה נכונה H0 1 טעות מסוג II החלטת החוקר :דחיית טעות מסוג I H0 החלטה נכונה (עוצמת המבחן) 1 מצב אמיתי: H0 נכונה מצב אמיתי: H1 נכונה טעות מסוג ראשון – זו טעות הנגרמת מדחייה מוטעית/שגויה של , H 0כלומר דוחים את H0 כשלמעשה היא נכונה. טעות מסוג שני – זו טעות הנגרמת מקבלה מוטעית/שגויה של , H 0כאשר לא דוחים את H 0 (מקבלים אותה) כשלמעשה ההשערה האלטרנטיבית היא הנכונה. העוצמה של המבחן מסומנת ב , 1 -היא ההסתברות לדחייה נכונה של H0 ,כלומר ההסתברות לעשות החלטה נכונה כשדוחים את השערת האפס. [email protected] | www.OpenBook.co.il 6 טעויות בהחלטת החוקר ועוצמת המבחן www.OpenBook.co.il 7 | [email protected] מודל – 1בדיקת השערות על תוחלת אחת כאשר השונות באוכלוסייה ידועה הנחות X ~ N , 2 :ואם n>30אין צורך בהנחת נורמליות .הסטטיסטי במדגם: xc n Zx שאלה 1 מפעל לצינורות מייצר סוג צינור מסוים שקוטרו הממוצע 50מ"מ עם סטיית תקן 6מ"מ .לבדיקת תקינות הייצור נלקח בכל יום מדגם של 64צינורות מהתוצרת היומית ונמדד קוטרם. א .נסח את ההשערות וקבע מהו כלל ההכרעה ברמת מובהקות .5% ב .ביום מסוים נמצא במדגם קוטר ממוצע של 48.8ס"מ .האם התוצרת היומית עברה את הביקורת על סמך כלל ההכרעה שקבעת בסעיף א' ? ג .אם ביום כלשהו חלה תקלה בייצור והקוטר הממוצע של הצינורות היה 48מ"מ בלבד עם סטיית תקן 6מ"מ ,מה ההסתברות שהתקלה לא תתגלה בביקורת היומית ? כיצד נקראת הסתברות זו ? פתרון שאלה 1 א. 50 6 בדיקת השערות על תוחלת כאשר השונות באוכלוסייה ידועה. ( )1נתונים: n 64 0.05 ( )2השערות: ( )3הנחות: H 0 : 50 H1 : 50 .1מ.ג.מ מתקיים; התפלגות Z .2שונות באוכלוסייה ידועה ( )4שרטוט ההשערות וקביעת אזור קבלה ודחייה כלל ההכרעה הוא :דחה את H0 אם Z X 1.96 או Z X 1.96 כלומר: X 50 6 z0.975 1.96 X 50 דחה את H 0אם 1.96 X 48.51 : 6 64 64 X 50 6 ZX z0.025 1.96 X 50 או 1.96 X 51.47 6 64 64 ZX ב .המשך של סעיף א ,מצאנו את ערך שבו נדחה את השערת האפס ולכן 48.53 x 48.8 51.47 לכן לא דוחים את השערת האפס וניתן לומר שהתוצרת היומית עברה את הביקורת. ג .מדובר בטעות מסוג שני .זו טעות הנגרמת מקבלה מוטעית/שגויה של , H 0כאשר לא דוחים את H0 (מקבלים אותה) כשלמעשה ההשערה האלטרנטיבית היא הנכונה [email protected] | www.OpenBook.co.il 8 P(48.53 X 51.47 | 48) 51.47 48 48.53 48 ( () ) (4.63) (0.71) 1 0.7611 0.2389 6 6 64 64 שאלה 2 ממוצע ציוני הבגרות במתמטיקה בארץ בשנה מסוימת היה 6.5עם סטיית תקן .1.2מדגם של 100 בוגרי בי"ס תיכון מסוים השיג באותה שנה ממוצע של 5.7בבגרות במתמטיקה. א .האם אפשר לטעון שבאוכלוסיית בית ספר זה נמצאה ירידה שאיננה מקרית בהשוואה לממוצע הארצי ברמת מובהקות של ?0.05 ב .מה תהיה מסקנתך ברמת מובהקות 0.01ו 0.1. -יש להסביר עבור כל רמת מובהקות ,האם ניתן להגיע למסקנה ללא בדיקה מחדש. [email protected] | www.OpenBook.co.il 9 ברמת מובהקות 0.01כלל ההכרעה זז שמאלה ואזור הדחייה של H0קטן ,לכן לא ניתן להגיע למסקנה ללא חישוב מחדש. בר"מ 0.1כלל הכרעה זז ימינה ואזור הדחייה של H0ולכן המסקנה לא תשתנה (עדין נדחה את )H0 [email protected] | www.OpenBook.co.il 10 שאלה 3 מנתוני משרד הבריאות ידוע כי ממוצע לחץ הדם באוכלוסייה הוא 133עם סטיית תקן .15במטרה לבדוק את הטענה כי מנהלים סובלים מלחץ דם גבוה יותר משאר האוכלוסייה ,נלקח מדגם מקרי של 64מנהלים ונמצא שממוצע לחץ הדם שלהם הוא .137 א .מה תהיה מסקנתך ברמת מובהקות של .0.01 ב .מהי הטעות האפשרית במסקנתך מסעיף א' ,אם ידוע שבקרב מנהלים לחץ הדם הממוצע הוא ?140הסבר וחשב. ג .חשב גודל מדגם מינימלי כך שיבטיח שאם לחץ הדם בקרב המנהלים הוא אכן 140נצליח לגלות זאת בהסתברות של 99%לפחות ,ואם לחץ הדם אצל מנהלים אינו גבוה מ,133- יוחלט בטעות שהוא גבוה יותר בהסתברות שלא תעלה על .0.02 [email protected] | www.OpenBook.co.il 11 www.OpenBook.co.il 12 | [email protected] www.OpenBook.co.il 13 | [email protected] שאלה ( 4פתרון מלא ומוקלט באתר) מעוניינים לבדוק אם מאזניים חדשים שהגיעו למעבדה מכוילים היטב .לשם כך נלקחה כמות חומר במשקל (ידוע) של 100גרם ,ונשקלה 25פעמים במאזניים החדשים .לפי פרסומי היצרן של המאזניים ,בשקילת 100גרם יש סטיית תקן של 3.2גרם וההתפלגות נורמלית. א .במדגם התקבל משקל ממוצע של 101.6גרם .האם ניתן להסיק שהמאזניים מכוילים היטב ? נסח את ההשערות ובדוק ברמת מובהקות .0.05 ב .האם ניתן להגיע לאותה מסקנה ,ללא חישוב נוסף ,עבור רמות המובהקות ? 0.1 ,0.01הסבר. ג .במבחן מסעיף א ,מהו הסיכוי לגלות שהמאזניים אינם מכוילים היטב ,אם למעשה יש להם הטיה של 2גרם כלפי מעלה ? פתרון שאלה 4 א .השערותH1 : 100 : . H 0 : 100, הנחות :א .אוכ' מתפלגת נורמלית ב .סטית התקן של האוכ' ידועה . 3.2 התפלגות הדגימה: 3.22 X 100 בהנחה ש H 0נכונה 0.4096) : ~ N (0,1) , X ~ N (100, . ZX 25 0.4096 קביעת רמת המובהקות ואזורי דחייה וקבלה . 0.05קבל אם 1.96 Z X 1.96 X 100 101.6 100 חישוב הסטטיסטי וההכרעה 2.5 1.96 : 0.64 0.4096 . ZX לכן נדחה את , H 0כלומר ניתן לומר ברמת מובהקות 0.05שהמאזניים אינם מכויילים היטב. ב .בכל רמת מובהקות גדולה יותר גם נדחה את , H 0לכן נדחה H 0בר"מ .0.1 לעומת זאת בר"מ נמוכה יותר אין לדעת אם הסטטיסטי עדיין יהיה באזור הדחייה או שמא יעבור לאזור הקבלה( .בר"מ 0.01דו צדדי 2.576 , ZCואז נקבל את .) H 0 ג .צריך לחשב את עוצמת המבחן: [email protected] | www.OpenBook.co.il 14 השערות: H0 : 100, H1 : 102 xc1 100 תחת השערת האפס נמצא את הערכים הקריטיים xc1 101.2544 : 0.64 xc 2 100 xc 2 98.7456 0.64 . Z c1 1.96 Z c 2 1.96 101.2544 102 תחת השערת האלטרנטיבית נמצא את ציון התקן 1.165 : 0.64 98.7456 102 Z c 2 5.085 0.64 , Z c 1 חישוב השטח של 1 תחת : H1 P(5.085 Z 1.165) ( 1.17) ( 5.09) 1 0.879 0 0.121 1 1 0.121 0.879 שאלה ( 5פתרון מלא ומוקלט באתר) התפלגות משקל ביצי תרנגולת היא נורמלית עם ממוצע 60גרם ,וסטיית תקן 15גרם. חוקר הציע הורמון חדש שאמור להגדיל את המשקל הממוצע ב – 5גרם מבלי לשנות את סטיית התקן .הטענה נבדקה בעזרת מבחן סטטיסטי. א .ההורמון החדש נוסה על 100תרנגולות .נמצא כי ההסתברות לטעות מסוג שני במבחן היא ,0.1 מהי רמת המובהקות של המבחן ? ב .בהמשך לסעיף א' ,אם ממוצע משקל הביצים במדגם היה 62גרם ,מה תהיה מסקנת הבדיקה ג .מהו גודל המדגם המינימלי שיבטיח רמת מובהקות של 0.01ועצמה של 0.95לפחות ? [email protected] | www.OpenBook.co.il 15 5 פתרון שאלה 15 , n 100 , 0.1 :נתון xC 65 15 1.282 63.077 100 :לכן H 0 : 60 H1 : 65 PH ( X xC ) ( 1 : ההשערות.א xC 65 ) 0.1 1.5 63.077 60 1 2.05 1 0.9798 0.0202 1.5 PH X 63.077 1 0 לא הוכח שההורמון החדש מגדיל את המשקל. לכן לא דוחים את השערת האפס62 63.077 .ב . 0.02 הממוצע ברמת מובהקות 1 0.95 , 0.01 : נתון.ג Z Xc X c 60 z0.01 2.326 15 / n Z Xc X c 65 z0.95 1.645 15 / n : לכןxc 65 1.645 15 / n : 0.01 ועבורH0 בהנחת – וגם : 1 0.95 0.05 ועבורH1 בהנחת xc 60 2.326 15 / n – מכאן 60 2.326 15 / n 65 1.645 15 / n n 3.971 15 / 5 2 3.971 15 / n 5 n 141.9 .142 גודל המדגם המינימלי הוא www.OpenBook.co.il 16 | [email protected] www.OpenBook.co.il 17 | [email protected] שאלה 6 בשיטת ייצור קיימת מייצר עובד בממוצע 60מוצרים ליום עם סטיית תקן של 15מוצרים .מנהל הייצור מציע שיטת תמריצים שתגדיל את התפוקה הממוצעת ב .10%- לבדיקת טענתו ניתנו התמריצים ל 100-עובדים שנבחרו באופן מקרי ונמצא כי התפוקה הממוצעת הייתה 64מוצרים. א .נסח את ההשערות ובדוק את הטענה ברמת מובהקות 0.01 ב .מהו גודל המדגם שיש לדגום כדי לבנות מבחן סטטיסטי לבדיקת טענתו של מנהל הייצור בו ההסתברות לטעות בטעות ששיטת התמריצים לא עוזרת לא תעלה על ,0.05וההסתברות להחליט בטעות ששיטת התמריצים עוזרת לא תעלה על ? 0.06 פתרון שאלה 6 אH1 : 66 60 , H 0 : 60 . זהו מבחן חד צדדי ימני. נתוןx 64 , 0.01 , 15 , n 100 : 64 60 2.67 z0.01 2.326 15 100 ZX לכן דוחים את השערת האפס ,ניתן לומר ששיטת התמריצים מגדילה את התפוקה הממוצעת. ב .נתון 0.05 , 0.06 : X c 60 z0.06 1.555 15 / n בהנחת H0ועבור : 0.06 בהנחת H1ועבור : 1 0.95 X c 66 z0.94 1.645 15 / n Z Xc xc 60 1.555 15 / n מכאן – xc 66 1.645 15 / n וגם – n 6 Z Xc n 3.2 15 / n 66 1.645 15 / לכן 60 1.555 15 / n 3.2 15 / 6 n 64 2 וגודל המדגם המינימלי 64 [email protected] | www.OpenBook.co.il 18 שאלה 7 מכונה לאריזת קופסאות גבינה מתוכננת לארוז קופסאות במשקל עם תוחלת 200גרם וסטית תקן 10גרם .הועלתה טענה כי הכיול של המכונה נפגם והיא אורזת כעת קופסאות בעלות משקל גבוה יותר ללא שינוי בסטית התקן .לצורך בדיקת הטענה שקלו 64קופסאות גבינה. א .נסח את ההשערות ורשום את המבחן לבדיקתן ברמת מובהקות . 0.01 ב .חשב את עוצמת המבחן המתואר בסעיף א' אם התוחלת האמיתית של משקל קופסת גבינה היא 204גרם. ג .כיצד תשתנה עוצמת המבחן ,שחישבת בסעיף ב' ,כתוצאה מהשינויים הבאים( :כל שינוי בנפרד) .1רמת המובהקות שווה ל. 0.05- .2גודל המדגם הוא .120 .3סטית התקן שווה ל 20-גרם. .4התוחלת האמיתית שווה ל 203-גרם. בכל מקרה נמק תשובתך או חשב. פתרון שאלה 7 א. H 0 : 200, H1 : 200 אזור הדחיה ברמת מובהקות 0.01הוא דחה את H 0אם : X 2000 z0.01 2.326 10 64 X 202.9075 z X ב. 202.9075 204 ) 1 ( 0.87) 0.8078 10 8 10 ג.1 .העצמה תגדל 202.056 , 64 ( 1 P( X 202.9075 | 204) 1 X C 200 1.645 1 P( X 202.056 | 204) 1 (1.56) 0.9406 10 .2העצמה תגדל 202.12 , 120 X C 200 2.326 1 P( X 202.12 | 204) (2.06) 0.9803 20 .3העצמה תקטן 205.815 , 64 X C 200 2.326 1 P( X 205.815 | 204) 1 (0.73) 1 0.7673 0.2327 10 .4העצמה תקטן 202.056 , 64 [email protected] X C 200 1.645 | www.OpenBook.co.il 19 1 P( X 202.056 | 203) (0.07) 0.5279 שאלה 8 מתקן מפעיל התראה למצב חירום על סמך החוזק של 9אותות שהוא קולט .חוזק האותות מתפלג נורמלית .במצב רגיל ,תוחלת החוזק היא 5000יחידות וס"ת 900יחידות .במצב חירום ,תוחלת החוזק היא 6300יחידות וס"ת נשארת .900המתקן מפעיל את האתראה רק כאשר העוצמה הממוצעת של תשעת האותות עולה על 5600יחידות. א. ב. מהי ההסתברות של אתראת שווא? מהי ההסתברות שלא תופעל אתראה במצב חירום? ענה על הסעיפים הבאים בהסבר ללא חישוב .כיצד יושפעו הסתברויות של א' ו -ב': ג. ד. ה. מתקן האתראה יופעל כאשר ממוצע החוזק יעלה על 5700יחידות. מספר האותות הנקלטים יהיה .12 תוחלת החוזק במצב חירום תהיה 6400יחידות. [email protected] | www.OpenBook.co.il 20 www.OpenBook.co.il 21 | [email protected] שאלה 9 הזמן הדרוש לייצור מוצר מסוים הוא בממוצע 10שעות וסטיית תקן של זמני הייצור היא שעה אחת. בית חרושת טוען שיש לו תהליך יצור מהיר יותר .נערכה בדיקה ונמצא ש 100 -מוצרים נוצרים במשך 960שעות. א. ב. ג. ד. האם מוצדקת טענת בית החרושת? בדוק ברמת מובהקות של .0.05 מהו הטעות האפשרית במסקנתך מסעיף א' ומה ערכה? נמק. אם ידוע כי זמן היצור בבית החרושת הנ"ל הוא ,9.8מה הסיכוי שנצליח לגלות זאת? כיצד נקראת הסתברות זו ומה ערכה. חשב גודל מדגם מינימלי כך שיבטיח שהסיכוי לדחייה לא מוצדקת של Hoלא יעלה על ,0.01והסיכוי לקבלה שגויה של Hoלא יעלה על .0.05 [email protected] | www.OpenBook.co.il 22 www.OpenBook.co.il 23 | [email protected] www.OpenBook.co.il 24 | [email protected] שאלה 10 על פי נתוני הלשכה המרכזית לסטטיסטיקה ,רמת החיסכון הממוצעת למשפחה בישראל היא 1500 ₪לחודש עם סטיית תקן ,₪ 400במדגם מיקרי של 100משפחות התקבל חיסכון ממוצע של 1550 . ₪מנהל חברת השקעות טוען כי רמת החיסכון הממוצעת באוכלוסייה עלתה .האם תוצאות המדגם מאששות את טענתו? בדוק ברמת מובהקות של .0.05 [email protected] | www.OpenBook.co.il 25 שאלה 11 למשקלו של תפוח יש ממוצע 260גרם וסטיית תקן 38גרם .אגרונום המתמחה בגידול תפוחים טוען כי שיטת השקיה חדשה שפיתח מעלה את המשקל הממוצע של תפוח ל 275-גרם. לבדיקת טענתו נלקח מדגם מקרי של 60תפוחים מחלקת קרקע שהושקתה בשיטת ההשקיה החדשה .הוחלט ששיטת ההשקיה החדשה תיכנס לשימוש אם משקל התפוחים הממוצע במדגם יהיה מעל 267גרם. א .מהי רמת המובהקות של המבחן המוצע? ב .מהי עצמת המבחן המוצע? ג .כיצד ישתנו תשובותיך לסעיפים א ו ב אם יוחלט להכניס לשימוש את שיטת ההשקיה החדשה רק אם משקל התפוחים הממוצע במדגם יהיה מעל 273גרם? נמק .אין צורך לחשב מחדש אך גם חישוב מחדש יתקבל כנימוק. ד .מהו גודל המדגם המינימלי שיבטיח שההסתברות להחליט בטעות שהשיטה החדשה יעילה לא תעלה על 0.05וההסתברות להחליט בטעות שהשיטה החדשה אינה יעילה לא תעלה על ?0.01 פתרון [email protected] | www.OpenBook.co.il 26 www.OpenBook.co.il 27 | [email protected] www.OpenBook.co.il 28 | [email protected] מודל :2בדיקת השערות של ממוצע – סטיית התקן אינה ידועה xc Tx התפלגות tעם ) (n-1דרגות חופש הנחות X ~ N , 2 :הסטטיסטי במדגם: S n 2 כאשר n>30נשתמש בהתפלגות נורמלית עם אמד לשונות nx n x 2 i i 1 n 1 2 S שאלה 1 יצרן מכוניות מפרסם שמכונית מסוימת שהוא מייצר צורכת ליטר דלק ל 20-ק"מ נסיעה בממוצע. לחברה מסוימת יש מספר רב של מכוניות מאותה תוצרת .בבחירה מקרית של 9מכוניות נבדקו מספר הק"מ לליטר שצרכה כל אחת מהמכוניות בנסיעה מיוחדת של 400ק"מ .התקבלו התוצאות הבאות ( בק"מ לליטר ) 171 : 9 x i i 1 9 xi2 3271 , i 1 בהנחה שמספר הק"מ לליטר מתפלג נורמלית ,האם יש בנתונים אלה הוכחה לכך שיצרן המכוניות אינו נוקט בשיטת "אמת בפרסום" ? נסח את ההשערות ובדוק עבור רמת מובהקות של .0.05 פתרון שאלה 1 ההשערות : 171 נתון 19 : 9 H0 : 20 x , H1 : 20 , 3271 9 192 2.75 8 19 20 1.809 t 80.95 1.86 2.75 9 9 x2 8 2 i 9 x i 1 0.05 , sˆ 2 tx מסקנה :השערת האפס לא נדחית בר"מ 0.05ולא ניתן לומר שהיצרן אינו נוקט ב"אמת בפרסום". [email protected] | www.OpenBook.co.il 29 שאלה ( 2פתרון מלא ומוקלט באתר) ממוצע הציונים במבחן הבודק כושר ריכוז באוכלוסייה רגילה הוא 16 .84נבדקים קיבלו תרופת הרגעה ונבדקה השפעת תרופה זו על הביצוע שלהם במבחן הריכוז .החוקר משער שבהשפעת התרופה יורד כושר הריכוז. לגבי ציונים שהתקבלו במדגם התוצאות היו 1299 : 16 x i 107, 225 i 1 16 x 2 ii i 1 א .האם התוצאות מעידות על כך שהתרופה מפחיתה את כושר הריכוז ,ברמת מובהקות ? 0.05 נסח את ההשערות ורשום את ההנחות הדרושות. ב .מצא רווח סמך ברמת סמך 95%עבור התוחלת של הציון במבחן הריכוז של סמך תוצאות המדגם. ג .האם מתוך הרווח סמך שמצאת בסעיף ב' ,ניתן להסיק כי בהשפעת התרופה חל שינוי בכושר הריכוז ,ברמת מובהקות ? 0.01הסבר. פתרון שאלה 2 1299 א .נחשב תחילה ממוצע וסטיית תקן לפי הנתונים 81.1875 : 16 x 107,225 16*81.1875 Sˆ 10.84 16 1 ניסוח השערות: H 0 : 84 מודל - 2בדיקת השערות על ; H1 : 84 כאשר סטיית התקן אינה ידועה n<30 ,ולכן התפלגות t עם 15 דרגות חופש ,מבחן חד צדדי עבור 0.05 כלל הכרעה :דחה את H0 עבור כל ערך הקטן מ.-1.753 x c 81.1875 84 1.037 Sˆ / n 10.84 / 16 מסקנה :קבל H0 Tx והתרופה לא מפחיתה את כושר הריכוז. 10.84 ב .מבקשים רווח סמך – לכן חוזרים ליחידה .12נתון לנו הכל רק להציב. 16 81.1875 2.131 ומקבלים 75.41 86.96 : ג .האם 84נמצא ברווח הסמך? כן .לכן לא ניתן לומר זאתרק עבור סעיף א' ניתן להסיק כי לא חל שינוי בכושר הריכוז. [email protected] | www.OpenBook.co.il 30 מודל :6בדיקת השערות על פרופורציה הנחות :התפלגות נורמלית או np 10 , nq 10 , pc c 1 c n pq Z , p n p Z / 2 שאלה 1 מנתוני משרד הבריאות ידוע כי התרופות המקובלות לכאבי ראש מביאות הקלה ל70% - מהמשתמשים בהן .יצרן תרופות טוען שיש תרופה חדשה יעילה יותר .לשם בדיקת הטענה נבדק מדגם מקרי של 250איש הסובלים מכאבי ראש. א .אם נמצא כי ההסתברות לגלות ,שאכן התרופה החדשה מביאה הקלה ל ,78% -היא ,0.85 מהי ההסתברות לטעות מסוג ראשון של המבחן? ב .אם במדגם נמצא כי התרופה החדשה הביאה הקלה ל 188 -מהם – מהי מסקנת הבדיקה ברמת מובהקות ?0.05נמק. ג .מהו גודל המדגם המינימלי שיבטיח ,שאם אכן התרופה החדשה מביאה הקלה ל,78%- ההסתברות לגלות זאת תהיה , 0.95וההסתברות להחליט בטעות שהתרופה החדשה יעילה תהיה .0.01 פתרון 1 נתון לנו אחוז= 70%זה פרופורציה /אחוז -מבחן Zלפרופורציה אחת –מודל .6 השערות: H 0 : p 0.7 H1 : p 0.7 הנחות :לפי משפט הגבול המרכזי מהסתברות בינומית נבדוק את התנאי לקירוב לנורמלי – n p 250 0.7 175 10 n q 250 0.3 75 10 ההסתברות לגלות ,שאכן התרופה החדשה מביאה הקלה ל ,0.78% -היא 0.85 נתון עוצמת המבחן ,עוצמת המבחן היא הסתברות שהצלחנו לגלות שחל שינוי אמיתי1 0.85 , [email protected] | www.OpenBook.co.il 31 נמצא את הערך הקריטי : k pc 1 0.85 pc 0.78 0.85 1 0.78 1 0.78 250 pc 0.78 0.78 1 0.78 250 1.036 pc 0.7529 ההסתברות לטעות מסוג ראשון היא - נסתכל על עקומת H0 : 0.7529 0.7 0.0344 1 0.7 0.3 250 ב) נתון שהתרופה החדשה הביאה להקלה ל 188 -מהם – מי זה מהם? מסה"כ ! ולכן מ .250נתון לנו המדגם שקיבלנו ולכן נצטרך לבדוק איפה הוא נפל ,באזור הקבלה או הדחייה .נבדוק את 188 p הפרופורציה 0.752 : 250 ברמת מובהקות 0.05אזור הקבלה והדחייה z p 1.645 :נדחה . H 0 0.752 0.7 חישוב סטטיסטי 1.78 1.645 : 0.7 0.3 250 [email protected] zp | www.OpenBook.co.il 32 ההכרעה :נדחה את H0 ,ניתן לומר ברמת מובהקות 0.05שהתרופה החדשה יעילה יותר מהתרופות המקובלות. ג) מבקשים למצוא את גודל המדגם המינימלי. נתונים: 0.01 ,1 0.95 , p1 0.78 , p0 0.7 השערות: H 0 : p 0.7 H1 : p 0.78 הנקודה הקריטית ניתן לבטא אותה בשני אופנים – תחת הסתכלות על השערת האפס H0 והשניה תחת הסתכלות על השערה אלטרנטיבית ונשווה בין 2המשוואות תחת z 2.326 : H 0 pc 0.7 0.7 0.3 / n pc 0.7 תחת z 1.645 : H1 pc 0.78 zc 2.326 0.78 0.22 / n 2.326 0.7 0.3 pc 0.78 n 1.0659 n zc 1.645 1.645 0.78 0.22 n 0.6814 pc 0.7 n pc 0.78 נשווה בין 2המשוואות האחרונות ונקבל: [email protected] | www.OpenBook.co.il 33 0.6814 1.0659 0.7 n n 1.7473 0.08 n 2 n 21.84 0.78 n 478 גודל המדגם המינימלי הוא .478 שאלה ( 2פתרון מלא ומוקלט באתר) בבית ספר תיכון מסוים נמצא כי 40%מהתלמידים מאחרים לפחות פעם אחת בחודש .מנהל בית הספר מציע שיטת תמריצים מיוחדת לצמצום האיחורים .השיטה נבדקה על מדגם מקרי של 200 תלמידים .נמצא כי 68מתוכם אחרו לפחות פעם אחת מחודש. א .האם השיטה יעילה ? נסח את ההשערות ובדוק ברמת מובהקות .0.025 ב .מהי ההסתברות לטעות האפשרית במסקנה מסעיף א' ,אם שיטת התמריצים מפחיתה את אחוז התלמידים המאחרים לפחות פעם אחת בחודש ,ל ? 30%- ג .מהי רמת המובהקות המינימלית שעבורה נחליט ששיטת התמריצים יעילה ,על סמך תוצאות המדגם ? פתרון שאלה 2 א .ההשערות הן: H 0 : p 0.4 68 0.34 , 200 H1 : p 0.4 pˆ 0.34 0.4 1.73 1.96 z0.025 0.4 0.6 200 z pˆ לא דוחים את השערת האפס ולכן לא הוכח שהשיטה יעילה. ב .הטעות האפשרית במסקנה היא :קבלה מוטעית של - H0טעות מסוג שני. pˆ 0.4 0.4 0.6 אזור הקבלה 1.96 : Z pˆ או 0.3321 200 0.4 0.6 200 pˆ 0.4 1.96 0.332 0.3 1 (0.99) 1 0.8389 0.1611 PH1 ( pˆ 0.3321) 1 0.3 0.7 200 0.34 0.4 ג (1.73) 1 (1.73) 1 0.9582 0.0418 . PH0 ( pˆ 0.34) 0.4 0.6 200 www.OpenBook.co.il | [email protected] 34 שאלה 3 60%מכלל הנבחנים בבחינת בגרות במתמטיקה עוברים את הבחינה בהצלחה .מורה מציע שיטת הוראה חדשה להגדלת פרופורציית המצליחים .השיטה החדשה נבדקה על מדגם מקרי של 200 תלמידים ,ובמדגם נמצא כי 66%מהנבחנים עברו בהצלחה את הבחינה. א .מהי מסקנת הבדיקה ברמת מובהקות ? 0.01 ב .מהי ההסתברות לטעות במסקנה שנתקבלה ,אם בשיטה החדשה לפחות 75%מהנבחנים עוברים את הבחינה בהצלחה ? ג .מהו גודל המדגם שיש לחקור כדי לבנות מבחן עבור רמת מובהקות 0.01ועוצמה 95%לפחות ? פתרון שאלה 3 א .ניסוח ההשערות : H1 : p 60 H 0 : p 60 כלל הכרעה :דחה H 0 מבחן חד צדדי ימני עבור כל ערך מחושב הגדול מ .2.326 pˆ p 0.66 0.6 0.06 התפלגות הסטטיסטי לפי השערת האפס 1.734 : )c(1 c 0.6 0.4 0.0346 n 200 לכן לקבל את H0 Z pˆ והמורה לא הצליח להוכיח את טענתו ברמת מובהקות .0.05 pˆ p pˆ 0.6 ב .יש לחשב 2.326 : pˆ c )c(1 c 0.6 0.4 n 200 Z pˆ ומקבלים 0.6804 0.75 0.0696 pˆ c 0.0346 2.326 0.6 0.6804כעת עבור 2.27 : H1 0.0306 0.75 0.25 200 Z h1 ומקבלים 2.27 1 0.9884 0.0116 : 2 Z /2 p0 (1 p0 ) Z /2 p1 1 p1 ג .הנוסחה הסופית : n p1 p0 2 2.326 0.6 0.4 1.65 0.75 0.25 2 n 12.36 152.7 153 0.75 0.6 www.OpenBook.co.il | [email protected] 35 שאלה 4 יצרן תנורים להורדת גשם טוען כי לתנורים שהוא מיצר יש 80%הצלחה בהורדת גשם .בעל תחנה חקלאית רוצה לבדוק טענה זו ,החורגת מהסיכוי המקובל להורדת גשם ,של 70%הצלחה ,ברמת מובהקות .0.05 א .נסח את ההשערות. ב .כדי להבטיח עוצמה של ,0.9כמה פעמים יש לנסות את התנורים הנ"ל ? ג .לאיזו מסקנה יגיע בעל התחנה החקלאית ,אם ב 125 -ניסיונות ירד גשם 95פעמים ? ד .מהי הטעות האפשרית במסקנה מסעיף ג' ,ומהי הסתברותה ? פתרון שאלה 4 א. H1 : p 0.7 , H0 : p 0.7 ב 0.05 Z 1.645 . בדיקת השערות על פרופורציה. 0.1 Z 1.282 2 Z p (1 p ) ( H ) Z b p (1 p ) H 1 0 פיתחנו בשיעור את הנוסחה : n p1 p0 2 1.645 0.3 0.7 1.282 0.8 0.2 n הצבה בנוסחה 160.4 161 : 0.8 0.7 95 . pˆ כלל הכרעה :דחה H 0עבור כל 1.645 Z ג 0.76 . 125 pˆ c 0.76 0.7 0.06 1.466 )c(1 c 0.7 *0.3 0.041 n 125 ד .קיבלנו את H0 Z pˆ מסקנה :קבל H 0וטענת היצרן לא מתקבלת. ולכן הטעות האפשרית :קיבלנו pˆ c 0.7 H 0למרות ש H1 0.7674 נכונה .טעות מסוג שני . יש לחשב את 1.645 pˆ c 0.3 0.7 125 0.7674 0.8 0.03257 0.91 1 0.91 1 0.8186 0.1814 , H1 : 0.03577 0.8*0.2 125 H 0 :ומקבלים pˆ cכעת יש להסתכל על . H1 לכן טעות מסוג שני 1 0.91 1 0.8186 0.1814 : www.OpenBook.co.il | [email protected] 36 שאלה 5 חברה לדיוור ישיר שוקלת לצאת במבצע פרסום למוצר מסוים ,באמצעות הדואר. משיקולים כלכליים החברה מעריכה שמבצע הפרסום יהיה כדאי רק אם שיעור התגובה של הצרכנים, כלומר מספר ההזמנות ביחס למספר המכתבים שנשלחו הינו לפחות .15% בכדי לבדוק את כדאיות המבצע ,נשלחו 100מכתבים ל 100-צרכנים שנבחרו באופן מקרי מרשימת תפוצה ,ומתוכם התקבלו 10הזמנות. א .מהי המלצתך לחברה ברמת מובהקות ? 3% ב .אם שיעור התגובה האמיתי של הצרכנים הוא ,12%מהי עוצמת המבחן מסעיף א' ? ג .בנה רווח סמך ברמת סמך 95%לשיעור התגובה באוכלוסייה על סמך המדגם שלעיל. ד .לדעת מנכ"ל החברה ,רווח הסמך שהתקבל גדול מדי .מהו גודל המדגם הדרוש כדי שאורך רווח הסמך יהיה מחצית מהאורך שקיבלת בסעיף ג' באותה רמת סמך ? פתרון שאלה 5 H : p 0.15 0.1 0.15 1.4 z0.97 1.881 , pˆ 10 0.1 0 א. 100 H1 : p 0.15 0.15 0.85 100 z pˆ לא דוחים את השערת האפס ,לא נדחתה ההשערה בדבר כדאיות מבצע הפרסום. ב. H1 : p 0.12 , pˆ c 0.15 1.881 0.15 0.85 0.0828 100 0.0828 0.12 ) (1.14) 1 0.8729 0.1271 0.12 0.88 100 0.1 0.9 0.1 0.9 1.96 p 0.1 ג1.96 . 100 100 ( 1 P( pˆ 0.0828 | H1 ) 0.0412 p 0.1588 0.1 ד .כדי לקבל רווח באורך מחצית האורך שהתקבל בסעיף ג' יש להגדיל את המדגם פי , 4=22 כלומר נדרש מדגם בגודל .400 www.OpenBook.co.il | [email protected] 37 שאלה 6 בעיר מסוימת נמצא על-פי מפקד האוכלוסין האחרון ,כי אחוז התושבים מעל גיל ,24בעלי תואר אקדמי הוא .25% מנהל אגף החינוך באותה עיר מעוניין לבדוק האם חל שינוי באחוז התושבים בעלי תואר אקדמי. סטטיסטיקאי הרשות הציע לבדוק מדגם מקרי של 20תושבים מעל גיל 24ולהחליט שלא חל שינוי באחוז האקדמאים ,אם מספר בעלי תואר אקדמי במדגם יהיה 7 ,6או . 8 א .מהי ההסתברות לטעות מסוג ראשון של המבחן המוצע ? ב .מהי ההסתברות לגלות שינוי באחוז האקדמאים בעיר ,אם זה אכן השתנה ל ? 40%- ג .חזור על סעיפים א' ו-ב' באם יוחלט שחל שינוי באחוז האקדמאים אם מספר בעלי תואר אקדמי יהיה שונה מ? 7 - פתרון שאלה 6 H 0 : p 0.25 H1 : p 0.25 X ~ B 20, p ,מספר האקדמאים במדגם אזור הקבלהX=6,7,8 : א. ) = רוזאהיחדה( ) PH0תועט גוסמ P( I 1 PHo ( X 6, 7,8) 1 P( X 8) P( X 5) 1 0.9591 0.6172 06581 ב. בהנחת H1 : )X ~ B (20, 0.4 1 1 PH1 ( X 6,7,8) 1 P( X 8) P( X 5) 1 0.5956 0.1256 0.53 ג. אזור הדחיה X 7 אזור הקבלה X 7 1 PHo ( X 7) 1 P( X 7) P( X 6) 1 0.8982 0.7858 0.8876 1 1 PH1 ( X 7) 1 P( X 7) P( X 6) 1 0.4159 0.25 0.8341 www.OpenBook.co.il | [email protected] 38 שאלה 7 ידוע משנים קודמות כי מבין כל 100סטודנטים שהתחילו ללמוד באו"פ 20הפסיקו את לימודיהם. משערים כי השנה אחוז הסטודנטים שהפסיקו ללמוד שונה מהעבר .לשם כך נלקח מדגם מיקרי של 150סטודנטים ונמצא כי 35הפסיקו את לימודיהם. א .נסח השערות ובדוק את הטענה בר"מ .0.02 ב .אם ההשערות היו: H 0 : p 0.2 H1 : p 0.2 האם ניתן לדעת ,ללא חישוב נוסף מה תהיה המסקנה באותה ר"מ? אם לא ,מדוע לא? ג .אם ההשערה היא כי השנה הפסיקו את לימודיהם 25%מהסטודנטים ,מה תהיה ההסתברות לטעות מסוג שני על פי המבחן בסעיף א'. www.OpenBook.co.il | [email protected] 39 40 [email protected] | www.OpenBook.co.il 41 [email protected] | www.OpenBook.co.il הסקה סטטיסטית לפי שני מדגמים באילו מצבים החוקר יתעניין בהשוואה לפי שני מדגמים ? כאשר רוצים להשוות בין 2טיפולים ולהחליט מי טוב יותר מדגם הראשון יטופל בטיפול א' ומדגם ב' יטופל בטיפול ב' ונשווה בין שתי האוכלוסיות. .1שני מדגמים בלתי תלויים המדגמים נבחרו באופן אקראי ,אין תלות בין בחירת המקרים בין מדגם א' לב'. לדוגמא :השוואת שכר גברים לשכר נשים יתכנו 3מצבים: .1שונות ידועה – מודל 3 .2שונויות לא ידועות אך שוות – מודל 4 .3שונויות לא ידועות ולא שוות – לא נתעסק בקורס זה .2שני מדגמים מזווגים ( תלויים) מודל 5 בין שני מדגנים מזווגים יש מתאם סטטיסטי ,מדגם מזווג זה כמו בחירת אותו נחקר לשני מדגמים ,השוואת לפני טיפול ואחרי טיפול וכו. www.OpenBook.co.il | [email protected] 42 מודל :5הסקה על הפרש ממוצעים לפי שני מדגמים מזווגים הנחות x1 , x2 מסווגים , Dc , D ~ N D , 2סטטיסטי במדגם: n Di X1 X 2 SD , TD נחשב הפרשים ונתייחס אליהם כאל מדגם אחד .התפלגות tעם ) (n-1דרגות חופש. שאלה 1 להלן נתונים על מספר השעות שהקדישו עשרה ילדים בגיל 14במשך שבוע להכנת שעורים ולצפייה בטלוויזיה : הכנת שעורים 13 15 16.5 14.5 10 13.5 19 16 15 12 צפייה בטלוויזיה 17.5 14 15 20 13.5 14 18 16 17 16 האם ניתן לומר כי ילדים מקדישים בממוצע יותר זמן לצפייה בטלוויזיה מאשר להכנת שעורים, בהנחה שמספר השעות מתפלג נורמלית ? נסח את ההשערות ובדוק ברמת מובהקות . 0.05 פתרון שאלה 1 ההשערות הן: H 0 : X Y D 0 H1 : X Y D 0 , כאשר – Xזמן הצפייה בטלוויזיה – Y ,זמן הכנת שיעורים, ההנחות :מדגמים מזווגים/תלויים ,שונות לא ידועה ,התפלגות נורמלית באוכ' ) D ~ N ( D , D2 נוסיף שורה חדשה Dהפרש התצפיות: הכנת שעורים 13 15 16.5 14.5 10 13.5 19 16 15 12 צפייה בטלוויזיה 17.5 14 15 20 13.5 14 18 16 17 16 D 4.5 1- 1.5- 5.5 3.5 0.5 1- 0 2 4 87.25 10 1.652 6.67 9 D0 בהנחת ~ t (9) : H 0 SˆD n אזור הדחייה ברמת מובהקות 10d 2 2 i 10 10 d i 1 9 (di d ) 2 i 1 9 sˆd2 , d 1.65 TD 0.05 הוא: TD t0.05 (9) 1.833 דחה את H 0אם - 1.65 0 9 2.02 t0.05 1.833 6.67 10 www.OpenBook.co.il | td [email protected] 43 לכן נדחה את , H 0כלומר ניתן לומר ברמת מובהקות 0.05שילדים מקדישים בממוצע יותר זמן לצפייה בטלוויזיה מאשר להכנת שיעורים. שאלה 2 קיימת טענה שאנשים המפסיקים לעשן עולים בממוצע יותר מ – 4ק"ג .לצורך בדיקת הטענה נלקח מדגם מקרי של 10גברים ,שנשקלו פעם אחת לפני שהפסיקו לעשן ,ופעם שנייה שנה לאחר הפסקת העישון .להלן התוצאות שנתקבלו : משקל לפני הפסקת העישון 62 75 78 82 68 76 77 74 84 80 משקל אחרי הפסקת העישון 70 84 84 80 75 80 82 80 89 86 האם ניתן לקבוע שהטענה נכונה ? נסח את ההשערות ,רשום את ההנחות שהנך מניח לצורך הפתרון ובדוק ברמת מובהקות .0.05 פתרון שאלה 2 - xiהמשקל של הנבדק הi - לפני הפסקת העישון, - y iהמשקל של הנבדק הi - לאחר הפסקת העישון. נגדיר y i xi . di נתוןn 10 : נניח כי ) N ( , 2 ההשערות הן , H 0 : d 4 :כלומר המפסיקים לעשן עולים במשקל יותר מ 4 -ק"ג, . H1 : d 4 לעומת ~ .D 1 ( d i2 10 d 2 ) . 9 )d נרשום את ההפרשים: i (d n 1 S D2 d i : 8,9,6,2,7,4,5,6,5,6 sˆd 2.99 1 1 (372 10 5.4 2 ) 80 .4 8.93, 9 9 התפלגות הדגימה בהנחת )~ t (9 H0 sˆd2 372 , 2 i d d 5.4, ,כאשר nקטן מ ,30 -היא: D 4 Sˆ D / 10 כלל ההכרעה הוא :דחה את 1.833 מלוח tידוע כי נחשב סטטיסטי המבחן: 1.4 1.48 0.946 H0 עבור T t1 בהתפלגות t עם 9דרגות חופש. 9( t 0.95דרגות חופש). 5.4 4 2.99 / 10 t , 1.48 1.833לכן לא נדחה את , H 0כלומר המפסיקים לעשן לא עולים במשקל יותר מ 4 -ק"ג. www.OpenBook.co.il | [email protected] 44 שאלה 3 הטבלה הבאה מציגה את מספר שעות השינה לאחר קבלת תרופה מסוימת ,ומספר שעות השינה לפני קבלתה ,של 9חולים שקבלו תרופה מסוימת. לפני קבלת התרופה 7 5 6.5 6.5 7 5 4.5 8 8 אחרי קבלת התרופה 8 7 6 8 7 8 8.5 7 9 האם יש לתרופה השפעה חיובית על מספר שעות השינה ,בהנחה שמספר שעות השינה מתפלג נורמלית ? נסח את ההשערות ,הסבר מהו המבחן הסטטיסטי המתאים ובדוק ברמת מובהקות .0.05 פתרון שאלה 3 xi - y iמספר שעות השינה אחרי קבלת התרופה . d i y i xi -מספר שעות השינה לפני קבלת התרופה נגדיר נתוןn 9 : נניח כי ) N ( , 2 ההשערות הןH1 : d 0 , H 0 : d 0 : ~ .D 9d 2 ) . 2 i ( d d ) 1 ( d i n 1 8 S D2 נרשום את ההפרשים: di : 1,2, 0.5,1.5,0,3,4, 1,1 1 (34.5 9 1.22 2 ) 2.63, sˆd 1.62 8 התפלגות הדגימה בהנחת H0 34.5, sˆd2 2 i d 11 1.22 , 9 d ,כאשר nקטן מ ,30 -היא: D )~ t (8 SˆD / 9 כלל ההכרעה הוא: דחה את מלוח t H0 עבור T t1 בהתפלגות t עם 8דרגות חופש. ידוע כי . t 0.95 1.86סטטיסטי המבחן: )(8 1.22 2.26 1.62 / 9 t , 2.26 1.86לכן נדחה את , H 0כלומר ברמת מובהקות , 0.05יש לתרופה השפעה חיובית על מספר שעות השינה. www.OpenBook.co.il | [email protected] 45 שאלה ( 4פתרון מלא ומוקלט באתר) במחקר מסוים נבדק יבול הקפה [מספר שקים בחודש] ב 7-חוות קטנות לפני ואחרי שימוש בשיטת טיפול חדשנית נגד פטרייה מזיקה: 2 1 חווה 6 5 לפני 9 10 אחרי ידוע שהיבול מתפלג נורמלית. 4 8 8 3 7 9 6 3 8 5 4 13 7 6 9 בדוק את ההשערה שתוחלת היבול לאחר הטיפול שונה מתוחלת היבול לפני הטיפול ברמת מובהקות .0.05נמק פתרון 6 לפני 5 X 7 8 4 3 6 8 0 13 9 8 5 9 3 9 9 אחרי 10 Y 2 3 5 D=Y-X 53 2 0953 d 3.857 7 52 32 22 02 92 52 32 153 2 i d 1 ( di2 7d 2 ) 8.144 Sˆ 8.144 2.8538 6 השערות: )d i (d n 1 S D2 H 0 : d 0 H1 : d 0 הנחות: ( )1התפלגות נורמלית ( )2מדגמים מזווגים 3.857 0 חישוב סטטיסטי 3.576 : 2.8535 / 7 אזור דחיית 𝟎𝑯: t TD t0.025 (6) 2.447 TD t0.025 (6) 2.447 מסקנה: 2.447<3.576ולכן נדחה את Hoבר"מ 0.05 כלומר חל שינוי בעקבות הטיפול החדש www.OpenBook.co.il | [email protected] 46 47 [email protected] | www.OpenBook.co.il מודל : 3+4בדיקת השערות על הפרש תוחלות במדגמים ב"ת מודל 3שונויות ידועות הנחות: x1 , x2 מתפלג נורמלית ,בלתי תלויים – אך אם n>30אין צורך בהנחת נורמליות. הסטטיסטי במדגם: ( x1 x2 ) c 12 2 2 n1 n2 . Z x1 x2 אם השונויות אינן ידועות ומדובר במדגמים גדולים מספיק נציב את s1 , s2במקום סטיות התקן של האוכלוסיות. שאלה 1 בחוות כבשים הגיעה עונת הגז והעובדים עושים תחרות בין שתי קבוצות :בקבוצה א' העובדים הוו תיקים ובקבוצה ב' העובדים החדשים שזה להם הגז הראשון .בנתונים שנאספו נמצא כי קבוצה א' גזמה 120ק"ג צמר ב 40-ימי עבודה שנדגמו מקרית בעוד שקבוצה ב' גזמה 70ק"ג צמר ב 35-ימי עבודה שנדגמו מקרית. ידוע כי סטיית התקן בקרב העובדים הוו תיקים היא 1.5ובקרב העובדים החדשים היא .2.5 א .האם לאור התוצאות ניתן לומר ,ברמת מובהקות 0.05כי ממוצע ק"ג צמר ליממה שנאסף בקבוצה א' גבוה מממוצע ק"ג צמר ליממה שנאסף בקבוצה ב' ב .מהי מובהקות התוצאה ,כלומר ,מהי רמת המובהקות המינימלית עבורה יוחלט כי ממוצע ק"ג צמר ליממה שנאסף בקבוצה א' אכן גבוה מממוצע ק"ג צמר ליממה שנאסף בקבוצה ב'? פתרון www.OpenBook.co.il | [email protected] 48 49 [email protected] | www.OpenBook.co.il שאלה מבחינה 2014ב מועד 84 המרכז הארצי לבחינות החליט לבדוק כמה סוגיות בקשר לתוחלת הציונים בבחינה הפסיכומטרית. ידוע כי הציונים בבחינה הפסיכומטרית מתפלגים נורמלית עם סטיית תקן ,100ללא קשר למועד אליו ניגשים הנבחנים .נלקח מדגם של 20תלמידי תיכון שנגשו לבחינה הפסיכומטרית והתקבל בו ציון ממוצע בבחינה של .540בנוסף ,נלקח מדגם של 25נבחנים שנגשו לבחינה הפסיכומטרית לאחר הצבא והתקבל בו ציון ממוצע בבחינה של .572 א .האם ניתן להסיק ,ברמת מובהקות ,0.05כי עדיף להיבחן בבחינה הפסיכומטרית לאחר הצבא מאשר בתיכון? רשמו את המבחן בו אתם משתמשים ונמקו תשובתכם. ב .ידוע כי תוחלת הציון בבחינה הפסיכומטרית לאורך השנים היא .535 .1האם ניתן לומר ,ברמת מובהקות ,0.05כי הציונים של הנבחנים בבחינה לאחר הצבא שונים מה ממוצע הכללי? רשמו את המבחן בו אתם משתמשים ונמקו תשובתכם. .2אם תוחלת הציון בבחינה הפסיכומטרית ,של הנבחנים בבחינה לאחר הצבא ,היא באמת ,560מה ההסתברות שהמבחן בו השתמשתם ב )1(-יגלה זאת? איך נקראת הסתברות זו? www.OpenBook.co.il | [email protected] 50 51 [email protected] | www.OpenBook.co.il שאלה ( 3פתרון מלא ומוקלט באתר) ידוע כי סטיית התקן של מספר שעות העבודה בשבוע של נשים עובדות היא 4שעות ,במדגם מקרי של 225נשים נמצא ממוצע 36.4שעות עבודה. במדגם מקרי נוסף של 100גברים נמצא כי ממוצע שעות העבודה שלהם בשבוע הוא 38שעות .ידוע כי סטית התקן של מספר שעות העבודה השבועיות בקרב הגברים היא 5שעות. א .האם לאור התוצאות ניתן לומר ברמת מובהקות 0.01שנשים עובדות בממוצע פחות שעות? הסבר ונמק. ב .בהמשך לסעיף א ,חשב את עצמת המבחן אם למעשה ממוצע שעות העבודה בשבוע של גברים גבוה ב 3 -שעות ממוצע שעות העבודה של נשים. נתונים: 𝛼 = 0.01 נשים1 - גברים2- 4 5 𝝈 225 100 n 36.4 38 ̅ 𝑿 השערות: 𝟎 = 𝟏𝝁 𝑯𝟎 : 𝝁𝟐 − 𝟎 > 𝟏𝝁 𝑯𝟏 : 𝝁𝟐 − הנחות: ( )1מדגמים ב"ת ( )2שונות באוכ' ידועות ( 30> 𝑛2 ,𝑛1 )3ולכן מ.ג.מ מתקיים שרטוט השערות וקביעת אזורי דחייה וקבלה אזור קבלת Z x2 x1 2.326 : H 0 אזור דחיית Z x2 x1 2.326 : H 0 חישוב סטטיסטי: www.OpenBook.co.il | [email protected] 52 38 36.4 0 2.82 2.326 42 52 225 100 Z x2 x1 החלטה :נדחה את H 0 מסקנה :ברמת מובהקות 0.01הנשים עובדות בממוצע פחות שעות מגברים התוצאה מובהקת סטטיסטית. סעיף ב H1משתנה ,ולכן: השערות: 𝟎 = 𝟏𝝁 𝑯𝟎 : 𝝁𝟐 − 𝟑 = 𝟏𝝁 𝑯𝟏 : 𝝁𝟐 − נפתור ב 2-שלבים: ( )1מציאת kב H 0 -לפי נתונה ( )2מציאת kב H1 -ומציאת 1 שלב ( )1חישוב ערך קריטי תחת 𝟎𝑯 בר"מ 0.01 x2 x1 c 1.32 x2 x1 0 2.326 42 52 225 100 ולכן בר"מ 0.01נדחה את 𝟎𝑯 אם x2 x1 1.32 שלב ( )2הצבת ערך קריטי ב:𝑯𝟏 - www.OpenBook.co.il | [email protected] 53 1.32 3 1 P x2 x1 1.32 1 42 52 225 100 1 2.97 2.97 0.9985 54 [email protected] | www.OpenBook.co.il 55 [email protected] | www.OpenBook.co.il מודל – 4בדיקת השערות :הפרש תוחלות כאשר השונויות אינן ידועות הנחות x1 , x2 -מתפלגים נורמלית ובלתי תלויים ,מדגמים קטנים אז נניח שונויות שוות .כשהמדגמים ב"ת והשונויות באוכלוסייה לא ידועות ,המדגמים בד"כ יהיו מאוד קטנים ותמיד נניח שהשונויות באוכלוסייה שוות (אלא אם כתוב בשאלה שלא ניתן להניח זאת). n1S12 n2 S 22 שלב ראשון-נחשב "שונות משוקללת" לפי הנוסחה: n1 n2 2 התפלגות tעם n1 n2 2 2 2 n 1 S 1 n2 1 S 2 1 n1 n2 2 2 S דרגות חופש שלב שני – בדיקת השערות רגילה ,הסטטיסטי במדגם: ( x1 x2 ) c 2 n2 S n1 2 S Tx1 x2 שאלה 1 בשתי שכונות נמדדו רמות הרעש [דציבלים] (להלן )Xביום העצמאות במספר מוקדים: 6 5 4 3 2 1 מוקד 112 95 115 80 100 שכונה א 103 98 109 102 117 110 שכונה ב א .בדוק את ההשערה שתוחלת - Xבשכונה א שונה מ 116ברמת מובהקות .0.05נמק ב .בדוק את ההשערה שתוחלת Xבשכונה א שונה מתוחלת Xבשכונה ב ברמת מובהקות .0.05נמק. בכל סעיף ,במידה ודרושות הנחות כלשהן ,רשום מהן. www.OpenBook.co.il | [email protected] 56 פתרון 57 [email protected] | www.OpenBook.co.il 58 [email protected] | www.OpenBook.co.il שאלה 2 באוניברסיטה מסוימת קיימת הטענה כי הציון הממוצע בבחינות בסטטיסטיקה ללא חומר עזר אינו שונה מהציון הממוצע בבחינות עם חומר עזר. לבדיקת הטענה ניתנה בחינה בסטטיסטיקה ללא חומר עזר ל 16-סטודנטים שנבחרו באופן מקרי מבין תלמידי הקורס. הציון הממוצע בבחינה היה 76עם טעות תקן Sˆ1 13 . כמו כן נבחנו 15סטודנטים אחרים שנבחרו באופן מקרי ,בבחינה דומה ( הבחינות היו חסויות ) כאשר בבחינה ניתן היה להיעזר בחומר עזר. הציון הממוצע בבחינה היה 73עם טעות תקן 9 . Sˆ 2 א .נסח את ההשערות ורשום את ההנחות הדרושות. ב .בדוק את ההנחה בדבר שוויון השונויות ברמת מובהקות .0.1 ג. האם התוצאות מאוששות את טענת האוניברסיטה ברמת מובהקות ? 0.05 פתרון שאלה 2 א .ההשערות: ההנחות: H1 : 1 2 0 , H0 : 1 2 0 מדגמים ב"ת ,שונויות לא ידועות אך שוות. ) Y1, ... Yn2 ~ N ( 2 , 2 ) , X1, .. X n1 ~ N ( 1, 2 ב. H1: 12 22 , H0: 12 22 s2 132 1 12 2 2.086 f15,14 (0.05) 2.46 f14,15 (0.05) s2 9 f15,14 (0.95) ערך זה לא מופיע בטבלה אך השבר כולו קטן מ- 1ולכן קטן מערך הסטטיסטי. לא דוחים את השערת האפס ,כלומר ההשערה בדבר שוויון השונויות לא נדחית. ג. (16 1)132 (15 1)92 sˆ 162.5 16 15 2 2 76 73 0.742 t0.025 (29) 2.045 1 1 1265 ) .( 16 15 t0.975 (29) 2.045 Tx y טענת האוניברסיטה לא נדחית בר"מ .0.05 www.OpenBook.co.il | [email protected] 59 שאלה ( 3פתרון מלא ומוקלט באתר) לבדיקת הטענה כי הציון הממוצע במבחני לשכת עו"ד של סטודנטים למשפטים שלמדו באוניברסיטאות גבוה מהציון המוצע של סטודנטים למשפטים שלמדו במכללות נבדקו ציונים של שתי קבוצות סטודנטים והתקבלו התוצאות המוצגות בטבלה שלהלן: מקום הלימוד מספר הסטודנטים ציון ממוצע אומדן לשונות Sˆ 2 410 81 אוניברסיטה 38 500 72 27 מכללה א .בדוק את הטענה ברמת מובהקות ?0.05נמק. ב .בשנים הקודמות הציון הממוצע במבחני לשכת עו"ד בקרב בוגרי מכללות היה .65האם ניתן לומר על סמך התוצאות הנ"ל ברמת מובהקות 0.05שחלה עלייה בציונים בקרב בוגרי מכללות? נמק. בשאלה מבקשים להשוות בין שתי תוחלות כאשר המדגמים הם בלתי תלויים ( )1נתונים: n x Sˆ 2 אוניברסיטה410 81 38 1 - 500 72 27 מכללה – 2 ( )2השערות: H 0 : 1 2 0 H1 : 1 2 0 ( )3הנחות: x1 , x2מתפלגים נורמלית שונויות באוכלוסייה אינן ידועות אך שוות 12 22 x1 , x2בלתי תלויים ( )4דחה את H 0אם 1.645 : t t0.05 38 27 2 63 ( )5רמת מובהקות 0.05 : ( )6חישוב התפלגות הדגימה: n 1 Sˆ12 n2 1 Sˆ22 (38 1)4102 (27 1)5002 28170 447.14 sˆ 2 1 n1 n2 2 38 27 2 63 בהנחה ש H 0נכונה. ( )7חישוב סטטיסטי וכלל הכרעה 1.691 1.645 : 81 72 0 1 1 447.14 38 27 t לכן נדחה את , H 0ניתן לומר בר"מ 0.05שהציון הממוצע במבחני לשכת עו"ד של סטודנטים למשפטים שלמדו באוניברסיטה גבוה מהציון הממוצע של סטודנטים למשפטים שלמדו במכללות. סעיף ב מבחן Tלתוחלת אחת www.OpenBook.co.il | [email protected] 60 השערות: H 0 : 2 65 H1 : 2 65 הנחות: התפלגות נורמלית שונות לא ידועה שרטוט ההשערות וקביעת אזור קבלה ודחייה אזור דחיית 𝟎𝑯: 1.706 t t0.05 27 1 26 התפלגות הדגימה :בהנחה ש 𝐻0 -נכונה: 𝑥2 ̅̅̅−65 26 ~𝑡0.05 𝑆̂2 ⁄ √27 חישוב סטטיסטי וכלל הכרעה: 72 65 1.63 1.706 500 27 t לכן נקבל את 𝟎𝑯 ,לאור התוצאות בר"מ 0.05 לא ניתן לומר שחלה עלייה בציונים בקרב בוגרי מכללה. www.OpenBook.co.il | [email protected] 61 62 [email protected] | www.OpenBook.co.il 63 [email protected] | www.OpenBook.co.il שאלה 4 הליגה לשוויון זכויות האישה טוענת כי ההכנסה של נשים נמוכה מזו של גברים העובדים באותו מקצוע .לשם בדיקת הטענה נלקח מדגם של 8נשים ו – 5גברים העובדים במחלקה אחת באותו מפעל ונרשמו ההכנסות החודשיות ( בדולרים ) : משכורת נשים 900 700 1000 925 1220 משכורת גברים 870 1350 1150 930 1400 800 950 940 מהי מסקנתך ברמת מובהקות ? 2.5% נסח את ההשערות ,רשום את ההנחות הדרושות לביצוע המבחן הסטטיסטי המתאים . פתרון שאלה :1 א .ההשערות : H 0 : 1 2 0 H1 : 1 2 0 - X1 ,משכורת נשים - X 2 ,משכורת גברים ) X 1 ,..., X n1 ~ N ( 1 , 12 כלומר :התפלגות נורמלית של הנתונים הנחות : 2 ) Y1 ,..., Yn2 ~ N ( 2 , 2 שוויון שונויות 12 22 : .ומדגמים בלתי תלויים. נפתור במחשבון : גברים נשים 5 8 n 239.16 151.29 S 1140 929.37 x 239.16 5 1 151.29 8 1 35365.63 2 2 852 x 2 x1 1140 929.375 1.96 2 1 1 1 1 ) s ( ) 35365.63( n1 n2 5 8 2 ˆ, s t x2 x1 עבור רמת מובהקות 2.5%אזור הדחיהTX 2 X1 t0.025 (11) 2.201 : 1.96 2.201לכן השערת האפס לא נדחית ברמת מובהקות 2.5%ולכן גם ברמת מובהקות 2%לא תדחה ,ולא הוכח שההכנסה של נשים נמוכה מהכנסת הגברים. www.OpenBook.co.il | [email protected] 64 מודל :7בדיקת השערות על הפרש פרופורציות הנחות x1 , x2 , n1 p1 , n1 q1 10 , n2 p2 , n2 q2 10 :בלתי תלויים ,התפלגות נורמלית.. p1 p 2 הסטטיסטי במדגם: pq pq n1 n2 n1 p1 n2 p 2 , Zכאשר p1 p 2 n1 n2 p שאלה 1 להלן תוצאות סקר שנעשה לבדיקת מספר בתי אב המנויים על כבלים באזורים שונים ברחבי הארץ: גודל המדגם מספר המנויים במדגם אזור 124 162 ירושלים 155 250 תל אביב 84 120 חיפה 341 620 מחוץ לערים הגדולות על סמך תוצאות הסקר ענה על השאלות הבאות: א .בדוק ברמת מובהקות 0.05את הטענה כי מחוץ לערים הגדולות ,יותר ממחצית בתי האב מנויים על כבלים .נמק. ב .האם ניתן לומר ,ברמת מובהקות ,0.05כי אחוז המנויים בת"א שונה מאחוז המנויים בחיפה?נמק. ג .בדוק ברמת מובהקות 0.05את הטענה כי פרופורצית בתי האב המנויים על כבלים בירושלים נמוכה מ .0.8נמק www.OpenBook.co.il | [email protected] 65 66 [email protected] | www.OpenBook.co.il 67 [email protected] | www.OpenBook.co.il שאלה 2 חוקר בדק את הקשר בין עישון ללחץ דם גבוה בעזרת מדגם מקרי של 800אנשים .במדגם היו 300 מעשנים ומתוכם 8%סובלים מלחץ דם גבוה ,וכן 500איש שאינם מעשנים ומתוכם 4%סובלים מלחץ דם גבוה. א .בדוק ברמת מובהקות של , 0.01את ההשערה שבקרב מעשנים אחוז הסובלים מלחץ דם גבוה גדול יותר מאשר בקרב אלה שאינם מעשנים. ב .אמוד את אחוז הסובלים מלחץ דם גבוה באוכלוסייה כולה ,ברמת בטחון של .95% ג .האם תוצאות המדגם מצדיקות את הטענה כי אחוז הסובלים מלחץ דם גבוה באוכלוסייה כולה ,הוא גבוה מ ? 5%נסח את ההשערות ובדוק ברמת מובהקות .0.01 פתרון שאלה 2 א .נסמן - p1פרופורצית הסובלים מלחץ דם גבוה בקרב המעשנים - p2פרופורצית הסובלים מלחץ דם גבוה בקרב הלא מעשנים נתון 0.01 , n1 = 300 n2 = 500 : ההשערות H : p p , H : p p :או H 0 : p1 p 2 0 1 1 2 0 1 2 H1 : p1 p 2 0 נתון: pˆ 1 0.08 , pˆ 2 0.04 הנחותn1pˆ 1 24 10 , n1qˆ 1 276 10 ,n2pˆ 2 20 10 , n2qˆ 2 480 10 : 0.08 300 0.04 500 44 24 20 44 0.055 pˆ או 0.055 300 500 800 800 800 pˆ אזור הדחיה ברמת מובהקות 0.01הואZpˆ 2 pˆ1 z 0.01 2.326 : 0.08 0.04 0.04 סטטיסטי המבחן 2.403 : 0.0166 1 1 (0.055 0.945 ) 300 500 pˆ1 pˆ 2 ˆ ˆ pq ˆˆ pq n1 n2 z מסקנה , 2.4 2.326 :לכן נדחה את , H 0כלומר ,ניתן לומר כי אחוז הסובלים מלחץ דם גבוה ,גבוה יותר בקרב המעשנים. n 800 0.05 Z1 / 2 Z 0.975 1.96 pˆ 0.055 qˆ 0.945 ב .רב"ס לפרופורציה 0.055 0.945 0.055 0.0158 : 800 ˆˆ pq 0.055 1.96 n 0.0392 , 0.0708 pˆ Z1 / 2 0.055 0.945 0.055 0.945 1.96 p 0.055 1.96 0.0392 p 0.0708 800 800 www.OpenBook.co.il | 0.055 [email protected] 68 ג .השערות H1 : p 0.05 ; H0 : p 0.05 : pˆ 0.05 pˆ 0.05 התפלגות הדגימה בהנחת ~ N (0, 1) : H 0 0.0077 0.05 0.95 800 רמת המובהקות . 0.01 דחה את H 0אם Z 2.326 0.005 0.649 0.0077 z pˆ , 0.649 2.326לכן מקבלים את . H 0 כלומר ,לא הוכח שאחוז הסובלים מלחץ דם גבוה באוכלוסייה גבוה מ 5% -ברמת מובהקות . 0.01 לא דוחים את השערת האפס ,תוצאות המדגם לא מצדיקות את הטענה. www.OpenBook.co.il | [email protected] 69 שאלה 3 במדגם מקרי של 400תושבי גוש דן נמצא של 140-מהם יש מכשיר .DVD במדגם מקרי של 500תושבים משאר חלקי הארץ נמצא כי של 150-מהם יש מכשיר .DVD א .האם ניתן לומר שפרופורצית בעלי DVDבגוש דן גבוה מפרופורצית בעלי DVDבשאר חלקי הארץ ? נסח את ההשערות והסק עבור רמת מובהקות .0.05 ב .בדוק את ההשערה שפרופורצית בעלי DVDבכל רחבי הארץ שונה מ 0.3-ברמת מובהקות.0.05 פתרון שאלה 1 - p2פרופורצית בעלי DVDבשאר חלקי הארץ. א .נסמן - p1פרופורצית בעלי DVDבגוש דן, נתון . 0.05 , n1 = 400, n2 = 500 :הנחות : ) - X 1 ~ B(400, p1מספר בעלי DVDבגוש דן - X 2 ~ B(500, p2 ) ,מספר בעלי DVDבשאר H 0 : p1 p 2 0 חלקי הארץ .ההשערות הן: H1 : p1 p 2 0 140 150 pˆ 1 0.35, pˆ 2 לפי הנתון 0.3 : 400 500 כלל ההכרעה הוא: 140 150 דחה את H 0אם . Z 1.645 pˆ נחשב 0.322 400 500 חישוב סטטיסטי המבחן: pˆ 1 pˆ 2 0.35 0.3 0.05 1.595 0.0313 ˆpˆ qˆ pˆ q 1 1 ( 0.322 * 0.678 ) n1 n2 400 500 z 1.595 1.645 לכן ,לא נדחה את . H 0כלומר ,לא ניתן לומר שפרופורצית בעלי DVDבגוש דן גבוהה מפרופוצית בעלי DVDבשאר חלקי הארץ. ב .השערות: Y H 0 : p 0.3 הסטטיסטי: pˆ H 1 : p 0.3 n pˆ 0.3 pˆ 0.3 התפלגות הדגימה בהנחת ~ N (0, 1) : H 0 0.3 0.7 0.0153 900 רמת המובהקות . 0.05 כלל הכרעה :קבל את H 0אם , z 0.975 Z z 0.025או 1.96 Z 1.96 ולא – דחה את . H 0 0.022 1.44 0.0153 z pˆ , 1.96 1.44 1.96לכן מקבלים את . H 0כלומר ,פרופורצית בעלי DVDבכל רחבי הארץ לא שונה מ 0.3 -ברמת מובהקות .0.05 www.OpenBook.co.il | [email protected] 70 שאלה ( 4פתרון מלא ומוקלט באתר) בסקר דעת קהל על תכנית חדשה בטלוויזיה נמצאו התוצאות הבאות : לא צופים צופים 162 38 נשים 192 108 גברים א .בדוק את ההשערה שלמין אין כל השפעה על הצפייה בתכנית ברמת מובהקות ? 0.05נמק. ב .האם לאור התוצאות ניתן לומר ,ברמת מובהקות , 5%שפרופורציית הנשים הצופות בתכנית נמוכה מ ? 20%-נמק. פתרון 108 146 38 0.36, pˆ 2 0.292 , pˆ1 א .נתון 0.19 : 300 500 200 ) X1 ~ B(300, p1 מספר הצופים בקרב מדגם הגברים ) X 2 ~ B(200, p2 מספר הצופים בקרב מדגם הנשים השערות: H0 : p1 p2 0 , pˆ מבחן Zלהפרש פרופורציות: H1 : p1 p2 0 n2 pˆ 2 38 10 n1 pˆ1 108 10 , הנחות: n2 qˆ2 162 10 n1 qˆ1 192 10 רמת המובהקות. 0.05 : כלל הכרעה :נדחה את השערת האפס אם Z pˆ1 pˆ 2 1.96או Z pˆ1 pˆ 2 1.96 0.36 0.19 חישוב הסטטיסטי וההכרעה 4.09 1.96 : 1 1 (0.292 0.708 ) 300 200 z pˆ1 pˆ 2 נדחה את השערת האפס ,כלומר ניתן לומר שלמין יש השפעה על הצפייה בר"מ .0.05 ב. מבחן Zלפרופורציה בודדת: קביעת ההשערות: H1 : p 0.2, H 0 : p 0.2 n p 200 0.2 40 10 38 הנחות: נתון 0.19 : nq 200 0.8 160 10 200 pˆ רמת המובהקות. 0.05 : קביעת אזורי דחייה וקבלה :נקבל את השערת האפס אם . Z 1.645דחה אם . z 1.645 0.19 0.2 חישוב הסטטיסטי וההכרעה 0.35 1.645 : 0.2 0.8 200 Z לא נדחה את , H 0לא ניתן לומר ברמת מובהקות 0.05שפרופורציית הנשים הצופות בתכנית נמוכה מ20% - www.OpenBook.co.il | [email protected] 71 מודל :8בדיקת השערות על שונות אחת nS 2 הנחות :התפלגות נורמלית .הסטטיסטי במדגם: c התפלגות 2 2 n 1 S 2 c עם ) (n-1דרגות חופש. שאלה 1 חוקר טוען שבידיו שיטה חדשה המשפרת את הצלחת כל התלמידים אך לא באופן שווה .לצורך בדיקת העניין דגם 30תלמידים מקרית ומצא כי ממוצע ציוניהם הוא 124עם סטיית תקן .9בהנחה שהציונים מתפלגים נורמלית באוכלוסייה עם ממוצע 120ושונות .100האם ניתן לטעון שהשיטה ה חדשה אכן שמפרת את שונות הציונים? בדקו בר"מ .0.05 www.OpenBook.co.il | [email protected] 72 שאלה 2 יצרן צינורות טוען שקוטר הצינורות שהוא מייצר מתפלג נורמלית עם שונות של 1ס"מ .בבדיקה שנערכה נבדקו 15צינורות והשונות במדגם s 2 -הייתה .2.25האם על סמך מדגם זה ניתן לשלול את טענת היצרן ברמת מובהקות . 0.02נמק. פתרון שאלה 1 מודל 8בדיקת השערות על שונות אחת .הנחות המודל התפלגות נורמלית קביעת ההשערות: H0 : 2 1 H1 : 2 1 ) X ~ N ( , 2 . (n 1) Sˆ 2 n S 2 2 ההנחות , X ~ N ( , ) :בהנחה ש H 0 -נכונה~ 2 (14) : 1 1 רמת המובהקות. 0.02 : אזורי קבלה ודחייה :נדחה את השערת האפס אם 29.141 2 או אם n S 2 15 2.25 חישוב הסטטיסטי וההכרעה 33.75 29.141 : 1 1 4.66 2 . . 2 נדחה את , H 0כלומר ברמת מובהקות 0.02ניתן לשלול את טענת היצרן. www.OpenBook.co.il | [email protected] 73 שאלה ( 3פתרון מלא ומוקלט באתר) חברת יעוץ להשקעות במניות מייעצת למשקיע מסוים לא להסתכן ,ולדחות כל השקעה שסטיית התקן של שיעור התשואה הצפוי ממנה עולה על .5%שיעורי התשואה הכוללים של מניות חברת STOCKהיו בתשע השנים האחרונות כדלקמן (באחוזים) 25,35,45,10,40,50,20,35,35 :בהנחה ששיעורי התשואה מתפלגים נורמלית: א .בדוק בר"מ של 0.05האם ישקיע במניות של חברה זו? ב .משקיע שמוכן לקחת סיכון גדול יותר ,מוכן לקבל כל השקעה שס"ת של שיעור התשואה הצפוי ממנה לא עולה על , 10%האם משקיע זה ישקיע ב"סטוק" באותה רמת מובהקות? נחשב במחשבון ממוצע ושונות: 252 352 452 ... 25 35 45 10 ... 32.78 , n 9 32.782 139.5 , x 9 9 S2 H : 2 25 H0 : 5 0 2 השערות: H1 : 5 H1 : 25 שרטוט וקביעת אזור קבלה ודחייה: 2 9 1 0.05 אזור קבלת 15.507 : H 0 2 9 1 0.05 אזור דחיית 15.507 : H 0 9 139.5 סטטיסטי 50.22 15.507 : 25 2 נדחה H 0בר"מ 0.05 מסקנה :סטיית התקן של התשואת המניות עולה על 5%ולכן נמליץ למשקיע לא להשקיע בר"מ .0.05 סעיף ב' H 0 : 2 100 השערות: 2 H1 : 100 n S 2 9 139.5 חישוב סטטיסטי 12.55 15.507 : c 100 2 החלטה :נקבל את השערת האפס מסקנה :השונות קטנה מ 100-ולכן נמליץ להשקיע בר"מ 0.05 www.OpenBook.co.il | [email protected] 74 75 [email protected] | www.OpenBook.co.il מודל :9הסקה על שתי שונויות של אוכלוסיות כאשר משווים שונות באוכלוסייה לנתון של מדגם ,זוהי בדיקת השערות לשונות אחת ונשתמש בהתפלגות 2 . לעומת זאת ,כאשר נתונים 2מדגמים בלתי תלויים ומעוניינים להשוות בין נתוני 2המדגמים ,אזי משווים בין 2אוכלוסיות ולכן זוהי בדיקת השערות ל 2-שונויות ומשתמשים בהתפלגות .F מבחן Fלשוויון שונויות במבחן Fאנו שואלים :אם שני מדגמים אכן לקוחים מהתפלגויות בעלות שונויות שוות ,אנו נצפה שההבדלים שבין אומדני השונויות של שני המדגמים יהיו קטנים .ההבדל שביניהם נובע מטעות מקרית .אם ההבדל שביניהם גדול דיו ,אנו נחשוש שהמדגמים לא לקוחים מהתפלגויות בעלות שונויות שוות ואז לא נוכל להניח שוויון שונויות במבחן tלמדגמים בלתי תלויים. הנחות :דגימה מקרית ,התפלגות הדגימה ,F 12 12 , H : השערות 1 : 1 0 22 22 x1 , x2 בלתי תלויים ,מתפלגים נורמלית. H1 : 2 2 הסטטיסטי במדגם F S 1 / S 2 :יחושב כיחס שבין האומדן הגדול חלקי האומדן הקטן מבין השניים. 1 עבור השערה דו צדדית :ערך קריטי ימני f /2 n1 1, n2 1ערך קריטי שמאלי f /2 n2 1, n1 1 התפלגות - Fהתפלגות זו לא בודקת הפרש ,אלא בודקת יחס בין שונויות ולכן הסטטיסטי שמתפלג 2 2 התפלגות Fהינו. F ~ S 1 / S 2 : התפלגות Fהיא כמו התפלגות , זוהי התפלגות אסימטרית שבה כל הערכים בהכרח חיוביים, 2 המשתנה Fבנוי מיחס של שני משתנים בלתי תלויים ,שלכל אחד מהם התפלגות עם דרגות חופש מתאימות .התפלגות Fתלויה בשני פרמטרים :מספר דרגות החופש של הביטוי במונה ומספר דרגות החופש של הביטוי במכנה: 2 דרגת חופש במונה n1 1 V1שורה -תלוי המספר התצפיות במדגם אחד דרגת חופש במכנה n2 1 V2טור -תלוי המספר התצפיות במדגם השני 12 תחת הנחת H 0מניחים שאין הבדל בין השונויות ולכן מרכז ההתפלגות 1 22 H 0 :ולכן הערכים הקריטיים העליונים בהתפלגות Fגדולים מ 1-והתחתונים נמצאים בין 0ל.1- בהשערה דו צדדית ,כמו ב , -יש להוציא שני ערכים קריטיים. 2 בטבלה מופיע רק ערך קריטי עליון והערך הקריטי התחתון מחושב לפי הנוסחהF1 /2 1/ F /2 : www.OpenBook.co.il | [email protected] 76 שאלה 1 חברה ליצור סלילי חוטים לתפירה טוענת כי אורך החוט בסליל המיוצר על ידה עולה על זה של חברה מתחרה ,אך השונות שווה .לשם בדיקת הטענה לגבי שוויון השונויות נלקח מדגם מקרי של 7סלילים מחברה א' ,ומדגם מיקרי של 5סלילים מחברה ב' והתקבלו אורכי החוטים הבאים: חברה א' : 81 165 97 134 92 חברה ב' : 102 86 98 109 92 87 114 א .בדוק את ההשערה שהשונויות שוות בשתי החברות בר"מ .0.1מהי מסקנתך? ב .על מנת לקבוע תקינו ת מכונות התפירה ,סטיית התקן של אורך חוט בסליל אינו צריך לעלות על 10ס"מ בחברה ב'? בדוק תקינות המכונות ברמת מובהקות של .0.01 www.OpenBook.co.il | [email protected] 77 שאלה 2מבחינה! כדי לבדוק האם קיימת השפעה של המתרגל על הצלחת סטודנטים בבחינה במבוא לכלכלה ,חולקו סטודנטים הלומדים אצל מרצה מסוים לשתי קבוצות תרגול באופן מקרי .בטבלה שלהלן נרשמו תוצאותיהם בבחינת הגמר: שם המתרגל מר ידעני ד"ר חכמי ציוני בחינת הגמר 77 89 67 45 88 95 68 72 601 83 72 95 35 50 76 74 92 88 65 730 8 x i 46941 i 1 x i i 1 10 10 i 2 8 y yi 2 56508 i 1 i 1 האם יש הבדל בממוצע הציונים אצל שני המתרגלים ,בהנחה שהציונים מתפלגים נורמלית? נסח את ההשערות ,נמק והסבר מהו המבחן הסטטיסטי המתאים ובדוק ברמת מובהקות .0.05 נחשב ממוצע וסטיית תקן מדגם של כל מתרגל: 2 46941 8 75.125 2 601 255.84 , x1 75.125 8 8 1 56508 10 73 2 730 357.56 , y1 73 10 10 1 2 ny nx x 2 1 n 1 y 2 1 n 1 2 2 1 s s2 נחשב שונות משותפת: n1 1 S n2 1 S2 7 255.84 9 357.56 313.06 n1 n2 2 16 2 1 2 2 S הנחות .1 :מדגמים ב"ת .2שונויות לא ידועות אך שוות .3נניח התפלגות נורמלית באוכלוסייה מבחן tלהפרש תוחלות במדגמים ב"ת השערות: H 0 : 1 2 0 H1 : 1 2 0 כלל ההכרעה :אם Tx x 2.12 Or Tx x 2.12נדחה H 0 1 חישוב סטטיסטי 0.25 : ולכן נקבל את H0 1 1 75.125 73 1 1 313.06 8 10 1 ,אחרת נקבל. x1 x2 0 1 1 313.06 8 10 H0 X1 , X 2 id 1 2 Tx x 2 1 ומכאן ,אין הבדל בין קבוצות התרגול. www.OpenBook.co.il | [email protected] 78 שאלה 3 חוקר טוען כי שונות הציונים בקורס סטטיסטיקה א' גדולה משונות הציונים בקורס סטטיסטיקה ב'. נבדקו הציונים במדגם מיקרי של 20סטודנטים הלומדים סטטיסטיקה ב' ובמדגם מיקרי של 25 סטודנטים הלומדים סטטיסטיקה א' והתקבלו התוצאות הבאות: y=1600 -Yסטטיסטיקה ב': y²=128285 ; -Xסטטיסטיקה א': x²=123460 ; x=1750 א. נסח השערות ,רשום את ההנחות הדרושות ובדוק בר"מ של ?0.05 ב. על סמך הנתונים ,בדוק את ההשערה שיש הבדל בין השוניות בר"מ ?0.1נמק ללא חישוב. www.OpenBook.co.il | [email protected] 79 80 [email protected] | www.OpenBook.co.il שאלה 4 בנק בודק אפשרות של פתיחת סניף חדש באחד משני מקומות. נבחר מדגם מקרי מכל אחד משני המקומות והתקבלו התוצאות הבאות לגבי ההכנסה של התושבים. x1 6500ש"ח מקום n1 10 - 1 מקום n2 8 - 2 x2 6000ש"ח ₪ s1 400 s2 300ש"ח בהנחה שהתפלגות ההכנסות היא נורמלית : א .האם ניתן לומר שקיים הבדל בין שני המקומות מבחינת שונות ההכנסה בר"מ ? 0.1נמק. ב .בדוק את ההשערה שבמקום 1שונות ההכנסות גבוהה יותר מהשונות במקום 2בר"מ .0.01 פתרון שאלה א .מבחן Fלהשוואת שתי שונויות :נסמן – X1 :הכנסת תושבים במקום .1 במקום .2 12 12 1 , H : .1השערות 1 : 1 22 22 - X2הכנסת תושבים . H0 : .2הנחות והתפלגות הדגימה: ) X 2 ~ N ( 2 , 22 ) , X1 ~ N (1 , 12 X1ו X 2 -בלתי תלויים Sˆ12 בהנחה ש H 0 -נכונה~ F (9,7) : Sˆ 2 2 .3רמת המובהקות ואזורי דחייה וקבלה. 0.1 : 1 1 0.304 F0.05 (7,9) 3.29 F / 2 F0.05 3.68, F1 / 2 קבל אם . 0.304 F 3.68דחה אם F 3.68או . F 0.304 .4חישוב הסטטיסטי וההכרעה: 10 8 Sˆ12 400 2 177 ,777 .7778 , Sˆ 22 300 2 102 ,857 .1429 9 7 2 ˆS 177 ,777 .7778 . F 12 1.728 3.68 ˆ S 2 102 ,857 .1429 לכן נקבל את , H 0כלומר ניתן לומר ברמת מובהקות 0.1שאין הבדל בין שונויות ההכנסות. 12 12 1 , H : ב .1 .השערות 1 : 1 22 22 www.OpenBook.co.il H0 : | [email protected] 81 .3רמת המובהקות ואזורי דחייה וקבלה 0.01 : קבל אם . F 6.72דחה אם . F 6.72 .4חישוב הסטטיסטי וההכרעה. F 1.728 6.72 : לכן נקבל את , H 0כלומר לא ניתן לומר ברמת מובהקות 0.01ששונות ההכנסות במקום 1גבוהה מהשונות במקום .2 (אפשר היה להסיק כבר מסעיף א' שנקבל את ההשערה החד צדדית בר"מ 0.05ואז ודאי שנקבלה בר"מ 0.01 www.OpenBook.co.il | [email protected] 82 83 [email protected] | www.OpenBook.co.il