סטטיסטיקה ב - הסקה סטטיסטית - ד"ר אופיר ברנע

Transcription

‫שיטות סטטיסטיות‬
‫הסקה סטטיסטית‬
‫ד"ר אופיר ברנע‬
‫‪Statistical Methods‬‬
‫‪Statistical Inference‬‬
‫‪Dr. Ophir Barnea‬‬
‫הפצה ישירה‬
‫‪www.ophirbarnea.co.il‬‬
‫©‬
‫כל הזכויות שמורות למחבר‬
‫אין לשכפל‪ ,‬להעתיק‪ ,‬לצלם‪ ,‬להקליט‪ ,‬לתרגם‪,‬‬
‫לאחסן במאגרי מידע‪ ,‬לשדר או להקליט‬
‫בכל דרך או בכל אמצעי אלקטרוני‪ ,‬אופטי‪ ,‬מכני‬
‫או אחר כל חלק שהוא מהחומר שבספר זה‪.‬‬
‫שימוש מסחרי מכל סוג שהוא בחומר הכלול בספר זה‬
‫אסור בהחלט אלא ברשות מפורשת בכתב מהמחבר‪.‬‬
‫מהדורה רביעית תשע"ה‬
‫הודפס בישראל‬
‫‪Fourth Edition 2015‬‬
‫‪Third Edition 2014‬‬
‫‪Second Edition 2013‬‬
‫‪First Edition 2011‬‬
‫‪Copyright © 2010 by Dr. Ophir Barnea‬‬
‫‪All rights reserved‬‬
‫‪No parts of this book may be reproduced in any form or by any means‬‬
‫‪Without permission in writing from the author‬‬
‫© כל הזכויות שמורות למחבר – ד"ר אופיר ברנע‬
‫‪2‬‬
‫פתח דבר‬
‫ספר זה נכתב ומיועד לסטודנטים הלומדים בקורס "הסקה סטטיסטית" (סטטיסטיקה ב) ולמרצים בתחום‪.‬‬
‫מטרתו של הספר לשמש כספר מנחה (‪ , )Text book‬לכל המקורב להליך המחקרי ולתהליכי קבלת החלטות‬
‫המושתתים ונבחנים בכלים סטטיסטיים‪.‬‬
‫הספר כולל את כל החומר הנלמד בקורס זה באוניברסיטאות ובמכללות בארץ ובעולם ‪ ,‬כתיבתו הדידקטית –‬
‫"הידידותית למשתמש" מאפשרת למידה עצמית של החומר‪.‬‬
‫הספר נכתב לאור ניסיון רב בהוראת התחום ‪ ,‬תוך כדי שיתוף פעולה והקשבה לבעיות ולקשיים בתחום העולים‬
‫מהסטודנטים הלומדים תחום זה‪.‬‬
‫בכתיבת הספר ניסיתי לחסוך מהסטודנט את הבסיס המתמטי של הסטטיסטיקה ואת פירוט הטכניקות המתמטיות‬
‫השונות "המעייפות" מיגעות ו"מלחיצות" באופן מיותר את הסטודנט שאינו מתחום המדעים המדויקים‬
‫ולהתמקד במימד היישומי שימושי ‪.‬‬
‫כל הבעיות המועלות בספר ‪ ,‬הן במהלך ההסברים והן בעיות לתרגול אותן תמצאו בסוף כל פרק ‪ ,‬פתורות באופן‬
‫מלא ומקיף‪ ,‬ובשלוש דרכים שונות ‪ -‬הדרכים הנפוצות לפתרון בעיות בהסקה סטטיסטית ובכך עונה הספר על‬
‫שיטות ההוראה השונות‪.‬‬
‫בסוף הספר תמצאו מבחני סיכום (מבחני סמסטר) פתורים פתרון מלא‪.‬‬
‫בספר פרק המוקדש לשימוש בתוכנת ‪ Microsoft Excel‬לעיבודים סטטיסטיים ולהסקה סטטיסטית‪.‬‬
‫באתר האינטרנט שלי שכתובתו ‪ ,www.ophirbarnea.co.il -‬תוכלו למצוא פורומים לסטודנטים‪ ,‬דרכם ניתן‬
‫לפתח דיונים ולהעלות שאלות בתחומי דעת רבים‪.‬‬
‫אשמח לקבל הערות והארות בדואר אלקטרוני ‪[email protected]‬‬
‫שלמי תודה‬
‫להורי היקרים‪ ,‬על שהשכילו לטעת בי את יצר הסקרנות‪ ,‬הרצון ללמוד‪ ,‬היכולת לשאול‪ ,‬ובראש ובראשונה את‬
‫הדרך להצבת מטרות והשגתן‪.‬‬
‫לאבי היקר והאהוב רפי ברנע ז"ל‪.‬‬
‫ד"ר אופיר ברנע‬
‫‪3‬‬
‫תוכן עניינים‬
‫‪.1‬‬
‫מבוא להסקה סטטיסטית‪9 .............................................................................‬‬
‫מדגם ‪ ,‬טעויות דגימה ‪ ,‬שיטות דגימה – מקרי ‪ ,‬שכבות ‪ ,‬אשכולות ‪ ,‬שיטתי ‪9-11 .............‬‬
‫‪.2‬‬
‫הסקה סטטיסטית ‪12 ......................................................................................‬‬
‫סטטיסטי ‪ ,‬פרמטר ‪ ,‬אמידה ‪ ,‬בדיקת השערות ‪12 ................................................ ,‬‬
‫התפלגות הדגימה של הממוצע ‪13 .......................................................................‬‬
‫משפט הגבול המרכזי ‪14-17 ..................................................................................‬‬
‫תרגילים ‪18 ..................................................................................................‬‬
‫פתרונות מלאים לתרגילים ‪19-22 ..........................................................................‬‬
‫‪.3‬‬
‫אמידה ‪23 ....................................................................................................‬‬
‫אומד נקודתי ‪ ,‬אומד חסר הטיה ‪ ,‬יעילות ‪23 ..........................................................‬‬
‫עקביות ‪ ,‬אמינות ‪ ,‬אומד ע"י תחום ‪24 ................................................................‬‬
‫רווח בר סמך ‪ ,‬רמת ביטחון ‪ ,‬רמת מובהקות ‪25 .....................................................‬‬
‫חישוב גודל מדגם ‪26 ......................................................................................‬‬
‫תרגילים ‪27 ..................................................................................................‬‬
‫‪.4‬‬
‫בדיקת השערות ‪ ,‬הסקה על תוחלת – שונות באכלוסיה ידועה ‪30 ...........................‬‬
‫המבחן הסטטיסטי ‪ ,‬השערה חד כיוונית ‪ ,‬השערה דו כיוונית ‪ ,‬השערת האפס ‪31 ..........‬‬
‫השערה אלטרנטיבית ‪ ,‬רמת מובהקות ‪33 .............................................................‬‬
‫מבחן חד כיווני ‪ ,‬תחומי קבלה ודחייה להשערת האפס ‪ ,‬שיטת הגבול הקריטי ‪33 ...........‬‬
‫מבחן המובהקות (הסתברויות) ‪34 ......................................................................‬‬
‫השוואת ערכי ‪ , Z‬החלטת החוקר ‪35 ..................................................................‬‬
‫טעויות אפשריות ‪ ,‬טעות מסוג ראשון ‪ ,‬טעות מסוג שני ‪ ,‬הסבר גרפי ‪37 ......................‬‬
‫חישוב טעות מסוג ראשון ‪37 .............................................................................‬‬
‫חישוב טעות מסוג שני ‪38 .................................................................................‬‬
‫התאמת גודל המדגם לטעויות רצויות ‪39 ..............................................................‬‬
‫מבחן דו כיווני ‪39 ...........................................................................................‬‬
‫גבולות קריטיים – דו כיווני ‪40 ..........................................................................‬‬
‫רמות מובהקות – דו כיווני ‪ ,‬ערכי ‪ – Z‬דו כיווני ‪41 ................................................‬‬
‫טעויות אפשריות – דו כיווני ‪42 .........................................................................‬‬
‫תרגילים ‪43 ..................................................................................................‬‬
‫‪4‬‬
‫‪.5‬‬
‫הסקה סטטיסטית – שונות באוכלוסיה אינה ידועה ‪50 ..........................................‬‬
‫‪‬‬
‫אמידת השונות באוכלוסיה ‪50 ....................................................................... S‬‬
‫התפלגות סטודנט ‪51-52 ..................................................................................... t‬‬
‫רווח בר סמך – שונות באוכלוסיה לא ידועה ‪53 .....................................................‬‬
‫בדיקת השערות – שונות לא ידועה ‪54-57 .................................................................‬‬
‫תרגילים ‪57 ..................................................................................................‬‬
‫‪.6‬‬
‫הסקה על הפרש תוחלות – שני מדגמים ‪ ,‬שתי אוכלוסיות בלתי תלויות ‪69 ..............‬‬
‫קבוצות טיפול וקבוצות ביקורת ‪ ,‬מדגמים בלתי תלויים ‪ ,‬מדגמים מזווגים ‪69 .................‬‬
‫השוואת ממוצעים – שני מדגמים בלתי תלויים ‪70 ...................................................‬‬
‫רווח בר סמך להפרש ממוצעים ‪73 ......................................................................‬‬
‫בדיקת השערות – סטיות תקן ידועות (שונות באוכלוסיה ידועה) ‪73 ............................‬‬
‫המבחן הסטטיסטי ‪73 ........................................................................................‬‬
‫תרגילים ‪74-75 ...................................................................................................‬‬
‫פתרונות מלאים לתרגילים ‪73-87 ...........................................................................‬‬
‫‪.7‬‬
‫הפרש תוחלות – סטיות תקן באוכלוסיה לא ידועות ‪88 ..........................................‬‬
‫סטיות תקן לא ידועות אך שוות ‪ ,‬משפט הגבול המרכזי ‪88 .......................................‬‬
‫השונות המשוקללת‪89 ......................................................................................‬‬
‫רווח בר סמך ‪90 .............................................................................................‬‬
‫בדיקת השערות ‪91-92 ..........................................................................................‬‬
‫תרגילים ‪93-94 ...................................................................................................‬‬
‫‪.8‬‬
‫מדגמים מזווגים ‪107 .........................................................................................‬‬
‫רווח בר סמך ‪ ,‬בדיקת השערות ‪107-110 ......................................................................‬‬
‫תרגילים ‪111-112 ...................................................................................................‬‬
‫‪.9‬‬
‫הסקה סטטיסטית על פרופורציה באוכלוסיה ‪128 ...................................................‬‬
‫סטיית תקן לפרופורציה ‪129 ................................................................................‬‬
‫משפט הגבול המרכזי לפרופורציה ‪130-132 ...................................................................‬‬
‫בדיקת השערות ‪133-134...........................................................................................‬‬
‫תרגילים ‪135 ...................................................................................................‬‬
‫שני מדגמים בלתי תלויים – השוואת פרופורציות ‪146 ...............................................‬‬
‫טעות תקן משוקללת להפרש פרופורציות ‪ ,‬רווח בר סמך להפרש פרופורציות ‪146-147 ...........‬‬
‫‪5‬‬
‫בדיקת השערות על הפרש פרופורציות ‪148-150 ...............................................................‬‬
‫תרגילים ‪151 .....................................................................................................‬‬
‫פתרונות מלאים לתרגילים ‪152-161 .............................................................................‬‬
‫הקירוב הנורמאלי לבינום ‪162-164 ................................................................................‬‬
‫תרגילים ‪165 ......................................................................................................‬‬
‫פתרונות מלאים לתרגילים ‪166-168 ..............................................................................‬‬
‫‪ .10‬הסקה סטטיסטית על שונות באוכלוסיה ‪169 ............................................................‬‬
‫התפלגות‬
‫‪2‬‬
‫‪ , ‬הסטטיסטי ‪169 ..............................................................................‬‬
‫רווח בר סמך לשונות ‪170 .....................................................................................‬‬
‫בדיקת השערות לשונות ‪171-172 .................................................................................‬‬
‫תרגילים ‪173 .....................................................................................................‬‬
‫פתרונות מלאים לתרגילים ‪174-183 .............................................................................‬‬
‫ניתוח שונות – ‪184 ................................................................................. ANOVA‬‬
‫שונות בתוך קבוצה‪ , ,‬שונות מוסברת‪ ,‬שונות בין קבוצות ‪184-185 .......................................‬‬
‫התפלגות ‪F‬‬
‫‪186 ........................................................................... SSW , SSB‬‬
‫טבלת ניתוח שונות ‪187 ........................................................................................‬‬
‫כלל החלטה ‪188-190 .................................................................................................‬‬
‫תרגילים ‪191-192 ......................................................................................................‬‬
‫פתרונות מלאים לתרגילים ‪192-197 ............................................................................‬‬
‫‪.11‬קשר סטטיסטי בין שני משתנים ‪198 .....................................................................‬‬
‫קשר ליניארי בין שני משתנים ‪199 .........................................................................‬‬
‫מקדם המתאם בין שני משתנים ‪200-201 .......................................................................‬‬
‫שונות משותפת ‪ , Covariance -‬חישוב מקדם המתאם ‪201 .......................................‬‬
‫רגרסיה ליניארית ‪202 ........................................................................................‬‬
‫שיטת הריבועים הפחותים ‪ ,‬קו הרגרסיה ‪203 ......................................................... ,‬‬
‫בניית קו החיזוי ‪203 ..........................................................................................‬‬
‫שונות מוסברת ‪203............................................................................................‬‬
‫תרגילים ‪204-205 ...................................................................................................‬‬
‫‪ .12‬מבחן‬
‫‪2‬‬
‫‪‬‬
‫לאי תלות ‪210-211 ................................................................................‬‬
‫המבחן הסטטיסטי ‪212 ........................................................................................‬‬
‫תרגילים ‪213 ...................................................................................................‬‬
‫‪6‬‬
‫‪ .13‬שימוש בתוכנת אקסל להסקה סטטיסטית ‪222 .......................................................‬‬
‫התקנה ותחילת עבודה באקסל ‪222 ........................................................................‬‬
‫שני מדגמים בלתי תלויים ‪223-226 .............................................................................‬‬
‫שני מדגמים מזווגים – (תלויים) ‪227-230 .....................................................................‬‬
‫מבחן‬
‫‪2‬‬
‫‪‬‬
‫לאי תלות ‪231-233 .................................................................................‬‬
‫רגרסיה ליניארית ‪237-237 ........................................................................................‬‬
‫‪ .14‬מבחנים לדוגמא ‪237 .........................................................................................‬‬
‫מבחן מס' ‪237 ............................................................................................... 1‬‬
‫מבחן מס' ‪242 ............................................................................................... 2‬‬
‫מבחן מס' ‪248 ............................................................................................... 3‬‬
‫מבחן מס' ‪252 ............................................................................................... 4‬‬
‫מבחן מס' ‪256 ............................................................................................... 5‬‬
‫מבחן מס' ‪260 ............................................................................................... 6‬‬
‫מבחן מס' ‪264 ............................................................................................... 7‬‬
‫מבחן מס' ‪268 ............................................................................................... 8‬‬
‫מבחן מס' ‪272 ............................................................................................... 9‬‬
‫מבחן מס' ‪276 ............................................................................................. 10‬‬
‫מבחן מס' ‪281 ............................................................................................. 11‬‬
‫פתרון מבחן ‪275 ............................................................................................ 1‬‬
‫פתרון מבחן ‪283 ............................................................................................ 2‬‬
‫פתרון מבחן ‪291 ............................................................................................ 3‬‬
‫פתרון מבחן ‪296 ............................................................................................ 4‬‬
‫פתרון מבחן ‪305 ............................................................................................ 5‬‬
‫פתרון מבחן ‪312 ............................................................................................ 6‬‬
‫פתרון מבחן ‪329 ............................................................................................ 7‬‬
‫פתרון מבחן ‪336 ............................................................................................ 8‬‬
‫פתרון מבחן ‪343 ............................................................................................ 9‬‬
‫‪ .15‬נספחים ‪..... ....................................................................................................‬‬
‫שימוש במחשבון ‪ Casio‬לחישובים סטטיסטיים‪351 ..................................................‬‬
‫לוח התפלגות נורמאלית ‪353 ................................................................................‬‬
‫לוח התפלגות ‪354 ........................................................................................... t‬‬
‫לוח‬
‫‪2‬‬
‫‪‬‬
‫‪355 ..................................................................................................‬‬
‫לוח ‪356 ....................................................................................................... F‬‬
‫‪7‬‬
‫מבוא להסקה סטטיסטית‬
‫‪Introduction to Statistical Inference‬‬
‫מהי הסקה סטטיסטית?‬
‫תחום ההסקה הסטטיסטית עוסק בשיטות הסקה על פרמטרים שונים של תכונה נבדקת‬
‫(ממוצע ‪ ,‬פיזור ‪ ,‬שונות ‪ ,‬פרופורציה וכו' ) באוכלוסייה שלמה מתוך בדיקת התכונה על מדגם מייצג‪.‬‬
‫מחקרים סטטיסטיים מבוססים בד"כ על מדגם מתוך אוכלוסיה ולא על האוכלוסייה כולה ‪ ,‬במטרה ליצור הכללה‬
‫נכונה ומדויקת מתוך תוצאות המדגם על האוכלוסייה כולה‪.‬‬
‫אוכלוסייה – אוכלוסיה היא אוסף כל הפרטים ‪ ,‬אובייקטים ‪ ,‬תצפיות העונים על קטגוריה מסוימת‪:‬‬
‫אוכלוסיית המועסקים במדינה – אוסף כל הפרטים המועסקים במדינה – ניתן להוציא רשימה שמית מוגדרת של כל‬
‫הפרטים‪ .‬אוכלוסיית תלמידי בית ספר – אוסף כל הפרטים הלומדים בבית ספר מסוים‪.‬‬
‫מדגם ‪ -‬קבוצה קטנה של פרטים ‪ ,‬אובייקטים ‪ ,‬תצפיות ‪ ,‬העונים על קטגוריה מסוימת הלקוחה מתוך אוכלוסיה‬
‫נתונה‪( .‬מדגם של ‪ 24‬איש מתוך אוכלוסיית המועסקים במדינה)‪.‬‬
‫מדוע נשתמש במדגם?‬
‫לשימוש במדגם מספר יתרונות ביחס לעבודה מול אוכלוסייה‪:‬‬
‫א‪.‬‬
‫עלות – עבודה מול קבוצה קטנה יותר ‪ ,‬צמצום ניכר בעלויות‪.‬‬
‫ב‪.‬‬
‫נח לניהול וניתוח – פחות נתונים ‪ ,‬פחות פרטים‪.‬‬
‫ג‪.‬‬
‫חסכון בזמן‪.‬‬
‫ד‪.‬‬
‫מאפשר ניתוח גם במצבים שהאוכלוסייה אינה נגישה ‪ /‬זמינה או ידועה‪.‬‬
‫ההסקה הסטטיסטית היא הסקה אינדוקטיבית – הסקה מהפרט אל הכלל – (ממדגם לאוכלוסיה)‪.‬‬
‫על מנת שהכללה – ההסקה ממדגם על התכונה הנבדקת באוכלוסיה תהיה מדויקת ככל הניתן ותשקף נכון יותר ‪ ,‬את‬
‫האוכלוסייה הנבדקת ‪ ,‬במטרה שהמסקנות המתקבלות מתוך המדגם אכן ייצגו את האוכלוסייה יש לבחור מדגם מייצג‪.‬‬
‫מדגם מייצג ‪ -‬מדגם המייצג את האוכלוסייה ממנה נדגם ‪ ,‬מהווה למעשה דגם מוקטן של האוכלוסייה על מרכיביה‬
‫השונים והתפלגותם ‪.‬‬
‫טעויות דגימה‬
‫א‪.‬‬
‫טעויות אקראיות – ‪ – Random Errors‬טעויות הנובעות מהעיסוק במדגם בהבדל מהעיסוק‬
‫באוכלוסיה כולה ‪ ,‬טעויות הנובעות מהסיכוי האקראי לקבלת מדגם מסוים ‪ ,‬טעות מסוג זה ניתן להפחית ע"י הגדלת‬
‫גודל המדגם ‪ ,‬הסיכוי לטעות זו ישאף לאפס ככל שגודל המדגם יגדל ויהיה אפס כאשר נעבוד עם אוכלוסייה‪.‬‬
‫ב‪.‬‬
‫טעויות שיטתיות – ‪ – Systematic Errors‬טעויות הנובעות מתהליכי המדידה עצמם ‪ ,‬טעויות מדידה ‪,‬‬
‫טעיות בשיטה‪/‬טכניקת המדידה ‪ ,‬טעויות מחשב ‪ ,‬טעויות מסוג זה אינן בגדר טעויות דגימה ‪ -‬אינן מושפעות מגודל‬
‫מדגם ואינן שייכות למדגמים בלבד – באותה מידה יכולים להתרחש בעבודה מול אוכלוסיה‪.‬‬
‫‪8‬‬
‫במטרה לדגום מדגם המייצג את האוכלוסייה ‪ ,‬יש לבחור מדגם ‪:‬‬
‫א‪ .‬בגודל מתאים‬
‫ב‪ .‬בשיטות הסתברותיות המאפשרות לכל פרט באוכלוסייה להיות מיוצג במדגם‬
‫את המדגם נדגום בשיטה מתאימה אשר תהפוך את המדגם למדגם מייצג ‪ ,‬משמע לא מספיק שאני דוגם אוכלוסייה‬
‫לשיטת המדגם יש משמעות גדולה בהנחה שרוצים שהפרטים באוכלוסייה יהיו מיוצגים במדגם ‪ ,‬במילים אחרות‬
‫השאיפה היא שהרכב קבוצת המדגם יהיה דומה ככל שניתן להרכב האוכלוסייה‪.‬‬
‫גודל המדגם – לגודל המדגם תפקיד משמעותי והוא מהווה פקטור משמעותי ביכולתו של המדגם להיות מייצג‪.‬‬
‫קיימות מספר שיטות דגימה החשובות שבהן ‪:‬‬
‫א‪ .‬מדגם מקרי פשוט‪.‬‬
‫ב‪ .‬מדגם שכבות‪.‬‬
‫ג‪ .‬מדגם אשכולות‪.‬‬
‫ד‪ .‬מדגם שיטתי‪.‬‬
‫מדגם מקרי פשוט‬
‫הרציונאל בבניית מדגם מקרי פשוט ‪ -‬לכל פרט באוכלוסייה יש אותה הסתברות להיכלל במדגם ‪ ,‬לכל מדגם יש‬
‫אותה הסתברות להיבחר וקיימת אי תלות בין תצפיות המדגם‪.‬‬
‫הדימוי הקרוב ביותר לבחירת מדגם זה הוא הגרלה ‪ ,‬נניח שכל פרט באוכלוסייה היה מקבל פתק עם מספר –‬
‫ההסתברות לבחור כל ‪ n‬פרטים שווה‪ .‬ההסתברות לכל פתק ‪ -‬כל פרט להיבחר שווה‪.‬‬
‫חסרונות ‪ -‬השיטה מחייבת מסגרת מוגדרת וממוספרת של כל האוכלוסייה ‪ ,‬החוקר חייב שתהיה בידו את רשימת כל‬
‫אוכלוסיית המחקר ממנה הוא דוגם ‪ ,‬אחרת אנו סותרים את התנאי הבסיסי של השיטה – לכל פרט הסתברות שווה‬
‫להיבחר‪ .‬נבהיר שוב נקודה זו ‪ ,‬אם חוקר מעוניין לבדוק את לחץ הדם אצל אנשים שמשקלם מעל ‪ 100‬ק"ג והוא‬
‫מעוניין במדגם של ‪ 40‬איש מאוכלוסייה זו ‪ ,‬עליו לדעת מיהי אוכלוסיית האנשים שמשקלם מעל ‪ 100‬ק"ג – רשימה‬
‫שמית ממנה הוא ידגום (בהנחת דגימה של מדגם מקרי פשוט) ‪ ,‬והיה ורשימת כזו לא נמצאת כלומר אין לנו פירוט‬
‫של האוכלוסייה הנדגמת ‪ ,‬עלינו להתאים שיטת דגימה אחרת‪.‬‬
‫‪‬‬
‫בדגימה מקרית נקבל בד"כ פיזור גיאוגרפי רחב של המדגם וזו יכולה להיות בעיה טכנית ‪,‬‬
‫לוגיסטית ותקציבית‪ .‬כאשר דוגמים מכלל האוכלוסייה (נניח מכלל האנשים שמשקלם מעל ‪ 100‬ק"ג) האוכלוסייה‬
‫מפוזרת גיאוגרפית ולכן יכול להיווצר מצב של פיזור רחב אשר יקשה בביצוע המחקר‪.‬‬
‫‪9‬‬
‫מדגם שכבות‬
‫כאשר ידועה החלוקה באוכלוסייה לשכבות‪/‬קבוצות הקשורות עם התכונה הנבדקת ‪ ,‬ניתן לשפר את הדגימה המקרית‬
‫ע"י דגימה בשכבות‪.‬‬
‫הרעיון הוא חלוקת האוכלוסייה לשכבות ומכל שכבה לדגום מדגם מקרי פשוט‪ ,‬בגודל הפרופורציוני לגודל השכבה‪.‬‬
‫שכבות – קיבוץ ‪ ,‬כפר ‪ ,‬עיר ‪ ,‬דתיים ‪ ,‬חילוניים וכו'‪ .‬נחלק את האוכלוסייה לשכבות כנ"ל ‪ ,‬אם נמצא כי בני‬
‫הקיבוצים מהווים ‪ 5%‬מהאוכלוסייה ‪ ,‬המשמעות היא שבני הקיבוצים יהוו ‪ 5%‬מהמדגם‪.‬‬
‫יתרונות – למדגם שכבות יש יתרון כאשר קיימת הומוגניות בתוך השכבה והטרוגניות בין השכבות‪.‬‬
‫אם נרצה לבנות מדגם לצורך חיזוי תוצאות בחירות ‪ ,‬ניקח לדוגמא שתי שכבות – מתנחלים ובני קיבוצים ‪ ,‬מצב‬
‫ברור הוא כי כל שכבה היא הומוגנית ובין השכבות יש הטרוגניות זהו מצב בו יש יתרון לחלוקה לשכבות‪.‬‬
‫מאחר והדגימה בפועל היא דגימה מקרית פשוטה אזי מגבלות שיטת המדגם המקרי הפשוט חלות גם בחלוקה לשכבות‪.‬‬
‫מדגם אשכולות‬
‫במדגם אשכולות ‪ ,‬יחידת הדגימה היא אשכול של פרטים ולא פרט בודד – כיתה ‪ ,‬מחלקה בגדוד ‪ ,‬רחוב ‪ ,‬שכונה וכו'‪.‬‬
‫רוצים לדגום ‪ 100‬חיילים ואין רשימה מוגדרת של החיילים (העונים על הפרמטר הנבדק) ניתן לדגום מדגם מקרי‬
‫פשוט של גדודים ומתוך כל גדוד לדגום מחלקה ‪ ,‬המחלקה תהווה אשכול ‪ ,‬בשיטה זו מקבל החוקר‪/‬המראיין רשימה‬
‫של מחלקות לחקור – בתוך כל מחלקה הוא מראיין פרטים‪.‬‬
‫יתרונות‪-‬‬
‫‪‬‬
‫טכני – ריכוז גיאוגרפי נח‪.‬‬
‫‪‬‬
‫אין צורך ברשימה מוגדרת של אוכלוסיית המחקר‪.‬‬
‫חסרונות‪-‬‬
‫‪‬‬
‫מדגם גדול ביחס לדגימה מקרית פשוטה – במטרה להגיע לאותן תוצאות‪.‬‬
‫‪‬‬
‫בד"כ יש הומוגניות בין הפרטים באשכול כך שלמעשה חוקרים פרטים דומים ובכך פוגעים בנושא החשוב‬
‫של שונות בין הפרטים‪.‬‬
‫מדגם שיטתי‬
‫במדגם שיטתי דוגמים באופן שיטתי (צעד קבוע) מתוך רשימה של אוכלוסייה – לדוגמא ספר טלפונים‪.‬‬
‫נדגום מתוך ספר הטלפונים כל שם עשירי ‪ ,‬כל בית חמישי ברחוב וכו'‪.‬‬
‫בצורה זו דוגמים אחוז ידוע מהאוכלוסייה שהוא גודל המדגם‪.‬‬
‫בדגימה מסוג זה יש לבדוק כי אין חוקיות נסתרת ברשימה ממנה דוגמים ‪ ,‬חוקיות העלולה לעוות את הדגימה וכמובן‬
‫את תוצאות המחקר‪.‬‬
‫ניתן לערוך שילוב של מספר שיטות דגימה ‪ ,‬בשטח (במציאות) בנית מדגם בד"כ משלבת יותר משיטה אחת‪.‬‬
‫‪10‬‬
‫הסקה סטטיסטית‬
‫‪Statistical Inference‬‬
‫נכיר מספר משתנים‬
‫פרמטר – ערך המשתנה הנחקר המתאר את כל האוכלוסייה (ממוצע האוכלוסייה ‪ -‬תוחלת המשתנה הנחקר)‪.‬‬
‫‪ - ‬תוחלת האוכלוסייה (הפרמטר) ‪ -  ,‬סטית התקן באוכלוסייה ‪ 2 ,‬‬
‫‪ -‬שונות האוכלוסייה‬
‫סטטיסטי – ערך המשתנה הנחקר המתאר את המדגם (ממוצע המדגם של המשתנה הנחקר)‪.‬‬
‫‪ - X‬ממוצע המדגם (הסטטיסטי) ‪ – S ,‬סטית התקן במדגם ‪ – S2 ,‬שונות המדגם‪.‬‬
‫הסקה סטטיסטית ‪ -‬הסקה מסטטיסטי לפרמטר מ‪ X -‬נסיק לגבי ‪. ‬‬
‫מנתוני המדגם אנו מעוניינים להסיק על האוכלוסייה כולה ‪ ,‬לכן ככל שהמדגם יהיה מדגם מייצג יותר –‬
‫ישקף וייצג נכון יותר את האוכלוסייה ההכללה תהיה מדויקת יותר‪.‬‬
‫הסקה ממדגם מייצג לאוכלוסייה איננה וודאית או מוחלטת אלא הסקה הסתברותית ‪ ,‬ניתן להסיק ממדגם בהסתברות‬
‫גבוהה לגבי האוכלוסייה אך תמיד קיים סיכוי לטעות ‪ ,‬לכן תמיד נציין בנוסף למסקנה המחקרית את ההסתברות‬
‫לטעות אפשרית במסקנה‪.‬‬
‫תהליך ההסקה הסטטיסטית מטרתו ‪ -‬הסקה על ממוצע האוכלוסייה ‪‬‬
‫ע"פ תוצאות מדגם מקרי בגודל ‪. n‬‬
‫הסקה סטטיסטית – הסקה מסטטיסטי לפרמטר מתמקדת בשני תחומים עיקריים‪:‬‬
‫א‪.‬‬
‫אמידה – אמידת פרמטר לא ידוע ‪ ,‬ביצוע הערכה‪/‬אומדן של פרמטר באוכלוסייה מתוך נתוני המדגם‪.‬‬
‫בנינו מדגם ‪ ,‬ערכנו מחקר וקיבלנו נתונים ‪ ,‬נשאלת השאלה איך מתוך ממוצע המדגם ניתן לאמוד את ממוצע‬
‫האוכלוסייה ‪ ,‬מאחר ומדובר באומדן ‪ /‬הערכה ‪ ,‬הרי שממוצע האוכלוסייה – הפרמטר יוערך בטווח מסוים ולא יהיה‬
‫מספר מדויק‪.‬‬
‫ב‪.‬‬
‫בדיקת השערות – בדיקת השערות סטטיסטיות על פרמטר לא ידוע‪.‬‬
‫כיצד על סמך תוצאות מדגם נוכל לאשש או להפריך השערות שיש לנו לגבי האוכלוסייה‪.‬‬
‫כיצד נוכל להעריך פרופורציה של תכונה מסוימת באוכלוסייה מתוך הפרופורציה של אותה תכונה במדגם‪.‬‬
‫‪11‬‬
‫התפלגות הדגימה של הממוצע‬
‫‪Sampling distribution of the sample mean‬‬
‫התפלגות הדגימה של הממוצע היא התפלגות ממוצעי כל המדגמים האפשריים בגודל ‪ n‬מסוים מתוך האוכלוסייה‪.‬‬
‫דוגמא‪ :‬נתונה אוכלוסיית מחקר בת ‪ , n=5‬להלן משקלי האוכלוסייה‪.‬‬
‫משקל‬
‫‪73‬‬
‫‪75‬‬
‫‪78‬‬
‫‪83‬‬
‫‪86‬‬
‫מס' נחקר‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫נחשב את המשקל הממוצע באוכלוסיה זו (עיין בנספח – שימוש במחשבון לחישובים סטטיסטיים)‪.‬‬
‫ממוצע המשקל באוכלוסייה ‪ -‬תוחלת האוכלוסייה ‪   79‬וסטית התקן ‪  4.86‬‬
‫(שימו לב כי מדובר באוכלוסייה כולה המונה ‪ 5‬אנשים ולא במדגם)‪.‬‬
‫שאלה‪ :‬כמה מדגמים שונים בגודל ‪ n=3‬ניתן להוציא מאוכלוסייה זו ?‬
‫כדי לחשב את מספר המדגמים יש להשתמש בחישוב הבא ‪:‬‬
‫‪ - N‬גודל האוכלוסייה ממנה בוחרים מדגם‬
‫‪ – n‬גודל המדגם המבוקש‬
‫!‪N‬‬
‫‪N‬‬
‫‪ ‬‬
‫!)‪ n  n! ( N  n‬‬
‫!‪5‬‬
‫!‪5‬‬
‫‪5‬‬
‫‪‬‬
‫‪ 10‬‬
‫‪ ‬‬
‫!‪ 3  3!(5  3)! 2!3‬‬
‫ניתן להוציא מאוכלוסייה זו ‪ 10‬מדגמים שונים בני ‪ 3‬אנשים כל אחד‪.‬‬
‫נבנה את כל ‪ 10‬המדגמים הנ"ל‪:‬‬
‫ממוצע המדגם‬
‫משקלי כל פרט במדגם‬
‫מדגמים (ע"פ מספר הנחקר)‬
‫מס'‬
‫‪75.33‬‬
‫‪77‬‬
‫‪78‬‬
‫‪78‬‬
‫‪79‬‬
‫‪80.66‬‬
‫‪78.66‬‬
‫‪79.66‬‬
‫‪81.33‬‬
‫‪82.33‬‬
‫‪73,75,78‬‬
‫‪73,75,83‬‬
‫‪73,75,86‬‬
‫‪73,78,83‬‬
‫‪73,78,86‬‬
‫‪73,83,86‬‬
‫‪75,78,83‬‬
‫‪75,78,86‬‬
‫‪75,83,86‬‬
‫‪78,83,86‬‬
‫‪1, 2 ,3‬‬
‫‪1, 2 ,4‬‬
‫‪1, 2 ,5‬‬
‫‪1, 3 ,4‬‬
‫‪1, 3 ,5‬‬
‫‪1, 4 ,5‬‬
‫‪2, 3 ,4‬‬
‫‪2, 3 ,5‬‬
‫‪2, 4 ,5‬‬
‫‪3, 4 ,5‬‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫‪6‬‬
‫‪7‬‬
‫‪8‬‬
‫‪9‬‬
‫‪10‬‬
‫‪12‬‬
‫מתוך טבלת עשרת המדגמים האפשריים בגודל ‪ n=3‬ניתן לראות כי ההסתברות לבחירת מדגם מסוים היא ‪, 1/ 10‬‬
‫לכל מדגם הסתברות שווה להיבחר ‪ ,‬אולם רק למדגם אחד (מס ‪ ) 5‬יש ממוצע השווה לממוצע האוכלוסייה‪.‬‬
‫ניתן לראות כי קיימת תמונה ברורה של פיזור ממוצעי המדגמים סביב ‪  79‬‬
‫כמו כן ניתן לראות כי‬
‫התפלגות ממוצעי המדגמים היא התפלגות נורמאלית‪.‬‬
‫אם נחשב את ממוצע ממוצעי המדגמים נקבל ‪ - 79‬ממוצע ממוצעי המדגמים שווה לממוצע האוכלוסייה‪.‬‬
‫לעומת זאת סטית התקן של ממוצעי המדגמים קטנה מסטיית התקן באוכלוסייה ‪ -‬פיזור ממוצעי המדגמים קטן יותר‬
‫מפיזור הפרטים באוכלוסייה ‪ ,‬ניתן לומר כי הממוצע משקף נכון יותר את ממוצע המדגמים מאשר את הפרטים‬
‫הבודדים באוכלוסייה‪ .‬התופעה שאנחנו רואים משקפת חוקיות כללית תיאורטית הטוענת כי –‬
‫התפלגות ממוצעי כל המדגמים האפשריים בגודל ‪ n‬שואפת להתפלגות נורמאלית סביב הפרמטר ‪. ‬‬
‫חוקיות זו נקראת משפט הגבול המרכזי ‪The Central Limit Theorem‬‬
‫משפט הגבול המרכזי ‪ -‬אם מתוך אוכלוסייה בעלת ממוצע ‪ ‬וסטית תקן ‪‬‬
‫‪,‬‬
‫נוציא את כל המדגמים האפשריים בגודל ‪ , n‬סדרת ממוצעי כל המדגמים תתפלג נורמאלית ‪,‬‬
‫עם ממוצע ‪‬‬
‫וסטית תקן הנקראת טעות התקן ‪ Standard Error‬ושווה ל‪-‬‬
‫‪‬‬
‫‪. SE ‬‬
‫‪n‬‬
‫בניסוח סטטיסטי‬
‫‪‬‬
‫‪ 2 ‬‬
‫‪‬‬
‫‪x~N  ,‬‬
‫‪‬‬
‫‪n ‬‬
‫‪‬‬
‫נורמלית‬
‫שונות התקן‬
‫השווה לריבוע טעות התקן‬
‫ממוצע‬
‫ממוצעי‬
‫המדגמים‬
‫מתפלג‬
‫ממוצע השווה לממוצע‬
‫האוכלוסייה ‪‬‬
‫טעות התקן ‪ –Standard Error -‬סטית התקן של ממוצע ממוצעי המדגמים נקראת טעות התקן במטרה לציין‬
‫את הטעות האפשרית באמידת ‪ ‬ע"פ ‪. X‬‬
‫טעות התקן מתקבלת כאשר מחלקים את סטית התקן באוכלוסייה ב‪n -‬‬
‫( ‪ - n‬גודל המדגם) ‪ ,‬ניתן לראות ולהבין ברמה המתמטית את המובן ברמה הלוגית ‪ -‬ככל שהמדגם גדול יותר כך‬
‫טעות התקן קטנה יותר ‪ ,‬הטעות האפשרית באמידת ‪‬‬
‫קטנה‪.‬‬
‫‪13‬‬
‫שאלה‪:‬‬
‫ע"פ נתוני הלשכה המרכזית לסטטיסטיקה השכר הממוצע במדינת ישראל עומד על ‪  5250‬‬
‫עם סטית תקן ‪  600‬‬
‫‪ ,‬אם נוציא את כל המדגמים האפשריים בגודל ‪ , n=400‬התפלגות הממוצעים תשאף‬
‫‪600‬‬
‫להתפלגות נורמאלית‪ 30 .‬‬
‫‪400‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫= טעות התקן‬
‫ברישום סטטיסטי‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪x ~ N  5250 , 900 ‬‬
‫‪‬‬
‫‪‬‬
‫מהו התחום הסימטרי בו מרוכזים ‪ 95%‬ממוצעי כל המדגמים בגודל ‪? n=400‬‬
‫מאחר וממוצעי כל המדגמים מתפלגים נורמאלית ‪ ,‬נעזר בטבלת ההתפלגות הנורמאלית‪.‬‬
‫‪2.5%‬‬
‫הסתברות של‬
‫‪0.025‬‬
‫‪2.5%‬‬
‫‪0.025‬‬
‫התחום בו מרוכזים ‪95%‬‬
‫ממוצעי המדגמים‬
‫של ‪0.95‬‬
‫כלומר הסתברות‬
‫‪0.975‬‬
‫הגבול העליון ‪ -‬הערך אשר ההסתברות לקבל ערך נמוך ממנו היא ‪ , 0.975‬הגבול אשר עד אליו מרוכזים ‪97.5%‬‬
‫ממוצעי כל המדגמים‪.‬‬
‫כאשר השטח נתון ומחפשים את ‪( Z‬ציון התקן) ‪ ,‬מחפשים את הערך בתוך הטבלה כלומר את ‪ 0.975‬בתוך הטבלה‬
‫ומוצאים את ה‪ Z-‬המתאים‪.‬‬
‫‪Ф(1.96)=0.975 -- Z ( 0.975)  1.96‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪    Z ‬הגבול העליון‬
‫‪n‬‬
‫‪600‬‬
‫‪ 5308.8‬‬
‫‪400‬‬
‫‪  5250  1.96 ‬גבול עליון‬
‫‪600‬‬
‫‪ 5191.2‬‬
‫‪400‬‬
‫‪  5250  1.96 ‬גבול תחתון‬
‫‪    Z ‬הגבול התחתון‬
‫התחום הסימטרי בו מרוכזים ‪ 95%‬ממוצעי כל המדגמים הוא בין ‪ ₪ 5191.2‬לבין ‪.₪ 5308.8‬‬
‫ממוצעי כל המדגמים‬
‫בגודל ‪n=400‬‬
‫‪5308.8‬‬
‫‪5250‬‬
‫‪5191.2‬‬
‫‪14‬‬
‫מהו אחוז המדגמים בהם ממוצע המדגם גדול מ‪?5320 -‬‬
‫נעזר בתכונה של ממוצעי כל המדגמים – מתפלגים נורמאלית ‪ ,‬ובטבלת ההתפלגות הנורמאלית‪.‬‬
‫נמצא את ציון התקן – ‪ Z‬עבור ‪. ₪ 5320‬‬
‫התחום‬
‫המבוקש‬
‫‪5320‬‬
‫‪5250‬‬
‫‪Xi  X‬‬
‫‪X ‬‬
‫‪‬‬
‫‪ i‬‬
‫‪S‬‬
‫‪ ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪Z‬‬
‫‪ X  ‬מאחר וממוצע ממוצעי המדגמים שווה לממוצע האוכלוסייה‪.‬‬
‫‪  X i‬ערך נבדק ‪ = S ,‬סטית התקן של ממוצע ממוצעי המדגמים שהיא למעשה טעות התקן ולכן‬
‫‪‬‬
‫‪n‬‬
‫‪S‬‬
‫על פי נתוני השאלה‪:‬‬
‫‪600‬‬
‫‪ 30‬‬
‫‪400‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪  5250‬‬
‫‪X i  5320‬‬
‫‪5320  5250‬‬
‫‪ 2.33‬‬
‫‪30‬‬
‫‪Z 2.33  0.9901‬‬
‫‪Z‬‬
‫‪1  0.9901  0.0099 ‬‬
‫‪ 0.99%‬‬
‫מצאנו כי ערכו של ‪ Z‬הוא ‪ , 2.33‬בדיקה בטבלה הראתה כי השטח הנמצא משמאל לערך זה הוא ‪0.9901‬‬
‫(כל השטח מתחת לעקומת ההתפלגות הנורמאלית שווה ל‪ , )1-‬ערך זה הוא ההסתברות לקבל ערך נמוך מ‪.₪ 5320-‬‬
‫מאחר והשאלה הנשאלת היא איזה אחוז מהמדגמים נמצא מעל ‪ , ₪ 5320‬מעוניינים בשטח מימין לערך זה ולכן‬
‫נחסיר מ‪.1-‬‬
‫‪15‬‬
‫מהו אחוז המדגמים בהם הממוצע נמוך מ‪? ₪ 5200 -‬‬
‫התחום‬
‫המבוקש‬
‫‪5250‬‬
‫‪600‬‬
‫‪ 30‬‬
‫‪400‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪  5250‬‬
‫‪5200‬‬
‫‪X i  5200‬‬
‫‪5200  5250‬‬
‫‪ 1.66‬‬
‫‪30‬‬
‫‪Z 1.67  0.9525‬‬
‫‪Z‬‬
‫‪1  0.9525  0.0475 ‬‬
‫‪ 4.75%‬‬
‫בעבודה עם טבלה הכוללת ערכי ‪ Z‬שליליים (טבלה ע"מ ‪ , )262‬מקבלים ישירות את הערך ‪. 0.0475‬‬
‫‪16‬‬
‫תרגילים‬
‫‪.1‬‬
‫הציון הממוצע בבחינה פסיכומטרית הוא ‪ 580‬עם סטית תקן ‪.86‬‬
‫א‪.‬‬
‫אם נוציא את כל המדגמים האפשריים בגודל ‪ , n=20‬מהו התחום הסימטרי בו ירוכזו ‪ 95%‬ממוצעי המדגמים‪.‬‬
‫ב‪.‬‬
‫מהי ההסתברות שציונם הכולל של ‪ 53‬נבחנים שנבחרו באקראי יהיה מעל ‪. 32520‬‬
‫‪2.‬‬
‫הציון הממוצע בבחינת בגרות במתמטיקה הוא ‪ 81‬עם סטית תקן ‪ , 7‬דוגמים ‪ 7‬בתי ספר ‪.‬‬
‫א‪.‬‬
‫מהו אחוז בתי הספר בהם הציון הממוצע גבוה מ‪. 87 -‬‬
‫ב‪.‬‬
‫מהו התחום הסימטרי בו מרוכזים ‪ 98%‬ממוצעי המדגמים‪.‬‬
‫‪.3‬‬
‫באוכלוסיה המונה ‪ 6‬נשים נמדדה מנת המשכל ‪ ,‬להלן הממצאים‪:‬‬
‫‪.125 , 117 , 122 , 112 , 115 , 120‬‬
‫א‪.‬‬
‫חשבו את מנת המשכל הממוצעת באוכלוסיה זו ואת סטית התקן‪.‬‬
‫ב‪.‬‬
‫בנו טבלה המכילה את כל המדגמים האפשריים של ‪ 4‬נשים‪.‬‬
‫ג‪.‬‬
‫חשבו את הממוצע לכל מדגם ואת ממוצע ממוצעי המדגמים והשוו את הממצאים לנתוני האוכלוסייה‪.‬‬
‫ד‪.‬‬
‫בוחרים מדגם של ‪ 3‬נשים מה ההסתברות שממוצע המדגם יהיה גבוה מ‪. 116 -‬‬
‫‪.4‬‬
‫נבחני נהיגה עוברים בממוצע בטסט שלישי עם סטית תקן ‪. 0.8‬‬
‫מהו התחום הסימטרי בו אינם נמצאים ‪ 4%‬מהנבחנים מתוך מדגם של ‪ 16‬נבחנים‪.‬‬
‫‪.5‬‬
‫ילד מחייג במהלך יום ל‪ 8-‬חברים בממוצע בעוד שסטיית התקן של מספר החיוגים היומי היא ‪.2‬‬
‫מה הסיכוי שב‪ 60-‬יום שנבחרו באקראי יחייג הילד בסה"כ לפחות ‪ 512‬פעם לחבריו?‬
‫ב‪.‬‬
‫‪0.0032‬‬
‫ג‪.‬‬
‫‪0.0394‬‬
‫ד‪.‬‬
‫‪0.451‬‬
‫א‪.‬‬
‫‪0.0197‬‬
‫‪.6‬‬
‫ע"פ נתוני המועצה להשכלה גבוהה הציון הממוצע בקורס מבוא לכלכלה הוא ‪  74‬‬
‫עם סטית תקן ‪,   16‬‬
‫א‪.‬‬
‫מהו התחום הסימטרי בו מרוכזים ‪ 95%‬ממוצעי כל המדגמים בגודל ‪?n=250‬‬
‫ב‪.‬‬
‫מהו אחוז המדגמים בהם הממוצע גבוה מ‪? 76-‬‬
‫‪.7‬‬
‫ידוע כי מניה מסוימת עולה בממוצע ב‪ ₪ 2-‬ליום עם סטיית תקן של ‪ . ₪ 0.8‬מה ההסתברות שבמשך ‪40‬‬
‫יום תהיה תשואת המניה בין ‪ ₪ 1.8‬ל‪ ₪ 2.4 -‬ליום בממוצע?‬
‫‪17‬‬
‫פתרונות‬
‫‪.1‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪ Z 0.975  1.96‬‬
‫‪0.05‬‬
‫‪2‬‬
‫‪1‬‬
‫‪n‬‬
‫‪  0.05‬‬
‫‪Z‬‬
‫‪86‬‬
‫‪  580  1.96 ‬גבול עליון‬
‫‪86‬‬
‫‪ 542.3‬‬
‫‪20‬‬
‫‪  580  1.96 ‬גבול תחתון‬
‫‪ 617.69‬‬
‫‪20‬‬
‫‪n  20‬‬
‫‪  86‬‬
‫‪  580‬‬
‫התחום בו מרוכזים ‪ 95%‬ממוצעי כל המדגמים הוא בין ‪ 542.3‬לבין ‪. 617.69‬‬
‫כל המדגמים‬
‫ממוצעי‬
‫בגודל ‪n=20‬‬
‫‪617.69‬‬
‫ב‪.‬‬
‫‪542.3‬‬
‫‪580‬‬
‫‪32520‬‬
‫נחשב את הציון הממוצע של ‪ 53‬הנבחנים ‪ 613.58 :‬‬
‫‪53‬‬
‫‪X ‬‬
‫נחשב את ההסתברות באמצעות טבלת ההתפלגות הנורמאלית‪.‬‬
‫‪613.58  580‬‬
‫‪ 2.84‬‬
‫‪ 86 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 53 ‬‬
‫‪1    0.9977‬‬
‫‪Z1 ‬‬
‫‪‬‬
‫‪  0.0023‬‬
‫‪Z  2.84‬‬
‫‪.2‬‬
‫‪613.58‬‬
‫‪1‬‬
‫‪580‬‬
‫א‪.‬‬
‫‪87  81‬‬
‫‪ 2.27‬‬
‫‪7‬‬
‫) (‬
‫‪7‬‬
‫‪1    0.9884‬‬
‫‪  0.0116‬‬
‫‪Z1 ‬‬
‫‪ 1.16%‬מבתי הספר הציון הממוצע בהם גבוה מ‪.87-‬‬
‫‪18‬‬
‫‪‬‬
‫ב‪.‬‬
‫‪n‬‬
‫‪ Z 0.99  2.33‬‬
‫‪ 87.16‬‬
‫‪ 74.83‬‬
‫‪.3‬‬
‫‪‬‬
‫‪0.02‬‬
‫‪2‬‬
‫‪1‬‬
‫‪  0.02‬‬
‫‪Z‬‬
‫‪7‬‬
‫‪  81  2.33 ‬גבול עליון‬
‫‪7‬‬
‫‪  81  2.33 ‬גבול תחתון‬
‫‪7‬‬
‫‪7‬‬
‫א‪.‬‬
‫‪ 7‬‬
‫‪n7‬‬
‫‪  81‬‬
‫לחישובים באמצעות מחשבון עיינו בנספח שימוש במחשבון לחישובים סטטיסטיים‪.‬‬
‫‪  4.34‬‬
‫ב‪.‬‬
‫‪n‬‬
‫‪X  118.5‬‬
‫!‪N‬‬
‫‪N‬‬
‫‪ ‬‬
‫!)‪ n  n!( N  n‬‬
‫!‪6‬‬
‫נחשב את מספר המדגמים האפשריים בגודל ‪ 15 . n=4‬‬
‫!‪4!2‬‬
‫ניתן להוציא מאוכלוסייה זו ‪ 15‬מדגמים שונים בני ‪ 4‬נשים כל אחד‪.‬‬
‫נמספר כל נבדק‪ ,‬ונבנה את כל ‪ 15‬המדגמים הנ"ל‪:‬‬
‫מס' נבדק‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫‪6‬‬
‫מנת משכל‬
‫‪120‬‬
‫‪115‬‬
‫‪112‬‬
‫‪122‬‬
‫‪117‬‬
‫‪125‬‬
‫ממוצע המדגם‬
‫מנת משכל כל פרט במדגם מדגמים (ע"פ מספר הנחקר) מס' מדגם‬
‫‪117.25‬‬
‫‪120,115,112,122‬‬
‫‪,1,2,3,4‬‬
‫‪1‬‬
‫‪116‬‬
‫‪120,115,112,117‬‬
‫‪,1,2,3,5‬‬
‫‪2‬‬
‫‪118‬‬
‫‪120,115,112,125‬‬
‫‪,1,2,3,6‬‬
‫‪3‬‬
‫‪118.5‬‬
‫‪120,115,122,117‬‬
‫‪,1,2,4,5‬‬
‫‪4‬‬
‫‪120.5‬‬
‫‪120,115,122,125‬‬
‫‪,1,2,4,6‬‬
‫‪5‬‬
‫‪119.5‬‬
‫‪120,115,117,125‬‬
‫‪,1,2,5,6‬‬
‫‪6‬‬
‫‪117.75‬‬
‫‪120,112,122,117‬‬
‫‪,1,3,4,5‬‬
‫‪7‬‬
‫‪119.75‬‬
‫‪120,112,122,125‬‬
‫‪,1,3,4,6‬‬
‫‪8‬‬
‫‪118.5‬‬
‫‪120,112,117,125‬‬
‫‪,1,3,5,6‬‬
‫‪9‬‬
‫‪121‬‬
‫‪120,122,117,125‬‬
‫‪,1,4,5,6‬‬
‫‪10‬‬
‫‪116.5‬‬
‫‪115,112,122,117‬‬
‫‪,2,3,4,5‬‬
‫‪11‬‬
‫‪118.5‬‬
‫‪115,112,122,125‬‬
‫‪,2,3,4,6‬‬
‫‪12‬‬
‫‪117.5‬‬
‫‪115,112,117,125‬‬
‫‪,2,3,5,6‬‬
‫‪13‬‬
‫‪119.75‬‬
‫‪115,122,117,125‬‬
‫‪,2,4,5,6‬‬
‫‪14‬‬
‫‪119‬‬
‫‪112,122,117,125‬‬
‫‪,3,4,5,6‬‬
‫‪15‬‬
‫‪19‬‬
‫‪ X  118.5‬ממוצע ממוצעי המדגמים‪.‬‬
‫‪  0.8413‬‬
‫ד‪.‬‬
‫‪1    0.1587‬‬
‫‪116  118.5‬‬
‫‪ 0.997 ~ 1‬‬
‫‪4.34‬‬
‫(‬
‫)‬
‫‪3‬‬
‫‪Z1 ‬‬
‫החישוב נעשה באמצעות טבלה בעלת ערכים שליליים ‪ ,‬בטבלה רגילה יש לבדוק את ההסתברות המתאימה ל‪-‬‬
‫‪ Z=1‬ולא להחסיר מ‪.1-‬‬
‫ההסתברות שממוצע המדגם יהיה גבוה מ‪ 116-‬היא ‪.0.8413‬‬
‫‪.4‬‬
‫‪‬‬
‫‪n‬‬
‫נחשב את התחום בו אינם נמצאים ‪ 4%‬הוא התחום בו נמצאים ‪ 96%‬נחשב תחום זה‪:‬‬
‫‪‬‬
‫‪ Z 0.98  2.06‬‬
‫‪0.04‬‬
‫‪2‬‬
‫‪1‬‬
‫‪n‬‬
‫‪Z‬‬
‫‪  0.04‬‬
‫‪0.8‬‬
‫‪ 3.41‬‬
‫‪16‬‬
‫‪  3  2.06 ‬גבול עליון‬
‫‪0.8‬‬
‫‪ 2.58‬‬
‫‪16‬‬
‫‪  3  2.06 ‬גבול תחתון‬
‫‪n  16‬‬
‫‪  0.8‬‬
‫‪ 3‬‬
‫התחום הסימטרי בו אינם מרוכזים ‪ 4%‬ממוצעי המדגמים בגדול ‪ 16‬הוא בין ‪ 2.58‬לבין ‪. 3.41‬‬
‫‪.5‬‬
‫תשובה א' נכונה‬
‫‪.6‬‬
‫‪512‬‬
‫‪ 8.53‬‬
‫‪n  60‬‬
‫‪ 2‬‬
‫‪ 8‬‬
‫‪60‬‬
‫‪8.53  8‬‬
‫‪Z1 ‬‬
‫‪ 2.065‬‬
‫‪1    0.9803‬‬
‫‪  0.0197‬‬
‫‪2‬‬
‫(‬
‫)‬
‫‪60‬‬
‫‪X ‬‬
‫התחום בו מרוכזים ‪ 95%‬ממוצעי כל המדגמים‬
‫‪2.5%‬‬
‫‪0.025‬‬
‫של ‪0.95‬‬
‫‪2.5%‬‬
‫‪0.025‬‬
‫‪0.975‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪n‬‬
‫‪20‬‬
‫‪ Z0.975  1.96‬‬
‫‪0.05‬‬
‫‪2‬‬
‫‪  0.05‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪16‬‬
‫‪ 75.98‬‬
‫‪250‬‬
‫‪  74  1.96 ‬גבול עליון‬
‫‪16‬‬
‫‪ 72.01‬‬
‫‪250‬‬
‫‪  74  1.96 ‬גבול תחתון‬
‫‪n  250‬‬
‫‪  16‬‬
‫של ‪0.95‬‬
‫‪75.98‬‬
‫‪.7‬‬
‫‪  74‬‬
‫‪72.01‬‬
‫מעוניינים לחשב את ההסתברות שתשואת המניה תהיה בין ‪ ₪ 1.8‬ל‪ ₪ 2.5-‬בממוצע ליום‪.‬‬
‫הדרך לחישוב היא חישוב ההסתברות שהתשואה תהיה נמוכה מ‪ ₪ 1.8-‬ליום ‪ ,‬חישוב ההסתברות שהתשואה‬
‫תהיה נמוכה מ‪ ₪ 2.5-‬ליום ‪ ,‬חיסור ההסתברויות ישאיר לנו את ההסתברות בין שני הערכים‪:‬‬
‫ההסתברות בין‬
‫‪ ₪ 1.8‬ל‪₪ 2.4 -‬‬
‫‪₪ 2.4‬‬
‫‪Xi  ‬‬
‫)‬
‫‪‬‬
‫‪n‬‬
‫‪Z‬‬
‫‪₪ 1.8‬‬
‫‪n  40‬‬
‫‪  0.8‬‬
‫‪2‬‬
‫(‬
‫‪1.8  2‬‬
‫‪ 1.58‬‬
‫‪0.8‬‬
‫(‬
‫)‬
‫‪40‬‬
‫‪Z 1.58  0.0571‬‬
‫‪Z‬‬
‫‪2.4  2‬‬
‫‪ 3.16‬‬
‫‪0.8‬‬
‫(‬
‫)‬
‫‪40‬‬
‫‪Z 3.16  0.9992‬‬
‫‪Z‬‬
‫‪0.9992  0.0571  0.9421‬‬
‫ההסתברות שהתשואה הממוצעת במשך ‪ 40‬יום תהיה בין ‪ ₪ 1.8‬ל‪ ₪ 2.4 -‬ליום היא ‪. 0.9421‬‬
‫‪21‬‬
‫אמידה ‪Estimation‬‬
‫מחקרים מבוססים בד"כ על מדגמים מתוך האוכלוסייה ‪ ,‬נשאלת השאלה כיצד ניתן לאמוד את הפרמטרים‬
‫המתאימים באוכלוסייה?‬
‫שתי שיטות אמידה‬
‫‪.1‬‬
‫אומד‪/‬אומדן נקודתי ‪- Point Estimate -‬‬
‫אמידת הפרמטר – ממוצע האוכלוסייה ע"י ערך נקודתי יחיד‪.‬‬
‫אומדים את הפרמטר (תוחלת האוכלוסייה) ע"י הסטטיסטי ‪  X -‬‬
‫‪.‬‬
‫אומד נקודתי בד"כ נוח לחישוב ופירוש והוא בד"כ התוצאה המוצגת במחקרים המופנים לקהל הרחב‪.‬‬
‫ניתן למצוא ע"י קריטריונים מסוימים את האומד הנקודתי הטוב ביותר לאמידת הפרמטר ‪ ,‬אך לא ניתן להעריך את‬
‫ההסתברות לטעות‪.‬‬
‫מהו האומד הנקודתי הטוב ביותר עבור ‪? ‬‬
‫עקרונית ניתן להתאים לכל פרמטר את הסטטיסטי המקביל לו במדגם ‪:‬‬
‫ממוצע האוכלוסייה = ממוצע המדגם‬
‫החציון באוכלוסייה = חציון המדגם‬
‫סטית התקן באוכלוסייה = סטית התקן במדגם‬
‫ישנם מקרים בהם האומד הנקודתי הטוב ביותר אינו בהכרח הסטטיסטי המקביל לו במדגם‪.‬‬
‫קיימים מספר קריטריונים לבחירת האומד הנקודתי הטוב ביותר‪:‬‬
‫א‪.‬‬
‫אומד חוסר הטיה ‪ ,   X -Unbiasedness‬מתוך נקודת המוצא כי ממוצע כל המדגמים האפשריים‬
‫בגודל ‪ n‬שווה לממוצע האוכלוסייה ‪ ,‬נכון הוא כי ממוצע של מדגם אחד אינו בהכרח שווה לממוצע האוכלוסייה ‪,‬‬
‫אולם מאחר וממוצע ממוצעי המדגמים שווה לממוצע האוכלוסייה נוכל לטעון כי ‪ X‬הוא אומד חסר הטיה ל ‪ .-‬‬
‫המושג חוסר הטיה משמעותו היא שאין הטיה שיטתית בין תוצאות המדגם לאוכלוסייה ‪ ,‬ההסתברות‬
‫שממוצע המדגם יהיה גבוה מממוצע האוכלוסייה שווה להסתברות שהוא יהיה נמוך ממנו ‪.‬‬
‫ב‪.‬‬
‫יעילות ‪ – Efficiency‬קריטריון נוסף הוא מידת היעילות באמידה‪,‬‬
‫יעילות האמידה נמדדת ע"י שונות התקן ‪ ,‬שונות התקן = ריבוע טעות התקן‪.‬‬
‫ככל ששונות התקן קטנה יותר המשמעות היא שהפיזור סביב ממוצע המדגם קטן יותר – נתוני המדגם הומוגניים‬
‫יותר ולכן האמידה יעילה יותר‪.‬‬
‫‪22‬‬
‫בהשוואה בין שני אומדים חסרי הטיה נעדיף את האומד ששונות התקן שלו קטנה יותר‪.‬‬
‫‪ 2T1‬‬
‫את היעילות היחסית בין שני אומדים נקודתיים (‪ )T1 ,T2‬חסרי הטיה ניתן לחשב ע"י‬
‫‪ 2T2‬‬
‫דוגמא‪ :‬נניח ששני חוקרים מבקשים לאמוד את ‪‬‬
‫‪1‬‬
‫‪5‬‬
‫‪‬‬
‫‪2‬‬
‫‪200‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪40‬‬
‫‪ T2 ‬‬
‫‪2‬‬
‫‪ ,‬חוקר א' דגם ‪ 40‬איש וחוקר ב' ‪. 200‬‬
‫‪2‬‬
‫‪200‬‬
‫‪ T1 ‬‬
‫‪2‬‬
‫‪2‬‬
‫‪40‬‬
‫מידת היעילות של ב' גדולה פי ‪ 5‬מידת היעילות של א' ‪ ,‬כלומר מידת הסבירות להתאמה בין‬
‫ממוצע המדגם לממוצע האוכלוסייה גדולה פי ‪ 5‬אצל חוקר ב'‪.‬‬
‫ג‪.‬‬
‫עקביות ‪ – Consistency‬הסטטיסטי יחשב כאומד עקבי ‪ /‬קונסיסטנטי לפרמטר באוכלוסיה אם ככל‬
‫שגודל המדגם יגדל ‪ ,‬ערך הסטטיסטי ישאף לערך הפרמטר ‪ -‬ממוצע המדגם ישאף לממוצע האוכלוסייה‪.‬‬
‫ד‪.‬‬
‫אמינות ‪/‬אומד מספק ‪ - Sufficiency‬הסטטיסטי ‪ X‬יחשב כאומד אמין ‪ /‬מספק אם הוא נותן את‬
‫האינפורמציה הטובה ביותר לגבי הפרמטר ואף אומד אחר (חציון ‪ ,‬שכיח ) לא יוכל להוסיף על האומדן המתקבל‬
‫על הפרמטר מתוך ממוצע המדגם ‪. X‬‬
‫‪.2‬‬
‫אומד ע"י תחום ‪ – Interval Estimation‬אמידת ‪‬‬
‫ע"י תחום ערכים כלומר ‪.   ‬‬
‫נבנה תחום עבור הפרמטר בהסתברות גבוהה כרצוננו – ההסתברות משמעותה שהתחום אכן מכיל את הפרמטר ‪,‬‬
‫וכמובן שמהסתברות זו נגזרת ההסתברות לשגיאה – ההסתברות להימצא מחוץ לתחום זה‪.‬‬
‫לתחום קוראים רווח בר סמך ‪ Confidence Interval -‬ולהסתברות המתאימה לתחום – רמת הסמך‪.‬‬
‫נסמן את ההסתברות לטעות באמידה באות ‪‬‬
‫ולכן רמת הסמך – ההסתברות המתאימה לתחום או במילים‬
‫אחרות ההסתברות שהפרמטר אכן בתחום תסומן ‪.1  ‬‬
‫‪L1    L2 ‬‬
‫‪ = L  L2  L1‬אורך רווח הסמך (ההפרש בין הגבול העליון לגבול התחתון)‪.‬‬
‫‪23‬‬
‫רווח בר סמך לממוצע האוכלוסייה‬
‫‪Confidence Interval for the population mean‬‬
‫טרם בניית התחום יש לקבוע את ההסתברות לשגיאה ‪‬‬
‫ההסתברות שהתחום אכן יכלול את ‪. ‬‬
‫ממנה נגזרת ההסתברות לנכונות ‪ ,1  ‬כלומר‬
‫‪ - 1  ‬נקראת גם רמת הביטחון ‪ ,‬הביטחון שהתחום אכן יכלול את ‪. ‬‬
‫אם נקבע כי ‪   5%‬המשמעות היא כי ישנו סיכוי של ‪ 5%‬לשגיאה ‪ ,‬ההסתברות לטעות היא ‪. 0.05‬‬
‫רמת הביטחון היא ‪ 95%‬כלומר ההסתברות ש‪  -‬בתחום היא ‪ – 0.95‬ביטחון של ‪ 95%‬ש‪ -‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪2‬‬
‫‪  X Z‬‬
‫‪1‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪2‬‬
‫נמצא בתחום‪.‬‬
‫‪X Z‬‬
‫‪1‬‬
‫‪‬‬
‫חישוב רווח הסמך כנ"ל הוא חישוב כאשר סטית התקן באוכלוסייה ידועה‪.‬‬
‫‪‬‬
‫ניתן לראות מדרך החישוב כי אורך רווח הסמך תלוי בגודל המדגם ‪ ,‬כלומר ככל שהמדגם גדל טעות‬
‫התקן קטנה ולכן הסטייה מהממוצע לכל צד תקטן כלומר רווח הסמך יקטן‪.‬‬
‫הגדלת המדגם פי ‪ K‬תקטין את אורך רווח הסמך פי ‪K‬‬
‫‪‬‬
‫הגדלת רמת הביטחון ) ‪ - , (1  ‬הקטנת ‪ , ‬תגדיל את התחום ‪ - ,‬בטחון גדול יותר משמעותו‬
‫הקטנת ההסתברות לשגיאה – רווח סמך גדול יותר‪.‬‬
‫במדגם של ‪ 16‬עורכי דין נמצא כי השכר הממוצע הוא ‪ ₪ 12500‬לחודש ‪ ,‬ידוע כי סטית התקן לשכר‬
‫עו"ד באוכלוסיה היא ‪. ₪ 3800‬‬
‫בנו רווח בר סמך לשכר הממוצע של עו"ד באוכלוסייה‪ ,‬ברמת סמך (רמת ביטחון) של ‪ -95%‬סיכוי שגיאה ‪.   5%‬‬
‫‪‬‬
‫‪n‬‬
‫‪ Z 0.975  1.96‬‬
‫‪0.05‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪  X Z‬‬
‫‪  0.05‬‬
‫‪‬‬
‫‪n‬‬
‫‪n  16‬‬
‫‪3800‬‬
‫‪3800‬‬
‫‪   12500  1.96 ‬‬
‫‪16‬‬
‫‪16‬‬
‫‪10638    14362‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪X Z‬‬
‫‪  3800‬‬
‫‪X  12500‬‬
‫‪12500  1.96 ‬‬
‫משמעות – ‪ 95%‬ממוצעי כל המדגמים בגודל ‪ n=16‬נמצאים בתחום הנ"ל ‪ ,‬על סמך משפט הגבול המרכזי ‪:‬‬
‫אנו מסיקים על סמך מדגם של ‪ 16‬עו"ד ברמת בטחון של ‪ 95%‬כי שכרם הממוצע של עו"ד‬
‫הינו בין ‪ ₪ 10638‬לבין ‪.₪ 14362‬‬
‫‪24‬‬
‫חישוב גודל המדגם‬
‫ניתן לחשב את גודל המדגם הדרוש לבניית רווח סמך מסוים תחילה יש להגדיר את רמת המובהקות ‪ ‬ואת‬
‫מחצית אורך רווח הסמך ‪ -‬הסטייה הדרושה בין‬
‫‪L‬‬
‫‪‬‬
‫‪Z  ‬‬
‫‪1‬‬
‫‪2‬‬
‫‪n‬‬
‫‪2‬‬
‫‪X ‬‬
‫‪  ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪L‬‬
‫‪X ‬‬
‫‪2‬‬
‫‪2‬‬
‫גודל המדגם‬
‫‪L‬‬
‫‪ X ‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪‬‬
‫‪ Z  ‬‬
‫) ‪(1 ‬‬
‫‪2‬‬
‫‪n  ‬‬
‫‪L‬‬
‫‪  ‬‬
‫‪ 2‬‬
‫חוקר רוצה למדוד את לחץ הדם הממוצע אצל רצי מרתון‪.‬‬
‫מהו גודל המדגם שעליו לבחור כדי לקבל רמת סמך של ‪ 0.95‬וסטייה מרבית של ‪ , 3‬אם ידוע כי סטית התקן של‬
‫האוכלוסייה הנחקרת היא ‪?   7‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1‬‬
‫‪.‬‬
‫‪96‬‬
‫‪‬‬
‫‪7‬‬
‫‪‬‬
‫‪20.91  ‬‬
‫‪ 6 ‬‬
‫‪   ‬‬
‫‪ 2 ‬‬
‫על החוקר לבחור מדגם של ‪ 21‬איש‪.‬‬
‫‪25‬‬
‫‪.1‬‬
‫לבדיקת התשואות השנתיות של מנהלי תיקים בחברה מסוימת ‪ ,‬נבחרה קבוצה של שישה יועצי השקעות ‪,‬‬
‫נבדקה תשואת תיקי ההשקעות שלהם במשך שנה‪ .‬ידוע כי סטית התקן לתשואות בחברה היא ‪ .2.36%‬התוצאות‪:‬‬
‫ד‬
‫היועץ‬
‫ו‬
‫ה‬
‫ג‬
‫ב‬
‫א‬
‫‪11‬‬
‫‪7‬‬
‫‪4‬‬
‫‪4‬‬
‫‪14‬‬
‫‪16‬‬
‫תשואה שנתית ‪%‬‬
‫בנו רווח בר סמך לאחוז התשואה השנתית הממוצעת אצל היועצים בחברה ברמת סמך של ‪.98%‬‬
‫‪.2‬‬
‫סטטיסטיקאי חישב רווח בר סמך לתוחלת זמן השירות של עובדי שירות לקוחות ‪5.72    8.28‬‬
‫גודל המדגם ‪ 65 -‬עובדים ונמצא כי ‪ X  7‬וסטית התקן של כלל העובדים היא ‪ 3.4‬ד'‪.‬‬
‫א‪.‬‬
‫מהי רמת הביטחון (רמת הסמך) בה חושב הרווח ?‬
‫ב‪.‬‬
‫מהו גודל המדגם המינימאלי על מנת שאורך הרווח לא יעלה על ‪ 0.5‬דקה ברמת בטחון של ‪? 95%‬‬
‫‪.3‬‬
‫בונים שני רווחי סמך לתוחלת של אוכלוסייה נורמאלית כאשר סטיית התקן ידועה‪ .‬רמת הסמך של שני‬
‫הרווחים זהה‪ .‬הרווח הראשון נבנה על מדגם בגודל ‪ ,100‬הרווח השני נבנה על מדגם בגודל ‪ .500‬הרווח הראשון ‪:‬‬
‫א‪.‬‬
‫ארוך פי ‪ 5‬מהרווח השני‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ארוך פי ‪ 2.236‬מהרווח השני‪.‬‬
‫ד‪.‬‬
‫קצר פי ‪ 5‬מהרווח השני‪.‬‬
‫‪.4‬‬
‫נבנה רווח סמך לתוחלת אוכלוסייה נורמאלית ‪ 100    200‬ברמת ביטחון של ‪ , 99%‬המשמעות היא‪:‬‬
‫א‬
‫הסיכוי שתוחלת האוכלוסייה שווה ל ‪ 150 -‬הוא ‪.99%‬‬
‫ב‪.‬‬
‫בסיכוי של ‪ 99%‬נמצאת תוחלת האוכלוסייה בין ‪ 100‬ל ‪.200 -‬‬
‫ג‪.‬‬
‫הסיכוי שתוחלת האוכלוסייה היא בין ‪ 100‬ל ‪ 200 -‬הוא ‪.1%‬‬
‫ד‪.‬‬
‫הסיכוי שתוחלת האוכלוסייה לא נמצאת בתוך הרווח שבין ‪ 100‬ל ‪ 200 -‬הוא ‪.1%‬‬
‫‪.5‬‬
‫מנהל השיווק בחברה מסוימת רצה לבדוק את פעילות מחלקת הטלמרקטינג ‪ ,‬המנהל בדק ‪ 8‬עובדים ‪ ,‬ידוע‬
‫כי סטית התקן למס' השיחות הממוצע בשעה היא ‪ , 1.92‬להלן היקף פעילותם‪:‬‬
‫‪8‬‬
‫‪7‬‬
‫‪6‬‬
‫‪5‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫מס' טלפן‬
‫‪4‬‬
‫‪5‬‬
‫‪8‬‬
‫‪4‬‬
‫‪3‬‬
‫‪7‬‬
‫‪4‬‬
‫מס' שיחות בשעה ‪6‬‬
‫חשבו רווח בר סמך למספר השיחות הממוצע שעורך טלפן בשעה ברמת בטחון של ‪.95%‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫איזה אחוז מהטלפנים מבצעים יותר מ‪ 6-‬שיחות בשעה‪.‬‬
‫‪.6‬‬
‫בונים רווח סמך לתוחלת של אוכלוסייה נורמאלית אחת‪ .‬לפניך ‪ 2‬טענות‪:‬‬
‫א‪ .‬ככל שהמדגם גדול יותר‪ ,‬רווח הסמך ארוך יותר‪ .‬ב‪ .‬ככל שרמת הביטחון קטנה יותר‪ ,‬הרווח ארוך יותר‪.‬‬
‫א‪ .‬שתי הטענות נכונות‪.‬‬
‫ב‪ .‬שתי הטענות לא נכונות‪.‬‬
‫ג‪ .‬רק הטענה הראשונה נכונה‪.‬‬
‫ד‪ .‬רק הטענה השנייה נכונה‪.‬‬
‫‪26‬‬
‫‪.1‬‬
‫עיינו בנספח לשימוש במחשבון לחישובים סטטיסטיים לצורך חישוב הממוצע‪:‬‬
‫‪ Z 0.99  2.33‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪2.36‬‬
‫‪6‬‬
‫‪1‬‬
‫‪‬‬
‫‪2‬‬
‫‪  2.36‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪  X Z‬‬
‫‪   9.33  2.33 ‬‬
‫‪‬‬
‫‪n‬‬
‫‪2.36‬‬
‫‪6‬‬
‫‪n6‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪X  9.33‬‬
‫‪X Z‬‬
‫‪9.33  2.33 ‬‬
‫‪7.088    11.57‬‬
‫התשואה השנתית הממוצעת היא בין ‪ 7.08%‬ל‪.11.57% -‬‬
‫‪.2‬‬
‫‪L‬‬
‫נחשב את מחצית הרווח ‪ 1.28 -‬‬
‫‪2‬‬
‫‪ ,‬הרווח אינו תלוי בממוצע המדגם לכן ‪:‬‬
‫‪‬‬
‫‪4‬‬
‫‪ 1.28‬‬
‫‪65‬‬
‫‪‬‬
‫)‬
‫‪ 2.579‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪(1‬‬
‫‪Z‬‬
‫‪Z‬‬
‫‪  0.0049‬‬
‫ב‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪S‬‬
‫‪Z  ‬‬
‫‪ 1.28‬‬
‫) ‪(1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪1.28  65‬‬
‫‪4‬‬
‫‪‬‬
‫‪ 0.9951‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪‬‬
‫‪ Z  ‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪n‬‬
‫‪ L‬‬
‫‪  ‬‬
‫‪ 2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1.96  3.4 ‬‬
‫‪‬‬
‫‪n‬‬
‫‪  0.5  ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪  2  ‬‬
‫‪n  710.54‬‬
‫‪27‬‬
‫‪.3‬‬
‫‪ ,‬לכן הגדלת המדגם פי ‪( 5‬מ‪ 100-‬ל‪ )500-‬תקצר את‬
‫הגדל המדגם פי ‪ K‬תקטין את אורך הרווח פי ‪K‬‬
‫הרווח פי ‪ , 2.236‬כלומר במדגם של ‪ 100‬הרווח ארוך פי ‪.2.236‬‬
‫‪.4‬‬
‫רווח בר סמך לתוחלת ברמת ביטחון של ‪ , 99%‬ע"פ משפט הגבול המרכזי ‪ 99%‬ממוצעי כל המדגמים בגודל‬
‫‪ n‬נמצאים בתחום המתקבל –ו‪ 1%-‬מחוץ לתחום ‪.‬‬
‫‪.5‬‬
‫א‪.‬‬
‫תשובה ג' נכונה‬
‫תשובה ד' נכונה ‪.‬‬
‫נחשב את מספר השיחות הממוצע בשעה ‪X  5.125‬‬
‫‪ Z 0.975  1.96‬‬
‫‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪  0.05‬‬
‫‪  1.92‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n8‬‬
‫‪  X Z‬‬
‫‪1‬‬
‫‪X  5.125‬‬
‫‪‬‬
‫‪n‬‬
‫‪1.92‬‬
‫‪1.92‬‬
‫‪   5.125  1.96 ‬‬
‫‪8‬‬
‫‪8‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪X Z‬‬
‫‪1‬‬
‫‪5.125  1.96 ‬‬
‫‪3.794    6.455‬‬
‫רווח הסמך למספר‬
‫השיחות הממוצע‬
‫ב‪.‬‬
‫מעל ‪ 6‬שיחות‬
‫‪ 6‬שיחות‬
‫‪9.85%‬‬
‫‪1  0.9015  0.0985‬‬
‫‪ 5.125‬שיחות‬
‫‪Z1.29  0.9015‬‬
‫‪6  5.125‬‬
‫‪ 1.288‬‬
‫‪1.92‬‬
‫(‬
‫)‬
‫‪8‬‬
‫‪Z‬‬
‫‪ 9.85%‬מהטלפנים מבצעים יותר מ‪ 6-‬שיחות בשעה‪.‬‬
‫‪.6‬‬
‫טענה א' אינה נכונה – ככל שהמדגם גדול יותר ‪ ,‬אורך הרווח קצר יותר – ברמה תיאורטית ככל‬
‫שהמדגם גדול יותר הדיוק טוב יותר ולכן אורך הרווח מתקצר ‪ .‬ברמה מתמטית ככל ש‪ n-‬גדל ‪ ,‬בנוסחה מחלקים‬
‫במכנה גדול יותר ולכן התוצאה קטנה יותר – רווח קטן יותר‬
‫טענה ב' אינה נכונה – ככל שרמת הביטחון גדלה הרווח גדל – שיפור הביטחון משמעותו רווח גדול יותר ‪,‬‬
‫מתמטית ככל ‪ ‬קטנה ‪ ,‬ערך ה‪ Z -‬גדל ולכן הרווח גדול יותר‬
‫‪28‬‬
‫בדיקת השערות‬
‫‪Hypothesis Testing‬‬
‫כאשר עורכים מחקר ‪ ,‬מגדירים תחילה את השערות המחקר ‪ ,‬כלומר מהי המטרה ‪ ,‬מה רוצים לחקור ‪ /‬להוכיח‬
‫במחקר ‪ ,‬בסיום המחקר ‪ ,‬עם קבלת התוצאות על החוקר להחליט אם לאשש או להפריך את השערתו‪.‬‬
‫השערות סטטיסטיות באות תמיד בזוגות – השערת האפס אותה בודקים וההשערה האלטרנטיבית‪.‬‬
‫מאחר והמחקר נערך על מדגם מתוך האוכלוסייה יש להחליט האם הפער בין ממוצע התכונה הנבדקת במדגם לבין‬
‫ממוצע אותה תכונה באוכלוסייה חריג מספיק – מובהק ‪ ,‬בכדי להחליט כי מקבלים את השערת המחקר או שלמרות‬
‫שקיים פער הוא אינו מובהק ברמה כזו שנוכל לקבל את השערת המחקר‪.‬‬
‫דוגמא‪:‬‬
‫ידוע כי בשיטת הלימוד הקיימת במתמטיקה ממוצע ציוני הבגרות הוא ‪ 76‬עם סטית תקן ‪.12‬‬
‫פותחה שיטת לימוד חדשה אשר מטרתה לשפר את הישגי התלמידים בבגרות במתמטיקה‪.‬‬
‫חוקר רוצה לבדוק אם אכן שיטת הלימוד החדשה גורמת לשיפור ממוצע הבגרות ‪.‬‬
‫החוקר דגם ‪ 64‬תלמידים אשר למדו ע"פ שיטת הלימוד החדשה ‪ ,‬ממוצע ציוני הבגרות של קבוצה זו היה ‪. 79.3‬‬
‫נשאלת השאלה האם לאור התוצאה שהתקבלה המראה כי ממוצע הבגרות של קבוצת המדגם גבוה ב‪ 3.3-‬נק'‬
‫מממוצע הבגרות באוכלוסייה ‪ ,‬נוכל לקבוע כי שיטת הלימוד החדשה אכן משפרת את ההישגים ולאור‬
‫תוצאה זו לשנות את שיטת הלימוד במתמטיקה בכל בתי הספר בארץ‪.‬‬
‫אילו היינו מנסים את שיטת הלימוד החדשה על כל אוכלוסיית התלמידים ואלו היו התוצאות ‪ ,‬היינו יכולים לקבל‬
‫את השערת המחקר ולומר כי התוצאות מעידות על שיפור בהישגים ‪ ,‬אולם השיטה נבדקה על מדגם של ‪ 64‬איש‬
‫לכן יש צורך בתהליך בו נבחן את התוצאות טרם אנו מסיקים מסקנות – בחינה אשר בסופה נקבל החלטה האם יש‬
‫כאן פער חריג מספיק או במונחים סטטיסטים פער מובהק‪ )significant( -‬כך שנוכל לקבל את השערת המחקר‬
‫ולהסיק כי השיטה החדשה אכן משפרת את ההישגים או שפער זה הוא בגבול הסטייה האפשרית סביב הממוצע‪.‬‬
‫אנחנו יודעים כי אם ניקח את כל המדגמים בני ‪ 64‬איש מאוכלוסייה זו ונבדוק עליהם את השיטה החדשה נקבל‬
‫תוצאות שונות בכל מדגם ונקבל התפלגות נורמאלית של תוצאות המדגמים ‪ ,‬אם הממוצע סביבו התפלגו מדגמים‬
‫אלו הוא ממוצע האוכלוסייה – כי אז אין השפעה לשיטה החדשה‪.‬‬
‫אם הממוצע סביבו התפלגו ממוצעי המדגמים הנ"ל גבוה ממוצע האוכלוסייה כיום ‪ ,‬במצב כזה אם הפער מובהק ‪,‬‬
‫יש משמעות לשיטה החדשה‪.‬‬
‫כדי לחדד את הנקודה‪:‬‬
‫אם היינו לוקחים מדגם אקראי מייצג בגודל ‪ n=64‬מאוכלוסיית הניגשים לבגרות במתמטיקה אשר למדו‬
‫בשיטה הרגילה היינו יכולים לקבל ממוצע הגבוה (או נמוך) מממוצע האוכלוסייה (משפט הגבול המרכזי) ‪,‬‬
‫לכן השאלה אותה יש לבחון היא משמעותו של הפער בין ממוצע המדגם לממוצע האוכלוסייה‪.‬‬
‫בסיס הרעיון של בחינת התוצאה הוא קביעת גבולות "סבירים" ביניהם יכול להימצא ממוצע האוכלוסייה ‪ ,‬אם‬
‫ממוצע המדגם יהיה מחוץ לגבול "סביר" זה נוכל לקבל את השערת המחקר ולומר כי קיים הבדל משמעותי‪/‬מובהק‪.‬‬
‫‪29‬‬
‫המבחן הסטטיסטי‬
‫תהליך בדיקת ההשערות הוא מבחן סטטיסטי המחולק ל‪ 5-‬שלבים‪:‬‬
‫ניסוח השערת המחקר ‪-‬‬
‫א‪.‬‬
‫השערת המחקר יכולה להיות השערה חד כיוונית ‪ -‬חד זנבית – ‪( One Tailed Hypothesis‬כלפי מעלה‪/‬מטה )‬
‫או השערה דו כיוונית – דו זנבית ‪Two Tailed Hypothesis -‬‬
‫השערה חד כיוונית משמעותה – בודקים שינוי מול המצב הקיים עם כוון ברור ‪:‬‬
‫‪‬‬
‫השיטה החדשה משפרת את הישגי התלמידים – בודקים אם הממוצע החדש גבוה מהממוצע הקיים‬
‫(השערה חד כיוונית כלפי מעלה)‪.‬‬
‫‪‬‬
‫התרופה החדשה מורידה את לחץ הדם – בודקים האם לחץ הדם בעקבות התרופה נמוך מלחץ הדם‬
‫הקיים (השערה חד כיוונית כלפי מטה)‪.‬‬
‫השערה דו כיוונית – בודקים האם קיים שינוי‪/‬הבדל – כיוון לא ברור‬
‫‪‬‬
‫התרופה החדשה משפיעה על המשקל – בודקים האם קיים הבדל במשקל בעקבות לקיחת התרופה‬
‫הכוון (השערה דו כיוונית)‪.‬‬
‫בסטטיסטיקה השערות תמיד באות בזוגות – השערת האפס וההשערה האלטרנטיבית – השערת המחקר‪.‬‬
‫החוקר מנסח שתי השערות ביחס ל‪(  -‬הממוצע החדש שהתקבל ‪   X -‬השווה למעשה לממוצע‬
‫המדגם)‪  0 ,‬הוא הממוצע הקיים היום באוכלוסייה – הממוצע בנקודת האפס ‪:‬‬
‫השערת האפס ‪ - H 0 - Null Hypothesis -‬השערת האפס מתייחסת למצב הקיים וטוענת כי אין כל שינוי‬
‫בין המצב הקיים למצב הנבדק‪.‬‬
‫‪  0‬‬
‫‪H0 :‬‬
‫אם הממוצע החדש קטן או שווה לממוצע הקיים אזי התוצאות לא מובהקות ‪.‬‬
‫חשוב לציין כי לא מדובר בבחינה של הממוצע החדש מול ‪ 0‬‬
‫בערכו הידוע אלא מול ערך חדש המחושב באמצעות‬
‫‪ ,  0‬הנקרא הגבול הקריטי ‪ .Critical Value – C‬הגבול הקריטי תוחם את הגבולות סביב ‪ 0‬‬
‫אם הפער הוא בגדר חריגה סבירה כלומר נובע מההתפלגות הסבירה ‪ 0‬‬
‫ומאפשר לנו לקבוע‬
‫סביב או פער מובהק‪.‬‬
‫לכן הרישום הנכון יותר להשערת האפס אמור היה להיות ‪:‬‬
‫‪ C‬‬
‫‪H0 :‬‬
‫בדוגמא שלנו ‪-‬‬
‫‪  76‬‬
‫‪H0 :‬‬
‫שיטת הלימוד החדשה אינה משפרת את הישגי התלמידים בבגרות במתמטיקה‬
‫‪30‬‬
‫השערה אלטרנטיבית ‪ - H 1 - Alternative Hypothesis -‬השערת המחקר ‪ -‬הטענה אותה רוצים‬
‫לבדוק‪/‬להוכיח במחקר – יש שינוי‪ /‬הבדל בין במצב הקיים למצב הנבדק‪.‬‬
‫‪  0‬‬
‫‪H1 :‬‬
‫אם הממוצע החדש גבוה מהממוצע הקיים אזי התוצאות מובהקות‪.‬‬
‫נבהיר שוב את הנקודה כי בפועל הבדיקה אינה מול ‪ 0‬‬
‫אלא מול גבול קריטי ‪ C‬המחושב באמצעות ‪ .  0‬לכן‬
‫הרישום הנכון יותר להשערת האפס אמור היה להיות‬
‫‪ C‬‬
‫‪H1 :‬‬
‫בדוגמא שלנו ‪  76 -‬‬
‫‪H1 :‬‬
‫שיטת הלימוד החדשה משפרת את הישגי התלמידים בבגרות במתמטיקה‪.‬‬
‫המבחן הסטטיסטי בנוי על בדיקת השערת האפס ‪ --‬דחית השערת האפס היא הוכחת טענת החוקר‬
‫דחית השערת האפס היא קבלת ‪ , H 1‬קבלת השערת המחקר‪.‬‬
‫קבלת השערת האפס משמעותה שלילת השערת המחקר – אין הבדל בתוצאות ביחס למצב הקיים‪.‬‬
‫ב‪.‬‬
‫קביעת רמת המובהקות ‪-‬‬
‫‪ - ‬רמת המובהקות של המבחן ‪ ,‬החוקר קובע מראש את רמת המובהקות של המבחן הסטטיסטי‬
‫רמת המובהקות היא ההסתברות לטעות בהחלטת החוקר ‪ ,‬מקובל כי ‪  0.05‬‬
‫כלומר ההסתברות לטעות‬
‫החלטת החוקר לא תעלה על ‪ - 0.05‬הסיכוי לטעות לא יעלה על ‪.5%‬‬
‫התחום של ‪ 1  ‬הוא למעשה תחום קבלת ‪ , H 0‬כלומר אם ‪  0.05‬‬
‫אזי ‪ 1  ‬הוא התחום בו מרוכזים‬
‫‪ 95%‬ממוצעי כל המדגמים לכן תוצאה שתתקבל בתוך תחום זה היא בגדר הסטייה המקובלת סביב הממוצע‪.‬‬
‫בדוגמא שלנו ‪  0.05‬‬
‫‪‬‬
‫‪  0.05‬‬
‫‪1‬‬
‫‪1    0.95‬‬
‫הגבול הקריטי ‪C‬‬
‫‪Critical Value‬‬
‫‪31‬‬
‫ג‪.‬‬
‫קביעת תחומי קבלה ודחייה ‪ Acceptance/Rejection region‬ל‪H 0 -‬‬
‫חישוב הגבול הקריטי – ‪ Critical Value C‬הערך המהווה גבול בין תחום קבלת ‪ H 0‬לתחום דחית ‪. H 0‬‬
‫השערה חד‬
‫כיוונית‬
‫כלפי מעלה‬
‫תחום דחית ‪H 0‬‬
‫תחום קבלת‬
‫‪H0‬‬
‫השערה‬
‫דו כיוונית‬
‫‪0‬‬
‫‪C‬‬
‫‪H0‬‬
‫‪C2‬‬
‫‪0‬‬
‫‪C1‬‬
‫שלב זה נלמד בשלוש הדרכים הנפוצות‬
‫‪.1‬‬
‫השיטה הקלאסית ‪ -‬חישוב הגבול הקריטי ‪C- Critical Value‬‬
‫‪‬‬
‫השערת חד כיוונית ‪-‬‬
‫‪n‬‬
‫‪C   0  Z 1  ‬‬
‫‪‬‬
‫בהשערה חד כיוונית קיים רק גבול אחד עליון ‪ /‬תחתון ולכן משתמשים ב‪Z 1  -‬‬
‫‪‬‬
‫הסימון ‪ ‬מתייחס לשתי האפשרויות – חד כווני כלפי מעלה ‪ , +‬כלפי מטה ‪. -‬‬
‫‪‬‬
‫השערה דו כיוונית ‪-‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪C  0  Z‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫בהשערה דו כיוונית ישנם שני גבולות – עליון ותחתון ‪ -‬רמת המובהקות ‪ -‬הסיכוי לטעות מתחלק לשניים‪.‬‬
‫בדוגמא שלנו – השערה חד כיוונית‬
‫‪Z 1   Z 10.05  Z 0.95  1.65‬‬
‫‪C  76  1.65  1.5  78.475‬‬
‫‪ 1.5‬‬
‫‪‬‬
‫‪n‬‬
‫‪12‬‬
‫‪64‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪  79.3  0  76‬‬
‫‪C  0  Z1  ‬‬
‫‪32‬‬
‫תחומי קבלה ‪ /‬דחייה ל‪H 0 -‬‬
‫‪H0‬‬
‫‪76‬‬
‫‪78.475 79.3‬‬
‫הערך הנבדק – ממוצע המדגם ‪ ,‬נמצא בתחום דחית השערת האפס ‪ ,‬נדחה את השערת האפס‬
‫‪.2‬‬
‫שיטה ב' ‪ -‬השוואת הסתברויות – רמות מובהקות‬
‫רמת המובהקות אשר נקבעה למחקר היא ‪ , 0.05‬המשמעות היא ‪ -‬הסיכוי שהגדרנו לשגיאה במחקר הוא ‪ , 5%‬אם‬
‫על סמך הנתונים שקיבלנו הסיכוי לשגיאה יהיה קטן מ‪ 5%-‬אזי נדחה את השערת האפס כלומר נקבל את השערת‬
‫המחקר ואם הסיכוי לשגיאה על סמך הנתונים יהיה גדול מרמת המובהקות המוגדרת נקבל את השערת האפס‪.‬‬
‫את ההסתברות ה"אמיתית" לשגיאה – על סמך הנתונים ניתן להגדיר כרמת המובהקות המינימאלית ‪ ,‬רמת‬
‫המובהקות הקטנה ביותר בה נדחה את השערת האפס ‪ ,‬זוהי למעשה ההסתברות לקבל ערך נמוך מ‪ -  -‬הערך‬
‫הנבדק ‪ - ,‬אם נחשב את הגבול הקריטי ע"י רמת מובהקות זו נקבל את ‪ , ‬הערך הקיצוני ביותר בו יכול להימצא‬
‫הגבול הקריטי‪.‬‬
‫נסמן את רמת המובהקות המינימאלית כ‪.  ' -‬‬
‫‪‬‬
‫'‪‬‬
‫‪H0‬‬
‫‪‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪C‬‬
‫‪0‬‬
‫‪Z1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪' ‬‬
‫דוחים את השערת האפס‬
‫‪' ‬‬
‫מקבלים את השערת האפס‬
‫‪ '  0.0139‬‬
‫‪1   '  0.9861‬‬
‫‪79.3  76‬‬
‫‪ 2.2‬‬
‫‪1.5‬‬
‫‪Z1 ' ‬‬
‫)‪ ' (0.0139)   (0.05‬‬
‫הסיכוי לשגיאה בהתאם לתוצאות הוא ‪ , 1.39%‬הסיכוי לשגיאה המוגדר במחקר ‪. 5%‬‬
‫נדחה את השערת האפס‬
‫‪33‬‬
‫‪.3‬‬
‫שיטה ג' ‪ -‬השוואת ערכי ‪Z‬‬
‫נתבונן בטבלת ההתפלגות הנורמאלית ‪ ,‬ניתן לראות כי ככל שערכו של ‪ Z‬גדל כך הערך המתקבל בטבלה גדל‪.‬‬
‫הערך המתקבל בטבלה שווה לשטח‪/‬הסתברות משמאל לערך הנבדק ולכן ככל שהשטח משמאל גדל כך השטח‬
‫מימין קטן‪ .‬במונחים שלנו השטח מימין הוא רמת המובהקות ‪ ,  -‬לכן ככל ש‪ Z -‬גדל ‪ ‬קטנה‪.‬‬
‫‪‬‬
‫'‪‬‬
‫‪H0‬‬
‫‪‬‬
‫‪C‬‬
‫‪Z STAT‬‬
‫‪0‬‬
‫‪Z1‬‬
‫נגדיר משתנה חדש ‪ Z( Z STAT‬מחושב) ‪ Z ,‬סטטיסטי הוא למעשה ה‪ Z-‬המחושב בהתאם לתוצאות המדגם‪.‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪Z STAT  Z1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪ Z1  Z Critical‬בהתאם לרמת המובהקות המוגדרת במחקר‬
‫‪ Z STAT  Z‬דוחים את השערת האפס‬
‫‪ Z STAT  Z‬מקבלים את השערת האפס‬
‫בדוגמא שלנו‪:‬‬
‫‪Z0.95  1.65‬‬
‫‪79.3  76‬‬
‫‪ 2.2‬‬
‫‪1.5‬‬
‫)‪Z STAT (2.2)  Z (1.65‬‬
‫ד‪.‬‬
‫‪Z STAT  Z1 ' ‬‬
‫החלטת החוקר ‪-‬‬
‫השלב הרביעי במבחן הסטטיסטי הוא החלטת החוקר בהתאם לנתוני המחקר ולתחומים שבנינו בסעיף ג‪.‬‬
‫בדוגמא שלנו‪ :‬ממוצע המדגם היה ‪ , 79.3‬הגבול הקריטי הוא ‪ 78.475‬כלומר ממוצע המדגם גבוה מהגבול הקריטי ‪,‬‬
‫כלומר נמצא בתחום דחית ‪ , H 0‬התחום בו החריגה מהמוצע הקיים אינה חריגה זניחה אלא מובהקת‪.‬‬
‫החלטת החוקר ‪ :‬נדחה את ‪ H 0‬ונקבל את השערת המחקר – שיטת הלימוד החדשה משפרת את הישגי‬
‫התלמידים‪( .‬ברמת מובהקות של ‪ , 0.05‬או ברמת בטחון של ‪.)95% – 0.95‬‬
‫‪34‬‬
‫ה‪.‬‬
‫טעויות אפשריות ‪-‬‬
‫ישנן שתי טעויות אפשריות בתהליך בדיקת ההשערות ‪:‬‬
‫‪.1‬‬
‫טעות מסוג ראשון – כאשר דוחים את ‪ - H 0‬האפשרות לשגיאה היא ‪ H 0‬נכונה ‪ ,‬מקבלים את‬
‫השערת המחקר אולם זו טעות והשערת המחקר אינה נכונה – תוצאות המחקר לא הוכיחו שינוי כלשהו‪.‬‬
‫ההסתברות לטעות זו היא ‪( . ‬באופן מדויק יותר ניתן לומר כי ההסתברות לטעות זו היא ' ‪.) ‬‬
‫‪.2‬‬
‫טעות מסוג שני – כאשר מקבלים את ‪ H 0‬האפשרות לשגיאה היא ‪ H 1‬נכונה ‪ ,‬דוחים את השערת‬
‫המחקר וטוענים כי המחקר לא הראה כל שינוי למרות שבפועל השערת המחקר נכונה‪.‬‬
‫ההסתברות לטעות מסוג שני היא ‪. ‬‬
‫‪   X‬ממוצע המדגם הוא הממוצע הנבדק בבחינת ההשערה והוא נבחן כ‪ -‬‬
‫החדש‪.‬‬
‫טעויות מסוג ראשון ושני כאשר ההשערה היא חד כיוונית כלפי מעלה‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪C‬‬
‫‪0‬‬
‫טעויות מסוג ראשון ושני כאשר ההשערה היא חד כיוונית כלפי מטה‬
‫‪0‬‬
‫‪‬‬
‫‪‬‬
‫‪C‬‬
‫‪‬‬
‫‪ - ‬כאשר דוחים את השערת האפס המשמעות היא ש‪  -‬הוא ערך חדש אשר אינו שייך להתפלגות סביב ‪-  0‬‬
‫הסיכוי לשגיאה הוא ההסתברות שערך השווה ל‪  -‬נמצא בהתפלגות סביב ‪.  0‬‬
‫‪‬‬
‫‪n‬‬
‫‪C   0  Z 1  ‬‬
‫‪C  0‬‬
‫‪‬‬
‫‪Z 1  ‬‬
‫‪n‬‬
‫‪35‬‬
‫‪ - ‬כאשר מקבלים את השערת האפס המשמעות היא ש‪  -‬אינו ערך חדש אלא שייך להתפלגות סביב ‪-  0‬‬
‫הסיכוי לשגיאה הוא ‪  -‬ערך חדש היוצר התפלגות חדשה ו‪ C-‬שייך להתפלגות זו ‪ ,‬לכן שגיאה מסוג שני היא‬
‫‪‬‬
‫ההסתברות שערך ‪ C‬שייך להתפלגות סביב ‪. ‬‬
‫‪n‬‬
‫‪C    Z 1   ‬‬
‫‪C‬‬
‫‪‬‬
‫‪Z 1   ‬‬
‫‪n‬‬
‫‪ - ‬מחושבת ע"י המרחק בין ‪ ‬ל‪.  0 -‬‬
‫‪ - ‬מחושבת ע"י המרחק בין ‪ ‬ל‪. C -‬‬
‫חישוב טעויות ‪:‬‬
‫‪.1‬‬
‫טעות מסוג ראשון ‪‬‬
‫ניתן לחשב את ‪ ‬באופן מדויק יותר בהתאם לנתוני המחקר הספציפי ‪ ,‬ההסתברות לקבל ערך גבוה מממוצע‬
‫‪ ,‬היא רמת המובהקות של המחקר‪.‬‬
‫המדגם (בהתאם לנתוני האוכלוסייה הקיימים ‪ -‬ההסתברות לקבל באוכלוסייה מדגם עם ממוצע גבוה (בלי לערוך‬
‫כל מחקר) מממוצע המדגם שקיבלנו (כתוצאה ממחקר) היא בעצם ההסתברות לטעות מסוג ראשון – דחית השערת‬
‫האפס בשעה שהשערת האפס נכונה ‪ ,‬במילים אחרות קבלת השערת המחקר בזמן שהשערת האפס נכונה –‬
‫בזמן שבפועל אין כל שינוי‪.‬‬
‫ניתן לחשב את ה‪  -‬הקטנה ביותר האפשרית ‪ ,‬נעזר בטבלת ההתפלגות הנורמאלית‬
‫נשתמש בדרך בה אנו מוצאים את הגבול הקריטי‬
‫ע"י ‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪ - C   0  Z 1  ‬הגבול הקריטי נקבע למעשה‬
‫אשר הוגדרה מראש בתהליך המבחן הסטטיסטי ‪ ,‬בפועל אם קיבלנו ‪ ‬הגדול‪/‬קטן מ‪( C-‬תלוי בסוג‬
‫המבחן ‪ ,‬הרי שיכולנו להשתמש ב‪  -‬קטנה יותר‪.‬‬
‫ה‪  -‬הקטנה ביותר בה נוכל להשתמש היא ה‪ -‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪n‬‬
‫בה ערכו של ‪ C‬יהיה שווה ל‪ ,  -‬לכן נציב ‪C  ‬‬
‫‪C  0  Z 1  ‬‬
‫‪  0  Z 1  ‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪Z 1  ‬‬
‫‪36‬‬
‫בדוגמא שלנו ‪:‬‬
‫‪1    0.9861‬‬
‫‪  0.0139‬‬
‫‪79.3  76‬‬
‫‪ 2.2‬‬
‫‪1.5‬‬
‫‪Z 1  ‬‬
‫בדוגמא שלנו ע"פ הגדרת המחקר ‪   0.05‬אולם באופן מדויק יותר ‪ ‬קטנה יותר ‪  0.0139‬‬
‫ההסתברות זו היא ההסתברות לטעות מסוג ראשון וזו גם ה‪  -‬הקטנה ביותר איתה עדיין נשאר עם אותם מסקנות‬
‫למחקר כלומר נדחה את ‪. H 0‬‬
‫כלומר ‪ ‬זו מתקיימת כאשר ‪ C  ‬עבור ‪ C     0.0139‬לכן נקבל את ‪H 0‬‬
‫עבור ‪  0.0139‬‬
‫‪ C  ‬לכן נדחה את ‪H 0‬‬
‫המשמעות היא ‪ -‬ניתן לערוך בדיקת השערות גם ללא חישוב גבול קריטי אלא על פי ערכי ‪‬‬
‫אם רמת המובהקות במחקר היא ‪   0.05‬נשווה אותה לתחום י דחייה‪/‬קבלה ‪ H 0‬ע"פ ‪ ‬שחישבנו‪.‬‬
‫‪ 0.05  0.0139‬לכן נידחה את ‪. H 0‬‬
‫‪.2‬‬
‫טעות מסוג שני ‪‬‬
‫‪ -‬קבלת השערת האפס למרות שהשערת המחקר נכונה‪.‬‬
‫מאחר וטעות זו היא הטענה כי השערת המחקר ‪ H 1‬נכונה וקיבלנו בטעות את ‪H 0‬‬
‫נגדיר את הגבול הקריטי ‪ C‬לפי ‪H 1‬‬
‫הגבול יוגדר ע"פ ‪ ‬בניגוד ל‪ C-‬ע"פ ‪ H 0‬המוגדר ע"פ ‪ 0‬‬
‫הגדרת ‪ C‬לפי‬
‫‪‬‬
‫‪H1‬‬
‫‪n‬‬
‫‪C    Z 1  ‬‬
‫לכן כדי לחשב את ‪‬‬
‫‪C‬‬
‫‪  ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪Z 1   ‬‬
‫בפועל אנחנו מודדים את המרחק בין ‪ C  ‬מאחר ועקומת ההתפלגות סימטרית אפשר להתייחס‬
‫לתשובה בערכה המוחלט‪.‬‬
‫נחשב את ההסתברות לטעות זו בדוגמא שלנו (למרות שבדוגמא זו השגיאה האפשרית ‪ ‬שהרי דחינו את ‪.) H 0‬‬
‫‪  0.2913‬‬
‫‪1    0.7088‬‬
‫‪79.3  78.475‬‬
‫‪ 0.55‬‬
‫‪1.5‬‬
‫‪Z 1  ‬‬
‫ההסתברות לטעות מסוג שני בדוגמא שלנו היא ‪ 0.29‬שהיא הסתברות גבוהה מאוד‪.‬‬
‫‪37‬‬
‫התאמת גודל המדגם כדי להבטיח ‪‬‬
‫‪ ‬רצויות‪.‬‬
‫ניתן להגדיר מראש את הטעויות המבוקשות – ( ‪ , ‬רמת המובהקות תמיד מוגדרת מראש) ‪ ,‬אך ניתן להגדיר גם‬
‫את ‪ ‬ולחשב את גודל המדגם הדרוש במטרה לעמוד בטעויות אלו‪.‬‬
‫‪‬‬
‫הגדרת ‪ C‬לפי ‪H1‬‬
‫הגדרת ‪ C‬לפי‬
‫‪n‬‬
‫‪‬‬
‫‪H0‬‬
‫‪n‬‬
‫‪C    Z1   ‬‬
‫‪C  0  Z1  ‬‬
‫מאחר ו‪ C-‬שווה ניתן להשוות (שימו לב שה‪  -‬תמיד הפוך בין שתי ההגדרות)‬
‫‪‬‬
‫‪n‬‬
‫‪   Z 1  ‬‬
‫‪‬‬
‫‪n‬‬
‫‪ 0  Z 1  ‬‬
‫אם נבודד את ‪ n‬ממשוואה זו נקבל‪:‬‬
‫‪‬‬
‫‪ ( Z 1   Z 1  )2‬‬
‫‪n‬‬
‫‪(  0 ) 2‬‬
‫נבדוק מהו גודל המדגם הדרוש בדוגמא שלנו על מנת להבטיח ‪  0.05‬‬
‫‪  0.05‬‬
‫‪2‬‬
‫‪‬‬
‫‪12(1.65  1.65)‬‬
‫‪n‬‬
‫‪ 144‬‬
‫‪(79.3  76) 2‬‬
‫‪38‬‬
‫מבחן דו כווני דו זנבי ‪Two Tailed Test -‬‬
‫תרופה חדשה להורדת לחץ הדם חשודה כמשפיעה על תאבון החולה (הצורך את התרופה) ‪ ,‬לבדיקת השפעת‬
‫התרופה על משקל החולים נבדק מדגם מקרי של ‪ 36‬חולים אשר לקחו את התרופה במשך חודש ימים ונמצא כי‬
‫משקלם הממוצע לאחר תקופה זו היה ‪ 79.5‬ק"ג‪.‬‬
‫ידוע כי משקלה הממוצע של אוכלוסיית חולים זו הוא ‪ 82‬ק"ג עם סטית תקן של ‪ 5‬ק"ג‪.‬‬
‫בנו מבחן סטטיסטי ברמת מובהקות של ‪   0.05‬לבדיקת הטענה ‪.‬‬
‫א‪.‬‬
‫השערות‪:‬‬
‫‪  0‬‬
‫‪ -- H 0 :‬השערת האפס למבחן דו כווני‬
‫‪  82‬‬
‫‪ -- H 0 :‬לתרופה אין השפעה על משקלם של החולים‬
‫‪  0‬‬
‫‪ -- H1 :‬השערת המחקר למבחן דו כווני‬
‫‪  82‬‬
‫‪ -- H1 :‬התרופה החדשה משפיעה על משקל החולים‪.‬‬
‫ב‪.‬‬
‫‪  0.05‬‬
‫ג‪.‬‬
‫‪.1‬‬
‫השיטה הקלאסית‬
‫אנו עוסקים בבדיקת השערות דו כיוונית ‪ -‬ישנם שני גבולות ‪ ,‬עליון ותחתון ולכן רמת המובהקות‬
‫‪‬‬
‫‪‬‬
‫מעל הגבול העליון ו‪-‬‬
‫מתחלקת לשניים‬
‫‪2‬‬
‫‪2‬‬
‫מתחת לגבול התחתון‪.‬‬
‫‪H0‬‬
‫‪83.63‬‬
‫‪‬‬
‫בהשערה דו כיוונית‪:‬‬
‫‪ Z 0.975  1.96‬‬
‫‪n‬‬
‫‪ Z‬‬
‫‪0.05 ‬‬
‫‪ 1‬‬
‫‪‬‬
‫‪2 ‬‬
‫‪‬‬
‫‪82‬‬
‫‪‬‬
‫‪Z‬‬
‫‪‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪‬‬
‫‪80.36‬‬
‫‪C  0  Z ‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪5‬‬
‫‪5‬‬
‫‪‬‬
‫‪36 6‬‬
‫‪5‬‬
‫‪5‬‬
‫‪ C 2  82  1.96   83.63‬גבול עליון ‪ 80.36‬‬
‫‪6‬‬
‫‪6‬‬
‫‪79.5‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪ 0  82‬‬
‫‪ C1  82  1.96 ‬גבול תחתון‬
‫‪39‬‬
‫‪.2‬‬
‫רמות מובהקות‬
‫‪82  79.5‬‬
‫‪3‬‬
‫‪5‬‬
‫‪ ‬‬
‫‪6‬‬
‫‪  0.0026‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪ 0.0013‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪Z1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫'‪‬‬
‫‪2‬‬
‫‪ 0.9987‬‬
‫'‪‬‬
‫‪2‬‬
‫‪' ‬‬
‫‪ ' ‬‬
‫‪1‬‬
‫‪3‬‬
‫'‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1‬‬
‫)‪ ' (0.0026)   (0.05‬‬
‫הסיכוי לשגיאה בהתאם לתוצאות הוא ‪ , 0.26%‬לעומת הסיכוי לשגיאה המוגדר במחקר ‪. 5%‬‬
‫‪.3‬‬
‫ערכי ‪Z‬‬
‫‪Z 0.975  1.96‬‬
‫‪82  79.5‬‬
‫‪3‬‬
‫‪5‬‬
‫‪ ‬‬
‫‪6‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪Z STAT  Z‬‬
‫‪1‬‬
‫)‪Z STAT (3)  Z (1.96‬‬
‫החלטה ‪:‬‬
‫המשקל הממוצע שהתקבל במדגם הוא ‪ 79.5‬ק"ג ממוצע זה נמוך מהגבול התחתון – נמצא בתחום דחית השערת האפס‪.‬‬
‫נדחה את ‪ H 0‬ונקבל את השערת המחקר התרופה משפיעה על משקלם של החולים‪.‬‬
‫‪40‬‬
‫הטעות האפשרית‬
‫הטעות האפשרית היא טעות מסוג ראשון טעות ‪ ‬ההסתברות לטעות זו היא ‪.0.05‬‬
‫נחשב את ‪‬‬
‫הספציפית למדגם זה – רמת המובהקות הקטנה ביותר לדחיית ‪. H 0‬‬
‫‪  0.0026‬‬
‫‪ 0.9987‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪82  79.5‬‬
‫‪3‬‬
‫‪5‬‬
‫) (‬
‫‪6‬‬
‫‪‬‬
‫‪‬‬
‫‪Z‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪‬‬
‫רמת המובהקות הקטנה ביותר לדחיית ‪ H 0‬היא ‪  0.0026‬‬
‫‪‬‬
‫ההסתברות האמיתית (המדויקת) – רמת המובהקות המינימאלית ‪ ,‬לטעות מסוג ראשון היא ‪0.0026‬‬
‫הערך שקיבלנו קטן מ‪ C-‬המשמעות היא שיכולנו להשתמש ב‪ C-‬קטן יותר ועדיין להגיע לאותן מסקנות ולהחליט‬
‫את אותן החלטות‪.‬‬
‫באופן מדויק יותר יכולנו להקטין‪/‬להגדיל את ‪ C‬עד הנקודה בה ‪ C  ‬ולכן הסיכוי לשגיאה בהחלטה קטן‬
‫מהסיכוי המתוכנן לשגיאה ‪ ,‬זוהי נקודה חשובה אשר ראוי להדגיש אותה בתוצאות ובמסקנות ‪-‬‬
‫ככל שהסיכוי לשגיאה קטן יותר כך המסקנה וההחלטה שלנו מוצקה יותר ומבוססת יותר‪.‬‬
‫‪41‬‬
‫‪.1‬‬
‫מנהל השיווק בחברה מסוימת רצה לבדוק את יעילותו של בונוס ‪ ,‬כתמריץ לשיפור המכירות‪ .‬ידוע כי‬
‫בממוצע מתוך ‪ 50‬שיחות טלפון במשמרת מאתר טלפן ‪ 6‬לקוחות חדשים עם סטית תקן ‪ .3‬הבונוס הוצע ל‪16 -‬‬
‫טלפנים באופן אקראי ונמצא כי באותה משמרת איתר טלפן בממוצע מתוך ‪ 50‬שיחות ‪ 8‬לקוחות חדשים‪.‬‬
‫א‪.‬‬
‫בדקו את יעילות הבונוס ברמת מובהקות של ‪. 0.05‬‬
‫ב‪.‬‬
‫מהי ההסתברות "האמיתית" לשגיאה (רמת המובהקות המינימאלית) בהחלטה שהתקבלה ?‬
‫‪.2‬‬
‫מכונית אמריקאית מדגם ‪ AAA‬צורכת בממוצע ‪ 10‬ליטר דלק לכל ‪ 100‬ק"מ עם סטית תקן של ליטר‬
‫וחצי‪ .‬בודקים סוג דלק חדש ומעוניינים לבדוק את השפעתו על צריכת הדלק ‪ ,‬הבדיקה נעשית על ‪ 20‬מכוניות‬
‫מדגם ‪ AAA‬ונמצא כי בממוצע צרכה כל מכונית ‪ 8.9‬ליטר דלק לכל ‪ 100‬ק"מ‪.‬‬
‫ערוך מבחן סטטיסטי ובדוק את הטענה ברמת מובהקות של ‪. 0.04‬‬
‫‪.3‬‬
‫הכנסתה הממוצעת נטו בחודש של משפחה במדינה מסוימת היא ‪ , ₪ 1000‬מתוך‬
‫הכנסה זו חוסכת המשפחה בממוצע ‪ 10%‬עם סטית תקן של ‪( 31.26%‬מהסכום הנחסך)‪.‬‬
‫במשרד האוצר של אותה מדינה שוקלים להקטין את נטל המס כך שהמשכורת נטו הממוצעת תעלה ב‪, 8%-‬‬
‫ההחלטה אם לבצע את השינוי מותנית בכך שכתוצאה מהמהלך יגדל סכום החיסכון אצל התושבים ‪.‬‬
‫נבדק מדגם מקרי של ‪ 64‬משפחות אשר ניסו את שיטת המס החדשה‪.‬‬
‫בדוק האם יש להקטין את נטל המס ‪ ,‬ברמת מובהקות של ‪. 0.05‬‬
‫‪.4‬‬
‫במאמר פורסם שרמת המובהקות המינימאלית לדחיית השערת האפס היא ‪ .5%‬משמעות הדבר הוא‪:‬‬
‫א‪.‬‬
‫שהשערת האפס תידחה ברמת מובהקות של ‪ 5%‬בלבד‪.‬‬
‫ב‪.‬‬
‫שהשערת האפס תידחה בכל רמת מובהקות של ‪ 5%‬לפחות ותתקבל בכל רמת מובהקות הנמוכה מ‪.5% -‬‬
‫ג‪.‬‬
‫שהשערת האפס תתקבל בכל רמת מובהקות של ‪ 5%‬לפחות ותידחה בכל רמת מובהקות הנמוכה מ‪.5% -‬‬
‫ד‪.‬‬
‫שהשערת האפס תידחה רק ברמת מובהקות בין ‪ 5%‬ל‪.10% -‬‬
‫‪.5‬‬
‫סטטיסטיקאי החליט כי הוא משתמש תמיד ברמת מובהקות של ‪ .2.5%‬לטווח הארוך‪ ,‬הוא החליט נכונה‪:‬‬
‫א‪ .‬בערך ב ‪ 2.5%‬מהשערות האפס הנכונות שבדק‪.‬‬
‫ב‪ .‬בערך ב ‪ 97.5%‬מהשערות האפס הנכונות שבדק‪.‬‬
‫ג‪ .‬בערך ב ‪ 2.5%‬מבדיקות ההשערות שביצע‪.‬‬
‫ד‪ .‬בערך ב ‪ 97.5%‬מבדיקות ההשערות שביצע‪.‬‬
‫‪.6‬‬
‫במבחן שנערך נמצא כי רמת המובהקות המינימאלית לדחיית ‪ H0‬היא ‪ .5%‬המשמעות היא ‪:‬‬
‫א‪.‬‬
‫ניתן לדחות את ‪ H0‬ברמת מובהקות של ‪.3%‬‬
‫ג‪.‬‬
‫לא ניתן לדחות את ‪ H0‬ברמת מובהקות של ‪.3%‬‬
‫ד‪.‬‬
‫לא ניתן לדחות את ‪ H0‬ברמת מובהקות של ‪ ,10%‬אך ניתן לדחות את ‪ H0‬ברמת מובהקות של ‪.5%‬‬
‫ב‪.‬‬
‫‪42‬‬
‫פתרונות לתרגילים‬
‫‪.1‬‬
‫מנהל השיווק רוצה לבדוק את יעילותו של הבונוס לשיפור המכירות – השערה חד כיוונית כלפי מעלה‪.‬‬
‫מבחן סטטיסטי‬
‫‪6‬‬
‫‪H0 :‬‬
‫הבונוס אינו משפר את רמת המכירות‬
‫‪ 6‬‬
‫‪H1 :‬‬
‫הבונוס גרום לשיפור ברמת המכירות‬
‫א‪.‬‬
‫השערות ‪:‬‬
‫ב‪.‬‬
‫רמת מובהקות‬
‫ג‪.‬‬
‫תחומי קבלה ודחית ‪H 0‬‬
‫‪  0.05‬‬
‫‪‬‬
‫השערה חד כיוונית ‪-‬‬
‫‪n‬‬
‫‪Z1   Z10.05  Z0.95  1.65‬‬
‫‪3‬‬
‫‪ 0.75‬‬
‫‪16‬‬
‫‪C  0  Z 1  ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪0  6‬‬
‫‪C  6  1.65  0.75  7.24‬‬
‫השיטה הקלאסית – גבולות קריטיים‬
‫‪H0‬‬
‫נדחה את השערת האפס‪.‬‬
‫‪8‬‬
‫ד‪.‬‬
‫‪7.24‬‬
‫‪6‬‬
‫נדחה את ‪ H 0‬ונקבל את השערת המחקר – הבונוס משפר את רמת המכירות וגורם להעלאת ממוצע המכירות‪.‬‬
‫ה‪.‬‬
‫השגיאה האפשרית ‪:‬‬
‫דחינו את השערת האפס ‪ ,‬השגיאה האפשרית ‪ -‬טעינו בהחלטה ‪ -‬דחינו את השערת האפס בזמן שהיא נכונה‪.‬‬
‫שגיאה מסוג ‪‬‬
‫‪ ,   0.05‬ברמת הגדרת המחקר יש סיכוי של ‪ 5%‬שטעינו‪.‬‬
‫‪43‬‬
‫השוואת הסתברויות – רמות מובהקות‬
‫‪  0‬‬
‫‪  ‬‬
‫‪Z1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪ '  0.0039‬‬
‫‪1   '  0.9961‬‬
‫‪86‬‬
‫‪ 2.67‬‬
‫‪0.75‬‬
‫‪Z1 ' ‬‬
‫)‪ ' (0.0038)   (0.05‬‬
‫הסיכוי לשגיאה בהתאם לתוצאות המחקר הוא ‪ , 0.38%‬הסיכוי לשגיאה המוגדר במחקר ‪. 5%‬‬
‫השוואת ערכי ‪Z‬‬
‫‪Z 0.95  1.65‬‬
‫‪86‬‬
‫‪ 2.67‬‬
‫‪0.75‬‬
‫‪Z STAT ‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪Z STAT  Z1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫)‪Z STAT (2.67)  Z (1.65‬‬
‫‪.1‬ב‬
‫ההסתברות האמיתית לשגיאה היא רמת המובהקות הקטנה ביותר (המינימאלית) בה עדיין נקבל את אותן‬
‫מסקנות‪ .‬בניסוח יותר סטטיסטי ‪ -‬ההסתברות לקבל ערך גבוה מהערך שקיבלנו במדגם ‪ ,‬ערך גבוה מ– ‪.8‬‬
‫נשווה את ‪ C‬לממוצע המדגם ‪ ,‬ונחשב את ההסתברות באמצעות טבלת ההתפלגות הנורמאלית ‪.‬‬
‫כלומר ניתן להזיז את ‪ C‬עד ‪ ‬ולא להסתפק ב‪. 7.24-‬‬
‫‪  0‬‬
‫‪‬‬
‫‪Z 1  ‬‬
‫‪n‬‬
‫‪86‬‬
‫‪‬‬
‫‪0.75‬‬
‫‪ 2.67‬‬
‫‪  0.0039‬‬
‫‪Z 1 ‬‬
‫‪Z 1 ‬‬
‫‪1    0.9961‬‬
‫ההסתברות "האמיתית" לשגיאה היא ‪.0.0039‬‬
‫סיכוי של ‪ 0.39%‬לשגיאה במסקנות‪.‬‬
‫‪44‬‬
‫‪.2‬‬
‫מעוניינים לבדוק את השפעת הדלק החדש – כוון לא ברור – מבחן דו כווני‬
‫א‪.‬‬
‫‪  10‬‬
‫‪H0 :‬‬
‫הדלק החדש אינו משפיע על צריכת הדלק‬
‫‪  10‬‬
‫‪H1 :‬‬
‫לדלק החדש יש השפעה על צריכת הדלק‬
‫ב‪.‬‬
‫‪  0.04‬‬
‫ג‪.‬‬
‫‪‬‬
‫‪n‬‬
‫‪ Z10.02  Z0.98  2.05‬‬
‫‪1.5‬‬
‫‪ 10.687‬‬
‫‪20‬‬
‫‪‬‬
‫‪‬‬
‫‪C1  0  Z‬‬
‫‪1 ‬‬
‫‪ 2‬‬
‫‪1.5‬‬
‫‪20‬‬
‫‪Z‬‬
‫‪‬‬
‫‪1 ‬‬
‫‪ 2‬‬
‫‪C2  10  2.05 ‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪1 ‬‬
‫‪ 2‬‬
‫‪0  10‬‬
‫‪n‬‬
‫‪1.5‬‬
‫‪ 9.31‬‬
‫‪20‬‬
‫‪‬‬
‫‪C2  0  Z‬‬
‫‪C1  10  2.05 ‬‬
‫‪H0‬‬
‫‪10.69‬‬
‫הערך הנבדק נמצא בתחום דחיית השערת האפס‬
‫ד‪.‬‬
‫‪10‬‬
‫‪9.31‬‬
‫‪8.9‬‬
‫נדחה את השערת האפס ונקבל את השערת המחקר – לדלק החדש יש השפעה על צריכת הדלק ‪,‬‬
‫הדלק החדש גורם לירידה בצריכת הדלק‪.‬‬
‫ה‪.‬‬
‫דחינו את השערת האפס ‪ ,‬השגיאה האפשרית ‪ -‬דחינו את השערת האפס בזמן שהיא נכונה ‪ -‬שגיאה מסוג ראשון ‪-‬‬
‫‪ ,   0.04 , ‬ברמת הגדרת המחקר יש סיכוי של ‪ 4%‬לטעות‪.‬‬
‫ההסתברות האמיתית לשגיאה היא רמת המובהקות הקטנה ביותר (המינימאלית) בה עדיין נקבל את אותן מסקנות‬
‫(סעיף ג – רמות מובהקות) במילים אחרות ההסתברות הקטנה ביותר בה ניתן לקבוע את ‪ C‬ועדיין להישאר עם אותן‬
‫מסקנות לכן ‪  C‬‬
‫‪. C  8.9‬‬
‫‪ '  0.001‬‬
‫הסיכוי האמיתי לשגיאה הוא ‪1%‬‬
‫‪8.9  10‬‬
‫‪ 3.27‬‬
‫‪‬‬
‫‪1‬‬
‫‪ 1.5 ‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪ 20 ‬‬
‫'‪‬‬
‫'‪‬‬
‫‪1   0.9995‬‬
‫‪ 0.0005‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪Z‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪ 3.27‬‬
‫‪‬‬
‫‪2‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪Z‬‬
‫‪45‬‬
‫בדיקה ע"י השוואת הסתברויות – רמות מובהקות‬
‫‪8.9  10‬‬
‫‪ 3.27‬‬
‫‪ 1.5 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 20 ‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z‬‬
‫'‪‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪ '  0.001‬‬
‫‪ 0.0005‬‬
‫‪' ‬‬
‫‪2‬‬
‫‪ 0.9995‬‬
‫‪2‬‬
‫'‪‬‬
‫‪1‬‬
‫'‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪ 3.27‬‬
‫‪1‬‬
‫'‪‬‬
‫‪2‬‬
‫‪ ' ‬‬
‫‪1‬‬
‫‪Z‬‬
‫)‪  ' (0.001)   (0.04‬הסיכוי לשגיאה בהתאם לתוצאות הוא ‪ , 0.1%‬לעומת הסיכוי לשגיאה המוגדר במחקר ‪. 5%‬‬
‫בדיקה ע"י השוואת ערכי ‪Z‬‬
‫‪8.9  10‬‬
‫‪ 3.27‬‬
‫‪ 1.5 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 20 ‬‬
‫‪Z 0.98  2.05‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫)‪Z STAT (3.27)  Z (2.05‬‬
‫נעבד את הנתונים ‪  31.26 -‬‬
‫‪.3‬‬
‫‪0  100‬‬
‫השכר הממוצע כתוצאה מהשינוי ‪₪ 1080‬‬
‫‪.   108‬‬
‫מבחן חד כווני כלפי מעלה‪:‬‬
‫א‪.‬‬
‫השערות ‪  100 :‬‬
‫‪H0 :‬‬
‫סכום החיסכון לא ישתנה‬
‫‪  100‬‬
‫‪H1 :‬‬
‫סכום החיסכון יגדל‬
‫ב‪.‬‬
‫רמת מובהקות ‪  0.05‬‬
‫ג‪.‬‬
‫‪Z1   Z10.05  Z0.95  1.65‬‬
‫‪‬‬
‫‪n‬‬
‫‪C  0  Z 1  ‬‬
‫‪31.26‬‬
‫‪ 3.9‬‬
‫‪64‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪0  100‬‬
‫‪C  100  1.65  3.9  106.43‬‬
‫‪46‬‬
‫‪H0‬‬
‫‪100‬‬
‫‪106.43 108‬‬
‫הערך הנבדק – ‪ 108‬נמצא בתחום דחיית השערת האפס – נדחה את השערת האפס‬
‫ד‪.‬‬
‫החלטת החוקר ‪:‬‬
‫הערך הנבדק ‪ ‬גבוה מהגבול הקריטי ‪ -‬נדחה את השערת האפס ונקבל את השערת המחקר – סכום החיסכון יעלה‬
‫כתוצאה מהשינוי במס ולכן ניתן לערוך את השינוי‬
‫ה‪.‬‬
‫דחינו את השערת האפס ‪ ,‬השגיאה האפשרית ‪ -‬דחינו את השערת האפס בזמן שהיא נכונה ‪,‬‬
‫שגיאה מסוג ראשון ‪ -‬‬
‫‪ ,   0.05‬בהתאם להגדרת המחקר הסיכוי לשגיאה ‪. 5%‬‬
‫ההסתברות האמיתית לשגיאה ‪ -‬רמת המובהקות הקטנה ביותר (המינימאלית) בה עדיין נקבל את אותן מסקנות‬
‫כלומר ההסתברות לקבל ערך גבוה מהערך שקיבלנו במדגם – ‪( .108‬סעיף ג' – רמות מובהקות)‬
‫‪108  100‬‬
‫‪ 2.05‬‬
‫‪3.9‬‬
‫‪1    0.9798‬‬
‫‪  0.0202‬‬
‫‪Z 1  ‬‬
‫נשווה את ‪ C‬לממוצע המדגם ‪ ,‬ונחשב את ההסתברות באמצעות‬
‫טבלת ההתפלגות הנורמאלית ‪ ,‬ההסתברות לטעות בהחלטה היא‬
‫‪ 0.0202‬כלומר סיכוי של ‪ 2.02%‬לשגיאה‪.‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪Z1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪ '  0.0202‬‬
‫‪1   '  0.9798‬‬
‫‪108  100‬‬
‫‪ 2.05‬‬
‫‪3.9‬‬
‫‪Z1 ' ‬‬
‫)‪ ' (0.0202)   (0.05‬‬
‫הסיכוי לשגיאה בהתאם לתוצאות הוא ‪ , 0.38%‬הסיכוי לשגיאה המוגדר במחקר ‪. 5%‬‬
‫‪47‬‬
‫)‪Z STAT (2.05)  Z (1.65‬‬
‫‪.4‬‬
‫רמת המובהקות המינימאלית היא רמת המובהקות הקטנה ביותר בה עדיין נדחה את השערת האפס ‪,‬‬
‫הגבול הנמוך ביותר לדחיית השערת האפס ‪ -‬ברמת מובהקות קטנה ממנה נקבל את השערת האפס ‪-‬‬
‫התשובה הנכונה היא ב ‪.‬‬
‫‪.5‬‬
‫כאשר סטטיסטיקאי משתמש ברמת מובהקות מסוימת המשמעות היא שבתהליך בדיקת ההשערות ‪,‬‬
‫הסיכוי לשגיאה הוא אותה רמת מובהקות לכן אם החליט על רמת מובהקות של ‪ 2.5%‬המשמעות היא שבתהליך‬
‫בדיקת ההשערות זהו הסיכוי לשגיאה לכן הסיכוי שהחליט נכון הוא ‪ - 97.5%‬תשובה נכונה ד'‪.‬‬
‫‪.6‬‬
‫‪' ‬‬
‫דוחים את השערת האפס ‪  '   ,‬מקבלים את השערת האפס‪ .‬תשובה נכונה ג'‪.‬‬
‫‪48‬‬
‫הסקה סטטיסטית על תוחלת של אוכלוסייה כאשר השונות לא ידועה‬
‫עסקנו בהסקה סטטיסטית על הפרמטר (ממוצע האוכלוסייה ‪ ) ‬כאשר השונות‪/‬סטיית התקן באוכלוסייה ידועה‪.‬‬
‫במציאות מחקים נערכים על מדגמים כאשר בד"כ נתוני האוכלוסיות שלהם אינם ידועים – לא בכל תחום ישנם‬
‫נתונים על האוכלוסייה – ממוצע של תכונה מסוימת וסטית התקן של אותה תכונה‪.‬‬
‫ברב המקרים תהליך הסקת המסקנות ממדגם לאוכלוסייה נעשה כאשר נתוני האוכלוסייה אינם ידועים‪.‬‬
‫אמידת השונות‬
‫כאשר נבדוק באוכלוסייה בה הנתונים ידועים את הקשר בין סטית התקן במדגם – ‪ S‬לבין סטית התקן באוכלוסייה‬
‫‪‬‬
‫‪ ,‬נוכל לראות כי סטית התקן במדגם איננה אומדן טוב לסטיית התקן באוכלוסייה ‪ ,‬זאת מאחר וקיימת‬
‫הטיה‪/‬סטייה שיטתית בין ‪ S‬ל‪ .  -‬ההטיה היא כלפי מטה ‪ S -‬קטן מ‪ -‬‬
‫)‪(n  1‬‬
‫באוכלוסיה פי גודל קבוע ‪ ,‬השווה ל‪-‬‬
‫‪n‬‬
‫שונות המדגם קטנה מהשונות‬
‫‪:‬‬
‫‪(n  1) 2‬‬
‫‪‬‬
‫‪n‬‬
‫‪ S 2 ‬כאשר ‪ n‬הוא גודל המדגם‪.‬‬
‫‪n 1‬‬
‫ככל שהמדגם גדול יותר‬
‫‪n‬‬
‫שואף לאחד ולכן ‪ S‬שואף ל‪.  -‬‬
‫נבצע מספר פעולות מתמטיות כמתואר להלן ונגיע לכך שסטית התקן של המדגם מחולקת‬
‫ב‪ n-1 -‬במקום ‪ n‬תבצע את התיקון הדרוש בהטיה בין סטית התקן במדגם‬
‫לאוכלוסייה וכך נוכל באמצעות המדגם לקבל אומדן לסטייה התקן באוכלוסייה ‪.‬‬
‫‪‬‬
‫את אומדן סטית התקן באוכלוסייה נגדיר באות ‪S‬‬
‫‪n‬‬
‫‪ 2‬‬
‫‪n 1‬‬
‫‪S2 ‬‬
‫‪(X i  X )2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪S‬‬
‫‪2‬‬
‫‪‬‬
‫‪n‬‬
‫‪(X i  X )2‬‬
‫‪‬‬
‫‪‬‬
‫‪n 1‬‬
‫‪2‬‬
‫‪S‬‬
‫‪n‬‬
‫‪n 1‬‬
‫‪(X i  X )2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫חישוב סטית התקן וחלוקה ב‪ n-1 -‬במקום ‪ n‬מבצע למעשה את תיקון הסטייה ולכן מקבלים אומדן ל‪ -‬‬
‫‪49‬‬
‫התפלגות ‪t‬‬
‫‪Student t distribution‬‬
‫כאשר עסקנו בהסקה סטטיסטית וסטית התקן באוכלוסייה הייתה ידועה ‪ ,‬הנחנו בהתאם למשפט הגבול המרכזי כי‬
‫התפלגות הדגימה של הממוצעים שואפת להתפלגות נורמאלית‪.‬‬
‫מנקודת מוצא זו עם טבלת ההתפלגות הנורמאלית והשתמשנו בציון התקן ‪. Z‬‬
‫‪  0‬‬
‫‪‬‬
‫)‬
‫‪Z‬‬
‫(‬
‫‪n‬‬
‫מאחר ואנו עובדים עם אומדן לסטיית התקן באוכלוסייה – סטית התקן באוכלוסייה אינה ידועה‬
‫‪‬‬
‫הרי שערך הביטוי משתנה ‪ ,‬מאחר והמכנה שלו משתנה ( ‪ S‬משתנה ביחס ל‪ )n -‬ולכן נגדיר סטטיסטי חדש ‪. t‬‬
‫‪  0‬‬
‫‪‬‬
‫‪t‬‬
‫‪S‬‬
‫(‬
‫)‬
‫‪n‬‬
‫התפלגות ‪ t‬פותחה ע"י ‪ William Gosset‬התפלגות ‪ t‬היא התפלגות סימטרית ‪ ,‬בצורת פעמון‪ ,‬דומה‬
‫להתפלגות נורמאלית סטנדרטית‪ ,‬אך שטוחה יותר ‪ ,‬להתפלגות ‪ t‬פרמטר נוסף הנקרא דרגת החופש ‪,‬‬
‫‪ Degrees of freedom‬דרגות החופש משנות את צורת ההתפלגות ‪ -‬ככל שדרגת החופש עולה ההתפלגות‬
‫מתקרבת לצורת התפלגות נורמאלית ‪.‬‬
‫תיאורטית בדרגת חופש אין סופית שתי ההתפלגויות זהות‪.‬‬
‫מעשית עבור דרגת חופש גדולה מ ‪ 120 -‬ההתפלגויות למעשה זהות‪.‬‬
‫מדובר במשפחה של התפלגויות ‪ ,‬עבור כל דרגת חופש יש התפלגות שונה ועם עליה בדרגת החופש ההתפלגות‬
‫שואפת להתפלגות נורמאלית‪.‬‬
‫דרגת החופש מתייחסת לגודל המדגם פחות אחד ‪df=n-1‬‬
‫‪df=8‬‬
‫‪df=6‬‬
‫‪‬‬
‫‪ ‬הוא גודל קבוע כאשר הוא נתון ‪ ,‬לעומתו ‪ S‬משתנה ממדגם למדגם ‪ ,‬מאחר והוא תלוי בגודל המדגם ‪.‬‬
‫בחישוב ‪ Z‬המכנה הוא קבוע ואילו בחישוב ‪ t‬המכנה משתנה ‪ ,‬שינוי זה הולך וקטן ככל שהמדגם גדול יותר‬
‫(מדגם שגודלו ‪ n=10‬מושפע יותר כאשר מחסירים ממנו ‪ , 1‬מאשר מדגם שגודלו ‪)100‬‬
‫‪50‬‬
‫‪‬‬
‫‪ ‬הוא גודל קבוע כאשר הוא נתון ‪ ,‬לעומתו ‪ S‬משתנה ממדגם למדגם ‪ ,‬מאחר והוא תלוי בגודל המדגם כלומר‬
‫שבחישוב ‪ Z‬המכנה הוא קבוע ואילו בחישוב ‪ t‬המכנה משתנה ‪ ,‬שינוי זה הולך וקטן ככל שהמדגם גדול יותר‬
‫(מדגם שגודלו ‪ n=10‬מושפע יותר כאשר מחסירים ממנו ‪ , 1‬מאשר מדגם שגודלו ‪)100‬‬
‫כתוצאה מכך ‪ ,‬התפלגות ‪ t‬אינה התפלגות נורמאלית סטנדרטית ‪ ,‬התפלגות ‪ t‬היא התפלגות ידועה ‪ ,‬התפלגות‬
‫סימטרית ‪ ,‬שטוחה יותר מהתפלגות נורמאלית – ככל שהמדגם גדל כך ‪ n-1‬שהוא בעצם התיקון בהטיה בין סטית‬
‫‪‬‬
‫התקן במדגם לסטייה באוכלוסייה נעשה זניח ולכן‬
‫‪ S‬שואף ל‪  -‬והתפלגות ‪ t‬שואפת להתפלגות נורמאלית‪.‬‬
‫התפלגות ‪ t‬תלויה ב‪"-‬דרגות חופש" ‪ , df - Degrees of freedom‬דרגות החופש הם ‪ n-1‬ככל שמספר דרגות‬
‫החופש גדל ערכי ‪ t‬מתקרבים לערכי ‪ – Z‬ככל שהמדגם גדול יותר – (יש יותר דרגות חופש) ‪ t‬מתקרב ל‪. Z-‬‬
‫כאשר מספר דרגות החופש ‪ df  120‬משתמשים בלוח התפלגות ‪. t‬‬
‫כאשר ‪ df >120‬נשתמש בהתפלגות ‪ – Z‬התפלגות נורמאלית‪.‬‬
‫דוגמא לחישוב בטבלת ‪t‬‬
‫מצאו את ) ‪  0.05 tn 1,(1‬‬
‫‪n  20‬‬
‫העמודה השמאלית בטבלה מציינת ‪ df‬דרגות חופש‪ ,‬העמודות ‪1   -‬‬
‫‪1   =0.95‬‬
‫‪df=19‬‬
‫‪t19,0.95  1.729‬‬
‫‪51‬‬
‫כאשר סטית התקן ‪ ‬באוכלוסייה לא ידועה‬
‫רווח בר סמך ל‪ -‬‬
‫‪‬‬
‫‪‬‬
‫‪S‬‬
‫‪S‬‬
‫‪X t‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪X‬‬
‫‪‬‬
‫‪t‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫) ‪( n 1)(1‬‬
‫) ‪( n 1)(1‬‬
‫‪n‬‬
‫‪n‬‬
‫‪2‬‬
‫‪2‬‬
‫במטרה לאמוד את ממוצע האיחורים של תלמידי בית ספר מסוים נלקח מדגם מקרי של ‪ 10‬תלמידים‬
‫להלן נתוני האיחורים בימים ‪1,4,3,1,5,10,11,10,9,3 :‬‬
‫‪. 0.95‬‬
‫חשבו רווח בר סמך לממוצע האיחורים בבית הספר ברמת סמך של‬
‫נכניס את הנתונים לטבלה ‪ ,‬נחשב את ממוצע האיחורים ונאמוד את סטית התקן לאיחורים בביה"ס‪:‬‬
‫ניתן לבצע את החישובים באמצעות המחשבון – עיין נספח לשימוש במחשבון‪.‬‬
‫‪2‬‬
‫) ‪(Xi  X‬‬
‫‪22.09‬‬
‫‪22.09‬‬
‫‪7.29‬‬
‫‪7.29‬‬
‫‪2.89‬‬
‫‪0.49‬‬
‫‪10.89‬‬
‫‪18.49‬‬
‫‪18.49‬‬
‫‪28.09‬‬
‫‪138.1‬‬
‫) ‪(Xi  X‬‬
‫‪Xi‬‬
‫מס נבדק ‪i‬‬
‫‪4.7‬‬‫‪4.7‬‬‫‪2.7‬‬‫‪2.7‬‬‫‪1.7‬‬‫‪0.7‬‬‫‪3.3‬‬
‫‪4.3‬‬
‫‪4.3‬‬
‫‪5.3‬‬
‫‪1‬‬
‫‪1‬‬
‫‪3‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫‪9‬‬
‫‪10‬‬
‫‪10‬‬
‫‪11‬‬
‫‪57‬‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫‪6‬‬
‫‪7‬‬
‫‪8‬‬
‫‪9‬‬
‫‪10‬‬
‫סה"כ‬
‫‪‬‬
‫‪138.1‬‬
‫‪ 15.3444‬‬
‫‪9‬‬
‫‪S  15.344  3.9171‬‬
‫‪ 0.975‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪S ‬‬
‫‪ t9,0.975 2.262‬‬
‫‪df  9‬‬
‫‪‬‬
‫‪t‬‬
‫‪0.05‬‬
‫‪(101)(1‬‬
‫)‬
‫‪2‬‬
‫‪‬‬
‫‪S‬‬
‫‪X t‬‬
‫‪ ‬‬
‫) ‪( n 1)(1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪3.9171‬‬
‫‪‬‬
‫‪2‬‬
‫‪57‬‬
‫‪X ‬‬
‫‪ 5.7‬‬
‫‪10‬‬
‫‪‬‬
‫‪S‬‬
‫‪X t‬‬
‫‪ ‬‬
‫) ‪( n 1)(1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪   5.7  2.262 ‬‬
‫‪10‬‬
‫‪8.501‬‬
‫‪3.9171‬‬
‫‪5.7  2.262 ‬‬
‫‪10‬‬
‫‪  ‬‬
‫‪2.898‬‬
‫‪52‬‬
‫בדיקת השערות – שונות לא ידועה‬
‫בדיקת השערות כאשר סטית התקן באוכלוסיה ‪ ‬אינה ידועה ‪ ,‬זהה לתהליך שהכרנו בפרק על בדיקת השערות ‪,‬‬
‫‪‬‬
‫ע"פ נתוני המדגם יש לחשב אומדן ל‪ -  -‬את הסטטיסטי ‪ S‬ולהשתמש בהתפלגות ‪ t‬במקום התפלגות נורמאלית‪.‬‬
‫חוקר בדק את הטענה כי אכילת ‪ 100‬גר' שוקולד לפני בחינה משפרת את הריכוז ומכאן את הישגי הנבחן‪.‬‬
‫לצורך בדיקת הטענה נלקח מדגם מקרי של ‪ 16‬סטודנטים בקורס בסטטיסטיקה ‪ ,‬ידוע כי ממוצע הציונים בקורס זה‬
‫הוא ‪ 70.6‬בדוק את טענת החוקר ברמת מובהקות ‪  0.01‬‬
‫ציוני הסטודנטים במדגם ‪70,74,78,78,80,80,45,90,75,75,65,68,70,74,76,80 :‬‬
‫‪2‬‬
‫‪( X i  X )  Fi‬‬
‫‪819.39‬‬
‫‪74.39‬‬
‫‪31.64‬‬
‫‪26.28‬‬
‫‪0.2812‬‬
‫‪3.7812‬‬
‫‪5.6406‬‬
‫‪38.28‬‬
‫‪121.92‬‬
‫‪268.14‬‬
‫‪1389.743‬‬
‫‪2‬‬
‫) ‪(Xi  X‬‬
‫) ‪(Xi  X‬‬
‫‪X i  Fi‬‬
‫‪Fi‬‬
‫‪Xi‬‬
‫‪819.39‬‬
‫‪74.39‬‬
‫‪31.64‬‬
‫‪13.14‬‬
‫‪0.1406‬‬
‫‪1.8906‬‬
‫‪5.6406‬‬
‫‪19.14‬‬
‫‪40.64‬‬
‫‪268.14‬‬
‫‪1274.15‬‬
‫‪28.625‬‬‫‪8.625‬‬‫‪5.625‬‬‫‪3.625‬‬‫‪0.375‬‬
‫‪1.375‬‬
‫‪2.375‬‬
‫‪4.375‬‬
‫‪6.375‬‬
‫‪16.375‬‬
‫‪45‬‬
‫‪65‬‬
‫‪68‬‬
‫‪140‬‬
‫‪148‬‬
‫‪150‬‬
‫‪76‬‬
‫‪156‬‬
‫‪240‬‬
‫‪70‬‬
‫‪1178‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪1‬‬
‫‪16‬‬
‫‪45‬‬
‫‪65‬‬
‫‪68‬‬
‫‪70‬‬
‫‪74‬‬
‫‪75‬‬
‫‪76‬‬
‫‪78‬‬
‫‪80‬‬
‫‪90‬‬
‫סה"כ‬
‫נחשב את הממוצע ‪ ,‬את ‪ t‬ונאמוד את סטית התקן‪.‬‬
‫‪t(161)(10.01)  t15,0.99  2.602‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫‪1389.743‬‬
‫‪ 9.625‬‬
‫‪15‬‬
‫‪‬‬
‫‪S‬‬
‫‪1178‬‬
‫‪ 73.625‬‬
‫‪16‬‬
‫‪X ‬‬
‫‪  70.6‬‬
‫‪ H 0 :‬לאכילת שוקולד לפני מבחן אין השפעה על ציוני הסטודנטים‬
‫‪  70.6‬‬
‫‪ H1 :‬אכילת שוקולד לפני מבחן משפרת את ציוני הסטודנטים‬
‫רמת מובהקות‪  0.01 :‬‬
‫‪53‬‬
‫ג‪.‬‬
‫תחומי דחייה וקבלה להשערת האפס‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪C   0  t ( n 1), (1 ) ‬‬
‫‪9.625‬‬
‫‪ 76.86‬‬
‫‪16‬‬
‫‪C  70.6  2.602 ‬‬
‫‪H0‬‬
‫ד‪.‬‬
‫‪73.62 76.86‬‬
‫‪70.6‬‬
‫החלטה‬
‫ממוצע הציונים החדש הוא ‪ 73.625‬והוא קטן מהגבול הקריטי שהוא ‪ - 76.86‬נמצא בתחום קבלת השערת האפס ‪,‬‬
‫נקבל את השערת האפס – לאכילת שוקולד לפני מבחן אין השפעה על ציוני הסטודנטים‪.‬‬
‫ה‪.‬‬
‫טעות אפשרית‬
‫קיבלנו את ‪ H 0‬הטעות האפשרית ‪ -‬קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה‪.‬‬
‫טעות מסוג שני ‪. ‬‬
‫‪76.86  73.625‬‬
‫‪ 1.344‬‬
‫‪2.406‬‬
‫‪‬‬
‫‪C‬‬
‫‪‬‬
‫)‬
‫‪S‬‬
‫‪t15,(1  ) ‬‬
‫(‬
‫‪n‬‬
‫ברמה של ‪ 15‬דרגות חופש הערך ‪ 1.344‬נמצא מתאים ל‪1    0.9 -‬‬
‫‪ ,   0.1‬כלומר הסיכוי לשגיאה‬
‫במסקנה הוא ‪10%‬‬
‫‪54‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.1   '  0.25‬‬
‫‪df  15 ‬‬
‫‪ 0.75  1   '  0.9‬‬
‫‪  ' (01‬מקבלים את השערת האפס‪.‬‬
‫)‪ 0.25)   (0.01‬‬
‫‪73.62  70.6‬‬
‫‪ 1.255‬‬
‫‪9.625‬‬
‫(‬
‫)‬
‫‪16‬‬
‫‪t15,1 ' ‬‬
‫בדיקה ע"י השוואת ערכי ‪t‬‬
‫‪t15,0.99  2.602‬‬
‫‪73.62  70.6‬‬
‫‪ 1.255‬‬
‫‪9.625‬‬
‫(‬
‫)‬
‫‪16‬‬
‫‪tSTAT ‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪tSTAT  t( n 1)(1 ') ‬‬
‫ערך ‪ t‬הנבדק נקרא גם ‪ - t Critical‬ערך המוביל אותנו לגבול הקריטי‬
‫‪ tSTAT  tCRITICAL‬דוחים את השערת האפס‬
‫)‪tSTAT (1.255)  t (2.602‬‬
‫‪tSTAT  tCRITICAL‬‬
‫‪55‬‬
‫חוקר מבקש למדוד את ממוצע משך הנישואים אצל זוגות גרושים (עד הגירושין) ‪ ,‬החוקר דגם מדגם‬
‫‪1.‬‬
‫מקרי של ‪ 10‬זוגות ‪ ,‬להלן התוצאות (בשנים)‪,7 , 2 , 1 , 15 , 25 , 3 , 7 , 20 , 8 , 2 :‬‬
‫א‪.‬‬
‫בנו רווח בר סמך ברמת סמך של ‪ 0.98‬לפרמטר ‪ - ‬ממוצע אורך חיי הנשואים אצל גרושים‪.‬‬
‫ב‪.‬‬
‫בדקו את הטענה (ברמת מובהקות של ‪ ) 0.05‬כי במדינה שכנה משך הנישואים ארוך יותר ‪ ,‬אם נתון כי‬
‫משך הנישואים הממוצע במדינה זו הוא ‪ 11.25‬שנים‪.‬‬
‫בדקו את הטענה ‪ -‬יש הבדל בין משך חיי הנישואים במדינות העולם השלישי לבין משך חיי הנישואים‬
‫ג‪.‬‬
‫במדינה זו אם נתון כי ממוצע משך הנישואים במדינות העולם השלישי הוא שנתיים וחצי‪  0.01 .‬‬
‫במטרה לבדוק את העלות הממוצעת של "סל קניות לחג" ‪ ,‬נבדק דגם מקרי של ‪ 10‬קונים ‪ ,‬להלן עלויות‬
‫‪.2‬‬
‫הקניה של כל קונה ‪. 485 , 540 , 420 , 630 , 480 , 550 , 530 , 520 , 475 , 450 :‬‬
‫א‪.‬‬
‫בנו רווח בר סמך לעלות הממוצעת של "סל קניות לחג" ברמת סמך של ‪.0.95‬‬
‫ב‪.‬‬
‫ע"פ נתוני השנה הקודמת ‪ ,‬עלות ממוצעת של "סל קניות לחג" הייתה ‪ , ₪ 420‬בדוק את הטענה כי השנה‬
‫ההוצאה הממוצעת למשפחה לחג גבוהה מההוצאה בשנה שעברה ברמת סמך של ‪.0.95‬‬
‫בדוק את הטענה כי השנה ההוצאה הממוצעת לחג למשפחה גבוהה מההוצאה בשנה שעברה ברמת סמך‬
‫ג‪.‬‬
‫של ‪ 0.99‬אם על פי נתוני השנה הקודמת סל הקניות הממוצע היה ‪.₪ 485‬‬
‫בישוב א נבדק מדגם של ‪ 20‬ילדים בגילאי ‪ 8-10‬ונמצא כי רמת המשכל שלהם – ‪ IQ‬היא בממוצע ‪ 112‬עם‬
‫‪.3‬‬
‫‪‬‬
‫שונות ‪( 100‬שימו לב – שורש של שונות המדגם ‪ -‬סטית התקן של המדגם ‪ S ‬אינו אומדן ל‪.  -‬‬
‫א‪.‬‬
‫בנה רווח בר סמך למנת המשכל הממוצע של הילדים בגיל זה באותה ישוב ברמת סמך של ‪. 0.95‬‬
‫ב‪.‬‬
‫בדוק את הטענה כי מנת המשכל של הילדים בישוב א גבוהה ממנת המשכל של הילדים בגיל זה בכל‬
‫המדינה העומדת על ‪ , 105‬ברמת מובהקות של ‪.0.05‬‬
‫בישוב ב ידוע כי מנת המשכל של הילדים גבוהה ב‪ 10%-‬ממנת המשכל הארצית הממוצעת ‪ ,‬בדקו את‬
‫ג‪.‬‬
‫הטענה כי מנת המשכל בישוב ב גבוהה ממנת המשכל בישוב א ‪ ,‬ברמת מובהקות של ‪. 0.05‬‬
‫אם נתון כי מנת המשכל הממוצעת של ילדי ישוב ב היא ‪ , 120‬מה תהיה תשובתך ומהו הסיכוי לטעות ?‬
‫ד‪.‬‬
‫חוקר ביצע ניסוי ‪ .‬הוא ניסח את ההשערות הבאות ‪. H 0 :   0 H1 :   0 :‬לצורך בדיקה הוא לקח‬
‫‪.4‬‬
‫מדגם מקרי בגודל ‪ 5‬מתוך אוכלוסיה המתפלגת נורמאלית עם שונות לא ידועה‪ .‬על סמך תוצאות המדגם הוא חישב‬
‫וקיבל ‪:‬‬
‫‪ . t stat  2.611‬לכן המסקנה היא ‪:‬‬
‫א‪.‬‬
‫ידחה ‪ H 0‬ברמת מובהקות ‪ 0.1‬אך לא כן ברמת מובהקות ‪.0.05‬‬
‫ב‪.‬‬
‫ידחה ‪ H 0‬ברמת מובהקות ‪ 0.05‬אך לא ברמת ‪.0.025‬‬
‫ג‪.‬‬
‫ידחה ‪ H 0‬ברמת מובהקות ‪ 0.025‬אך לא ברמת ‪0.01‬‬
‫ד‪ .‬הוא לא ידחה ‪ H 0‬ברמת מובהקות ‪.0.1‬‬
‫‪56‬‬
‫‪.1‬‬
‫א‪.‬‬
‫נחשב את הממוצע ‪ ,‬את ‪ t‬ונאמוד את סטית התקן‪.‬‬
‫‪ t9,0.99  2.821‬‬
‫‪0.02‬‬
‫)‬
‫‪2‬‬
‫‪t‬‬
‫‪9,(1‬‬
‫‪‬‬
‫‪‬‬
‫) ‪( n 1),(1‬‬
‫‪2‬‬
‫‪t‬‬
‫‪S  8.3‬‬
‫‪‬‬
‫‪‬‬
‫‪S‬‬
‫‪X t‬‬
‫‪ ‬‬
‫) ‪( n 1)(1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪8.3‬‬
‫‪S‬‬
‫‪X t‬‬
‫‪ ‬‬
‫) ‪( n 1)(1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪‬‬
‫‪8.3‬‬
‫‪   9  2.821‬‬
‫‪10‬‬
‫‪  ‬‬
‫‪1.595‬‬
‫בדיקת השערות – חד כווני כלפי מעלה‬
‫‪  11.25‬‬
‫ב‪.1.‬‬
‫‪9  2.821‬‬
‫‪10‬‬
‫‪16.4‬‬
‫ב‪.‬‬
‫‪X 9‬‬
‫‪‬‬
‫‪t(101)(10.05)  t9,0.95  1.833‬‬
‫‪0  9‬‬
‫‪S  8.3‬‬
‫‪ 9‬‬
‫‪ H 0 :‬אין הבדל בין משך חיי הנישואים במדינה למדינה השכנה‬
‫‪ 9‬‬
‫‪ H1 :‬במדינה השכנה משך חיי הנישואים ארוך יותר‬
‫ב‪.2.‬‬
‫‪  0.05‬‬
‫ב‪.3.‬‬
‫‪‬‬
‫‪S‬‬
‫‪C  0  t( n1),(1 ) ‬‬
‫‪n‬‬
‫‪8.3‬‬
‫‪ 13.81‬‬
‫‪10‬‬
‫‪C  9  1.833 ‬‬
‫‪H0‬‬
‫‪11.25 13.81‬‬
‫‪9‬‬
‫‪57‬‬
‫ב‪.4.‬‬
‫החלטה‬
‫משך חיי הנישואים במדינה השכנה – ‪ 11.25‬נמצא בתחום קבלת השערת האפס ‪ ,‬לכן נקבל את ‪ H 0‬ונדחה את‬
‫השערת המחקר – אין הבדל בין משך חיי הנישואים בין שתי המדינות‬
‫ב‪.5.‬‬
‫קיבלנו את ‪ H 0‬הטעות האפשרית ‪ -‬השערת המחקר ‪ H 1‬נכונה ‪ -‬טעות מסוג שני ‪. ‬‬
‫ברמה של ‪ 9‬דרגות חופש הערך נמצא מתאים ל‪-‬‬
‫‪0.75  1    0.9‬‬
‫‪13.81  11.25‬‬
‫‪‬‬
‫‪ 0.975‬‬
‫‪2.625‬‬
‫‪0.1    0.25‬‬
‫הסיכוי לשגיאה במסקנה הוא בין ‪10%-25%‬‬
‫‪C‬‬
‫‪‬‬
‫‪t9,(1  ) ‬‬
‫‪S‬‬
‫) (‬
‫‪n‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.1   '  0.25‬‬
‫‪df  9 ‬‬
‫‪ 0.75  1   '  0.9‬‬
‫‪11.25  9‬‬
‫‪ 0.8572‬‬
‫‪8.3‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪t9,1 ' ‬‬
‫‪  ' (0.1‬מקבלים את השערת האפס‪.‬‬
‫)‪ 0.25)   (0.05‬‬
‫‪11.25  9‬‬
‫‪ 0.8572‬‬
‫‪8‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪t9,0.95  1.833‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫)‪tSTAT (0.8572)  t (1.833‬‬
‫‪  0‬‬
‫‪‬‬
‫‪tSTAT  t( n 1)(1 ') ‬‬
‫‪58‬‬
‫השערה דו כיוונית‬
‫ג‪1.‬‬
‫‪  2.5‬‬
‫ג‪.2.‬‬
‫‪ t9,0.995  3.25‬‬
‫‪‬‬
‫‪0.01‬‬
‫)‬
‫‪2‬‬
‫‪(101)(1‬‬
‫‪t‬‬
‫‪0  9‬‬
‫‪S  8.3‬‬
‫‪ 9‬‬
‫‪ H 0 :‬אין הבדל בין משך חיי הנישואים במדינה למדינות העולם השלישי‬
‫‪ 9‬‬
‫‪ H1 :‬יש הבדל בין משך חיי הנישואים במדינה למדינות העולם השלישי‬
‫ג‪.3.‬‬
‫‪  0.01‬‬
‫ג‪.3.‬‬
‫‪‬‬
‫‪S‬‬
‫‪ C  0  t( n 1),(1  ) ‬תחום דחית‬
‫‪n‬‬
‫‪2‬‬
‫‪H0‬‬
‫‪8.3‬‬
‫‪ 17.53‬‬
‫‪10‬‬
‫‪8.3‬‬
‫‪C1  9  3.25 ‬‬
‫‪ 0.46‬‬
‫‪10‬‬
‫‪C2  9  3.25 ‬‬
‫מקבלים את השערת האפס‪.‬‬
‫ג‪.4.‬‬
‫‪H0‬‬
‫‪17.53‬‬
‫‪0.46 2.5‬‬
‫‪9‬‬
‫החלטה‬
‫משך חיי הנישואים במדינות העולם השלישי ‪ 2.5‬נמצא בתחום קבלת השערת האפס ‪ ,‬לכן נקבל את ‪ H 0‬ונדחה‬
‫את השערת המחקר – אין הבדל בין משך חיי הנישואים בין מדינות העולם השלישי למדינה זו‪.‬‬
‫ג‪.5.‬‬
‫קיבלנו את ‪ H 0‬הטעות האפשרית ‪ -‬קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה‪.‬‬
‫כלומר טעות מסוג שני ‪. ‬‬
‫‪2.5  0.46‬‬
‫‪ 0.77‬‬
‫‪2.625‬‬
‫ברמה של ‪ 9‬דרגות חופש‪:‬‬
‫הסיכוי לשגיאה במסקנה הוא בין ‪20%-50%‬‬
‫‪0.2    0.5‬‬
‫‪‬‬
‫‪ C‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫(‬
‫‪‬‬
‫‪‬‬
‫) ‪9,(1‬‬
‫‪2‬‬
‫‪t‬‬
‫‪ 0.9‬‬
‫‪‬‬
‫‪2‬‬
‫‪0.75  1 ‬‬
‫‪59‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫'‪‬‬
‫) ‪( n 1),(1‬‬
‫‪2‬‬
‫‪t‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.02   '  0.05‬‬
‫‪ 0.99‬‬
‫'‪‬‬
‫‪2‬‬
‫‪2.5  9‬‬
‫‪ 2.476‬‬
‫‪8.3‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪df  9 ‬‬
‫‪ 0.975  1 ‬‬
‫‪  ' (0.02 ‬מקבלים את השערת האפס‪.‬‬
‫)‪ 0.05)   (0.01‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪t‬‬
‫‪9,1‬‬
‫‪t9,0.995  3.25‬‬
‫‪2.5  9‬‬
‫‪ 2.47‬‬
‫‪8.3‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪  0‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫)‬
‫'‪‬‬
‫‪2‬‬
‫‪( n 1)(1‬‬
‫‪tSTAT  t‬‬
‫)‪ tSTAT (2.47)  t (3.25‬מקבלים את השערת האפס‬
‫‪.2‬א‪.‬‬
‫‪ t9,0.975  2.262‬‬
‫‪0.05‬‬
‫)‬
‫‪2‬‬
‫‪t‬‬
‫‪9,(1‬‬
‫‪‬‬
‫‪‬‬
‫) ‪( n 1),(1‬‬
‫‪2‬‬
‫‪‬‬
‫‪t‬‬
‫‪‬‬
‫‪S‬‬
‫‪X t‬‬
‫‪ ‬‬
‫) ‪( n 1)(1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪59.45‬‬
‫‪S  59.45‬‬
‫‪X  508‬‬
‫‪‬‬
‫‪   508  2.262 ‬‬
‫‪10‬‬
‫‪S‬‬
‫‪X t‬‬
‫‪ ‬‬
‫) ‪( n 1)(1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪59.45‬‬
‫‪508  2.262 ‬‬
‫‪10‬‬
‫‪465.47    550.52‬‬
‫‪60‬‬
‫‪.2‬ב‪.‬‬
‫מבחן חד כווני כלפי מעלה‬
‫‪  508‬‬
‫‪‬‬
‫‪t(101)(10.05)  t9,0.95  1.833‬‬
‫‪0  420‬‬
‫‪S  59.45‬‬
‫‪ .1‬השערות ‪:‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪  420‬‬
‫‪H0 :‬‬
‫עלות סל קניות השנה לא שונה מעלותו לפני שנה‬
‫‪  420‬‬
‫‪H1 :‬‬
‫עלות סל קניות השנה גבוהה מעלותו בשנה שעברה‬
‫‪  0.05‬‬
‫‪‬‬
‫‪S‬‬
‫‪C  0  t( n1),(1 ) ‬‬
‫‪n‬‬
‫‪59.45‬‬
‫‪ 454.45‬‬
‫‪10‬‬
‫‪H0‬‬
‫‪C  420  1.833 ‬‬
‫‪454.4 508‬‬
‫‪420‬‬
‫דוחים את השערת האפס‪.‬‬
‫‪.4‬‬
‫החלטה‬
‫ממוצע עלות סל קניות השנה – ‪ ₪ 508‬נמצא בתחום דחית השערת האפס ‪ ,‬נדחה את השערת האפס ונקבל את‬
‫השערת המחקר – עלות סל קניות לחג השנה גבוהה מעלותו בשנה שעברה‪.‬‬
‫‪.5‬‬
‫דחינו את ‪ H 0‬הטעות האפשרית ‪ -‬דחינו את השערת האפס בזמן שהשערת האפס נכונה ‪.‬‬
‫טעות מסוג ראשון ‪ . ‬ההסתברות ה"אמיתית" לטעות מסוג זה במחקר זה – רמת המובהקות המינימאלית היא‪:‬‬
‫‪0.995  1    0.9995‬‬
‫‪, 0.0005    0.005‬‬
‫‪508  420‬‬
‫‪ 4.68‬‬
‫‪18.799‬‬
‫‪‬‬
‫‪  0‬‬
‫‪‬‬
‫‪t9,(1 ) ‬‬
‫‪S‬‬
‫) (‬
‫‪n‬‬
‫הסיכוי לשגיאה במסקנה הוא בין ‪0.5% - 0.05%‬‬
‫‪61‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.0005   '  0.005‬‬
‫‪508  420‬‬
‫‪ 4.68‬‬
‫‪59.45‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪df  9 ‬‬
‫‪ 0.995  1   '  0.9995‬‬
‫‪t9,1 ' ‬‬
‫‪  ' (0.0005 ‬דוחים את השערת האפס‪.‬‬
‫)‪ 0.005)   (0.05‬‬
‫‪508  420‬‬
‫‪ 4.68‬‬
‫‪59.45‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪t9,0.95  1.833‬‬
‫)‪tSTAT (4.68)  t (1.833‬‬
‫‪  0‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪tSTAT  t( n 1)(1 ') ‬‬
‫‪ 2‬ג‪ .‬אם בשנה הקודמת סל קניות ממוצע לחג עלה ‪ ₪ 485‬המשמעות היא שינוי בגבול הקריטי ‪C‬‬
‫‪ 528.8‬‬
‫‪59.45‬‬
‫‪10‬‬
‫‪C  485  2.33 ‬‬
‫ממוצע הסל השנה‪ ₪ 508 ,‬נמצא בתחום קבלת השערת האפס ‪ ,‬לכן נקבל את השערת האפס‪.‬‬
‫טעות במקרה זה היא טעות מסוג שני ‪‬‬
‫‪528.8  508‬‬
‫‪ 1.106‬‬
‫‪18.799‬‬
‫‪‬‬
‫‪C‬‬
‫‪‬‬
‫)‬
‫‪S‬‬
‫‪n‬‬
‫‪t 9,(1  ) ‬‬
‫(‬
‫ברמה של ‪ 9‬דרגות חופש הערך נמצא מתאים ל‪0.75  1    0.9 -‬‬
‫‪ - 0.1    0.25‬הסיכוי לשגיאה‬
‫במסקנה הוא בין ‪.10% - 25%‬‬
‫הסיכוי לטעות מאוד גבוה מאחר והערכים קרובים אחד לשני – ככל שהערכים קרובים כך הסיכוי לשגיאה גדל‪.‬‬
‫‪62‬‬
‫‪.3‬‬
‫‪‬‬
‫כאשר נתון כי שונות המדגם היא ‪ , 100‬המשמעות היא ‪ , S 2  100‬כיצד נתרגם מנתון זה את ‪? S‬‬
‫אנחנו יודעים כי‬
‫כלומר‬
‫‪ ( X i  X )2‬‬
‫‪n‬‬
‫ו‪-‬‬
‫‪( X i  X )2‬‬
‫‪‬‬
‫‪100 ‬‬
‫‪20‬‬
‫נציב את הנתון הנ"ל בנוסחה‬
‫‪2000‬‬
‫לכן ‪ 10.259‬‬
‫‪19‬‬
‫‪ t19,0.975  2.093‬‬
‫‪S2 ‬‬
‫‪0.05‬‬
‫)‬
‫‪2‬‬
‫‪‬‬
‫‪t‬‬
‫‪19,(1‬‬
‫‪ ( X i  X )2‬‬
‫‪n 1‬‬
‫‪2‬‬
‫לכן‬
‫‪( X i  X )2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪S‬‬
‫‪n 1‬‬
‫‪ ( X i  X )2‬‬
‫‪n 1‬‬
‫‪‬‬
‫) ‪( n 1),(1‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2000‬‬
‫כלומר‬
‫‪S ‬‬
‫‪19‬‬
‫‪‬‬
‫‪S‬‬
‫‪S  10.259‬‬
‫‪‬‬
‫‪X  112‬‬
‫‪‬‬
‫‪S‬‬
‫‪X t‬‬
‫‪ ‬‬
‫) ‪( n 1)(1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪10.259‬‬
‫) ‪2000   ( X i  X‬‬
‫‪‬‬
‫‪t‬‬
‫‪2‬‬
‫‪S ‬‬
‫‪‬‬
‫‪   112  2.093 ‬‬
‫‪20‬‬
‫‪116.8‬‬
‫‪S‬‬
‫‪X t‬‬
‫‪ ‬‬
‫) ‪( n 1)(1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪10.259‬‬
‫‪112  2.093 ‬‬
‫‪20‬‬
‫‪ ‬‬
‫‪107.198‬‬
‫ב‪ .‬מבחן חד כווני כלפי מעלה‬
‫‪ .1‬השערות ‪:‬‬
‫‪  105‬‬
‫‪H0 :‬‬
‫מנת המשכל של הילדים בישוב אינה גבוהה ממנת המשכל של הילדים בגיל זה במדינה ‪.‬‬
‫‪  105‬‬
‫‪H1 :‬‬
‫מנת המשכל של הילדים בישוב גבוהה ממנת המשכל של הילדים בגיל זה במדינה ‪.‬‬
‫‪.2‬‬
‫‪  0.05‬‬
‫‪63‬‬
‫‪.3‬‬
‫‪‬‬
‫‪S‬‬
‫‪C  0  t( n1),(1 ) ‬‬
‫‪n‬‬
‫‪10.259‬‬
‫‪ 108.96‬‬
‫‪20‬‬
‫‪H0‬‬
‫‪C  105  1.729 ‬‬
‫‪108.96 112‬‬
‫‪105‬‬
‫‪.4‬‬
‫החלטה‬
‫מנת המשכל של ילדי הישוב נמצאת מעבר לגבול הקריטי כלומר בתחום דחיית השערת האפס‪.‬‬
‫נדחה את השערת האפס – מנת המשכל הממוצעת אצל ילדי הישוב גבוהה ממנת המשכל של הילדים במדינה‪.‬‬
‫‪.5‬‬
‫דחינו את ‪ H 0‬הטעות האפשרית ‪ -‬דחינו את השערת האפס בזמן שהשערת האפס נכונה ‪.‬‬
‫כלומר טעות מסוג ראשון ‪. ‬‬
‫‪112  105‬‬
‫ההסתברות ה"אמיתית" לטעות מסוג זה במחקר זה היא‪ 3.052 :‬‬
‫‪2.293‬‬
‫‪‬‬
‫ברמה של ‪ 19‬דרגות חופש הערך נמצא מתאים ל‪0.995  1    0.9995 -‬‬
‫‪  0‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫‪t19,(1 ) ‬‬
‫(‬
‫‪0.0005    0.005‬‬
‫כלומר הסיכוי לשגיאה במסקנה הוא בין ‪0.5% - 0.05%‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.0005   '  0.005‬‬
‫‪df  19 ‬‬
‫‪ 0.995  1   '  0.9995‬‬
‫‪112  105‬‬
‫‪ 3.052‬‬
‫‪10.259‬‬
‫(‬
‫)‬
‫‪20‬‬
‫‪t19,1 ' ‬‬
‫)‪ 0.005)   (0.05‬‬
‫‪  ' (0.0005 ‬דוחים את השערת האפס‪.‬‬
‫‪64‬‬
‫‪t19,0.95  1.729‬‬
‫‪112  105‬‬
‫‪ 3.052‬‬
‫‪2.293‬‬
‫)‪tSTAT (3.052)  t (1.729‬‬
‫ג‪.‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪tSTAT  t( n 1)(1 ') ‬‬
‫הטענה ‪ -‬בישוב ב רמת המשכל הממוצעת היא ‪ 10%( 115.5‬יותר מהממוצע הארצי )‬
‫הרעיון הוא לבדוק זאת מול ישוב א בו הממוצע הוא ‪. 112‬‬
‫ג‪1.‬‬
‫‪ H 0 :   112‬מנת המשכל של הילדים בישוב ב אינה גבוהה ממנת המשכל של הילדים בגיל זה בישוב א‪.‬‬
‫‪ H1 :   112‬מנת המשכל של הילדים בישוב ב גבוהה ממנת המשכל של הילדים בגיל זה בישוב א‪.‬‬
‫ג‪.2.‬‬
‫ג‪3.‬‬
‫‪  0.05‬‬
‫‪‬‬
‫‪S‬‬
‫‪C  0  t( n1),(1 ) ‬‬
‫‪n‬‬
‫‪10.259‬‬
‫‪ 115.96‬‬
‫‪20‬‬
‫‪C  112  1.729 ‬‬
‫ג‪4.‬‬
‫‪H0‬‬
‫‪115.5 115.96‬‬
‫‪112‬‬
‫החלטה‬
‫מנת המשכל של ילדי ישוב ב נמצאת בתחום קבלת השערת האפס‪ .‬נקבל את השערת האפס –‬
‫מנת המשכל הממוצעת אצל ילדי ישוב ב אינה גבוהה ממנת המשכל של הילדים בישוב א‪.‬‬
‫‪65‬‬
‫ג‪5.‬‬
‫קבלנו את ‪ H 0‬הטעות האפשרית ‪ -‬קבלנו את השערת האפס בזמן שהשערת המחקר נכונה ‪.‬‬
‫כלומר טעות מסוג שני ‪. ‬‬
‫‪115.96  115.5‬‬
‫‪ 0.2‬‬
‫‪2.293‬‬
‫‪‬‬
‫‪C‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫‪t19,(1  ) ‬‬
‫(‬
‫ברמה של ‪ 19‬דרגות חופש הערך נמצא מתאים ל‪1    0.6 -‬‬
‫‪ , 0.4  ‬כלומר הסיכוי לשגיאה במסקנה‬
‫הוא גדול מ‪ - 40%-‬סיכוי גבוה מאוד וזאת מאחר ו‪ C-‬ו‪  -‬מאוד קרובים‪.‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.05   '  0.1‬‬
‫‪df  19 ‬‬
‫‪ 0.9  1   '  0.95‬‬
‫‪115.5  112‬‬
‫‪ 1.526‬‬
‫‪10.259‬‬
‫(‬
‫)‬
‫‪20‬‬
‫‪t19,1 ' ‬‬
‫)‪ 0.1)   (0.05‬‬
‫‪t19,0.95  1.729‬‬
‫‪115.5  112‬‬
‫‪ 1.256‬‬
‫‪10.259‬‬
‫(‬
‫)‬
‫‪20‬‬
‫)‪tSTAT (1.256)  t (1.729‬‬
‫‪  0‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪tSTAT  t( n 1)(1 ') ‬‬
‫‪66‬‬
‫ד‪.‬‬
‫אם מנת המשכל הממוצעת בישוב ב היא ‪ 120‬אזי נדחה את השערת האפס כלומר טעות מסוג ראשון ‪. ‬‬
‫ההסתברות לטעות מסוג זה במחקר זה היא‪:‬‬
‫‪120  112‬‬
‫‪ 3.48‬‬
‫‪2.293‬‬
‫‪‬‬
‫‪  0‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫‪t19,(1 ) ‬‬
‫(‬
‫ברמה של ‪ 19‬דרגות חופש הערך נמצא מתאים ל‪0.995  1    0.9995 -‬‬
‫‪0.0005    0.005‬‬
‫כלומר הסיכוי לשגיאה במסקנה הוא בין ‪0.5% - 0.05%‬‬
‫‪.4‬‬
‫החוקר בדק מדגם של ‪ 5‬אנשים בהשערה דו כיוונית ‪ ,‬נחשב את ' ‪ ‬עבור ‪t  2.611‬‬
‫‪0.05   '  0.1‬‬
‫‪ 0.975‬‬
‫'‪‬‬
‫‪2‬‬
‫‪0.95  1 ‬‬
‫‪ 2.611‬‬
‫‪‬‬
‫‪2‬‬
‫‪4,1‬‬
‫‪t‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1,1‬‬
‫‪t‬‬
‫‪  '  ‬דוחים את השערת האפס‬
‫‪  '  ‬מקבלים את השערת האפס‬
‫כלומר כאשר‬
‫‪   0.5‬נדחה בוודאות את השערת האפס וכאשר ‪   0.05‬מקבלים את השערת האפס‪.‬‬
‫התשובה הנכונה היא א‪.‬‬
‫‪67‬‬
‫הסקה על הפרש תוחלות (ממוצעים) של שתי אוכלוסיות בלתי תלויות‬
‫בהסקה ע"פ מדגם אחד למדנו לאמוד את ערכו של הפרמטר ולבדוק השערות ביחס לערכו‪.‬‬
‫נרחיב את הדיון להסקה סטטיסטית המתבססת על שני מדגמים מקריים מהם נלמד על הפרש הממוצעים‬
‫‪ 12‬‬
‫‪ 1  2‬ועל יחס השונויות‬
‫‪ 22‬‬
‫‪ ,‬איננו מתעניינים בערכו של כל פרמטר אלא בקשרים ביניהם ‪.‬‬
‫ישנם מקרים רבים בהם אנו מתעניינים ורוצים ללמוד ולהסיק על הקשרים בין שני ממוצעים ולא על כל ממוצע‬
‫בנפרד ‪ ,‬הדבר בה לידי ביטוי כאשר הנושא עליו אנו רוצים ללמוד‪/‬להסיק הוא הקשר‪/‬ההבדלים בין שתי תופעות‪.‬‬
‫לדוגמא‪:‬‬
‫נערוך השוואה בין יכולות של נשים כטייסות קרב ליכולתם של גברים כטייסי קרב ‪.‬‬
‫אם נשווה את ממוצע הפגיעות במטרה ונמצא כי ‪ 1  2  0‬הרי נוכל להסיק כי אין הבדל בתפקוד כטייסי קרב‬
‫בין גברים ונשים‪.‬‬
‫נערוך השוואה בין שני סוגי טיפול שונים השוואת ציונים של שתי שיטות לימוד ‪ ,‬בין שני סוגי תרופות וכו'‪.‬‬
‫קבוצת טיפול וקבוצת ביקורת – במחקרים רבים ‪ ,‬מחקרים אשר בודקים בהם הליך מסוים ולא מחקרי איסוף ישנן‬
‫קבוצות מחקר וקבוצות ביקורת‪:‬‬
‫בודקים השפעת תרופה מסוימת ‪ ,‬לוקחים שתי קבוצות אחת מקבלת את התרופה והשנייה מקבלת את אותה תרופה‬
‫אבל חסרת השפעה אמיתית (בשפה המחקרית הפעולה נקראת פלסבו) במטרה לנטרל כל השפעה מלבד הגורם‬
‫הנבדק המהלכים זהים ויותר מכך כולם בטוחים שהם מקבלים אותה פרוצדורה ‪ ,‬בסוף התהליך יש להשוות בין שתי‬
‫האוכלוסיות – ממוצעים שונויות וכו'‪.‬‬
‫כאשר עוסקים בהסקה סטטיסטית לפי שני מדגמים יש להבחין בין שני מדגמים בלתי תלויים לבין‬
‫שני מדגמים תלויים ‪ -‬מזווגים‪:‬‬
‫מדגמים בלתי תלויים – שני המדגמים נבחרים באופן מקרי ‪ ,‬אין תלות בין בחירת המקרים למדגם א לבין‬
‫בחירתם למדגם ב ‪.‬‬
‫דוגמא – לוקחים מדגם בגודל ‪ n‬מבין החיילות הקרביות ומדגם בגודל ‪ n‬מבין החיילים הקרביים (אין הכרח‬
‫שגודל המדגמים יהיה שווה)‬
‫מדגמים מזווגים ‪ -‬שני המדגמים בנויים כזוגות של תצפיות ‪ ,‬כלומר לכל פרט במדגם א מותאם פרט ממדגם ב ‪,‬‬
‫בין זוגות התצפיות קיימת אי תלות ‪ ,‬שני מדגמים מזווגים הם מדגמים מותאמים סטטיסטית כלומר בין שני‬
‫המדגמים קיים מתאם ‪/‬קשר ליניארי‪.‬‬
‫בודקים השכלה של הורים והשכלת ילדיהם‪.‬‬
‫בודקים השפעה של תרופה להורדת לחץ דם על מדגם של חולים – לפני לקיחת התרופה ואחריה – מדגם אחד –‬
‫לפני ואחרי הוא למעשה שני מדגמים מזווגים‪.‬‬
‫‪68‬‬
‫השוואת ממוצעים בין שני מדגמים בלתי תלויים‬
‫הסקה סטטיסטית על הפרש ממוצעים מתבססת גם היא על משפט הגבול המרכזי‪:‬‬
‫משפט הגבול המרכזי ‪ -‬אם מתוך אוכלוסייה בעלת ממוצע ‪ ‬וסטית תקן ‪‬‬
‫‪ ,‬נוציא את כל המדגמים‬
‫האפשריים בגודל ‪ .n‬סדרת ממוצעי כל המדגמים תתפלג נורמאלית ‪ ,‬עם ממוצע ‪‬‬
‫וסטית תקן הנקראת טעות התקן ושווה ל‪-‬‬
‫‪‬‬
‫‪n‬‬
‫‪.‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪x ~ N   ,‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫שונות (ריבוע סטית התקן)‬
‫ממוצע‬
‫ממוצעי‬
‫מתפלג‬
‫האוכלוסייה ‪‬‬
‫כאשר עוסקים בשתי אוכלוסיות בלתי תלויות ניתן לומר כי השונות של סכום או הפרש בין שני משתנים מקריים‬
‫בלתי תלויים היא‪:‬‬
‫) ‪ 2 ( X  Y )   2 ( x)   2 (Y‬‬
‫‪ 22‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪‬‬
‫‪n2‬‬
‫‪n2‬‬
‫‪ 12‬‬
‫‪ 2(X Y) ‬‬
‫‪ 12‬‬
‫‪ (X Y) ‬‬
‫‪n1‬‬
‫‪n1‬‬
‫ניתן לנסח את הטענה הבאה‪:‬‬
‫אם משתי אוכלוסיות נוציא את כל המדגמים האפשריים בגודל ‪n2‬‬
‫‪ n1‬אזי התפלגות הדגימה של‬
‫הפרשי הממוצעים בכל מדגם ‪ X 1  X 2‬שואפת להתפלגות נורמאלית עם ממוצע ‪1  2‬‬
‫וטעות תקן‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪‬‬
‫‪12  22 ‬‬
‫‪‬‬
‫‪( X 1  X 2 ) ~ N 1  2 ,‬‬
‫‪‬‬
‫ברישום סטטיסטי‬
‫‪‬‬
‫‪n1‬‬
‫‪n2 ‬‬
‫‪‬‬
‫השווה לסכום ריבועי טעות‬
‫התקן ‪ ,‬של כל קבוצה‬
‫ההפרש בין‬
‫ממוצעי‬
‫מתפלג‬
‫להפרש ממוצעי‬
‫האוכלוסיות‬
‫‪69‬‬
‫רווח בר סמך להפרש ממוצעים‬
‫‪12  2 2‬‬
‫‪12  2 2‬‬
‫‪(X1  X 2)  Z  ‬‬
‫‪‬‬
‫‪  2  1  ( X 1  X 2 )  Z  ‬‬
‫‪‬‬
‫) ‪(1‬‬
‫) ‪(1‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪2‬‬
‫‪2‬‬
‫כפי שחישבנו רווח בר סמך לממוצע ניתן לחשב רווח בר סמך להפרש ממוצעים ‪ ,‬מאחר ואנו עוסקים בשני‬
‫מדגמים ‪ ,‬נתייחס לטעות התקן המשותפת‪.‬‬
‫שאלה ‪:‬‬
‫חוקר מעוניין לאמוד את הפרש ממוצעי הגבהים בין בנים ובנות בגילאים ‪ , 13‬החוקר דגם ‪ 100‬בנים ו‪ 100-‬בנות‬
‫בגילאי ‪ 13‬ומצא כי ממוצע גובה הבנות היה ‪ 160‬ס"מ וממוצע גובה הבנים היה ‪ 156‬ס"מ ידוע כי סטית התקן‬
‫לגובה הבנות בגיל זה היא ‪ 7‬ס"מ וסטית התקן לגובה הבנים היא ‪ 3.5‬ס"מ‪.‬‬
‫בנו רווח בר סמך להפרש הממוצעים ברמת סמך של ‪0.98‬‬
‫נתונים‪:‬‬
‫‪2‬‬
‫בנים‪:‬‬
‫‪3.52‬‬
‫‪‬‬
‫‪ 0.1225‬‬
‫‪n‬‬
‫‪100‬‬
‫‪2‬‬
‫בנות‪:‬‬
‫‪72‬‬
‫‪‬‬
‫‪ 0.49‬‬
‫‪n 100‬‬
‫‪ 0.1225  0.49  0.7826‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪n2  100‬‬
‫‪n1  100‬‬
‫‪ 2  3.5‬‬
‫‪X 2  156‬‬
‫‪1  7‬‬
‫‪ Z 0.99  2.33‬‬
‫‪0.02‬‬
‫)‬
‫‪2‬‬
‫‪X 1  160‬‬
‫‪(1‬‬
‫‪Z‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪(160  156)  2.33  0.7826   2  1  (160  156)  2.33  0.7826‬‬
‫‪2.1765   2  1  5.8234‬‬
‫‪70‬‬
‫בדיקת השערות כאשר ‪  2  1 -‬סטיות התקן ידועות‬
‫במטרה לבדוק את הבדלים בין שתי שיטות להוראה במתמטיקה מבחינת רמת ההישגים נלקחו שני מדגמים לבדיקת‬
‫הטענה כי שיטה א עדיפה על פני שיטה ב‪.‬‬
‫מדגם של ‪ n1=60‬סטודנטים למדו ע"פ שיטה א‬
‫מדגם של ‪ n2=40‬סטודנטים למדו ע"פ שיטה ב‪.‬‬
‫בבחינת הסיום נתקבלו התוצאות ‪X 2  72 :‬‬
‫‪X 1  76‬‬
‫‪1  8‬‬
‫כמו כן סטיות התקן בשתי האוכלוסיות ידועות ‪ 2  6‬‬
‫בדקו את הטענה ברמת מובהקות של ‪0.05‬‬
‫מבחן חד כיווני כלפי מעלה‬
‫א‪.‬‬
‫‪1   2  0‬‬
‫‪H0 :‬‬
‫‪1   2  0‬‬
‫‪ H1 :‬ממוצע הציונים בשיטה א גבוה יותר‬
‫אין הבדל בין ממוצעי הציונים בין השיטות‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪82 6 2‬‬
‫‪‬‬
‫‪ 1.4‬‬
‫‪60 40‬‬
‫‪Z1   Z10.05  Z0.95  1.65‬‬
‫‪‬‬
‫‪C  1  2  Z1  ‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪1  2  0‬‬
‫‪C  0  1.4  1.65  2.31‬‬
‫הוא הגבול הקריטי ‪ --2.31‬אם ההפרש בין שני הממוצעים קטן מ‪ 2.31-‬נקבל את ‪H 0‬‬
‫‪H0‬‬
‫‪4‬‬
‫‪2.31‬‬
‫‪0‬‬
‫‪71‬‬
‫ד‪.‬‬
‫החלטת החוקר‬
‫נדחה את השערת האפס ונקבל את השערת המחקר – מאחר וההפרש בין הממוצעים הוא ‪ , 4‬נמצא בתחום דחיית‬
‫השערת האפס ‪ -‬יש הבדל בין ממוצעי השיטות לשיטה א הישגים גבוהים יותר‪.‬‬
‫ה‪.‬‬
‫השגיאה האפשרית‬
‫דחינו את השערת האפס ‪ ,‬השגיאה האפשרית ‪ -‬דחינו את השערת האפס בזמן שהיא נכונה ‪ -‬שגיאה מסוג‬
‫‪ ,   0.05‬ברמת הגדרת המחקר יש סיכוי של ‪ 5%‬לטעות‪.‬‬
‫ראשון ‪ -‬‬
‫ההסתברות האמיתית לשגיאה היא רמת המובהקות הקטנה ביותר בה עדיין נקבל את אותן מסקנות‬
‫כל עוד ‪ C>4‬נקבל את אותן מסקנות – רמת המובהקות המינימאלית (סעיף ג)‬
‫‪(X 1  X 2 )  0‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪Z 1 '  ‬‬
‫‪ ‬רמת המובהקות הקטנה ביותר לדחיית ‪ H 0‬היא ‪.  ' 0.0021‬‬
‫‪‬‬
‫רמת המובהקות המינימאלית ‪ ,‬לטעות מסוג ראשון היא ‪ ,0.0021‬כלומר‬
‫‪n1‬‬
‫‪40‬‬
‫‪ 2.86‬‬
‫‪1.4‬‬
‫‪1   '  0.9979‬‬
‫‪ '  0.0021‬‬
‫‪Z 1 '  ‬‬
‫בכל רמת מובהקות הגדולה מ‪ 0.0021-‬נדחה את השערת האפס‪.‬‬
‫‪ ‬הערך שקיבלנו קטן מ‪ C-‬המשמעות היא שיכולנו להשתמש ב‪ C-‬קטן‬
‫יותר ועדיין להגיע לאותן מסקנות ולהחליט את אותן החלטות‪.‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪ '  0.0021‬‬
‫‪‬‬
‫‪12‬‬
‫‪' ‬‬
‫‪Z (1 ') ‬‬
‫‪' ‬‬
‫‪n1‬‬
‫‪1   '  0.9979‬‬
‫)‪ ' (0.0021)   (0.05‬‬
‫‪40‬‬
‫‪ 2.86‬‬
‫‪1.4‬‬
‫‪Z1 ' ‬‬
‫‪Z 0.95  1.65‬‬
‫‪40‬‬
‫‪ 2.86‬‬
‫‪1.4‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪Z STAT  Z1 ' ‬‬
‫‪n1‬‬
‫ערך ‪ Z‬הנבדק נקרא גם ‪ - Z Critical‬ערך ‪ Z‬המוביל אותנו לגבול הקריטי‬
‫‪ Z STAT  ZCRITICAL‬דוחים את השערת האפס‬
‫)‪Z STAT (2.86)  Z (1.65‬‬
‫‪Z STAT  ZCRITICAL‬‬
‫‪72‬‬
‫‪.1‬‬
‫חוקר טוען כי בגילאי ‪ 13‬בנות רציניות יותר מבנים ולכן ממוצע הציונים שלהן גבוה ממוצע ציוני הבנים‬
‫במטרה לבדוק את טענתו ‪ ,‬החוקר דגם ‪ 80‬בנים ו‪ 80-‬בנות בגילאי ‪ 13‬ומצא כי ממוצע ציוני הבנות היה ‪81‬‬
‫וממוצע ציוני הבנים היה ‪ ,78‬ידוע כי סטית התקן לציוני הבנות בגיל זה היא ‪7‬‬
‫וסטית התקן לציוני הבנים היא ‪ 5‬בדקו את הטענה ברמת מובהקות של ‪0.05‬‬
‫‪.2‬‬
‫מנהל תיקי השקעות רצה לבחון הבדלים בתשואות בין שני אפיקי השקעה ‪ ,‬סולידי וספקולטיבי לאחר‬
‫חודש של ירידות בו ירד האפיק הסולידי ב‪ 2%-‬והספקולטיבי ב‪. 12%-‬‬
‫המנהל לקח מדגם מקרי של ‪ 16‬תיקים "סולידיים" ו‪ 20-‬תיקים ספקולטיביים ובדק את התשואה הממוצעת במשך‬
‫‪ 12‬חודשים‪ .‬הממצאים היו ‪ :‬האפיק הסולידי עלה בממוצע ב‪ 10%-‬ואילו האפיק הספקולטיבי עלה ב‪ 17%-‬כמו כן‬
‫ידוע כי סטית התקן בתיקים הסולידיים היא ‪ 2%‬ובתיקים הספקולטיביים ‪.10%‬‬
‫א‪.‬‬
‫בנו רווח בר סמך לתשואה השנתית הממוצעת בכל אחד מאפיקי ההשקעות ברמת סמך של ‪.0.95‬‬
‫ב‪.‬‬
‫בצע מבחן עבור מנהל התיקים ברמת מובהקות של ‪.0.05‬‬
‫‪.3‬‬
‫נערך מחקר במטרה לקבוע הבדלים ביכולת אצל ילדים בעלי הפרעות קשב וריכוז במטרה לקבוע אם‬
‫מינון גבוה של ריטלין ישפר את היכולת ‪.‬קבוצה א בת ‪ 50‬נבדקים קיבלה ‪ 10‬מ"ג ריטלין ביום וקבוצה ב בת ‪30‬‬
‫נבדקים ‪ 5‬מ"ג ‪ .‬נערך מבחן זהה לשתי הקבוצות ‪ ,‬קבוצה א הממוצע היה ‪ 83‬ואילו בקבוצה ב ‪ 80‬ידוע כי סטית‬
‫התקן באוכלוסייה במבחן זה היא ‪. 6‬‬
‫א‬
‫בנו רווח בר סמך להפרש הממוצעים בין שתי רמות הריטלין‪ ,‬ברמת סמך של ‪.0.98‬‬
‫ב‪.‬‬
‫בדוק את הטענה ברמת מובהקות של ‪.0.04‬‬
‫‪.4‬‬
‫קיימת טענה כי נשים מעל גיל ‪( 35‬אוכלוסייה ב) מעלות יותר משקל במהלך הריון מאשר נשים עד גיל ‪25‬‬
‫(אוכלוסייה א)‪ ,‬החוקר דגם ‪ 30‬נשים בהריון בכל שכבת גיל ומצא כי בממוצע אישה מעל גיל ‪ 35‬מעלה ‪ 14.5‬ק"ג‬
‫בהריון ואילו אישה מתחת לגיל ‪ 25‬מעלה בממוצע ‪ 12.5‬ק"ג בהריון ‪ .‬ידוע כי סטית התקן באוכלוסיית נשים א היא ‪4‬‬
‫ק"ג ואילו באוכלוסייה ב הסטייה היא ‪ 2.3‬ק"ג ‪ ,‬בדקו את הטענה ברמת מובהקות של ‪. 0.03‬‬
‫‪.5‬‬
‫השערת האפס ( ‪ ) Ho‬היא שאין הבדל בין תוחלות זמן השיחה בטלפון סלולארי בין שתי ערים‪.‬‬
‫ההשערה האלטרנטיבית ( ‪ ) H1‬היא שתוחלות זמן השיחה בטלפון סלולארי בשתי הערים שונות‪.‬‬
‫לבדיקת השערות אלו נלקחו שני מדגמים (אחד מכל עיר) וחושבו הנתונים הבאים (בדקות)‬
‫עיר א'‬
‫‪7.98‬‬
‫ממוצע מדגם‬
‫‪4.84‬‬
‫סטית תקן של האוכלוסייה‬
‫‪10‬‬
‫בהנחה שזמני השיחה בשתי הערים בלתי תלויים ומתפלגים נורמאלית‪.‬‬
‫עיר ב'‬
‫‪4.32‬‬
‫‪3.61‬‬
‫‪12‬‬
‫‪73‬‬
‫א‪.‬‬
‫ברמת מובהקות של ‪ 5%‬נדחה ‪ ,Ho‬אך לא ברמת מובהקות של ‪.1%‬‬
‫ב‪.‬‬
‫ברמת מובהקות ‪ 1%‬נדחה ‪.Ho‬‬
‫ג‪.‬‬
‫ברמת מובהקות ‪ 5%‬נקבל ‪Ho‬‬
‫ד‬
‫תשובות א' עד ג' אינן נכונות‪.‬‬
‫‪.6‬‬
‫במסגרת סקר שיווק רוצים להשוות בין זמן הגלישה של נשים מבוגרות לזמן גלישה של גברים מבוגרים‪.‬‬
‫במדגם מקרי של ‪ 65‬נשים נמצא שזמן הגלישה הממוצע היה ‪ 22‬שעות במדגם מקרי של ‪ 60‬גברים נמצא ממוצע‬
‫של ‪ 18‬שעות‪ .‬ידוע שסטיית התקן של זמן הגלישה הן של גברים והן של נשים היא ‪.5‬‬
‫האם יש הבדל משמעותי בין זמן גלישה של גברים לזמן גלישה של נשים ? בדוק ברמת מובהקות של ‪.0.05‬‬
‫‪.7‬‬
‫בדיקת גובה החשבון החודשי עבור השימוש בטלפון הסלולארי בקרב לקוחות בגילאים שונים הראתה‬
‫תוצאות הבאות‪:‬‬
‫קבוצת גיל‬
‫מספר חשבונות שנבדקו‬
‫גובה חשבון ממוצע‬
‫סטית התקן באוכלוסיה‬
‫‪20-30‬‬
‫‪8‬‬
‫‪200‬‬
‫‪40‬‬
‫‪30-40‬‬
‫‪7‬‬
‫‪190‬‬
‫‪43‬‬
‫בנוסף נבדקו גם ‪ 9‬חשבונות של לקוחות בגילאים ‪ .40-50‬נתוני המדגם הם‪:‬‬
‫‪160 ,240 170 ,160 ,160 ,230 ,150, 210 ,200‬‬
‫א‪.‬‬
‫השווה בין תוחלות גובה החשבון של לקוחות בגילאים ‪ 20-30‬ובגילאים ‪ 40 -30‬רמת מובהקות של ‪.5%‬‬
‫ב‪.‬‬
‫בנה רווח סמך לתוחלת גובה החשבון החודשי בגילאים ‪ 20-30‬ברמת סמך של ‪. 90%‬‬
‫ג‪.‬‬
‫פי כמה יגדל הרווח אם רמת הסמך תעלה ל‪?98%-‬‬
‫הנח שסטית התקן של גובה החשבון החודשי באוכלוסיית לקוחות בני ‪ 40-50‬ידועה ושווה ל‪.35 -‬‬
‫ד‪.‬‬
‫מצא את רמת המובהקות המינימאלית בה ניתן לדחות את השערת האפס כאשר בודקים השערה שתוחלת‬
‫גובה התשלום של לקוחות בגילאים ‪ 50-40‬שווה ל‪ 210-‬שקלים כנגד אלטרנטיבה שתוחלת זו נמוכה יותר‪.‬‬
‫ה‪.‬‬
‫מהו מספר החשבונות המינימאלי שיש לבחור במטרה לבנות רווח סמך לתוחלת גובה החשבון החודשי של‬
‫לקוחות בגילאים ‪ 50-40‬ברמת סמך של ‪ 95%‬כדי שאורך הרווח לא יעלה על ‪ 15‬שקלים‪.‬‬
‫‪74‬‬
‫‪.1‬‬
‫נתונים ‪:‬‬
‫בנות ‪  7 -‬‬
‫‪n  80‬‬
‫‪X 1  81‬‬
‫‪ 5‬‬
‫‪n  80‬‬
‫‪X 2  78‬‬
‫בנים‪:‬‬
‫‪X1  X 2  3‬‬
‫א‪.‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬ממוצע ציוני הבנות אינו גבוה ממוצע ציוני הבנים‬
‫‪1   2  0‬‬
‫‪ H1 :‬ממוצע ציוני הבנות גבוה יותר ממוצע הבנים‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪C  1  2  Z1  ‬‬
‫‪52 7 2‬‬
‫‪‬‬
‫‪‬‬
‫‪ 0.9617‬‬
‫‪80 80‬‬
‫‪Z 1   Z 1 0.05  Z 0.95  1.65‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪1  2  0‬‬
‫‪C  0  0.9617  1.65  1.58‬‬
‫‪ 1.58‬הוא הגבול הקריטי ‪ ,‬אם ההפרש בין שני הממוצעים קטן מ‪ 1.58 -‬נקבל את ‪H 0‬‬
‫‪H0‬‬
‫‪3‬‬
‫‪1.58‬‬
‫‪0‬‬
‫ד‪.‬‬
‫נדחה את השערת האפס ונקבל את השערת המחקר – ההפרש בין הממוצעים הוא ‪ - 3‬נמצא בתחום דחיית השערת‬
‫האפס ‪ ,‬ממוצע ציוני הבנות גבוה מממוצע ציוני הבנים‪.‬‬
‫‪75‬‬
‫ה‪.‬‬
‫דחינו את השערת האפס ‪ -‬השגיאה האפשרית היא ‪ -‬דחינו את השערת האפס בזמן שהיא נכונה ‪ ,‬שגיאה מסוג‬
‫‪ ,   0.05‬בהתאם להגדרת המחקר יש סיכוי של ‪ 5%‬לטעות‪.‬‬
‫ראשון ‪‬‬
‫ההסתברות האמיתית לשגיאה היא למעשה רמת המובהקות הקטנה ביותר(המינימאלית) בה עדיין נקבל את אותן‬
‫מסקנות ‪ ,‬כל עוד ‪ C<3‬נקבל את אותן מסקנות‪..‬‬
‫‪(X 1  X 2 )  0‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪Z 1 '  ‬‬
‫נחשב את השגיאה ע"פ הנקודה הקיצונית ביותר בה היינו מקבלים‬
‫את אותן מסקנות‪ -‬הפרש הממוצעים‪ ,‬נחשב את ההסתברות באמצעות‬
‫‪n1‬‬
‫טבלת ההתפלגות הנורמאלית‬
‫‪30‬‬
‫‪ 3.12‬‬
‫‪0.9617‬‬
‫‪1   '  0.9991‬‬
‫‪ '  0.0009‬‬
‫‪Z 1 '  ‬‬
‫ההסתברות לשגיאה היא ‪ – 0.0009‬סיכוי של ‪ 0.09%‬לשגיאה‪.‬‬
‫) ‪( X 1  X 2 )  ( 1   2‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪ '  0.0009‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪Z (1 ') ‬‬
‫‪' ‬‬
‫‪n1‬‬
‫‪30‬‬
‫‪ 3.12‬‬
‫‪0.9617‬‬
‫‪1   '  0.9991‬‬
‫)‪ ' (0.0009)   (0.05‬‬
‫‪' ‬‬
‫‪Z1 ' ‬‬
‫‪Z 0.95  1.65‬‬
‫‪30‬‬
‫‪ 3.12‬‬
‫‪0.9617‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪Z STAT  Z1 ' ‬‬
‫‪n1‬‬
‫ערך ‪ Z‬הנבדק נקרא גם ‪ - Z Critical‬ערך המוביל אותנו לגבול הקריטי‬
‫)‪Z STAT (3.12)  Z (1.65‬‬
‫‪76‬‬
‫נתונים‪ :‬תיק מניות ספקולטיבי‬
‫‪.2‬א‪.‬‬
‫תיק מניות סולידי‬
‫‪  10‬‬
‫‪n  20‬‬
‫‪X 1  17‬‬
‫‪ 2‬‬
‫‪n  16‬‬
‫‪X 1  10‬‬
‫‪X 1  X 2  17  10  7‬‬
‫‪102 22‬‬
‫‪‬‬
‫‪ 2.291‬‬
‫‪20 16‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ Z 1 0.025  Z 0.975  1.96‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪n1‬‬
‫‪ 2  1  ( X1  X 2 )  Z‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪Z‬‬
‫‪‬‬
‫‪1 ‬‬
‫‪ 2‬‬
‫‪12‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪n1‬‬
‫‪( X1  X 2 )  Z‬‬
‫‪7  1.96  2.291  1   2  7  1.96  2.291‬‬
‫‪2.5  1   2  11.49‬‬
‫‪.2‬ב‪.‬‬
‫מבחן דו כווני – רוצים לבחון הבדלים בתשואות בין שני התיקים – אין כוון ברור‬
‫א‪.‬‬
‫‪1   2  0‬‬
‫‪H0 :‬‬
‫אין הבדל בתשואות בין שני תיקי המניות‬
‫‪1   2  0‬‬
‫‪H1 :‬‬
‫יש הבדל בתשואות בין שני תיקי המניות‬
‫ב‪.‬‬
‫ג‪.‬‬
‫השערה דו כיוונית – יש לחשב שני גבולות קריטיים‪:‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪‬‬
‫‪C1  1   2  Z ‬‬
‫‪‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪ Z10.025  Z0.975  1.96‬‬
‫‪Z‬‬
‫‪‬‬
‫‪1 ‬‬
‫‪ 2‬‬
‫‪C1  0  2.291  1.96  4.49‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪‬‬
‫‪C 2  1   2  Z ‬‬
‫‪‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪102 22‬‬
‫‪‬‬
‫‪ 2.291‬‬
‫‪20 16‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪1  2  0‬‬
‫‪C2  0  2.291  1.96  4.49‬‬
‫‪  4.49‬הוא הגבול הקריטי ‪ ,‬אם ההפרש בין שני הממוצעים קטן מ‪ 4.49 -‬נקבל את ‪H 0‬‬
‫‪77‬‬
‫‪H0‬‬
‫‪4.49‬‬
‫‪7‬‬
‫‪ 4.49‬‬
‫‪0‬‬
‫‪X 1  X 2  17  10  7‬‬
‫ד‪.‬‬
‫ההפרש בין הממוצעים הוא ‪ - 7‬נמצא בתחום דחיית השערת האפס ‪ ,‬נדחה את השערת האפס ונקבל את השערת‬
‫המחקר ‪ -‬יש הבדל בין ממוצעי התשואות בין שני סוגי התיקים ‪ ,‬בתיק הספקולטיבי התשואות גבוהות יותר‪.‬‬
‫ה‪.‬‬
‫דחינו את השערת האפס ‪ ,‬השגיאה האפשרית ‪ -‬דחינו את השערת האפס בזמן שהיא נכונה כלומר שגיאה מסוג‬
‫‪ -   0.05‬ברמת הגדרת המחקר יש סיכוי של ‪ 5%‬שטעינו‪.‬‬
‫הסיכוי "האמיתי" לשגיאה ‪ -‬ההסתברות האמיתית לשגיאה היא בעצם רמת המובהקות הקטנה ביותר‬
‫(המינימאלית) בה עדיין נקבל את אותן מסקנות ‪.‬‬
‫‪(X 1  X 2)  0‬‬
‫‪Z 1  ‬‬
‫‪ 12  2 2‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪70‬‬
‫‪Z   ‬‬
‫‪ 3.055‬‬
‫‪ 1 ‬‬
‫‪2‬‬
‫‪.‬‬
‫‪291‬‬
‫‪ 2‬‬
‫הסיכוי לשגיאה מסוג זה הוא ‪. 0.22%‬‬
‫‪‬‬
‫‪1   0.09989‬‬
‫‪  0.0022‬‬
‫‪2‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪ '  0.0022‬‬
‫‪‬‬
‫‪12‬‬
‫‪‬‬
‫)‬
‫'‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪Z‬‬
‫‪' ‬‬
‫‪n1‬‬
‫‪ 0.9989‬‬
‫)‪ ' (0.0022)   (0.05‬‬
‫‪' ‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪70‬‬
‫‪ 3.05‬‬
‫‪2.291‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪78‬‬
‫‪70‬‬
‫‪ 3.055‬‬
‫‪2.291‬‬
‫‪Z 0.975  1.96‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n2‬‬
‫)‪Z STAT (3.055)  Z (1.96‬‬
‫‪.3‬א‪.‬‬
‫‪12‬‬
‫‪‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪n1‬‬
‫נתונים‪ :‬מינון של ‪ 10‬מ"ג‬
‫מינון של ‪ 5‬מ"ג‬
‫‪ 6‬‬
‫‪n  50‬‬
‫‪X 1  83‬‬
‫‪ 6‬‬
‫‪n  30‬‬
‫‪X 1  80‬‬
‫‪X 1  X 2  83  80  3‬‬
‫‪62 62‬‬
‫‪‬‬
‫‪ 1.3856‬‬
‫‪50 30‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪ Z 1 0.01  Z 0.99  2.33‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪ 2  1  ( X1  X 2 )  Z‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪Z‬‬
‫‪‬‬
‫‪1 ‬‬
‫‪ 2‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪( X1  X 2 )  Z‬‬
‫‪3  2.33  1.3856  1   2  3  2.33  1.3856‬‬
‫‪ 0.228  1   2  6.22‬‬
‫‪.3‬ב‪.‬‬
‫סוג המבחן – על פניו נראה כי לפנינו מבחן דו כיווני מאחר והרעיון הוא לקבוע אם יש הבדלים בין מינוני‬
‫רטלין שונים ‪ ,‬אולם המשך השאלה – "במטרה לקבוע אם מינון גבוה ישפר את היכולת" מוביל אותנו למבחן‬
‫חד כיווני בו המטרה לבדוק האם מינון של ‪ 10‬מ"ג יגרום תוצאות טובות יותר ממינון של ‪ 5‬מ"ג‪.‬‬
‫א‪.‬‬
‫‪1   2  0‬‬
‫‪H0 :‬‬
‫אין הבדל בין שתי רמות הרטלין‬
‫‪1   2  0‬‬
‫‪H1 :‬‬
‫מינון של ‪ 10‬מ"ג רטלין ישפר את היכולת ביחס למינון של ‪ 5‬מ"ג‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪79‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪ 12‬‬
‫‪‬‬
‫‪C  1   2  Z 1  ‬‬
‫‪n1‬‬
‫‪62 62‬‬
‫‪‬‬
‫‪ 1.3856‬‬
‫‪Z 1   Z 10.04  Z 0.96  1.75‬‬
‫‪50 30‬‬
‫‪C  0  1.3856  1.75  2.42‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪1  2  0‬‬
‫כלומר ‪ 2.42‬הוא הגבול הקריטי ‪ -‬אם ההפרש בין שני הממוצעים קטן מ‪ 2.42 -‬נקבל את ‪H 0‬‬
‫‪H0‬‬
‫‪X 1  X 2  83  80  3‬‬
‫‪3‬‬
‫‪2.42‬‬
‫‪0‬‬
‫ד‪.‬‬
‫נדחה את השערת האפס ונקבל את השערת המחקר – ההפרש בין הממוצעים הוא ‪ , 3‬הפרש זה נמצא בתחום דחיית‬
‫השערת האפס שהוא התחום שמעל ‪ - , 2.36‬מינון של ‪ 10‬מ"ג רטלין משפר את ההישגים יותר ממינון של ‪ 5‬מ"ג‪.‬‬
‫ה‪.‬‬
‫דחינו את השערת האפס ‪ ,‬השגיאה האפשרית ‪ -‬דחינו את השערת האפס בזמן שהיא נכונה כלומר שגיאה מסוג‬
‫‪ ,   0.04‬סיכוי של ‪ 4%‬לטעות בהתאם להגדרת המחקר ‪.‬‬
‫ההסתברות האמיתית לשגיאה היא בעצם רמת המובהקות הקטנה ביותר (המינימאלית) בה עדיין נקבל את אותן‬
‫מסקנות כל עוד ‪ C>3‬נקבל את אותן מסקנות‪.‬‬
‫‪(X 1  X 2)  0‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪Z 1  ‬‬
‫‪n1‬‬
‫‪30‬‬
‫‪ 2.165‬‬
‫‪1.3856‬‬
‫‪1    0.9850‬‬
‫‪  0.015‬‬
‫‪Z 1  ‬‬
‫הסיכוי לשגיאה מסוג זה הוא ‪1.5%‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪ '  0.015‬‬
‫‪‬‬
‫‪12‬‬
‫‪Z (1 ') ‬‬
‫‪' ‬‬
‫‪n1‬‬
‫‪1   '  0.9850‬‬
‫)‪ ' (0.015)   (0.04‬‬
‫‪' ‬‬
‫‪30‬‬
‫‪ 2.165‬‬
‫‪1.3856‬‬
‫‪Z1 ' ‬‬
‫‪80‬‬
‫‪Z 0.96  1.75‬‬
‫‪30‬‬
‫‪ 2.165‬‬
‫‪1.3856‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n2‬‬
‫)‪Z STAT (2.165)  Z (1.75‬‬
‫‪.4‬‬
‫‪‬‬
‫‪12‬‬
‫‪Z STAT  Z1 ' ‬‬
‫‪n1‬‬
‫הטענה הנבדקת היא – נשים מעל גיל ‪ 35‬מעלות יותר משקל בהריון מנשים מתחת לגיל ‪. 25‬‬
‫מעל גיל ‪- 35‬‬
‫‪  2.3‬‬
‫‪n  30‬‬
‫‪X 1  14.5‬‬
‫מתחת לגיל ‪- 25‬‬
‫‪ 4‬‬
‫‪n  30‬‬
‫‪X 1  12.5‬‬
‫‪X1  X 2  2‬‬
‫א‪.‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬נשים מעל גיל ‪ 35‬אינן מעלות יותר משקל בהריון מנשים מתחת לגיל ‪25‬‬
‫‪1   2  0‬‬
‫‪ H1 :‬נשים מעל גיל ‪ 35‬מעלות יותר משקל בהריון מנשים מתחת לגיל ‪25‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪C  1  2  Z1  ‬‬
‫‪2.32 42‬‬
‫‪‬‬
‫‪ 0.8424‬‬
‫‪30 30‬‬
‫‪Z 1   Z 10.03  Z 0.97  1.88‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪1  2  0‬‬
‫‪C  0  0.8424  1.88  1.583‬‬
‫‪ 1.583‬הוא הגבול הקריטי ‪ ,‬אם ההפרש בין שני הממוצעים גדול מ‪ 1.583 -‬נדחה את ‪H 0‬‬
‫‪H0‬‬
‫‪2‬‬
‫‪1.583‬‬
‫‪0‬‬
‫‪81‬‬
‫ד‪.‬‬
‫נדחה את השערת האפס ונקבל את השערת המחקר – ההפרש בין הממוצעים הוא ‪ - 2‬נמצא בתחום דחיית השערת‬
‫האפס ‪ ,‬מקבלים את השערת המחקר – נשים מעל גיל ‪ 35‬מעלות יותר משקל בהריון מנשים מתחת לגיל ‪.25‬‬
‫ה‪.‬‬
‫דחינו את השערת האפס ‪ ,‬השגיאה האפשרית ‪ -‬מסוג ‪ ,   0.03 ‬ברמת הגדרת המחקר‪.‬‬
‫ההסתברות האמיתית לשגיאה היא בעצם רמת המובהקות הקטנה ביותר בה עדיין נקבל את אותן מסקנות ‪.‬‬
‫‪1    0.9911‬‬
‫‪  0.0089‬‬
‫‪20‬‬
‫‪ 2.374‬‬
‫‪0.8424‬‬
‫‪(X 1  X 2)  0‬‬
‫‪Z 1  ‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫הסיכוי האמיתי לשגיאה – רמת המובהקות המינימאלית ‪0.089%‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪Z 1  ‬‬
‫‪n1‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪12‬‬
‫‪Z (1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪n1‬‬
‫‪20‬‬
‫‪ 2.37‬‬
‫‪1   '  0.9911‬‬
‫‪ '  0.0089‬‬
‫‪0.8424‬‬
‫)‪ ' (0.0089)   (0.03‬‬
‫‪Z1 ' ‬‬
‫‪Z 0.97  1.88‬‬
‫‪20‬‬
‫‪ 2.37‬‬
‫‪0.8424‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n2‬‬
‫)‪Z STAT (2.37)  Z (1.88‬‬
‫‪.5‬‬
‫‪‬‬
‫‪12‬‬
‫‪Z STAT  Z1 ' ‬‬
‫‪n1‬‬
‫השערה דו כיוונית להפרשי ממוצעים ‪ ,‬סטיות תקן באוכלוסיה ידועות – התפלגות ‪. Z‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬אין הבדל בין זמן שיחות הטלפון בין שתי הערים‬
‫‪1   2  0‬‬
‫‪ H1 :‬קיים הבדל בין זמן שיחות הטלפון בין שתי הערים‬
‫נבדוק גבולות קריטיים עבור ‪  0.05 ,   0.01‬‬
‫‪82‬‬
‫‪4.842 3.612‬‬
‫‪‬‬
‫‪ 3.62‬‬
‫‪10‬‬
‫‪12‬‬
‫‪C  1.96 ‬‬
‫‪ 22‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪‬‬
‫‪n2‬‬
‫‪4.842 3.612‬‬
‫‪C  2.57 ‬‬
‫‪‬‬
‫‪ 4.74‬‬
‫‪10‬‬
‫‪12‬‬
‫‪n2‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪C  0  Z 0.975 ‬‬
‫‪C  0  Z 0.995 ‬‬
‫ההפרש בין הממוצעים הוא ‪ 3.66‬לכן עבור ‪ 5%‬נדחה את השערת האפס ועבור ‪ 1%‬מקבלים את השערת האפס ‪.‬‬
‫‪.6‬‬
‫מבחן דו כווני‪:‬‬
‫נשים ‪  5 :‬‬
‫‪n  65‬‬
‫‪X 1  22‬‬
‫גברים‪  5 :‬‬
‫‪n  60‬‬
‫‪X 2  18‬‬
‫‪X1  X 2  4‬‬
‫א‪.‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬אין הבדל בזמן הגלישה בין גברים לנשים‪.‬‬
‫‪1   2  0‬‬
‫‪ H1 :‬קיים הבדל בזמן הגלישה בין גברים לנשים‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪ 22‬‬
‫‪ Z 0.975  1.96‬‬
‫‪n2‬‬
‫‪ Z‬‬
‫‪0.05 ‬‬
‫‪1‬‬
‫‪‬‬
‫‪2 ‬‬
‫‪‬‬
‫‪Z‬‬
‫‪‬‬
‫‪1 ‬‬
‫‪ 2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪‬‬
‫‪C  1   2  Z ‬‬
‫‪‬‬
‫‪1 ‬‬
‫‪ 2‬‬
‫‪52 52‬‬
‫‪‬‬
‫‪‬‬
‫‪ 0.8951‬‬
‫‪60 65‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪1   2  0‬‬
‫‪C  0  0.8951  1.96  1.754‬‬
‫‪ 1.754‬הוא הגבול הקריטי ‪ ,‬אם ההפרש בין שני הממוצעים קטן מ‪ 1.754 -‬נקבל את ‪H 0‬‬
‫‪H0‬‬
‫‪4‬‬
‫‪1.754‬‬
‫‪0‬‬
‫‪83‬‬
‫ד‪.‬‬
‫נדחה את השערת האפס ונקבל את השערת המחקר – ההפרש בין הממוצעים ‪ , 4 -‬נמצא בתחום דחיית השערת‬
‫האפס ‪ ,‬קיים הבדל בין זמן הגלישה בין נשים וגברים‪.‬‬
‫ה‪.‬‬
‫דחינו את השערת האפס ‪ -‬השגיאה האפשרית ‪ -‬דחינו את השערת האפס בזמן שהיא נכונה ‪,‬‬
‫‪ ,   0.01‬בהתאם להגדרת המחקר הסיכוי לשגיאה ‪. 1%‬‬
‫שגיאה מסוג ראשון ‪‬‬
‫ההסתברות האמיתית לשגיאה היא למעשה רמת המובהקות הקטנה ביותר(המינימאלית) בה עדיין נקבל את אותן‬
‫מסקנות ‪ ,‬כל עוד ‪ C<4‬נקבל את אותן מסקנות‪..‬‬
‫‪(X 1  X 2)  0‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪40‬‬
‫‪ 4.46‬‬
‫‪0.8951‬‬
‫‪ '  0.0004‬‬
‫‪Z 1  ‬‬
‫‪‬‬
‫‪ 0.9998‬‬
‫‪Z‬‬
‫‪'‬‬
‫‪ 1 ‬‬
‫‪ 2 ‬‬
‫'‪‬‬
‫‪2‬‬
‫ההסתברות לשגיאה היא ‪ – 0.0004‬הסיכוי לשגיאה ‪.0.04%‬‬
‫‪1‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪ '  0.0004‬‬
‫‪‬‬
‫‪12‬‬
‫‪Z (1 ') ‬‬
‫‪' ‬‬
‫‪n1‬‬
‫‪ 0.9998‬‬
‫)‪ ' (0.0004)   (0.05‬‬
‫‪' ‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪40‬‬
‫‪ 4.46‬‬
‫‪0.8951‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪Z C  Z 0.975  1.96‬‬
‫‪40‬‬
‫‪ 4.46‬‬
‫‪0.8951‬‬
‫) ‪( X 1  X 2 )  ( 1   2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n2‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪n1‬‬
‫ערך ‪ Z‬הנבדק נקרא גם ‪ - Z Critical‬ערך המוביל אותנו לגבול הקריטי‬
‫)‪Z STAT (4.46)  Z (1.96‬‬
‫‪84‬‬
‫‪.7‬‬
‫מבחן להשוואת ממוצעים ‪ ,‬סטיות תקן באוכלוסיה ידועות – מבחן ‪ , Z‬מבחן דו כיווני‬
‫‪ 1  40‬‬
‫‪X 1  200‬‬
‫‪n1  8‬‬
‫‪20  35‬‬
‫‪ 2  43‬‬
‫‪X 2  190‬‬
‫‪n2  7‬‬
‫‪30  40‬‬
‫‪1   2  0‬‬
‫‪X 1  X 2  10‬‬
‫‪ H 0 :‬אין הבדל בין הגילאים בגובה הממוצע של חשבון הטלפון‬
‫‪1   2  0‬‬
‫‪ H1 :‬קיים הבדל בין הגילאים בגובה הממוצע של חשבון הטלפון‬
‫‪40 2 43 2‬‬
‫‪‬‬
‫‪ 42.26‬‬
‫‪8‬‬
‫‪7‬‬
‫‪ 22‬‬
‫‪C  0  1.96 ‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪C  1   2  Z‬‬
‫‪H0‬‬
‫‪10‬‬
‫‪42.26‬‬
‫‪0‬‬
‫‪ 42.26‬‬
‫הפרש הממוצעים נמצא בתחום קבלת השערת האפס – נקבל את השערת האפס אין הבדל בגובה החשבון‪.‬‬
‫ב‪.‬‬
‫רווח בר סמך‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪X Z‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪40‬‬
‫‪40‬‬
‫‪   200  1.65 ‬‬
‫‪8‬‬
‫‪8‬‬
‫‪176.66    223.34‬‬
‫ג‪.‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪X Z‬‬
‫‪200  1.65 ‬‬
‫ערך ‪ Z‬בטבלה עבור ‪ 98%‬הוא ‪ , 2.33‬ערך ‪ Z‬בטבלה עבור ‪ 90%‬הוא ‪ 1.65‬מאחר והערך עבור ‪98%‬‬
‫גדול פי ‪ 1.41‬המשמעות היא שהרווח יגדל פי ‪1.41‬‬
‫ד‪.‬‬
‫‪0  210‬‬
‫‪  40‬‬
‫‪  X 3  186.66‬‬
‫‪n3  9‬‬
‫‪40  50‬‬
‫רמת המובהקות הקטנה ביותר – ה‪  -‬המינימאלית מתקבלת כאשר ‪( . C  ‬המרחק בין ‪ ‬ל‪ - 0 -‬ערך מוחלט)‬
‫‪210  186.66‬‬
‫‪2‬‬
‫‪35‬‬
‫) (‬
‫‪9‬‬
‫‪Z1 ‬‬
‫‪  0‬‬
‫‪‬‬
‫‪Z1 ‬‬
‫(‬
‫)‬
‫‪n‬‬
‫‪1    0.9772‬‬
‫‪  0.0228‬‬
‫‪85‬‬
‫ה‪.‬‬
‫אורך הרווח הוא ‪ 15‬כלומר אורך מחצית הרווח הוא ‪7.5‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪ 7.5‬‬
‫‪  X Z‬‬
‫‪‬‬
‫‪n‬‬
‫‪35‬‬
‫‪1.96 ‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪‬‬
‫‪ 7.5‬‬
‫‪n‬‬
‫‪‬‬
‫‪X Z‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪2‬‬
‫‪84  n‬‬
‫‪ 1.96  35 ‬‬
‫‪‬‬
‫‪ n‬‬
‫‪ 7.5 ‬‬
‫‪86‬‬
‫הסקה סטטיסטית על הפרש ממוצעים ‪ -‬סטיות התקן אינן ידועות‬
‫כאשר סטיות התקן אינן ידועות ‪ ,‬יש להבחין בין שני מצבים‪:‬‬
‫סטיות התקן אינן ידועות אך שוות ‪-‬‬
‫‪1   2  ‬‬
‫סטיות התקן אינן ידועות ואינן שוות ‪-‬‬
‫‪1   2‬‬
‫סטיות תקן אינן ידועות – אך שוות‬
‫כאשר אנו טוענים לסטיות תקן שוות ‪ ,‬אין הכוונה לשוויון מלא כלומר זהות בין סטיות התקן אלא שוויון סביב‬
‫טווח מסוים ‪ ,‬בדומה לבדיקת שוויון בין ממוצעים ‪ ,‬ניתן לבצע מבחן לבדיקת שוויון בין שונויות ‪ ,‬כלומר קיים‬
‫מבחן להשוואה בין שונויות בו מגדירים גבולות קריטיים ובהתאם לכך ניתן לקבוע האם השונויות ‪ /‬סטיות התקן‬
‫שוות או לא‪.‬‬
‫‪‬‬
‫‪‬‬
‫כאשר השונות ‪ /‬סטית התקן לא ידועה יש לאמוד אותה – כלומר לחשב את ‪. S‬‬
‫‪‬‬
‫כאשר אומדים את סטית התקן ‪ ,‬משתמשים בהתפלגות ‪.t‬‬
‫‪‬‬
‫מס' דרגות החופש – ‪ , df‬כאשר עוסקים בשני מדגמים ‪, n1  1  n2  1  n1  n2  2 --‬‬
‫כלומר מס' דרגות החופש הוא למעשה חיבור דרגות החופש של שני המדגמים‪.‬‬
‫כאשר סטית התקן שווה בשתי האוכלוסיות ‪ ,‬ניתן לרשום את טעות התקן המשותפת כחיבור טעויות התקן‪:‬‬
‫‪1‬‬
‫‪1‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪‬‬
‫‪2‬‬
‫‪n2‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1‬‬
‫‪‬‬
‫‪ 1 1 ‬‬
‫‪( X 1  X 2 ) ~ N  1  2 ,  2    ‬‬
‫‪ n1 n2  ‬‬
‫‪‬‬
‫נורמאלי‬
‫ת‬
‫השווה לסכום ריבועי טעות‬
‫התקן ‪ ,‬של כל קבוצה‬
‫ההפרש בין‬
‫ממוצעי‬
‫מתפלג‬
‫להפרש ממוצעי‬
‫האוכלוסיות‬
‫כאשר יש שוויון שונויות ניתן לאמוד את השונות ע"פ אחד משני המדגמים‪:‬‬
‫‪( X 2i  X 2 ) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪n2  1‬‬
‫‪2‬‬
‫‪‬‬
‫‪S2‬‬
‫‪( X 1i  X 1 ) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪n1  1‬‬
‫‪2‬‬
‫‪‬‬
‫‪S1‬‬
‫‪87‬‬
‫מאחר ושני המדגמים אומדים את אותה שונות יהיה מדויק יותר לאמוד את השונות דרך שני המדגמים‪,‬‬
‫אנו אומדים את השונות כממוצע משוקלל של שתי השונויות ‪.‬‬
‫‪( X 1i  X 1 ) 2   ( X 2i  X 2 ) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪S‬‬
‫‪n1  n2  2‬‬
‫אם נסדר את הנוסחאות הנ"ל ‪:‬‬
‫‪( X 2i  X 2 ) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n2  1‬‬
‫‪( X 1i  X 1 ) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪S2‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1  1‬‬
‫‪‬‬
‫‪S1‬‬
‫‪‬‬
‫‪S 12 (n1  1)   ( X 1i  X 1 ) 2‬‬
‫‪S 2 2 (n2  1)   ( X 2i  X 2 ) 2‬‬
‫‪‬‬
‫‪‬‬
‫)‪S (n1  1)  S 2 (n2  1‬‬
‫‪S ‬‬
‫‪n1  n2  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪1‬‬
‫‪2‬‬
‫השונות המשוקללת ‪ -‬ממוצע משוקלל של שונויות שני המדגמים‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪S S‬‬
‫‪S S‬‬
‫‪‬‬
‫‪ 1   2  X 1  X 2  t‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪n1 n 2 2,1‬‬
‫‪n1 n2‬‬
‫‪n‬‬
‫‪n2‬‬
‫‪1‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1 n 2 2,1‬‬
‫‪‬‬
‫‪ X 2 t‬‬
‫‪1‬‬
‫‪X‬‬
‫‪2‬‬
‫מאחר והשונות היא שונות משוקללת ‪ ,‬ניתן להוציא את ‪ , S‬מתוך השורש ולקבל ‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1 1‬‬
‫‪1 1‬‬
‫‪S‬‬
‫‪  1   2  X 1  X 2  t‬‬
‫‪‬‬
‫‪S‬‬
‫‪‬‬
‫‪‬‬
‫‪n1 n 2 2,1‬‬
‫‪n1 n2‬‬
‫‪n‬‬
‫‪n2‬‬
‫‪1‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1 n 2 2,1‬‬
‫‪‬‬
‫‪ X2 t‬‬
‫‪1‬‬
‫‪X‬‬
‫‪88‬‬
‫שאלה‬
‫חוקר מעוניין להשוות שני סוגי כדורים להורדת חם במטרה לאמוד את ההפרש במשך זמן הורדת החם בין שני הכדורים‪.‬‬
‫‪‬‬
‫כדור א' ניתן למדגם מקרי של ‪ 19‬נבדקים ‪ ,‬נמצא כי ‪S  0.8‬‬
‫‪. X  3.2‬‬
‫כדור ב' ניתן למדגם מקרי של ‪ 23‬נבדקים ‪ ,‬נמצא כי ‪S  0.6‬‬
‫‪. X  2.5‬‬
‫‪‬‬
‫א‪.‬‬
‫חשבו רווח בר סמך להפרש בין הזמן הממוצע להורדת החם בין שני הכדורים‪ ,‬ברמת מובהקות של ‪.0.05‬‬
‫ב‪.‬‬
‫בדקו את הטענה כי כדור א' יעיל יותר (משך זמן הורדת החם ארוך יותר) ‪ ,‬ברמת מובהקות של ‪.0.05‬‬
‫נתונים וחישובים‪:‬‬
‫‪X 1  X 2  3.2  2.5  0.7‬‬
‫‪‬‬
‫‪S 2  0.6‬‬
‫‪‬‬
‫‪X 2  2.5‬‬
‫‪S 1  0.8‬‬
‫‪ t 40, 0.975  2.021‬‬
‫‪0.05‬‬
‫‪2‬‬
‫‪X 1  3.2‬‬
‫‪t‬‬
‫‪19 23 2 ,1‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪n1 n 2  2 ,1‬‬
‫‪‬‬
‫)‪S 1 (n1  1)  S 2 (n2  1) 0.8 2 (19  1)  0.6 2 (23  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 0.486‬‬
‫‪n1  n2  2‬‬
‫‪40‬‬
‫‪2‬‬
‫‪‬‬
‫‪S  0.697‬‬
‫‪2‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪‬‬
‫‪ 0.697 ‬‬
‫‪‬‬
‫‪ 0.216‬‬
‫‪n1 n2‬‬
‫‪19 23‬‬
‫א‪.‬‬
‫‪t‬‬
‫‪2‬‬
‫‪‬‬
‫‪S‬‬
‫נציב את הנתונים בנוסחה לחישוב רווח בר סמך‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1 1‬‬
‫‪1 1‬‬
‫‪  1   2  X 1  X 2  t‬‬
‫‪‬‬
‫‪S‬‬
‫‪‬‬
‫‪‬‬
‫‪n1 n 2  2 ,1‬‬
‫‪n1 n2‬‬
‫‪n1 n2‬‬
‫‪2‬‬
‫‪‬‬
‫‪S‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1 n 2  2 ,1‬‬
‫‪‬‬
‫‪ X 2 t‬‬
‫‪1‬‬
‫‪X‬‬
‫‪0.7  2.021  0.216  1   2  0.7  2.021  0.216‬‬
‫‪0.263  1   2  1.136‬‬
‫ב‪.‬‬
‫השערה חד כיוונית – כלפי מעלה – המטרה היא לבדוק האם לכדור א' השפעה טובה יותר מאשר לכדור‬
‫ב' כלומר האם משך הזמן בו החולה נשאר ללא חם לאחר כדור א' ארוך ממשך הזמן לאחר כדור ב'‪.‬‬
‫‪.1‬‬
‫‪1   2  0‬‬
‫‪H0 :‬‬
‫כדור א' אינו עדיף על כדור ב' במשך זמן הורדת החם‪.‬‬
‫‪1    0‬‬
‫‪H1 :‬‬
‫כדור א' עדיף על כדור ב' במשך זמן הורדת החם‪.‬‬
‫‪2‬‬
‫‪.2‬‬
‫‪89‬‬
‫‪.3‬‬
‫‪1‬‬
‫‪1‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪‬‬
‫‪C  1   2  t n1 n 22,1  S‬‬
‫‪1   2  0‬‬
‫‪C  0  1.684  0.216  0.363‬‬
‫כלומר ‪ 0.363‬הוא הגבול הקריטי ‪ ,‬במילים אחרות אם ההפרש בין שני הממוצעים קטן מ‪ 0.363 -‬נקבל את ‪H 0‬‬
‫‪H0‬‬
‫‪0.7‬‬
‫‪.4‬‬
‫‪0.363‬‬
‫‪0‬‬
‫נדחה את השערת האפס ‪ ,‬נקבל את השערת המחקר – מאחר וההפרש בין הממוצעים ‪ ,0.7‬נמצא בתחום דחיית‬
‫השערת האפס ‪ -‬יש הבדל בין משך השפעת שני הכדורים ‪ ,‬כדור א' משפיע על הורדת החם לפרק זמן ארוך‬
‫יותר באופן מובהק‪.‬‬
‫‪.5‬‬
‫דחינו את השערת האפס ‪ ,‬השגיאה האפשרית ‪ -‬דחינו את השערת האפס בזמן שהיא נכונה ‪ ,‬שגיאה מסוג‬
‫‪‬‬
‫ההסתברות האמיתית לשגיאה היא רמת המובהקות הקטנה ביותר (המינימאלית) בה עדיין נקבל את אותן מסקנות‪.‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪tn1 n 2 2,1 ' ‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪0.0005   '  0.005‬‬
‫‪0.995  1   '  0.9995‬‬
‫‪0.7  0‬‬
‫‪ 3.24‬‬
‫‪0.216‬‬
‫‪t40,1 ' ‬‬
‫‪90‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪tn1 n 2 2,1 ' ‬‬
‫‪' ‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪0.0005   '  0.005‬‬
‫‪' ‬‬
‫‪0.7  0‬‬
‫‪ 3.24‬‬
‫‪0.216‬‬
‫‪0.995  1   '  0.9995‬‬
‫‪ ' (0.0005 ‬‬
‫)‪ 0.005)   (0.05‬‬
‫‪t40,1 ' ‬‬
‫‪t40,0.95  1.684‬‬
‫‪0.7  0‬‬
‫‪ 3.24‬‬
‫‪0.216‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪tSTAT  tn1 n 2  2,1 ' ‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫)‪tSTAT (3.24)  t (1.684‬‬
‫‪91‬‬
‫‪.1‬‬
‫נערך מחקר השוואתי בין שני בתי ספר במטרה להשוות בין הישגי התלמידים בכיתות י"ב בין שני בתי‬
‫הספר ‪ ,‬נלקח מדגם מקרי של תלמידים בכיתה י"ב בכל בית ספר ונבדק ממוצע ציוניהם ‪ ,‬להלן הנתונים‪:‬‬
‫‪70‬‬
‫‪70‬‬
‫‪70 65 100‬‬
‫בית ספר ‪A‬‬
‫‪70 80 85‬‬
‫בית ספר ‪B‬‬
‫סטיות התקן באוכלוסיות שוות‪.‬‬
‫‪80 95 100‬‬
‫‪90 100 70‬‬
‫‪90‬‬
‫‪90‬‬
‫‪85‬‬
‫‪85‬‬
‫‪70‬‬
‫‪80‬‬
‫‪80‬‬
‫‪80‬‬
‫‪60‬‬
‫‪70‬‬
‫‪65‬‬
‫‪50‬‬
‫א‪.‬‬
‫בנו רווח בר סמך להפרש ממוצעי הציונים בין שני בתי הספר ‪ ,‬ברמת סמך של ‪0.98‬‬
‫ב‪.‬‬
‫בדקו את הטענה כי קיים פער בהישגים הלימודיים בין שני בתי הספר ברמת מובהקות של ‪0.05‬‬
‫‪.2‬‬
‫מדגם מקרי של ‪ 20‬חולים במחלה ‪ BB‬טופלו בתרופה מסוימת ונזקקו בממוצע עד החלמתם ל‪ 60 -‬מ"ג‬
‫‪‬‬
‫מהתרופה עם סטיית תקן ‪ 6‬מ"ג ) ‪ . ( S‬מדגם מקרי של ‪ 12‬חולים במחלה ‪ SARA‬טופלו באותה תרופה ונזקקו‬
‫לכמות ממוצעת של ‪ 64‬מ"ג מהתרופה עד החלמתם ‪ ,‬עם סטית תקן של ‪ 8‬מ"ג‪ .‬בהנחה כי סטיות התקן שוות‪.‬‬
‫האם נכונה הטענה כי להחלמה ממחלת ‪ SARA‬נדרשת כמות רבה יותר של התרופה מאשר ל‪)   0.025 ( BB-‬‬
‫‪.3‬‬
‫השערת האפס (‪ )Ho‬היא שאין הבדל בין תוחלות ההוצאות החודשיות על שימוש בטלפון נייד בין חיילים‬
‫לחיילות‪ .‬ההשערה האלטרנטיבית (‪ )H1‬היא שתוחלות ההוצאות החודשיות הן שונות‪.‬‬
‫לבדיקת השערות אלו נלקחו שני מדגמים בלתי תלויים של חיילים ושל חיילות והתקבל‪:‬‬
‫חיילות‬
‫חיילים‬
‫‪₪ 192‬‬
‫‪₪ 180‬‬
‫‪₪ 31.5‬‬
‫‪₪ 26‬‬
‫סטיית תקן מדגמית ‪ sˆ ‬‬
‫‪17‬‬
‫‪15‬‬
‫בהנחה שהוצאות השימוש של חיילים וחיילות בלתי תלויות ומתפלגות נורמאלית וסטיות התקן שוות ‪ ,‬אזי ‪:‬‬
‫א‪ .‬ברמת מובהקות של ‪ 5%‬נדחה את ‪ ,Ho‬אך לא ברמת מובהקות של ‪ .10%‬ב‪.‬‬
‫נדחה את השערת האפס‪ .‬ג‪ .‬ברמת מובהקות ‪ 10%‬נדחה את ‪.Ho‬‬
‫‪.4‬‬
‫ד‪.‬‬
‫ברמת מובהקות של ‪5%‬‬
‫ברמת מובהקות ‪ 5%‬נקבל את ‪Ho‬‬
‫בדיקת גובה החשבון החודשי עבור השימוש בטלפון הסלולארי בקרב לקוחות בגילאים שונים הראתה ‪:‬‬
‫‪20-30‬‬
‫‪30-40‬‬
‫‪8‬‬
‫‪7‬‬
‫‪200‬‬
‫‪190‬‬
‫סטית התקן של המדגם‬
‫‪40‬‬
‫‪43‬‬
‫‪ , 160 ,240 170 ,160 ,160 ,230 ,150, 210 ,200‬הנח שגובה החשבון החודשי בכל קבוצת גיל מפולג‬
‫נורמאלית וקיים שוויון שונויות בין גובה החשבון החודשי בקבוצות הגיל השונות‪.‬‬
‫א‪ .‬השווה בין תוחלות גובה החשבון של לקוחות בגילאים ‪ 20-30‬ובגילאים ‪ 40 -30‬רמת מובהקות של ‪.5%‬‬
‫‪92‬‬
‫ב‪ .‬בנה רווח סמך לתוחלת גובה החשבון החודשי בגילאים ‪ 20-30‬ברמת סמך של ‪ . 90%‬פי כמה‬
‫יגדל הרווח אם רמת הסמך תעלה ל‪?98%-‬‬
‫בסעיפים ג' ו‪ -‬ד' הנח שסטית התקן של גובה החשבון החודשי בקרב לקוחות בני ‪ 40-50‬ידועה ושווה ל‪.35-‬‬
‫ג‪.‬‬
‫מצא את רמת המובהקות המינימאלית בה ניתן לדחות את השערת האפס כאשר בודקים השערה‬
‫שתוחלת גובה התשלום של לקוחות בגילאים ‪ 50-40‬שווה ל‪ 210-‬שקלים כנגד אלטרנטיבה‬
‫שתוחלת זו נמוכה יותר‪.‬‬
‫ד‪ .‬מהו מספר החשבונות המינימאלי שיש לבחור במטרה לבנות רווח סמך לתוחלת גובה החשבון החודשי‬
‫של לקוחות בגילאים ‪ 50-40‬ברמת סמך של ‪ 95%‬כדי שאורך הרווח לא יעלה על ‪ 15‬שקלים‪.‬‬
‫‪.5‬‬
‫חברה מסוימת מספקת ללקוחותיה שרותי תמיכה טלפוניים לגלישה באינטרנט‪ .‬אחד המדדים לטיב‬
‫השירות הוא הזמן הנדרש לעובד על מנת למצוא ולטפל בבעיה‪.‬‬
‫המנכ"ל טוען שעובדים וותיקים (עובדים לפחות שנה ) נותנים שירות מהיר יותר מעובדים חדשים (פחות משנה)‪.‬‬
‫לבדיקת הטענה נלקח מדגם של ‪ 38‬עובדי החברה הוותיקים ו‪ 24-‬עובדי החברה החדשים‪ .‬התקבלו התוצאות‪:‬‬
‫מדגם עובדים וותיקים ‪ :‬זמן שירות ממוצע של ‪ 6.5‬דקות עם סטיית תקן מדגמית של ‪ 3‬דקות‪.‬‬
‫מדגם עובדים חדשים ‪ :‬זמן שירות ממוצע של ‪ 7‬דקות עם סטיית תקן מדגמית של ‪ 3.4‬דקות‪.‬‬
‫הניחו שזמן השירות מתפלג נורמאלית וקיים שוויון שונויות‪.‬‬
‫א‪.‬‬
‫בדוק את טענת המנהל ברמת מובהקות של ‪.1%‬‬
‫ב‪.‬‬
‫בעבר ממוצע זמן השירות של עובדים חדשים היה ‪ 7.5‬דקות‪ .‬האם ניתן לומר על סמך תוצאות‬
‫המדגם שחל שיפור בשירות של העובדים החדשים ? רמת מובהקות ‪.5%‬‬
‫ציין מהו המבחן בו אתה משתמש ‪ ,‬נסח את ההשערות ואת ההנחות המתאימות‪.‬‬
‫לפתרון סעיפים ג' ו‪-‬ד' הנח שסטיית התקן של זמן השרות של עובדים חדשים ידועה והיא ‪ 4‬דקות‪.‬‬
‫ג‪.‬‬
‫סטטיסטיקאי חישב רווח סמך לתוחלת זמן השירות של עובדים חדשים וקיבל ‪5.72    8.28‬‬
‫מהי רמת הביטחון (רמת הסמך) לפיה חושב הרווח ?‬
‫ד‪.‬‬
‫הוחלט לבדוק שוב את טיב השירות של עובדים חדשים‪ .‬מהו גודל המדגם המינימאלי שצריך‬
‫לקחת אם רוצים שאורך הרווח לא יעלה על ‪ 0.5‬דקה וזאת ברמת בטחון (רמת סמך) ‪? 95%‬‬
‫‪.6‬‬
‫מפעל לארטיקים רוצה לבדוק הבדלי מכירה בין שני אזורים ‪ ,‬נלקחו שני מדגמים של חנויות – מדגם א‬
‫כלל ‪ 40‬חנויות באזור ‪ A‬ומדגם ב' כלל ‪ 22‬חנויות באזור ‪. B‬‬
‫מדגם א' – כל חנות קיבלה ‪ 300‬ק"ג ארטיקים ‪ ,‬קצב המכירות הממוצע ליום היה ‪ 9‬ק"ג ארטיקים‪.‬‬
‫מדגם ב' – כל חנות קיבלה ‪ 450‬ק"ג ארטיקים ‪ ,‬קצב המכירות הממוצע היה ‪ 13‬ק"ג ליום‪.‬‬
‫סטית התקן באזור ‪ A‬הייתה ‪ 2.3‬ק"ג ביום‪ ,‬ובאזור ב' ‪ 2.8‬ק"ג ביום‪.‬‬
‫א‪.‬‬
‫בנו רווח בר סמך להפרש בין ממוצע המכירות היומי בין שני האזורים – רמת סמך ‪. 0.95‬‬
‫ב‪.‬‬
‫בדקו את הטענה כי אזור ב' בעל פוטנציאל מכירה גבוה יותר ( ‪.)   0.04‬‬
‫ג‪.‬‬
‫מה תהיה השגיאה האפשרית אם קצב המכירה באזור ‪ A‬יעלה ב‪.15%-‬‬
‫‪93‬‬
‫‪.1‬‬
‫‪‬‬
‫‪S 2  12.67‬‬
‫‪ t24,0.99  2.492‬‬
‫‪0.02‬‬
‫‪2‬‬
‫‪t‬‬
‫‪1214 2,1‬‬
‫‪‬‬
‫‪X 2  77.5‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1 n 2  2,1‬‬
‫‪t‬‬
‫‪S 1  13.73‬‬
‫‪X 1  X 2  80.42  77.5  2.92‬‬
‫‪‬‬
‫‪‬‬
‫‪X 1  80.42‬‬
‫‪‬‬
‫)‪S 12 (n1  1)  S 2 2 (n2  1) 13.732 (12  1)  12.67(14  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 173.35‬‬
‫‪n1  n2  2‬‬
‫‪24‬‬
‫‪S  13.16‬‬
‫‪1 1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪‬‬
‫‪ 13.16 ‬‬
‫‪‬‬
‫‪ 5.177‬‬
‫‪n1 n2‬‬
‫‪12 14‬‬
‫א‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪S‬‬
‫נציב את הנתונים בנוסחה לחישוב רווח בר סמך‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ 1‬‬
‫‪1 1‬‬
‫‪1‬‬
‫‪S‬‬
‫‪‬‬
‫‪ 1   2  X 1  X 2  t‬‬
‫‪‬‬
‫‪ S‬‬
‫‪n1 n 22,1‬‬
‫‪n1 n2‬‬
‫‪n1 n2‬‬
‫‪2‬‬
‫‪X 1  X 2   t n1n22,1‬‬
‫‪2‬‬
‫‪2.92  2.492  5.177  1   2  2.92  2.492  5.177‬‬
‫‪ 9.98  1   2  15.82‬‬
‫ב‪.‬‬
‫השערה דו כיוונית – המטרה היא לבדוק האם קיים פער בהישגי התלמידים בין שני בתי הספר‪.‬‬
‫ב‪.1‬‬
‫ב‪.2‬‬
‫‪1   2  0‬‬
‫‪H0 :‬‬
‫אין הבדל בהישגים בין שני בתי הספר‬
‫‪1   2  0‬‬
‫‪H1 :‬‬
‫יש הבדל בהישגים בין בתי הספר‪.‬‬
‫‪94‬‬
‫ב‪.3‬‬
‫‪1 1‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪‬‬
‫‪S‬‬
‫‪‬‬
‫‪2‬‬
‫‪ t 24, 0.975  2.061‬‬
‫‪C 2  0  2.064  5.177  10.67‬‬
‫כלומר‬
‫‪n1 n 2  2,1‬‬
‫‪0.05‬‬
‫‪2‬‬
‫‪C1,2  1  2  t‬‬
‫‪1   0  0‬‬
‫‪t‬‬
‫‪1214 2 ,1‬‬
‫‪C 2  0  2.064  5.177  10.67‬‬
‫‪  10.67‬הוא הגבול הקריטי ‪ ,‬במילים אחרות אם ההפרש בין שני הממוצעים קטן או גדול מ‪10.68 -‬‬
‫נדחה את ‪ H 0‬אם ההפרש בין ‪ -10.67‬ל‪ 10.67-‬נקבל את ‪H 0‬‬
‫‪H0‬‬
‫‪10.67‬‬
‫‪0‬‬
‫‪2.92‬‬
‫‪ 10.67‬‬
‫מסקנה – נקבל את ‪H 0‬‬
‫ב‪.4‬‬
‫נקבל את השערת האפס ונדחה את השערת המחקר – ההפרש בין הממוצעים ‪ ,2.92‬נמצא בתחום קבלת השערת‬
‫האפס ‪ -‬אין הבדל בהישגי התלמידים בין שני בתי הספר ברמת מובהקות של ‪0.05‬‬
‫ב‪.5‬‬
‫מאחר וקיבלנו את השערת האפס ‪ ,‬השגיאה האפשרית ‪ -‬קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה ‪,‬‬
‫כלומר שגיאה מסוג שני ‪.  -‬‬
‫)‪C  (X 1  X 2‬‬
‫‪‬‬
‫‪1 1‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪ t24,1  ‬הטעות היא השטח בין הפרש הממוצעים לבין הגבול הקריטי ‪ -‬נחשב‬
‫‪2‬‬
‫‪10.67  2.92‬‬
‫‪5.177‬‬
‫‪‬‬
‫‪ 1.497‬‬
‫‪‬‬
‫‪ 0.95‬‬
‫‪2‬‬
‫‪0.1    0.2‬‬
‫את ההסתברות באמצעות טבלת ההתפלגות ‪ t‬הערך ‪ 1.499‬נמצא בין‬
‫‪‬‬
‫‪24,1‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪24,1‬‬
‫‪t‬‬
‫שני ערכים לכן ההסתברות אינה נקודתית אלא בתחום‪.‬‬
‫הסיכוי לשגיאה הוא בין ‪ 10%‬ל‪.20%-‬‬
‫‪t‬‬
‫‪0 .9  1 ‬‬
‫‪‬‬
‫‪ 0.1‬‬
‫‪2‬‬
‫‪0.05 ‬‬
‫‪95‬‬
‫) ‪( X 1  X 2 )  ( 1   2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪n1  n 2  2 ,1 ‬‬
‫‪t‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.5   '  0.8‬‬
‫‪ 0.75‬‬
‫'‪‬‬
‫‪2‬‬
‫‪2.92  0‬‬
‫‪ 0.564‬‬
‫‪5.177‬‬
‫‪0.6  1 ‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪24,1‬‬
‫‪t‬‬
‫)‪ 0.8)   (0.05‬‬
‫‪t24,0.975  2.061‬‬
‫‪2.92  0‬‬
‫‪ 0.564‬‬
‫‪5.177‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪tSTAT  tn1 n 2  2,1 ' ‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫)‪tSTAT (0.564)  t (2.061‬‬
‫‪.2‬‬
‫‪n2  20‬‬
‫‪‬‬
‫‪S2  6‬‬
‫‪X 2  60‬‬
‫‪n1  12‬‬
‫‪tn1 n 2  2,1  t2012 2,0.975  t30,0.975  2.042‬‬
‫‪‬‬
‫‪S  6.8‬‬
‫‪‬‬
‫‪S1  8‬‬
‫‪X 1  64‬‬
‫‪X 1  X 2  64  60  4‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫)‪S 12 (n1  1)  S 2 2 (n2  1) 62 (20  1)  82 (12  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 42.66‬‬
‫‪n1  n2  2‬‬
‫‪30‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪‬‬
‫‪ 6.8 ‬‬
‫‪‬‬
‫‪ 2.48‬‬
‫‪n1 n2‬‬
‫‪12 20‬‬
‫‪‬‬
‫‪S‬‬
‫השערה חד כיוונית כלפי מעלה המטרה היא לבדוק האם למחלת ‪ SARA‬נדרשת כמות גדולה יותר של תרופה‬
‫מאשר למחלת ‪.BB‬‬
‫‪96‬‬
‫‪.1‬‬
‫‪1   2  0‬‬
‫‪H0 :‬‬
‫אין הבדל בכמות התרופה הנדרשת לשתי המחלות‬
‫‪1   2  0‬‬
‫‪H1 :‬‬
‫למחלת ‪ SARA‬נדרשת כמות גדולה יותר של תרופה‬
‫‪.2‬‬
‫‪.3‬‬
‫‪‬‬
‫‪1‬‬
‫‪1‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪C  1  2  tn1 n 22,1  S‬‬
‫‪1   2  0‬‬
‫‪C  0  2.042  2.48  5.064‬‬
‫‪H0‬‬
‫‪4‬‬
‫‪5.064‬‬
‫‪0‬‬
‫‪.4‬‬
‫נקבל את השערת האפס ונדחה את השערת המחקר – ההפרש בין הממוצעים הוא ‪ - 4‬נמצא בתחום קבלת השערת‬
‫האפס ‪ -‬אין הבדל בכמות התרופה הנדרשת לטיפול בשתי המחלות‬
‫‪.5‬‬
‫מאחר וקיבלנו את השערת האפס ‪ ,‬השגיאה האפשרית היא ‪ -‬קיבלנו את השערת האפס בזמן שהשערת המחקר‬
‫נכונה כלומר שגיאה מסוג שני ‪.  -‬‬
‫)‪C  (X 1  X 2‬‬
‫‪‬‬
‫‪1 1‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫הטעות היא השטח בין הפרש הממוצעים לבין הגבול‬
‫‪t30,1  ‬‬
‫הקריטי – נחשב את ההסתברות באמצעות טבלת ההתפלגות‬
‫‪ , t‬הסיכוי לשגיאה בין ‪ 25%‬ל‪40%-‬‬
‫‪5.064  4‬‬
‫‪2.48‬‬
‫‪ 0.429‬‬
‫‪t30,1  ‬‬
‫‪t30,1 ‬‬
‫‪0.6  1    0.75‬‬
‫‪0.25    0.4‬‬
‫‪97‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪tn1 n 2 2,1 ' ‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪ '  0.05‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪40‬‬
‫‪ 1.612‬‬
‫‪2.48‬‬
‫‪1   '  0.95‬‬
‫)‪ ' (0.05)   (0.025‬‬
‫‪t30,1 ' ‬‬
‫‪40‬‬
‫‪ 1.612‬‬
‫‪2.48‬‬
‫‪t30,0.975  2.042‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪tSTAT  tn1 n 2  2,1 ' ‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫)‪tSTAT (1.612)  t (2.041‬‬
‫‪.3‬‬
‫מבחן השערות דו כיווני (אין הבדל בהוצאות השימוש בין חיילים וחיילות) ‪ ,‬שני מדגמים בלתי תלויים ‪,‬‬
‫סטיות תקן באוכלוסיות לא ידועות – מבחן ‪.t‬‬
‫א‪ .‬השערות ‪:‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬אין הבדל בהוצאות החודשיות לטלפון בין חיילים וחיילות‬
‫‪1   2  0‬‬
‫‪ H1 :‬יש הבדל בהוצאות החודשיות לטלפון בין חיילים וחיילות‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫יש לחשב שונות משוקללת (שני מדגמים ב"ת)‬
‫‪‬‬
‫‪S  29.06‬‬
‫‪‬‬
‫‪‬‬
‫)‪S 1 (n1  1)  S 2 (n2  1) 262 (15  1)  31.52 (17  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 844.66‬‬
‫‪n1  n2  2‬‬
‫‪30‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪98‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪ t30,0.975  2.042‬‬
‫‪ ‬‬
‫‪n1 n 22,1 ‬‬
‫‪ 2‬‬
‫‪ t30,0.95  1.697‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪844.66 844.66‬‬
‫‪‬‬
‫‪ 10.29‬‬
‫‪15‬‬
‫‪17‬‬
‫‪t‬‬
‫‪ ‬‬
‫‪n1 n 22, 1 ‬‬
‫‪ 2‬‬
‫‪‬‬
‫‪C  1   2  Z ‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪1   2  0‬‬
‫‪t‬‬
‫‪C0.05  0  2.042  10.29  21.01‬‬
‫‪C0.1  0  1.697  10.29  17.46‬‬
‫חישבנו את הגבולות הקריטיים עבור רמות מובהקות של ‪ 0.1‬ו‪ 0.05-‬בשני הגבולות הפרש הממוצעים ‪ 12‬נמצא‬
‫בתחום קבלת השערת האפס‪.‬‬
‫תשובה ד נכונה‪.‬‬
‫‪.4‬‬
‫מבחן להשוואת ממוצעים ‪ ,‬סטיות תקן באוכלוסיה אינן ידועות – מבחן ‪ , t‬מבחן דו כיווני‬
‫‪‬‬
‫‪S 1  40‬‬
‫‪X 1  200‬‬
‫‪n1  8‬‬
‫‪20  35‬‬
‫‪S 2  43‬‬
‫‪X 2  190‬‬
‫‪n2  7‬‬
‫‪30  40‬‬
‫‪‬‬
‫‪X 1  X 2  10‬‬
‫‪1   2  0‬‬
‫‪1   2  0‬‬
‫נחשב את השונות המשוקללת‪:‬‬
‫‪‬‬
‫‪‬‬
‫)‪S 1 (n1  1)  S 2 (n2  1) 432 (7  1)  402 (8  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 1714.92‬‬
‫‪n1  n2  2‬‬
‫‪13‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪1714.92 1714.92‬‬
‫‪‬‬
‫‪ 46.29‬‬
‫‪8‬‬
‫‪7‬‬
‫‪C  0  2.16 ‬‬
‫‪2‬‬
‫‪‬‬
‫‪S12 S 2 2‬‬
‫‪C  1  2  t‬‬
‫‪‬‬
‫‪‬‬
‫‪ ‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪n1 n 2  2,1 ‬‬
‫‪2‬‬
‫‪‬‬
‫‪H0‬‬
‫‪ 46.29‬‬
‫‪0‬‬
‫‪10‬‬
‫‪46.29‬‬
‫הפרש הממוצעים נמצא בתחום קבלת השערת האפס – מקבלים את השערת האפס אין הבדל בין ממוצעי גובה‬
‫החשבון‪.‬‬
‫‪99‬‬
‫ב‪.‬‬
‫‪‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪( n 1)(1‬‬
‫‪S‬‬
‫‪n‬‬
‫‪   X t‬‬
‫‪‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪( n 1)(1‬‬
‫‪X t‬‬
‫‪40‬‬
‫‪40‬‬
‫‪   200  1.895 ‬‬
‫‪8‬‬
‫‪8‬‬
‫‪173.2    226.79‬‬
‫‪200  1.895 ‬‬
‫ערך ‪ t‬בטבלה עבור ‪ 98%‬הוא ‪ , 2.998‬ערך ‪ t‬בטבלה עבור ‪ 90%‬הוא ‪ 1.895‬מאחר והערך עבור ‪ 98%‬גדול פי‬
‫‪ 1.58‬המשמעות היא שהרווח יגדל פי ‪. 1.58‬‬
‫ג‪.‬‬
‫‪0  210‬‬
‫‪  X 3  186.66‬‬
‫‪  40‬‬
‫‪n3  9‬‬
‫‪40  50‬‬
‫סטית התקן ידועה לכן משתמשים בהתפלגות ‪Z‬‬
‫‪210  186.66‬‬
‫‪2‬‬
‫‪35‬‬
‫) (‬
‫‪9‬‬
‫‪  0‬‬
‫‪‬‬
‫‪Z1 ‬‬
‫‪Z1 ‬‬
‫(‬
‫)‬
‫‪n‬‬
‫‪1    0.9772‬‬
‫‪  0.0228‬‬
‫ד‪.‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪ 7.5‬‬
‫‪  X Z‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪n‬‬
‫‪35‬‬
‫‪1.96 ‬‬
‫‪‬‬
‫‪ 7.5‬‬
‫‪n‬‬
‫‪n‬‬
‫‪‬‬
‫‪X Z‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪2‬‬
‫‪ 1.96  35 ‬‬
‫‪‬‬
‫‪ n‬‬
‫‪ 7.5 ‬‬
‫‪84  n‬‬
‫‪.5‬‬
‫מבחן להשוואת ממוצעים ‪ ,‬סטיות תקן באוכלוסיה אינן ידועות – מבחן ‪ , t‬מבחן חד כיווני כלפי מטה‪.‬‬
‫‪‬‬
‫‪S1  3‬‬
‫‪X 1  6.5‬‬
‫‪n1  38‬‬
‫‪S 2  3.4‬‬
‫‪X2 7‬‬
‫‪n 2  24‬‬
‫‪‬‬
‫‪X 1  X 2  0.5‬‬
‫‪100‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬זמן השירות של עובדים ותיקים אינו מהיר יותר מזמן השירות של עובדים חדשים‪.‬‬
‫‪1   2  0‬‬
‫‪ H1 :‬זמן השירות של עובדים ותיקים מהיר יותר מזמן השירות של עובדים חדשים‪.‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫)‪S 12 (n1  1)  S 2 2 (n2  1) 3 2 (38  1)  3.4 2 (24  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 9.98‬‬
‫‪n1  n2  2‬‬
‫‪60‬‬
‫‪2‬‬
‫‪9.98 9.98‬‬
‫‪‬‬
‫‪ 1.968‬‬
‫‪38‬‬
‫‪24‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪C  0  2.39 ‬‬
‫‪C  0  t n1 n 22,1 ‬‬
‫‪H0‬‬
‫‪0‬‬
‫‪ 1.968  0.5‬‬
‫הפרש הממוצעים נמצא בתחום קבלת השערת האפס – מקבלים את השערת האפס זמן השירות של עובדים ותיקים‬
‫אינו מהיר יותר מזמן השירות של עובדים חדשים‪.‬‬
‫מבחן חד כיווני כלפי מטה להשוואת ממוצעים בין הממוצע הקיים לממוצע המדגם‪.‬‬
‫ב‪.‬‬
‫‪ H 0 :   7.5‬זמן השירות עובדים חדשים אינו קצר מזמן השירות של עובדים חדשים בעבר‪.‬‬
‫‪ H1 :   7.5‬זמן השירות של עובדים חדשים השתפר והתקצר ביחס לעבר‬
‫‪  0.05‬‬
‫‪‬‬
‫‪ 6.31‬‬
‫‪3.4‬‬
‫‪C  7.5  1.714 ‬‬
‫‪24‬‬
‫‪S‬‬
‫‪C   0  t n1,1 ‬‬
‫‪n‬‬
‫‪H0‬‬
‫‪7.5‬‬
‫‪7‬‬
‫‪6.31‬‬
‫הממוצע החדש גדול מהתחום הקריטי – נמצא בתחום קבלת השערת האפס ‪ ,‬לכן נקבל את השערת האפס – לא חל‬
‫שיפור בזמן השירות של העובדים החדשים‪.‬‬
‫‪101‬‬
‫ג‪.‬‬
‫סטית התקן באוכלוסיה ידועה ‪ ,‬נחשב רווח בר סמך באמצעות התפלגות ‪.Z‬‬
‫מחצית הרווח היא ‪.1.28‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪‬‬
‫‪‬‬
‫‪X Z‬‬
‫‪‬‬
‫‪n‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪X Z‬‬
‫‪5.72    8.28‬‬
‫‪‬‬
‫‪4‬‬
‫‪ 1.28‬‬
‫‪24‬‬
‫‪‬‬
‫)‬
‫‪ 1.56‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪(1‬‬
‫‪S‬‬
‫‪Z  ‬‬
‫‪ 1.28‬‬
‫) ‪(1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1.28  24‬‬
‫‪4‬‬
‫‪Z‬‬
‫‪  0.1188‬‬
‫ד‪.‬‬
‫‪‬‬
‫‪‬‬
‫)‬
‫‪ 0.9406‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1‬‬
‫אורך הרווח ‪" , 0.5‬נטפל" במחצית הרווח – ‪:0.25‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪  X Z‬‬
‫‪4‬‬
‫‪ 0.25‬‬
‫‪n‬‬
‫‪1.96 ‬‬
‫‪‬‬
‫‪n‬‬
‫‪ 0.25‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪X Z‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪2‬‬
‫‪984  n‬‬
‫‪.6‬‬
‫‪‬‬
‫‪S 1  2.3‬‬
‫‪‬‬
‫‪S 2  2.8‬‬
‫א‪.‬‬
‫‪ 1.96  4 ‬‬
‫‪‬‬
‫‪ n‬‬
‫‪ 0.25 ‬‬
‫‪X1  9‬‬
‫‪n1  40‬‬
‫‪X 2  13‬‬
‫‪n2  22‬‬
‫‪2.3 2  40  2.8 2  22‬‬
‫‪‬‬
‫‪ 6.4‬‬
‫‪40  22  2‬‬
‫‪2‬‬
‫‪2‬‬
‫)‪S 1 (n1  1)  S 2 (n2  1‬‬
‫‪n1  n2  2‬‬
‫‪2‬‬
‫‪S ‬‬
‫‪102‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪ 1   2  X 1  X 2  t‬‬
‫‪‬‬
‫‪ ‬‬
‫‪n1 n 2  2 ,1‬‬
‫‪n1 n2‬‬
‫‪n1 n2‬‬
‫‪2‬‬
‫‪6.4 6.4‬‬
‫‪6.4 6.4‬‬
‫‪‬‬
‫‪ 1   2  4  1.96 ‬‬
‫‪‬‬
‫‪40 22‬‬
‫‪40 22‬‬
‫‪‬‬
‫‪‬‬
‫‪n1 n 2  2 ,1‬‬
‫‪2‬‬
‫‪‬‬
‫‪ X 2 t‬‬
‫‪1‬‬
‫‪X‬‬
‫‪4  1.96 ‬‬
‫‪2.683  1   2  5.316‬‬
‫ב‪.‬‬
‫השערה חד כיוונית כלפי מעלה המטרה – האם אזור א' בעל פוטנציאל מכירות גבוה יותר‪.‬‬
‫‪.1‬‬
‫‪1   2  0‬‬
‫‪H0 :‬‬
‫לאזור א אין הבדל פוטנציאל מכירות גבוה יותר‪.‬‬
‫‪1   2  0‬‬
‫‪H1 :‬‬
‫לאזור א פוטנציאל מכירות גבוה יותר‪.‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪2‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪C  1   2  t n1 n 22,1 ‬‬
‫‪1   2  0‬‬
‫‪C  0  1.671  0.671  1.122‬‬
‫‪H0‬‬
‫‪4‬‬
‫‪1.122‬‬
‫‪0‬‬
‫‪103‬‬
‫‪.4‬‬
‫נדחה את השערת האפס ונקבל את השערת המחקר – ההפרש בין הממוצעים ‪ 4 -‬נמצא בתחום דחית השערת‬
‫האפס ‪ -‬אזור ב' בעל פוטנציאל מכירות גבוה יותר‬
‫‪.5‬‬
‫מאחר ודחינו את השערת האפס ‪ ,‬השגיאה האפשרית היא ‪ -‬דחינו את השערת האפס בזמן שהיא נכונה כלומר‬
‫שגיאה מסוג ראשון ‪.  -‬‬
‫‪(X 1  X 2)  0‬‬
‫‪‬‬
‫‪1 1‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫הטעות היא השטח מעבר לנקודה הרחוקה ביותר‬
‫‪t60,1 ‬‬
‫‪4‬‬
‫‪0.671‬‬
‫‪ 5.96‬‬
‫‪t60,1 ‬‬
‫בה נוכל למקם את ‪ – C‬הנקודה בה ‪X 1  X 2  C‬‬
‫‪  0.0005‬‬
‫‪t60,1‬‬
‫‪1    0.9995‬‬
‫) ‪( X 1  X 2 )  ( 1  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪tn1 n 2 2,1 ' ‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪ '  0.0005‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪40‬‬
‫‪ 5.96‬‬
‫‪0.671‬‬
‫‪1   '  0.9995‬‬
‫)‪ ' (0.0005)   (0.05‬‬
‫‪t 60,1 ' ‬‬
‫‪t 60,0.95  1.671‬‬
‫‪40‬‬
‫‪ 5.96‬‬
‫‪0.671‬‬
‫‪t STAT ‬‬
‫) ‪( X 1  X 2 )  ( 1   2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪t STAT  t n1 n 22,1 ' ‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n 2‬‬
‫)‪t STAT (5.96)  t (1.671‬‬
‫‪104‬‬
‫ג‪.‬‬
‫אם קצב המכירות יעלה ב‪ 20%-‬המשמעות היא שקצב המכירות הממוצע יהיה ‪ 10.8‬ק"ג‪.‬‬
‫במקרה זה הפרש הממוצעים ירד מ‪ 4 -‬ל‪. 2.2-‬‬
‫המסקנה לא תשתנה מאחר והגבול הקריטי אינו משתנה הפרש הממוצעים עדין נמצא בתחום דחית השערת האפס‬
‫הסיכוי לשגיאה יגדל – ככל שהפער בין הגבול הקריטי לערך הנבדק גדל כך הסיכוי לשגיאה קטן ולהיפך‪.‬‬
‫נחשב את הסיכוי לשגיאה במקרה זה‪:‬‬
‫‪2‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n 2‬‬
‫‪C  1   2  t n1 n 2 2,1 ‬‬
‫‪2.2  0  t 60,1  0.671‬‬
‫‪3.27  t 60,1‬‬
‫‪0.005    0.0005‬‬
‫‪2.2‬‬
‫‪ t 60,1‬‬
‫‪0.671‬‬
‫‪0.995  1    0.9995‬‬
‫‪105‬‬
‫מדגמים מזווגים‬
‫הסקה סטטיסטית על הפרשי ממוצעים של שני מדגמים מזווגים‬
‫שני מדגמים מזווגים ‪ ,‬הינם שני מדגמים הבנויים מזוגות של תצפיות – לכל תצפית במדגם א' קיים בן זוג‬
‫מתאים במדגם ב'‪.‬‬
‫את הזיווג ניתן ליצור בשני אופנים‪:‬‬
‫א‪.‬‬
‫חקירת אותו נבדק לפני ואחרי טיפול ‪ ,‬כלומר שני המדגמים מכילים למעשה את אותם אנשים ‪ ,‬כל אדם‬
‫הוא בן הזוג של עצמו – כל אדם מהווה קבוצת ביקורת של עצמו‪.‬‬
‫ב‪.‬‬
‫בחירת זוגות עם משתני רקע דומים‪ .‬משתני רקע הם למעשה גורמים מתערבים – גורמים אשר יכולים‬
‫להשפיע על תוצאות המחקר ועל ההבדל בין הזוגות ‪ ,‬כאשר אדם הוא בן הזוג של עצמו (סעיף א) מבחינת משתני‬
‫רקע‪/‬גורמים מתערבים זהו המצב האופטימאלי מאחר ואם קיים הבדל בין הטיפולים סיבתו תהיה הטיפול עצמו ולא‬
‫הבדלים בין המטופלים‪.‬‬
‫מאחר ואנו עובדים עם זוגות ‪ ,‬שני המדגמים יהיו בעלי אותו גודל ולמעשה ניתן לומר כי אנחנו עוסקים במדגם אחד‬
‫של ‪ n‬זוגות ‪ ,‬רעיון זה הוא גם הבסיס לניתוח הסטטיסטי אשר נעשה כאילו עסקנו במדגם אחד‪.‬‬
‫מאחר וההתייחסות היא למדגם אחד של ‪ n‬זוגות ‪ ,‬ההסקה נעשית ע"פ מדגם אחד כאשר סטית תקן אינה ידועה ‪.‬‬
‫‪‬‬
‫ההסקה נעשית על הפרשי הממוצעים – לטור הפרשים זה נחשב ממוצע ‪ d‬ונאמוד את סטית התקן ‪S d‬‬
‫‪‬‬
‫‪‬‬
‫‪Sd‬‬
‫‪Sd‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1,1‬‬
‫‪ D  d  t‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪d t‬‬
‫‪‬‬
‫השערה חד כיוונית כלפי מעלה ‪:‬‬
‫‪Sd‬‬
‫‪C  0  t n 1,1‬‬
‫‪Sd‬‬
‫‪C  0  t n 1,1‬‬
‫‪n‬‬
‫‪‬‬
‫השערה חד כיוונית כלפי מטה ‪:‬‬
‫‪n‬‬
‫‪‬‬
‫השערה דו כיוונית ‪:‬‬
‫‪Sd‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪C2  0  t‬‬
‫‪Sd‬‬
‫‪n‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪C1  0  t‬‬
‫נקודת התחלה היא ‪ 0‬מאחר והשערת האפס ‪ H 0‬היא שאין הבדל בין שני המדגמים‪/‬בין שני‬
‫הטיפולים ו‪ C-‬מתייחס ל‪. H 0 -‬‬
‫‪106‬‬
‫חוקר בדק תרופה להורדת לחץ דם על מדגם מקרי של ‪ 10‬אנשים הסובלים מיתר לחץ דם‪.‬‬
‫לחץ הדם נמדד לפני קבלת התרופה ולאחר קבלת התרופה ‪ ,‬נתקבלו שני מדגמים עבור אותן תצפיות‪:‬‬
‫א‪ .‬חשבו רווח בר סמך לממוצע הפרשי לחץ הדם באוכלוסיה‪ -‬לפני הטיפול ואחריו‪ ,‬ברמת מובהקות של ‪.2%‬‬
‫ב‪ .‬בדקו את הטענה כי התרופה החדשה מורידה את לחץ הדם‪ ,‬ברמת מובהקות של ‪.1%‬‬
‫אחרי השימוש ‪Yi‬‬
‫לפני השימוש ‪X i‬‬
‫נבדק מס'‬
‫‪10‬‬
‫‪150‬‬
‫‪160‬‬
‫‪1‬‬
‫‪20‬‬
‫‪130‬‬
‫‪150‬‬
‫‪2‬‬
‫‪0‬‬
‫‪150‬‬
‫‪150‬‬
‫‪3‬‬
‫‪30‬‬
‫‪140‬‬
‫‪170‬‬
‫‪4‬‬
‫‪10‬‬
‫‪140‬‬
‫‪150‬‬
‫‪5‬‬
‫‪10‬‬
‫‪140‬‬
‫‪150‬‬
‫‪6‬‬
‫‪20‬‬
‫‪120‬‬
‫‪140‬‬
‫‪7‬‬
‫‪10‬‬
‫‪150‬‬
‫‪160‬‬
‫‪8‬‬
‫‪10‬‬
‫‪140‬‬
‫‪150‬‬
‫‪9‬‬
‫‪20‬‬
‫‪160‬‬
‫‪180‬‬
‫‪10‬‬
‫‪X-Y‬‬
‫‪di‬‬
‫כפי שנאמר לעיל מאחר ואנו עובדים עם זוגות ‪ ,‬אנו עוסקים במדגם אחד של ‪ n‬זוגות ‪ ,‬רעיון זה הוא‬
‫הבסיס לניתוח הסטטיסטי אשר נעשה כלומר תהליך ההסקה הסטטיסטית יעשה על ממוצע ההפרשים‬
‫בין התצפיות כלומר על ‪.  D‬‬
‫‪i‬‬
‫‪y‬‬
‫‪2 ‬‬
‫‪N‬‬
‫‪ di‬‬
‫‪N‬‬
‫‪d‬‬
‫‪i‬‬
‫‪x‬‬
‫‪N‬‬
‫‪1 ‬‬
‫) ‪d i  ( xi  y i‬‬
‫‪ D  1   2‬‬
‫‪107‬‬
‫נחשב את הנתונים הדרושים‪:‬‬
‫‪ t9,0.99  2.821‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫א‪.‬‬
‫‪n 1,1‬‬
‫‪t‬‬
‫‪Sd  8.43‬‬
‫‪d  14‬‬
‫רווח בר סמך להפרש לחץ הדם הממוצע אחרי לקיחת התרופה ולפני לקיחת התרופה ברמת סמך של ‪0.98‬‬
‫‪‬‬
‫‪‬‬
‫‪Sd‬‬
‫‪Sd‬‬
‫‪d t‬‬
‫‪ D  d  t‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪n 1,1‬‬
‫‪n 1,1‬‬
‫‪n‬‬
‫‪n‬‬
‫‪2‬‬
‫‪2‬‬
‫‪8.43‬‬
‫‪8.43‬‬
‫‪14  2.821 ‬‬
‫‪  D  14  2.821 ‬‬
‫‪10‬‬
‫‪10‬‬
‫‪6.49   D  21.52‬‬
‫ב‪.‬‬
‫נבדוק את טענת החוקר כי התרופה החדשה מורידה את לחץ הדם ברמת מובהקות של ‪0.01‬‬
‫‪.1‬‬
‫‪D  0‬‬
‫‪H0 :‬‬
‫התרופה אינה גורמת להורדת לחץ הדם‪.‬‬
‫‪D  0‬‬
‫‪H1 :‬‬
‫התרופה גורמת לירידה בלחץ הדם‪.‬‬
‫מעוניינים לבדוק את ירידת לחץ הדם ‪ ,‬הגודל הנבדק הוא ההפרש בין ממוצע לחץ הדם לפני הטיפול ואחריו לכן‬
‫ככל שההפרש גבוה יותר ירידת לחץ הדם גדולה יותר‪.‬‬
‫‪.2‬‬
‫‪  0.01‬‬
‫‪.3‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪ 7.52‬‬
‫‪C  0  t ( n 1), (1 ) ‬‬
‫‪8.43‬‬
‫‪10‬‬
‫‪C  0  2.821 ‬‬
‫‪H0‬‬
‫‪7.52 14‬‬
‫‪0‬‬
‫‪108‬‬
‫‪.4‬‬
‫החלטה‬
‫ההפרש הממוצע שלחץ הדם לפני התרופה ואחריה הוא ‪ , 14‬ערך הנמצא מחוץ לגבול הקריטי כלומר בתחום דחית‬
‫השערת האפס ‪ ,‬לכן נדחה את השערת האפס ונקבל את השערת המחקר – התרופה גורמת לירידה בלחץ הדם‪.‬‬
‫‪.5‬‬
‫מאחר ודחינו את ‪ , H 0‬הטעות האפשרית היא טעות מסוג ראשון ‪.  -‬‬
‫‪14‬‬
‫‪ 5.25‬‬
‫‪2.665‬‬
‫‪‬‬
‫‪d 0‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫‪t9, (1 ) ‬‬
‫(‬
‫ברמה של ‪ 9‬דרגות חופש הערך נמצא מחוץ לגבולות הטבלה לכן ‪0.995  1  ‬‬
‫‪  0.005‬‬
‫כלומר הסיכוי לשגיאה במסקנה קטן מ‪0.5% -‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪ '  0.0005‬‬
‫‪df  9 ‬‬
‫' ‪ 0.9995  1  ‬‬
‫)‪  ' ( 0.0005)   (0.01‬דוחים את השערת האפס‪.‬‬
‫‪14  0‬‬
‫‪ 5.25‬‬
‫‪8.43‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪t9,1 ' ‬‬
‫‪t9,0.99  2.821‬‬
‫‪14  0‬‬
‫‪ 5.25‬‬
‫‪8.43‬‬
‫(‬
‫)‬
‫‪10‬‬
‫)‪tSTAT (5.25)  t (2.821‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪tSTAT  t( n 1)(1 ') ‬‬
‫‪109‬‬
‫תרגילים – מדגמים מזווגים‬
‫‪.1‬‬
‫מאמן נבחרת רצה לבדוק אם תוספת של אימון משקולות שבועי תגרום לשיפור בהישגיהם של אצנים‪.‬‬
‫לצורך הבדיקה נדגמו ‪ 10‬אצנים ונמדדה מהירותם בריצת ‪ 100‬מ' לפני הוספת האימון ולאחר חודשיים בהם‬
‫התאמנו אימון שבועי נוסף במשקולות‪.‬‬
‫להלן התוצאות‪:‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫אצן מס' ‪1‬‬
‫‪10.8‬‬
‫‪10.6‬‬
‫‪10.4‬‬
‫‪10.5‬‬
‫לפני‬
‫‪10.9‬‬
‫‪10.9‬‬
‫‪10.2‬‬
‫‪10.3‬‬
‫אחרי‬
‫בדקו את הטענה ברמת מובהקות של ‪. 0.01‬‬
‫‪.2‬‬
‫‪5‬‬
‫‪10.9‬‬
‫‪10.6‬‬
‫‪7‬‬
‫‪11.1‬‬
‫‪11.4‬‬
‫‪6‬‬
‫‪10.1‬‬
‫‪10‬‬
‫‪9‬‬
‫‪10.3‬‬
‫‪10.1‬‬
‫‪8‬‬
‫‪10.2‬‬
‫‪10‬‬
‫‪10‬‬
‫‪9.9‬‬
‫‪10‬‬
‫חוקר בדק את הטענה כי מנת המשכל של ילדים גבוהה משל הוריהם‪.‬‬
‫לבדיקת הטענה נלקח מדגם מקרי של ‪ 13‬הורים וילדיהם ונערכו להם מבחני ‪ , IQ‬להלן התוצאות‪:‬‬
‫‪121‬‬
‫‪118‬‬
‫הורה‬
‫ילד‬
‫א‪.‬‬
‫‪115 109 136 125 117 115 126 118 112 115 120‬‬
‫‪120 118 135 129 115 120 124 122 115 120 118‬‬
‫בנו רווח בר סמך להפרש ממוצע מנת המשכל בין ילדים להוריהם ברמת סמך של ‪.0.95‬‬
‫ב‪.‬‬
‫בדקו את הטענה ברמת מובהקות של ‪.0.05‬‬
‫‪.3‬‬
‫כדי לבחון את יעילות ערכות הרזייה "רזה לתמיד" נבחרו ‪ 5‬אנשים באופן מקרי ונבדק משקלם לפני‬
‫‪124‬‬
‫‪132‬‬
‫השימוש בערכת ההרזיה של החברה וחודש לאחר מכן‪ .‬להלן תוצאות הבדיקה‪:‬‬
‫משקל לפני השימוש בערכה‬
‫משקל לאחר השימוש בערכה‬
‫‪87‬‬
‫‪84‬‬
‫‪89‬‬
‫‪84‬‬
‫‪75‬‬
‫‪76‬‬
‫‪80‬‬
‫‪76‬‬
‫‪70‬‬
‫‪66‬‬
‫האם ניתן לומר ברמת מובהקות של ‪ 5%‬כי תוחלת המשקל לאחר השימוש בערכות ההרזיה של‬
‫"רזה לתמיד" קטנה לעומת המשקל לפני השימוש בה?‬
‫‪.4‬‬
‫בנק ההשקעות "השקעת הרווחת" השיג עבור משקיעיו במהלך שנת ‪ ,2005‬תשואות נמוכות ממתחריו בשוק‪.‬‬
‫על מנת לשנות את התדמית הגרועה ולהוות גורם תחרותי בשוק‪ ,‬החליטה הנהלת הבנק לשלוח את יועצי ההשקעות‬
‫לקורס "ניתוח ניירות ערך"‪.‬‬
‫כדי לבדוק אם הקורס משפר את תשואות תיקי ההשקעות של היועצים‪ ,‬נבחרה‬
‫קבוצה של שישה יועצי השקעות אשר השתתפו בקורס‪ ,‬ונבדקה תשואת תיקי ההשקעות שלהם לפני ואחרי הקורס‪.‬‬
‫התוצאות שהתקבלו (אחוזים) ‪:‬‬
‫היועץ‬
‫לאחר הקורס‬
‫לפני הקורס‬
‫א‬
‫ב‬
‫‪16‬‬
‫‪13‬‬
‫ג‬
‫‪14‬‬
‫‪8‬‬
‫‪4‬‬
‫‪-2‬‬
‫ד‬
‫ה‬
‫‪4‬‬
‫‪4‬‬
‫‪7‬‬
‫‪5‬‬
‫ו‬
‫‪11‬‬
‫‪10‬‬
‫האם הקורס משפר את התשואות ? בדקו ברמת מובהקות של ‪.1%‬‬
‫‪110‬‬
‫‪.5‬‬
‫כדי לבדוק אם אכילת תרד מגבירה את הכושר הפיסי בחרו קבוצה של חמישה מרימי משקולות ובדקו את‬
‫המשקל שכל אחד מהם הצליח להרים ביום שבו הם אכלו תרד וביום שבו לא אכלו תרד‪.‬‬
‫התוצאות שהתקבלו (ק"ג) ‪:‬‬
‫א‬
‫‪152‬‬
‫‪145‬‬
‫הספורטאי‬
‫עם תרד‬
‫בלי תרד‬
‫ד‬
‫ג‬
‫‪141 153‬‬
‫‪145 150‬‬
‫ב‬
‫‪170‬‬
‫‪170‬‬
‫ה‬
‫‪148‬‬
‫‪144‬‬
‫א‪ .‬האם לאכילת התרד יש השפעה חיובית ברמת מובהקות של ‪? 5%‬‬
‫ב‪ .‬על סמך המחקרים בתחום הספורט ידוע שממוצע המשקל שמצליח מרים משקולות להרים בדרך כלל (ללא‬
‫אכילת תרד) הוא ‪ 146‬ק"ג האם על סמך התוצאות לאחר אכילת התרד ניתן לומר שהתרד משפר את התוצאות‬
‫משמעותית ברמת מובהקות של ‪ . 1%‬נמקו‪ ( .‬עליכם להתייחס לנתונים על המשקל לאחר אכילת התרד )‪.‬‬
‫‪.6‬‬
‫חברת סופרמן רצתה לבדוק את השפעת משקה האנרגיה שברשותה על שעות הערנות‪.‬‬
‫נלקח מדגם של ‪ 10‬סטודנטים ונמדד מס' שעות השינה שלהם ללא משקה האנרגיה ולאחר שתייה יומית של‬
‫חצי ליטר משקה במשך שבוע ‪:‬‬
‫‪9 10‬‬
‫‪8‬‬
‫‪7‬‬
‫‪5‬‬
‫‪6‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫נבדק‬
‫‪ 20 17 18 22 24 19 14 12 19 15‬שעות ערנות עם משקה‬
‫‪ 16 18 20 17 20 16 13 14 16 13‬שעות ערנות בלי משקה‬
‫בדוק את הטענה ברמת מובהקות של ‪0.05‬‬
‫‪.7‬‬
‫במטרה לבדוק פערי שכר בין שני מוסדות ממשלתיים נלקחו ‪ 10‬עובדים בעלי אותו וותק והשכלה ובדקו את‬
‫שכרם להלן התוצאות‪:‬‬
‫ותק בשנים‬
‫מוסד ‪A‬‬
‫מוסד ‪B‬‬
‫‪2‬‬
‫‪4500‬‬
‫‪4630‬‬
‫‪4‬‬
‫‪4850‬‬
‫‪4480‬‬
‫‪6‬‬
‫‪4480‬‬
‫‪4520‬‬
‫‪8‬‬
‫‪5120‬‬
‫‪4960‬‬
‫‪10‬‬
‫‪4960‬‬
‫‪4870‬‬
‫‪12‬‬
‫‪5350‬‬
‫‪5120‬‬
‫‪14‬‬
‫‪5460‬‬
‫‪5250‬‬
‫‪16‬‬
‫‪4870‬‬
‫‪5280‬‬
‫‪18‬‬
‫‪5920‬‬
‫‪6250‬‬
‫א‪.‬‬
‫בדקו את הטענה כי ישנם פערי שכר בין שני המוסדות ברמת מובהקות של ‪. 0.02‬‬
‫ב‪.‬‬
‫כיצד תשתנה תשובתך אם למדגמים צורפו גם שני המנכ"לים של המוסדות‬
‫‪20‬‬
‫‪6580‬‬
‫‪5380‬‬
‫מוסד ‪ , ₪ 12560 A‬מוסד ‪. ₪ 8450 B‬‬
‫ג‪.‬‬
‫חשבו את השגיאה האפשרית החדשה בסעיף ב'‬
‫ד‪.‬‬
‫הסבירו את תוצאת סעיף ב‪.‬‬
‫‪111‬‬
‫‪.1‬‬
‫נחשב את הנתונים הדרושים‪:‬‬
‫‪10‬‬
‫‪9‬‬
‫‪8‬‬
‫‪7‬‬
‫‪6‬‬
‫‪5‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫אצן מס'‬
‫‪9.9 10.3 10.2 11.1 10.1 10.9 10.8 10.6 10.4 10.5‬‬
‫לפני‬
‫‪10 10.1 10 11.4 10 10.6 10.9 10.9 10.2 10.3‬‬
‫אחרי‬
‫‪0.1 -0.2 -0.2 0.3 -0.1 -0.3 0.1 0.3 -0.2 -0.2‬‬
‫‪di‬‬
‫שיפור ההישגים – עליה במהירות הריצה כלומר ירידה בזמן הריצה – נבצע בדיקה חד כיוונית כלפי מטה ונבדוק‬
‫אם הזמן אחרי האימון קצר יותר מהזמן לפניו‪.‬‬
‫אפשרי לבצע גם מבחן חד כיווני כלפי מעלה ולבדוק את הטענה שהזמן לפני ארוך יותר – הממוצע יהיה זה אך‬
‫חיובי והגבול הקריטי יהיה חיובי שאר הפרמטרים לא ישתנו‪.‬‬
‫‪t n1,1  t 9,0.99  2.821‬‬
‫א‪.‬‬
‫‪‬‬
‫‪S d  0.2107‬‬
‫‪d  0.04‬‬
‫בדיקת השערות – חד כווני כלפי מטה‬
‫‪D  0‬‬
‫‪H0 :‬‬
‫אימון המשקולות אינו משפיע על מהירות הריצה‬
‫‪D  0‬‬
‫‪H1 :‬‬
‫אימון המשקולות משפר את מהירות הריצה‪.‬‬
‫ב‪.‬‬
‫‪  0.01‬‬
‫ג‪.‬‬
‫‪‬‬
‫‪S‬‬
‫‪ 0.187‬‬
‫‪C  0  t ( n1), (1 ) ‬‬
‫‪n‬‬
‫‪0.2107‬‬
‫‪10‬‬
‫‪C  0  2.821 ‬‬
‫‪H0‬‬
‫‪0‬‬
‫‪ 0.187  0.04‬‬
‫הגבול הקריטי הוא ‪ , -0.187‬אם ממוצע ההפרשים קטן מהגבול הקריטי נדחה את השערת האפס‪.‬‬
‫‪112‬‬
‫ד‪.‬‬
‫החלטה‬
‫ממוצע הפרשי זמן הריצה הוא ‪ -0.04‬והוא גדול מ‪ , -0.187-‬נמצא בתחום קבלת השערת האפס ‪ -‬נקבל את‬
‫השערת האפס ונדחה את השערת המחקר – אימון המשקולות אינו משפר את זמן הריצה‪.‬‬
‫ה‪.‬‬
‫קיבלנו את ‪ , H 0‬הטעות האפשרית היא טעות מסוג שני ‪.  -‬‬
‫טעות מסוג שני היא השטח הנמצא בין הגבול הקריטי לערך הנבדק (ממוצע הפרשי הזמנים) ‪ -‬בין ‪ 0.193‬ל‪0.06-‬‬
‫את המרווח ניתן למדוד בערכים מוחלטים מאחר והטבלה והשטחים חיוביים‪.‬‬
‫‪0.187  0.04‬‬
‫‪ 2.206‬‬
‫‪0.2107‬‬
‫(‬
‫)‬
‫‪10‬‬
‫ברמה של ‪ 9‬דרגות חופש הערך‬
‫‪0.95  1    0.975‬‬
‫‪0.025    0.05‬‬
‫הסיכוי לשגיאה במסקנה הוא בין ‪ 2.5%‬ל‪5%-‬‬
‫‪‬‬
‫‪Cd‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫‪t9,(1 ) ‬‬
‫(‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.25   '  0.4‬‬
‫‪df  9 ‬‬
‫‪ 0.6  1   '  0.75‬‬
‫‪ 0.04  0‬‬
‫‪ 0.6‬‬
‫‪0.2107‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪t9,1 ' ‬‬
‫)‪ 0.4)   (0.01‬‬
‫‪t9,0.99  2.821‬‬
‫‪ 0.04  0‬‬
‫‪ 0.6‬‬
‫‪0.2107‬‬
‫(‬
‫)‬
‫‪10‬‬
‫)‪tSTAT (0.874)  t (2.821‬‬
‫‪  0‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪ n ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪tSTAT  t( n 1)(1 ') ‬‬
‫‪113‬‬
‫‪.2‬‬
‫הורה ‪124 121 115 109 136 125 117 115 126 118 112 115 120‬‬
‫ילד ‪132 118 120 118 135 129 115 120 124 122 115 120 118‬‬
‫‪8‬‬
‫‪-3‬‬
‫‪5‬‬
‫‪9‬‬
‫‪-1‬‬
‫‪4‬‬
‫‪-2‬‬
‫‪5‬‬
‫‪-2‬‬
‫‪4‬‬
‫‪3‬‬
‫‪5‬‬
‫‪-2‬‬
‫‪di‬‬
‫א‪.‬‬
‫רווח בר סמך‪:‬‬
‫‪ t12,0.975  2.179‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪n 1,1‬‬
‫‪Sd  4.07‬‬
‫‪t‬‬
‫‪d  2.54‬‬
‫‪‬‬
‫‪Sd‬‬
‫‪Sd‬‬
‫‪‬‬
‫‪ D  d  t‬‬
‫‪‬‬
‫‪‬‬
‫‪n 1,1‬‬
‫‪n‬‬
‫‪n‬‬
‫‪2‬‬
‫‪4.07‬‬
‫‪4.07‬‬
‫‪  D  2.54  2.179 ‬‬
‫‪13‬‬
‫‪13‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪d t‬‬
‫‪2.54  2.179 ‬‬
‫‪0.077   D  5.0023‬‬
‫ב‪.‬‬
‫הטענה – לילדים מנת משכל גבוהה מהוריהם – נבדוק את הפרש מנת המשכל בין ילד להורה ונבחן‬
‫השערה חד כיוונית כלפי מעלה – נבדוק אם ממוצע הפרשי מנת המשכל גבוה מהגבול הקריטי אשר עד אליו אין‬
‫הבדל בין רמות המשכל‪.‬‬
‫‪tn 1,1  t12,0.95  1.782‬‬
‫ב‪.1.‬‬
‫‪‬‬
‫‪Sd  4.07‬‬
‫‪d  2.54‬‬
‫‪D  0‬‬
‫‪H0 :‬‬
‫מנת המשכל של ילדים אינה גבוהה ממנת המשכל של הוריהם‪.‬‬
‫‪D  0‬‬
‫‪H1 :‬‬
‫לילדים מנת משכל גבוהה יותר מהוריהם‪.‬‬
‫ב‪.2.‬‬
‫‪  0.05‬‬
‫ב‪.3.‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪C  0  t( n 1),(1 ) ‬‬
‫‪4.07‬‬
‫‪ 2.011‬‬
‫‪13‬‬
‫‪C  0  1.782 ‬‬
‫‪2.011 2.54‬‬
‫‪H0‬‬
‫‪0‬‬
‫‪114‬‬
‫ב‪.4.‬‬
‫החלטה‬
‫ממוצע הפרשי מנת המשכל בין ילדים להוריהם הוא ‪ - 2.54‬גבוה מהגבול הקריטי שהוא ‪ - 2.027‬נמצא בתחום‬
‫דחית השערת האפס ‪ -‬נדחה את השערת האפס ונקבל את השערת המחקר – לילדים מנת משכל גבוהה משל‬
‫הוריהם (ברמת מובהקות של ‪)0.05‬‬
‫ב‪.5.‬‬
‫דחינו את ‪ , H 0‬הטעות האפשרית היא טעות מסוג ראשון ‪.  -‬‬
‫טעות מסוג ראשון – המקום הרחוק ביותר בו יכול להיות ‪ C‬ועדיין לקבל אותן מסקנות‪.‬‬
‫‪2.54  0‬‬
‫‪ 2.25‬‬
‫‪4.07‬‬
‫(‬
‫)‬
‫‪13‬‬
‫‪d 0‬‬
‫‪‬‬
‫‪t12, (1 ) ‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫(‬
‫ברמה של ‪ 12‬דרגות חופש הערך אינו נמצא בטבלה ‪0.975  1    0.99‬‬
‫‪0.01    0.025‬‬
‫הסיכוי לטעות הוא בין ‪ 1%‬ל‪. 2.5%-‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.01   '  0.025‬‬
‫‪2.54  0‬‬
‫‪ 2.25‬‬
‫‪4.07‬‬
‫(‬
‫)‬
‫‪13‬‬
‫‪df  12 ‬‬
‫‪ 0.975  1   '  0.99‬‬
‫)‪ 0.05)   (0.05‬‬
‫‪  ' (0.01‬דוחים את השערת האפס‪.‬‬
‫‪t12,1 ' ‬‬
‫‪t12,0.95  1.782‬‬
‫‪2.54  0‬‬
‫‪ 2.25‬‬
‫‪4.07‬‬
‫(‬
‫)‬
‫‪13‬‬
‫)‪tSTAT (2.54)  t (1.782‬‬
‫‪  0‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t STAT  t( n 1)(1 ') ‬‬
‫‪115‬‬
‫‪.3‬‬
‫לפני השימוש בערכה‬
‫אחרי השימוש בערכה‬
‫‪di‬‬
‫‪89‬‬
‫‪84‬‬
‫‪5‬‬
‫‪87‬‬
‫‪84‬‬
‫‪3‬‬
‫‪70‬‬
‫‪75‬‬
‫‪66‬‬
‫‪76‬‬
‫‪4 1‬‬‫‪‬‬
‫‪S d  2.34‬‬
‫‪t n1,1  t 4,0.95  2.132‬‬
‫‪80‬‬
‫‪76‬‬
‫‪4‬‬
‫‪d 3‬‬
‫הטענה – ערכת ההרזיה גורמת לירידה במשקל – נבדוק את הפרש בין המשקל לפני השימוש בערכה ואחריה –‬
‫נבדוק אם ממוצע הפרשי המשקל גבוה מהגבול הקריטי אשר עד אליו אין הבדל בין המשקל לפני ואחרי‪.‬‬
‫א‪.‬‬
‫‪D  0‬‬
‫‪H0 :‬‬
‫הערכה אינה משפרת את הירידה במשקל‪.‬‬
‫‪D  0‬‬
‫‪H1 :‬‬
‫הירידה במשקל כתוצאה מהשימוש בערכה גבוה מהירידה ללא הערכה‬
‫ב‪.‬‬
‫‪  0.05‬‬
‫ג‪.‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪ 2.23‬‬
‫‪C  0  t ( n1),(1 ) ‬‬
‫‪2.34‬‬
‫‪5‬‬
‫‪H0‬‬
‫‪C  0  2.132 ‬‬
‫‪3‬‬
‫ד‪.‬‬
‫‪2.23‬‬
‫‪0‬‬
‫החלטה‬
‫ממוצע הפרשי הירידה במשקל עם הערכה ובלעדיה הוא ‪ 3‬ק"ג‪ – .‬הממוצע גבוה מהגבול הקריטי שהוא ‪.2.23‬‬
‫הממוצע נמצא בתחום דחית השערת האפס ‪ -‬נדחה את השערת האפס ונקבל את השערת המחקר –‬
‫ערכת רזה לתמיד משפרת את הירידה במשקל ברמת מובהקות של ‪5%‬‬
‫ה‪.‬‬
‫דחינו את ‪ , H 0‬הטעות האפשרית היא טעות מסוג ראשון ‪.  -‬‬
‫טעות מסוג ראשון – המקום הרחוק ביותר בו יכול להיות ‪ C‬ועדיין לקבל אותן מסקנות‪.‬‬
‫‪30‬‬
‫‪ 2.86‬‬
‫‪2.34‬‬
‫(‬
‫)‬
‫‪5‬‬
‫‪‬‬
‫‪d 0‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫‪t4, (1 ) ‬‬
‫(‬
‫ברמה של ‪ 4‬דרגות חופש הערך בטבלה‪0.975  1    0.99 :‬‬
‫‪0.01    0.025‬‬
‫הסיכוי לטעות הוא בין ‪ 1%‬ל‪. 2.5%-‬‬
‫‪116‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.01   '  0.05‬‬
‫‪df  4 ‬‬
‫‪ 0.975  1   '  0.99‬‬
‫)‪ 0.05)   (0.05‬‬
‫‪30‬‬
‫‪ 2.86‬‬
‫‪2.34‬‬
‫(‬
‫)‬
‫‪5‬‬
‫‪t 4,1 ' ‬‬
‫‪t 4,0.95  2.132‬‬
‫‪30‬‬
‫‪ 2.86‬‬
‫‪2.34‬‬
‫(‬
‫)‬
‫‪5‬‬
‫)‪t STAT (2.86)  t (2.132‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t STAT  t ( n 1)(1 ') ‬‬
‫‪117‬‬
‫‪.4‬‬
‫א‬
‫‪16‬‬
‫‪13‬‬
‫‪3‬‬
‫היועץ‬
‫תשואה לאחר הקורס‬
‫תשואה לפני הקורס‬
‫‪di‬‬
‫‪ t 5,0.99  3.635‬‬
‫ג‬
‫‪4‬‬
‫‪-2‬‬
‫‪6‬‬
‫ב‬
‫‪14‬‬
‫‪8‬‬
‫‪6‬‬
‫ה‬
‫‪7‬‬
‫‪5‬‬
‫‪2‬‬
‫ד‬
‫‪4‬‬
‫‪4‬‬
‫‪0‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪t‬‬
‫‪S d  2.53‬‬
‫ו‬
‫‪11‬‬
‫‪10‬‬
‫‪1‬‬
‫‪d 3‬‬
‫הטענה – הקורס משפר את תשואות תיקי ההשקעות של היועצים – נבדוק את הפרש התשואות של כל יועץ לפני‬
‫ואחרי הקורס‪ –.‬נבדוק אם ממוצע הפרשי התשואות גבוה מהגבול הקריטי אשר עד אליו אין הבדל בין התשואות‪.‬‬
‫א‪.‬‬
‫‪D  0‬‬
‫‪H0 :‬‬
‫הקורס אינו משפר את תשואת תיק ההשקעות‪.‬‬
‫‪D  0‬‬
‫‪H1 :‬‬
‫הקורס משפר את התשואה בתיק ההשקעות‪.‬‬
‫ב‪.‬‬
‫‪  0.01‬‬
‫ג‪.‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪ 3.47‬‬
‫‪C  0  t ( n1),(1 ) ‬‬
‫‪2.53‬‬
‫‪6‬‬
‫‪H0‬‬
‫‪C  0  3.365 ‬‬
‫ד‪.‬‬
‫‪3.47‬‬
‫‪3‬‬
‫‪0‬‬
‫החלטה‬
‫ממוצע תשואות תיקי ההשקעות של היועצים לפני ואחרי הקורס אינו שונה‪ .‬ממוצע הפרש התשואות לפני ואחרי‬
‫הקורס עמד על ‪ . 3%‬ממוצע זה נמוך מהגבול הקריטי – ‪ 3.47%‬כלומר נמצא בתחום קבלת השערת אפס ‪-‬‬
‫נקבל את השערת האפס ונדחה את השערת המחקר – הקורס אינו משפר את תשואות היועצים‪.‬‬
‫ה‪.‬‬
‫קיבלנו את ‪ , H 0‬הטעות האפשרית היא טעות מסוג שני ‪ .  -‬טעות מסוג שני ‪:‬‬
‫‪3.47  3‬‬
‫‪ 0.455‬‬
‫‪2.53‬‬
‫(‬
‫)‬
‫‪6‬‬
‫‪‬‬
‫‪Cd‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫‪t5, (1  ) ‬‬
‫(‬
‫‪118‬‬
‫‪0.25    0.4‬‬
‫ברמה של ‪ 5‬דרגות חופש הערך בטבלה‪0.6  1    0.75 :‬‬
‫הסיכוי לטעות הוא בין ‪ 25%‬ל‪. 40%-‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.01   '  0.05‬‬
‫‪30‬‬
‫‪ 2.904‬‬
‫‪2.53‬‬
‫(‬
‫)‬
‫‪6‬‬
‫‪df  5 ‬‬
‫‪ 0.975  1   '  0.99‬‬
‫)‪ 0.05)   (0.01‬‬
‫‪t5,1 ' ‬‬
‫‪30‬‬
‫‪ 2.904‬‬
‫‪2.56‬‬
‫(‬
‫)‬
‫‪6‬‬
‫‪t5, 0.99  3.365‬‬
‫)‪t STAT (2.904)  t (3.365‬‬
‫‪.5‬‬
‫‪  0‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪ n ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪t STAT  t( n1)(1 ') ‬‬
‫מבחן חד כיווני כלפי מעלה (האם תרד משפר את הכושר הפיסי) ‪,‬‬
‫עם תרד‬
‫בלי תרד‬
‫‪di‬‬
‫‪ t 4,0.95  2.132‬‬
‫א‬
‫‪152‬‬
‫‪145‬‬
‫‪7‬‬
‫ב‬
‫‪170‬‬
‫‪170‬‬
‫‪0‬‬
‫ג‬
‫‪153‬‬
‫‪150‬‬
‫‪3‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪t‬‬
‫‪S d  4.18‬‬
‫ד‬
‫‪141‬‬
‫‪145‬‬
‫‪-4‬‬
‫ה‬
‫‪148‬‬
‫‪144‬‬
‫‪4‬‬
‫‪d 2‬‬
‫הטענה – תרד משפר את הכוח הפיזי – נבדוק את הפרש המשקל שמרים כל ספורטאי לפני ואחרי אכילת תרד‪.‬‬
‫‪119‬‬
‫א‪.‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬תרד אינו משפר את הכושר הפיסי‬
‫‪1   2  0‬‬
‫אכילת תרד משפרת את הכושר הפיסי‬
‫‪H1 :‬‬
‫ב‪.‬‬
‫‪  0.05‬‬
‫ג‪.‬‬
‫‪‬‬
‫‪S‬‬
‫‪C  0  t( n1),(1 ) ‬‬
‫‪n‬‬
‫‪4.183‬‬
‫‪C  0  2.132 ‬‬
‫‪ 3.988‬‬
‫‪5‬‬
‫ד‪.‬‬
‫‪H0‬‬
‫‪3.988‬‬
‫‪2‬‬
‫‪0‬‬
‫החלטה‬
‫התרד אינו משפיע על הכושר הפיזי – מקבלים את השערת האפס‪.‬‬
‫ה‪.‬‬
‫קיבלנו ‪ , H 0‬הטעות האפשרית היא טעות מסוג שני ‪.  -‬‬
‫‪3.988  2‬‬
‫‪ 1.062‬‬
‫‪4.183‬‬
‫(‬
‫)‬
‫‪5‬‬
‫‪‬‬
‫‪Cd‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫‪t4, (1  ) ‬‬
‫(‬
‫ברמה של ‪ 4‬דרגות חופש הערך בטבלה‪0.75  1    0.9 :‬‬
‫‪0.1    0.25‬‬
‫הסיכוי לטעות הוא בין ‪ 10%‬ל‪.25% -‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪120‬‬
‫‪0.1   '  0.25‬‬
‫‪20‬‬
‫‪ 1.069‬‬
‫‪4.183‬‬
‫(‬
‫)‬
‫‪5‬‬
‫‪df  4 ‬‬
‫‪ 0.75  1   '  0.9‬‬
‫)‪ 0.25)   (0.05‬‬
‫‪t 4,1 ' ‬‬
‫‪t 4,0.95  2.132‬‬
‫‪20‬‬
‫‪ 1.069‬‬
‫‪4.183‬‬
‫(‬
‫)‬
‫‪5‬‬
‫)‪t STAT (1.069)  t (2.132‬‬
‫‪.5‬ב‪.‬‬
‫‪  0‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪ n ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪t STAT  t( n1)(1 ') ‬‬
‫מבחן על תוחלת ‪ /‬ממוצע של אוכלוסיה אחת ‪ ,‬סטית תקן אינה ידועה ‪ -‬מבחן ‪t‬‬
‫נתונים‪ 0  146 :‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫‪‬‬
‫‪S  114.7  10.7‬‬
‫‪  152.8‬‬
‫‪n5‬‬
‫‪  146‬‬
‫‪H0 :‬‬
‫תרד אינו משפר את הכושר הפיסי‬
‫‪  146‬‬
‫‪H1 :‬‬
‫‪  0.01‬‬
‫‪‬‬
‫‪10.7‬‬
‫‪ 163.93‬‬
‫‪5‬‬
‫‪C  146  3.747 ‬‬
‫‪S‬‬
‫‪‬‬
‫‪n‬‬
‫‪C   0  t n1,1‬‬
‫‪H0‬‬
‫‪163.93‬‬
‫‪ C‬‬
‫‪146 152.8‬‬
‫‪ - 152.8  163.93‬הממוצע החדש נמצא בתחום קבלת ‪H 0‬‬
‫לכן נקבל את ‪ - H 0‬אכילת תרד אינה משפרת את הכושר הפיסי‪.‬‬
‫‪121‬‬
‫‪.6‬‬
‫‪9 10‬‬
‫‪7‬‬
‫‪8‬‬
‫‪6‬‬
‫‪5‬‬
‫‪4‬‬
‫‪3‬‬
‫‪1‬‬
‫‪2‬‬
‫נבדק‬
‫‪ 20 17 18 22 24 19 14 12 19 15‬שעות ערנות עם משקה‬
‫‪ 16 18 20 17 20 16 13 14 16 13‬שעות ערנות בלי משקה‬
‫‪2‬‬
‫‪1 -2‬‬
‫‪3‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫‪-2‬‬
‫‪4 -1‬‬
‫‪d‬‬
‫המבחן הוא מבחן דו כיווני האם משקה האנרגיה משפיע על הערנות‪.‬‬
‫‪‬‬
‫חישוב נתונים ‪S  2.584 :‬‬
‫א‪.‬‬
‫‪d  1.7‬‬
‫‪D  0‬‬
‫‪H0 :‬‬
‫המשקה אינו משפיע על שעות הערנות‪.‬‬
‫‪D  0‬‬
‫‪H1 :‬‬
‫המשקה משפיע על הערנות‬
‫ב‪.‬‬
‫‪  0.05‬‬
‫ג‪.‬‬
‫‪2.584‬‬
‫‪ 1.848‬‬
‫‪10‬‬
‫‪C  0  2.262 ‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪( n1), (1‬‬
‫‪2‬‬
‫‪C 0t‬‬
‫תחום‬
‫קבלת‬
‫‪H0‬‬
‫‪1.848‬‬
‫‪1.7‬‬
‫‪0‬‬
‫‪ 1.848‬‬
‫נקבל את השערת האפס‬
‫ד‪.‬‬
‫החלטה‬
‫ממוצע ההפרשים בין שעות הערנות עם המשקה ובלעדיו ‪ 1.7‬שעות ‪ ,‬ממוצע זה נמצא בתחום קבלת השערת האפס‪.‬‬
‫נקבל את השערת האפס – המשקה אינו משפיע על הערנות‪.‬‬
‫ה‪.‬‬
‫מאחר וקיבלנו את ‪ , H 0‬הטעות האפשרית היא טעות מסוג שני ‪.  -‬‬
‫‪122‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫)‪ 0.1)   (0.05‬‬
‫'‪‬‬
‫‪df  9 ‬‬
‫‪ 0.95  1   0.975‬‬
‫‪0.05   '  0.1‬‬
‫‪2‬‬
‫‪1.7  0‬‬
‫‪‬‬
‫‪ 2.08‬‬
‫‪2.584‬‬
‫(‬
‫)‬
‫‪10‬‬
‫'‪‬‬
‫‪2‬‬
‫‪9 ,1‬‬
‫‪t‬‬
‫‪t9,0.975  2.262‬‬
‫‪1.7  0‬‬
‫‪ 2.08‬‬
‫‪2.584‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪  0‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪ n ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪t STAT  t ( n1)(1 ') ‬‬
‫)‪ t STAT (2.08)  t (2.262‬מקבלים את השערת האפס‬
‫‪.7‬‬
‫המבחן הוא מבחן דו כיווני האם קיים פער בין שני המוסדות – אין כיוון לגבי מוסד מסוים‪.‬‬
‫‪‬‬
‫חישוב נתונים ‪S  449.8 :‬‬
‫א‪.‬‬
‫‪d  135‬‬
‫‪D  0‬‬
‫‪H0 :‬‬
‫אין הבדל בשכר בין שני המוסדות‬
‫‪D  0‬‬
‫‪H1 :‬‬
‫קיים הבדל בשכר בין שני המוסדות‬
‫ב‪.‬‬
‫‪  0.02‬‬
‫ג‪.‬‬
‫‪449.8‬‬
‫‪ 401.25‬‬
‫‪10‬‬
‫‪0  2.821 ‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪( n1), (1‬‬
‫‪2‬‬
‫‪C 0t‬‬
‫‪123‬‬
‫‪H0‬‬
‫‪401.25‬‬
‫‪135‬‬
‫‪ 401.25‬‬
‫‪0‬‬
‫ד‪.‬‬
‫החלטה‬
‫ממוצע ההפרשים בין המשכורת בין שני המוסדות הוא ‪ ₪ 135‬והוא נמצא בתחום קבלת השערת האפס ‪ -‬אין הבדל‬
‫בין המשכורות בין שני המוסדות‪.‬‬
‫ה‪.‬‬
‫מאחר וקיבלנו את ‪ , H 0‬הטעות האפשרית היא טעות מסוג שני ‪.  -‬‬
‫טעות מסוג שני היא השטח הנמצא בין הגבול הקריטי לערך הנבדק (ממוצע הפרשי השכר) כלומר בין ‪ 135‬ל‪-‬‬
‫‪ , 401.25‬את המרווח ניתן למדוד בערכים מוחלטים מאחר והטבלה והשטחים חיוביים‪.‬‬
‫‪401.25  135‬‬
‫‪ 1.87‬‬
‫‪449.8‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪‬‬
‫‪C  D‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫(‬
‫‪‬‬
‫‪‬‬
‫) ‪9 ,(1‬‬
‫‪2‬‬
‫‪t‬‬
‫ברמה של ‪ 9‬דרגות חופש‬
‫‪ 0.979‬‬
‫‪‬‬
‫‪2‬‬
‫‪0.95  1 ‬‬
‫‪ 0.05‬‬
‫‪‬‬
‫‪2‬‬
‫‪0.025 ‬‬
‫‪0.05    0.1‬‬
‫הסיכוי לשגיאה במסקנה הוא בין ‪ 5%‬ל‪.10%-‬‬
‫‪124‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.2   '  0.5‬‬
‫‪ 0.9‬‬
‫'‪‬‬
‫‪2‬‬
‫‪135  0‬‬
‫‪ 0.949‬‬
‫‪449.8‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪df  9 ‬‬
‫‪ 0.75  1 ‬‬
‫)‪ 0.5)   (0.02‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪9 ,1‬‬
‫‪t‬‬
‫‪t9,0.99  2.821‬‬
‫‪135  0‬‬
‫‪ 0.949‬‬
‫‪449.8‬‬
‫(‬
‫)‬
‫‪10‬‬
‫)‪t STAT (0.949)  t (2.821‬‬
‫ב‪.‬‬
‫‪  0‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪ n ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪t STAT  t ( n1)(1 ') ‬‬
‫‪‬‬
‫שני המנכ"לים ישנו את הערכים ‪S  1272.2‬‬
‫‪1272.2‬‬
‫‪ 1060.22‬‬
‫‪11‬‬
‫‪d  496.36‬‬
‫‪C  0  2.764 ‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪( n1), (1‬‬
‫‪2‬‬
‫‪C 0t‬‬
‫‪H0‬‬
‫‪0 496.36 1060.22‬‬
‫‪ 1060.22‬‬
‫התוצאות בתוך תחום קבלת השערת האפס המסקנות אינן משתנות – מקבלים את השערת האפס‪.‬‬
‫‪125‬‬
‫ג‪.‬‬
‫‪1060.22  496.36‬‬
‫‪ 1.47‬‬
‫‪1272.2‬‬
‫(‬
‫)‬
‫‪11‬‬
‫‪‬‬
‫‪C  D‬‬
‫‪‬‬
‫)‬
‫‪S‬‬
‫‪n‬‬
‫(‬
‫‪‬‬
‫‪‬‬
‫‪t‬‬
‫) ‪10,(1‬‬
‫‪2‬‬
‫ברמה של ‪ 10‬דרגות חופש הערך אמנם לא נמצא אך הוא בין ‪ 1.372‬ל‪ 1.812-‬לכן‬
‫‪ 0.95‬‬
‫‪‬‬
‫‪2‬‬
‫‪0.9  1 ‬‬
‫‪ 0.1‬‬
‫‪‬‬
‫‪2‬‬
‫‪0.05 ‬‬
‫‪0.1    0.2‬‬
‫הסיכוי לשגיאה במסקנה הוא בין ‪ 10%‬ל‪.20%-‬‬
‫ד‪.‬‬
‫הוספנו שתי משכורות אשר הפער ביניהם כ‪ , ₪ 4000-‬המסקנה האינטואיטיבית המתבקשת היא שכתוצאה‬
‫מכך נחליט שבמוסד ‪ A‬השכר גבוה יותר ‪ ,‬מאחר ושתי המשכורות שהוספנו הן קיצוניות בכל אחד מהמוסדות הם גרמו‬
‫להעלאה משמעותית של סטית התקן בכל מוסד וכמובן העלו את סטית התקן בהפרשים בין המשכורות ולכן לא נגרם‬
‫שינוי בהחלטה ‪ ,‬סטיית התקן כמדד לפיזור "תרמה" כאן ל"סדר" ובכך ערכים קיצוניים יחידים לא שינו את ההחלטה ‪,‬‬
‫אולם מאחר ובכל זאת הפער גדל הסיכוי לשגיאה‪.‬‬
‫‪126‬‬
‫הסקה סטטיסטית על פרופורציה באוכלוסיה‬
‫ישנם מצבים בהם אנו רוצים ללמוד ולהסיק על פרופורציה‪/‬יחס של משתנה מסוים באוכלוסיה –‬
‫*‬
‫מפעל רוצה לבדוק את הפרופורציה‪/‬יחס של המוצרים הפגומים המוחזרים ע"י החנויות למפעל‪.‬‬
‫*‬
‫מפלגה רוצה לאמוד את הפרופורציה מבין מצביעה התומכים במועמד מסוים ‪ /‬הצעה מסוימת‪.‬‬
‫הקונספציה דומה לזו בה עסקנו בהסקה על ממוצעים ‪ ,‬מאחר ואנו עוסקים בתכונות המתפלגות נורמאלית באוכלוסיה‬
‫אולם בהסקות הסטטיסטיות בהן עסקנו עד עתה ‪ -‬הסקה על ממוצע האוכלוסייה מתוך מדגם ‪ ,‬עסקנו במשתנים‬
‫אינטרוולים (משתני רווח) ‪ ,‬כאשר אנחנו עוסקים בהסקה על פרופורציה כלומר הסקה ממדגם על הפרופורציה של‬
‫המשתנה הנבדק באוכלוסיה אנו עוסקים במשתנה מרמה נומינלית – מאחר ולמשתנה הנבדק ישנן שתי אפשרויות –‬
‫קיים לא קיים ‪ ,‬משתנה זה בהגדרה מדויקת יותר הוא משתנה דיכוטומי – כן או לא‪ - .‬חיובי ‪/‬שלישי ‪ ,‬הריון ‪ /‬לא‬
‫בהריון ‪ ,‬פגום ‪ /‬תקין‪.‬‬
‫המצב אנלוגי למצבים אותם הכרנו בהסתברות – צלף יורה למטרה ‪ :‬בפני הצלף עומדות שתי אופציות – פוגע‪ /‬מחטיא אין‬
‫מצבי ביניים ‪ ,‬אם ההסתברות של הצלף לפגוע היא ‪ P‬אז ההסתברות שלו להחטיא היא ‪ 1-P‬מאחר‬
‫וסה"כ האפשרויות ‪ /‬הסתברויות = ‪ , )100%( 1‬אם ‪ 70%‬מהניגשים מבחן עוברים אזי ‪ 30%‬נכשלים‪.‬‬
‫‪ – P‬פרמטר – פרופורציית התכונה הנבדקת באוכלוסיה‪.‬‬
‫‪ 1-P‬הפרופורציה המשלימה של התכונה הנבדקת באוכלוסיה (שהתכונה אינה מתקיימת בה)‪.‬‬
‫‪‬‬
‫‪ - P‬סטטיסטי – פרופורציה התכונה הנבדקת במדגם ‪.‬‬
‫‪‬‬
‫‪ – 1  P‬הפרופורציה המשלימה במדגם‪.‬‬
‫באוכלוסיה ‪ 1000‬ילדים ‪ ,‬ידוע כי ‪ 350‬ילדים לומדים בבית ספר תיכון‪:‬‬
‫‪350‬‬
‫‪ 0.35 ‬‬
‫‪ 35%‬‬
‫‪1000‬‬
‫‪ P ‬כלומר הפרופורציה של מספר הילדים הלומדים בבית ספר מתוך כלל הילדים היא‬
‫‪ , 0.35‬הילדים הלומדים בבית הספר מהווים ‪ 35%‬מכלל הילדים באוכלוסיה‪.‬‬
‫מנתון זה נובע כי ‪ 0.65‬היא פרופורציית הילדים שאינם לומדים בבית ספר מכלל הילדים‪.‬‬
‫נניח כי ‪ N‬הוא גודל האוכלוסייה ו‪ M-‬הוא גודל התכונה הנבדקת באוכלוסיה זו ‪:‬‬
‫‪M‬‬
‫‪N‬‬
‫‪P‬‬
‫‪N M‬‬
‫‪N‬‬
‫‪1 P ‬‬
‫‪127‬‬
‫ניקח אוכלוסיה בת ‪ 100‬איש ונבדוק את מספר העוברים מתוכם בטסט ראשון בנהיגה נמצא כי ‪ 65‬נוכל לומר כי‬
‫‪ , P=0.65‬מאחר וכפי שהוסבר משתנה זה אינו יכול לקבל ערכים אינטרוולים ‪ -‬ישנן שתי אפשרויות – עובר‪/‬לא‬
‫עובר ניתן לאדם שעובר ציון ‪ 1‬ולנכשל ציון ‪. 0‬‬
‫‪65  1  35  0‬‬
‫נחשב את ממוצע העוברים ‪ 0.65‬‬
‫‪100‬‬
‫‪  ‬מכך אנו למדים כי ‪:‬‬
‫‪P‬‬
‫נחשב את סטית התקן‪:‬‬
‫‪X i  X 2  Fi‬‬
‫‪Fi‬‬
‫‪Xi‬‬
‫‪1  0.652  65‬‬
‫‪65‬‬
‫‪1‬‬
‫‪0  0.652  35‬‬
‫‪35‬‬
‫‪0‬‬
‫‪(1  0.65) 2  65  (0  0.65) 2  35‬‬
‫‪‬‬
‫‪ 0.4769‬‬
‫‪100‬‬
‫‪ ( X i  X ) 2  Fi‬‬
‫‪N‬‬
‫‪‬‬
‫) ‪(1  P) 2  M  (0  P) 2  ( N  M‬‬
‫‪N‬‬
‫‪‬‬
‫נציב את ‪ P‬במקום‬
‫הערכים המספריים‬
‫‪M‬‬
‫‪N M 2‬‬
‫‪ (1  P) 2 ‬‬
‫‪ P  P(1  P) 2  (1  P)  P 2‬‬
‫‪N‬‬
‫‪N‬‬
‫‪‬‬
‫נפרק ונהפוך את‬
‫כל הביטוי לערכי ‪P‬‬
‫‪  P(1  P)1  P  P ‬‬
‫סטית התקן‬
‫לפרופורציה‬
‫נוציא גורם משותף‬
‫) ‪  P(1  P‬‬
‫‪128‬‬
‫בדומה להתפלגות הממוצע ניתן להגדיר את משפט הגבול המרכזי לפרופורציה‬
‫משפט הגבול המרכזי לפרופורציה‬
‫אם מתוך אוכלוסייה בעלת פרופורציה ‪ P‬לתכונה מסוימת וסטית תקן )‪ ,   P(1  P‬נוציא את כל‬
‫‪‬‬
‫המדגמים האפשריים בגודל ‪ .n‬סדרת הפרופורציות של כל המדגמים תתפלג נורמאלית ‪ ,‬עם פרופורציה ‪, P‬‬
‫)‪P(1  P‬‬
‫וסטית תקן הנקראת טעות התקן ‪ Standard Error‬ושווה ל‪-‬‬
‫‪n‬‬
‫‪. SE ‬‬
‫‪‬‬
‫‪‬‬
‫‪P(1  P) ‬‬
‫‪‬‬
‫‪P ~ N  P ,‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫נורמאלית‬
‫שונות התקן‬
‫סדרת‬
‫הפרופורציות‬
‫של המדגמים‬
‫מתפלג‬
‫פרופורציות האוכלוסייה‬
‫‪P‬‬
‫כאשר אנו בודקים פרופורציה של תכונה מסוימת גודל המדגם משמעותי ‪ ,‬מאחר ולפרופורציה במדגמים קטנים‬
‫אין משמעות – אנו עוסקים במדגמים הגדולים מ‪ 30-‬איש‪.‬‬
‫מאחר וסדרת הפרופורציות של כל המדגמים מתפלגת נורמלית‪:‬‬
‫‪‬‬
‫‪P P‬‬
‫)‪P(1  P‬‬
‫‪n‬‬
‫כאשר הפרופורציה באוכלוסיה ידועה‬
‫‪Z‬‬
‫‪‬‬
‫כאשר הפרופורציה באוכלוסיה אינה ידועה‬
‫‪P P‬‬
‫‪‬‬
‫‪‬‬
‫‪Z‬‬
‫)‪P(1  P‬‬
‫‪n‬‬
‫רווח בר סמך לפרופורציה ‪ P‬באוכלוסיה‪:‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪ P  P Z  ‬‬
‫‪1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪‬‬
‫‪P Z  ‬‬
‫‪1‬‬
‫‪2‬‬
‫‪129‬‬
‫נערך מדגם של ‪ 100‬מצביעים ונמצא כי ‪ 42%‬מתוכם תומכים במועמד מסוים‪.‬‬
‫בנו רווח בר סמך לפרופורציית המצביעים באוכלוסיה ברמת בטחון של ‪.95%‬‬
‫‪‬‬
‫)‪0.42(1  0.42‬‬
‫‪ 0.04935 Z   Z 0.975  1.96‬‬
‫‪1‬‬
‫‪100‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P (1  P‬‬
‫‪ P  P Z  ‬‬
‫‪1‬‬
‫‪n‬‬
‫) ‪P (1  P‬‬
‫‪n‬‬
‫‪‬‬
‫) ‪P (1  P‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪P  0.42‬‬
‫‪‬‬
‫‪P Z  ‬‬
‫‪1‬‬
‫‪2‬‬
‫‪2‬‬
‫‪0.42  1.96  0.04935  P  0.42  1.96  0.04395‬‬
‫‪0.3232  P  0.5167‬‬
‫‪32.32%  P  51.67%‬‬
‫פרופורציית המצביעים למועמד באוכלוסיה היא בין ‪ 32.32%‬ל‪. 51.67% -‬‬
‫קיבלנו רווח רחב – אורך הרווח כ‪ , 20%-‬ניתן לצמצם בשתי אפשרויות‬
‫א‪.‬‬
‫הגדלת המדגם – מדגם גדול יותר יקטין את טעות התקן ובכך יצמצמם את הרווח ‪.‬‬
‫ב‪.‬‬
‫הקטנת רמת הביטחון – רמת סמך קטנה יותר תגדיל את הרווח אך תפגע בביטחון – תגדיל את הסיכוי‬
‫לשגיאה‪.‬‬
‫נניח כי גודל המדגם בו התקבלה פרופורציה זו הוא ‪ 400‬מצביעים‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪ P  P Z  ‬‬
‫‪1‬‬
‫‪n‬‬
‫‪n‬‬
‫‪2‬‬
‫)‪0.42(1  0.42‬‬
‫)‪0.42(1  0.42‬‬
‫‪ P  0.42  1.96 ‬‬
‫‪400‬‬
‫‪400‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪P Z‬‬
‫‪1‬‬
‫‪0.42  1.96 ‬‬
‫‪0.3716  P  0.4683‬‬
‫פרופורציית המצביעים היא בין ‪ 37.16%‬ל‪ , 46.83%-‬כלומר הגדלת המדגם צמצמה את הרווח ל‪.9%-‬‬
‫אם נבדוק באופן מדויק יותר במדגם בן ‪ 100‬איש אורך הרווח הוא ‪ , 19.35%‬במדגם בן ‪ 400‬איש אורך הרווח‬
‫הוא ‪. 9.67%‬‬
‫כפי שלמדנו הגדלת המדגם פי ‪ K‬תצמצם את אורך הרווח פי ‪K‬‬
‫הגדלנו את המדגם פי ‪ – 4‬הרווח הצטמצם פי ‪. 2‬‬
‫‪130‬‬
‫מהו גודל המדגם הדרוש על מנת שאורך הרווח לא יעלה על ‪? 4%‬‬
‫‪L‬‬
‫מחצית אורך הרווח ‪ 2%  0.02‬‬
‫‪2‬‬
‫‪ 0.02‬‬
‫)‪0.42(1  0.42‬‬
‫‪‬‬
‫‪1.96 ‬‬
‫‪n‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪ 0.02‬‬
‫‪n‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪2‬‬
‫‪2339  n‬‬
‫‪ 1.96  0.42  0.58 ‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪0‬‬
‫‪.‬‬
‫‪02‬‬
‫‪‬‬
‫‪‬‬
‫גודל המדגם המינימאלי הוא ‪ 2339‬איש‪.‬‬
‫‪131‬‬
‫מנהל כ"א בחברה מסוימת טוען כי ‪ 40%‬מעובדי החברה ראויים לקידום ‪ ,‬מנכ"ל החברה טוען כי הערכת מנהל כ"א‬
‫גבוהה מדי ולכן ראיין ‪ 50‬עובדים ומצא כי ‪ 35%‬מהם ראויים לקידום ‪ ,‬בדקו האם קיים הבדל בין הנחת מנהל כ"א‬
‫לבין ממצאי המנכ"ל ‪ ,‬ברמת מובהקות של ‪0.05‬‬
‫‪P  0.4‬‬
‫‪H0 :‬‬
‫פרופורציית העובדים המועמדים לקידום בחברה היא ‪)40%( 0.4‬‬
‫‪P  0.4‬‬
‫‪H1 :‬‬
‫פרופורציית העובדים המועמדים לקידום בחברה קטנה מ‪.)40%( 0.4 -‬‬
‫‪  0.05‬‬
‫בדיקה בשיטה הקלאסית ‪ :‬נחשב את הגבול הקריטי – תחומי קבלה ודחיית השערת האפס‪:‬‬
‫‪Z 0.95  1.65‬‬
‫‪0.35  0.65‬‬
‫‪ 0.0675‬‬
‫‪50‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪P  0.35‬‬
‫‪n  50‬‬
‫‪‬‬
‫‪P  0.4‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪ 0.4  1.65  0.0675  0.288‬‬
‫‪n‬‬
‫‪C  P  Z1‬‬
‫‪H0‬‬
‫‪0.4‬‬
‫‪0.35‬‬
‫‪0.288‬‬
‫החלטה‪:‬‬
‫השערת המנכ"ל נמצאת בתחום קבלת השערת האפס ‪ ,‬נקבל את השערת האפס – שיעור המועמדים לקידום אינו‬
‫נמוך מ‪.40% – 0.4-‬‬
‫שגיאה אפשרית – שגיאה מסוג שני ‪ , ‬קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה‪.‬‬
‫‪0.35  0.288‬‬
‫‪ 0.9185‬‬
‫‪0.0675‬‬
‫‪‬‬
‫‪‬‬
‫‪CP‬‬
‫‪Z 1  ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1    0.8212‬‬
‫‪  0.1788‬‬
‫‪132‬‬
‫בדיקה שיטת ההסתברויות ‪:‬‬
‫נחשב את ההסתברות לקבל ערך נמוך מהשערת המנהל (רמת המובהקות המינימאלית)‬
‫‪0.35  0.4‬‬
‫‪ 0.74‬‬
‫‪0.0675‬‬
‫‪‬‬
‫‪P  P0‬‬
‫‪Z1 ' ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ '  0.2296‬‬
‫רמת המובהקות המינימאלית לדחיית השערת האפס היא ‪ 0.2296‬כאשר רמת המובהקות המינימאלית גדולה מרמת‬
‫המובהקות בהגדרת המחקר נקבל את השערת האפס – אם הגדרנו את הסיכוי לשגיאה – ‪ 5%‬וקיבלנו שהסיכוי‬
‫לשגיאה הוא ‪ 22.96%‬נקבל את השערת האפס‪.‬‬
‫‪  '  ‬נדחה את השערת האפס‪.‬‬
‫‪  '  ‬נקבל את השערת האפס‪.‬‬
‫בדיקה ע"פ ערכי ‪: Z‬‬
‫ערך ‪ Z‬ע"פ נערך המבחן‬
‫‪ Z  1.65‬ערך ‪ Z‬נבדק‬
‫‪( Z STAT  Z1 '  0.74‬בדיקה ע"פ ערך מוחלט)‬
‫‪ Z STAT  Z‬דוחים את השערת האפס‬
‫‪ Z STAT  Z‬מקבלים את השערת האפס‬
‫)‪Z STAT (0.74)  Z (1.65‬‬
‫‪133‬‬
‫‪.1‬‬
‫במפעל מסוים‪ 29% ,‬מהעובדים נוהגים לאחר לפחות פעם בחודש‪ .‬מנהל הייצור של המפעל מציע שיטת‬
‫תמריצים מיוחדת שעשויה לצמצם את אחוז המאחרים‪ .‬השיטה נבדקה על מדגם מיקרי של ‪ 45‬עובדים‪ .‬במדגם‬
‫נמצא כי ‪ 21%‬מעובדים אחרו לפחות פעם בחודש‪.‬‬
‫א‪.‬‬
‫בדקו את הטענה ברמת מובהקות של ‪?   0.05‬‬
‫ב‪.‬‬
‫בנו רווח סמך בביטחון של ‪ 95%‬לאחוז המאחרים לפחות פעם בחודש אם תונהג שיטת התמריצים החדשה‪.‬‬
‫‪.2‬‬
‫במחלקת טלמרקטינג נמצא כי ‪ 36%‬מהשיחות גורמות להתעניינות ולקביעת פגישה אישית‪.‬‬
‫נבדקה השפעתם של תעריפי שכר חדשים על שיפור היקף הפגישות הנקבעות לאחר השיחות על קבוצה של ‪30‬‬
‫טלפנים ונמצא כי ‪ 59%‬מהשיחות הניבו פגישה ‪.‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫מהו גודל המדגם המינימאלי (בהנחה כי שאר הנתונים אינם משתנים) לדחיית את השערת האפס ?‬
‫ג‪.‬‬
‫בנו רווח בר סמך לפרופורציית השיחות המניבות בהתאם לממצאי סעיף ב‪.‬‬
‫‪.3‬‬
‫חברה מצאה כי ‪ 17%‬משעות העבודה (יום עבודה = ‪ 8‬שעות) של עובדיה מושקע בשיטוט באתרי‬
‫אינטרנט‪ .‬החברה הודיעה לעובדיה כי היא מכניסה תוכנה חדשה למעקב אחר פעילות האינטרנט של עובדיה‪.‬‬
‫לבדיקת אפקטיביות ההצהרה נלקח מדגם של ‪ 40‬עובדים ונמצא כי בממוצע שוטטו באינטרנט חצי שעה ביום‪.‬‬
‫א‪.‬‬
‫בנו רווח בר סמך לפרופורציית שעות ה"שיטוט" באינטרנט לאחר הודעת החברה ‪.   0.04‬‬
‫ב‪.‬‬
‫בדקו את יעילות ההצהרה ברמת מובהקות של ‪.0.04‬‬
‫ג‪.‬‬
‫חלה טעות בהנחה הבסיסית ונמצא כי פרופורציית השיטוט היא ‪ 13%‬ולא ‪17%.‬‬
‫‪.4‬‬
‫‪.1‬‬
‫מהי רמת המובהקות המינימאלית הדרושה בכדי להחליט כי הטענה אפקטיבית‪.‬‬
‫‪.2‬‬
‫מהו גודל המדגם המינימאלי הדרוש בכדי לדחות את השערת האפס ברמת מובהקות של ‪.0.04‬‬
‫‪ 36%‬מכלל המצביעים לפרלמנט מצביעים לזורו‪ .‬התבטאויותיו האחרונות גרמו לסערה בקרב המצביעים‬
‫ובסקר שנערך בקרב ‪ 175‬בעלי זכות הצבעה ‪ ,‬נמצא כי אחוז התומכים בזורו הוא ‪. 32%‬‬
‫בדקו את הטענה כי התבטאויותיו גרמו לו לנזק ‪ ,‬ברמת מובהקות של ‪.0.05‬‬
‫‪.5‬‬
‫אחוזי הצפייה (רייטינג) בתוכנית הלילה של מומו היו בעונה הקודמת ‪ 22%‬בממוצע ‪ ,‬בסקר שכלל ‪360‬‬
‫בתי אב נמצא כי אחוז הצפייה בתוכנית הראשונה העונה עמד על ‪. 25%‬‬
‫בדוק את הטענה כי אחוזי הצפייה בתוכנית עלו ברמת מובהקות של ‪.0.05‬‬
‫‪.6‬‬
‫‪ 42%‬מהניגשים לטסט ראשון (נהיגה) עוברים‪ 49% .‬מבין ‪ 425‬נבחנים אשר למדו אצל המורה הידוע‬
‫מוטי הילוכים עברו טסט ראשון ‪ ,‬האם מוטי הילוכים מורה טוב מהממוצע ? ‪ .‬בדקו ברמת מובהקות של ‪.0.01‬‬
‫‪134‬‬
‫‪.1‬‬
‫מבחן חד כיווני כלפי מטה ‪ ,‬נתונים וחישובים‪:‬‬
‫‪‬‬
‫‪Z 0.95  1.65‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪0.21 0.79‬‬
‫‪‬‬
‫‪ 0.0607‬‬
‫‪n‬‬
‫‪45‬‬
‫‪n  45‬‬
‫‪P  0.29‬‬
‫‪H0 :‬‬
‫הבונוס אינו משפיע על אחוז המאחרים‪.‬‬
‫‪P  0.29‬‬
‫‪H1 :‬‬
‫הבונוס מצמצם את אחוז המאחרים‪.‬‬
‫‪‬‬
‫‪P  0.21‬‬
‫‪P  0.29‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪C  P  Z1 ‬‬
‫‪ 0.29  1.65  0.0607  0.189‬‬
‫‪n‬‬
‫קבלת‬
‫תחום‬
‫‪H0‬‬
‫‪0.29‬‬
‫‪0.21‬‬
‫‪0.18‬‬
‫אחוז המאחרים החדש – ‪ 21%‬נמצא בתחום קבלת השערת האפס ‪ ,‬נקבל את השערת האפס – התמריצים החדשים‬
‫אינם מצמצמים את אחוז המאחרים‪.‬‬
‫‪0.21  0.18‬‬
‫‪ 0.494‬‬
‫‪0.0607‬‬
‫‪‬‬
‫‪‬‬
‫‪CP‬‬
‫‪Z 1  ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1    0.6517‬‬
‫‪  0.3488‬‬
‫‪135‬‬
‫בדיקה בשיטת ההסתברויות ‪:‬‬
‫‪0.21  0.29‬‬
‫‪ 1.317‬‬
‫‪0.0607‬‬
‫‪‬‬
‫‪‬‬
‫‪P P‬‬
‫‪Z1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ '  0.0934‬‬
‫‪‬‬
‫‪‬‬
‫‪ , Z  1.65‬ערך ‪ Z‬נבדק‬
‫‪Z STAT  Z ‬‬
‫‪Z STAT  Z‬‬
‫)‪Z STAT (1.32)  Z (1.65‬‬
‫ב‪.‬‬
‫‪Z   Z 0.975  1.96‬‬
‫‪1‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P (1  P‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P (1  P‬‬
‫‪ P  P Z  ‬‬
‫‪1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪‬‬
‫‪P Z  ‬‬
‫‪1‬‬
‫‪2‬‬
‫‪0.21  1.96  0.0607  P  0.21  1.96  0.0607‬‬
‫‪0.091  P  0.328‬‬
‫‪136‬‬
‫‪.2‬‬
‫מבחן חד כיווני כלפי מעלה ‪ ,‬נתונים וחישובים‪:‬‬
‫‪Z 0.95  1.65‬‬
‫‪0.41  0.59‬‬
‫‪ 0.08979‬‬
‫‪30‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪n‬‬
‫‪n  30‬‬
‫‪‬‬
‫‪P  0.59‬‬
‫‪P  0.36‬‬
‫‪H0 :‬‬
‫תעריפי השכר החדשים אינם משפיעים על היקף הפגישות‬
‫‪P  0.36‬‬
‫‪H1 :‬‬
‫תעריפי השכר החדשים משפיעים על היקף הפגישות‬
‫‪P  0.36‬‬
‫‪  0.05‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪ 0.36  1.65  0.08979  0.508‬‬
‫‪n‬‬
‫‪C  P  Z1‬‬
‫‪H0‬‬
‫‪0.59‬‬
‫‪0.508‬‬
‫‪0.36‬‬
‫‪ 59%‬מהשיחות הניבו פגישות – ערך הנמצא בתחום דחית השערת האפס – נדחה את השערת האפס תעריפי‬
‫השכר החדשים משפרים את אחוז הפגישות ‪.‬‬
‫שגיאה אפשרית – שגיאה מסוג ראשון ‪ , ‬דחינו את השערת האפס בזמן שהשערת האפס נכונה‪.‬‬
‫חישוב השגיאה האפשרית‪:‬‬
‫‪0.59  0.36‬‬
‫‪ 2.56‬‬
‫‪0.08979‬‬
‫‪‬‬
‫‪‬‬
‫‪P P‬‬
‫‪Z 1 ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1    0.9948‬‬
‫‪  0.0052‬‬
‫‪137‬‬
‫‪0.59  0.36‬‬
‫‪ 2.56‬‬
‫‪0.08979‬‬
‫‪‬‬
‫‪P P‬‬
‫‪‬‬
‫‪Z1 ' ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1   '  0.9948‬‬
‫‪ '  0.0052‬‬
‫רמת המובהקות המינימאלית לדחיית השערת האפס היא ‪ 0.0052‬כאשר רמת המובהקות המינימאלית קטנה מרמת‬
‫המובהקות בהגדרת המחקר נדחה את השערת האפס – אם הגדרנו את הסיכוי לשגיאה – ‪ 5%‬וקיבלנו שהסיכוי‬
‫לשגיאה הוא ‪ 0.52%‬נדחה את השערת האפס‪.‬‬
‫‪ , Z  1.65‬ערך ‪ Z‬נבדק‬
‫‪Z STAT  Z1 '  2.56‬‬
‫)‪Z STAT (2.56)  Z (1.65‬‬
‫ב‪.‬‬
‫כדי לדחות את השערת האפס בהנחה שכל הגורמים למעט גודל המדגם אינם משתנים נשתמש ב‪Z-‬‬
‫‪‬‬
‫‪P P‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪0.23  n‬‬
‫‪0.59  0.41‬‬
‫‪1.65 ‬‬
‫‪0.59  0.36‬‬
‫‪0.59  0.41‬‬
‫‪n‬‬
‫‪Z1 ‬‬
‫‪1.65 ‬‬
‫‪2‬‬
‫‪13  n‬‬
‫‪ 1.65  0.4918 ‬‬
‫‪‬‬
‫‪ n‬‬
‫‪0.23‬‬
‫‪‬‬
‫‪‬‬
‫‪138‬‬
‫ג‪.‬‬
‫‪ Z 0.975  1.96‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫)‪P (1  P‬‬
‫‪n‬‬
‫‪1‬‬
‫‪‬‬
‫‪‬‬
‫)‪P (1  P‬‬
‫‪ P  P Z  ‬‬
‫‪1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪‬‬
‫‪Z‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪P Z‬‬
‫‪0.59  1.96  0.1364  P  0.59  1.96  0.1364‬‬
‫‪0.3226  P  0.8573‬‬
‫‪.3‬‬
‫‪0.0625  0.0.9375‬‬
‫‪ 0.03827‬‬
‫‪40‬‬
‫א‪.‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫) ‪P (1  P‬‬
‫‪n‬‬
‫‪‬‬
‫‪30‬‬
‫‪P  0.17‬‬
‫‪P‬‬
‫‪ 0.0625‬‬
‫‪480‬‬
‫‪Z 0.96  1.75‬‬
‫‪Z 0.98  2.05‬‬
‫‪n  40‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫)‪P (1  P‬‬
‫‪ P  P Z  ‬‬
‫‪1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪‬‬
‫‪P Z  ‬‬
‫‪1‬‬
‫‪2‬‬
‫‪0.0625  2.05  0.03827  P  0.0625  2.05  0.03827‬‬
‫‪ 0.0159  P  0.1409‬‬
‫ב‪.‬‬
‫מבחן חד כיווני כלפי מטה‪:‬‬
‫‪P  0.17‬‬
‫‪H0 :‬‬
‫הודעת החברה אינה מקצרת את זמן "השיטוט" של העובדים‪.‬‬
‫‪P  0.17‬‬
‫‪H1 :‬‬
‫הודעת החברה מקצרת את זמן "השיטוט" של העובדים‬
‫‪  0.04‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪ 0.17  1.75  0.03827  0.1030‬‬
‫‪n‬‬
‫‪C  P  Z1‬‬
‫‪H0‬‬
‫‪0.17‬‬
‫‪0.1030‬‬
‫‪0.0625‬‬
‫‪139‬‬
‫‪ 6%‬מזמן העבודה שוטטו העובדים באינטרנט ערך הנמצא בתחום דחיית השערת האפס ‪.‬‬
‫נדחה את השערת האפס – הצהרת החברה קיצרה את זמן השיטוט באינטרנט‪.‬‬
‫שגיאה אפשרית‪:‬‬
‫‪0.0625  0.17‬‬
‫‪ 2.8‬‬
‫‪0.03827‬‬
‫‪‬‬
‫‪‬‬
‫‪P P‬‬
‫‪Z 1 ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪  0.0026‬‬
‫נחשב את רמת המובהקות המינימאלית‪:‬‬
‫‪0.0625  0.17‬‬
‫‪ 2.8‬‬
‫‪0.03827‬‬
‫‪‬‬
‫‪P P‬‬
‫‪‬‬
‫‪Z1 ' ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ '  0.0026‬‬
‫רמת המובהקות המינימאלית לדחיית השערת האפס היא ‪ 0.0026‬כאשר רמת המובהקות המינימאלית קטנה מרמת‬
‫המובהקות בהגדרת המחקר נדחה את השערת האפס – אם הגדרנו את הסיכוי לשגיאה – ‪ 4%‬וקיבלנו שהסיכוי‬
‫לשגיאה הוא ‪ 0.26%‬נדחה את השערת האפס‪.‬‬
‫‪ , Z  1.75‬ערך ‪ Z‬נבדק‬
‫‪( Z STAT  Z1 '  2.8‬בדיקה בערך מוחלט)‬
‫)‪Z STAT (2.8)  Z (1.75‬‬
‫‪140‬‬
‫ג‪.‬‬
‫‪P  0.13‬‬
‫‪0.0625  0.13‬‬
‫‪Z1 ' ‬‬
‫‪ 1.76‬‬
‫‪0.03827‬‬
‫‪ '  0.0392‬‬
‫רמת המובהקות המינימאלית לדחיית השערת האפס היא ‪.0.0392‬‬
‫‪‬‬
‫‪P P‬‬
‫ד‪.‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪ 1.75  0.242 ‬‬
‫‪‬‬
‫‪ n‬‬
‫‪ 0.0675 ‬‬
‫‪46  n‬‬
‫‪.4‬‬
‫‪0.0675  n‬‬
‫‪0.0625  0.9375‬‬
‫‪1.75 ‬‬
‫‪0.0625  0.13‬‬
‫‪0.0625  0.9375‬‬
‫‪n‬‬
‫‪Z1 ‬‬
‫‪1.75 ‬‬
‫מבחן חד כיווני כלפי מטה ‪ ,‬נתונים וחישובים‪:‬‬
‫‪Z 0.95  1.65‬‬
‫‪0.32  0.68‬‬
‫‪ 0.0352‬‬
‫‪175‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪n‬‬
‫‪n  175‬‬
‫‪P  0.36‬‬
‫‪H0 :‬‬
‫התבטאויותיו של זורו לא גרמו לירידה באחוז התומכים‪.‬‬
‫‪P  0.36‬‬
‫‪H1 :‬‬
‫התבטאויותיו של גרמו לירידה באחוז התומכים ‪.‬‬
‫‪‬‬
‫‪P  0.32‬‬
‫‪P  0.36‬‬
‫נחשב את הגבול הקריטי – תחומי קבלה ודחיית השערת האפס‪:‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪ 0.36  1.65  0.0352  0.301‬‬
‫‪n‬‬
‫‪C  P  Z1‬‬
‫‪H0‬‬
‫‪0.36‬‬
‫‪0.32‬‬
‫‪0.301‬‬
‫‪141‬‬
‫אחוז ההתומכים ע"פ הסקר – ‪ 32%‬נמצא בתחום קבלת השערת האפס ‪ ,‬נקבל את השערת האפס – התבטאויותיו‬
‫של זורו לא גרמו לו נזק ולא פגעו באחוז התומכים‪.‬‬
‫‪0.32  0.301‬‬
‫‪ 0.539‬‬
‫‪0.0352‬‬
‫‪‬‬
‫‪CP‬‬
‫‪‬‬
‫‪Z 1  ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1    0.7054‬‬
‫‪  0.2946‬‬
‫‪0.32  0.36‬‬
‫‪ 1.136‬‬
‫‪0.0352‬‬
‫‪‬‬
‫‪‬‬
‫‪P P‬‬
‫‪Z1 ' ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ '  0.1292‬‬
‫‪ , Z  1.65‬ערך ‪ Z‬נבדק‬
‫‪Z STAT  Z ‬‬
‫)‪Z STAT (1.14)  Z (1.65‬‬
‫‪.5‬‬
‫‪Z 0.95  1.65‬‬
‫‪0.25  0.75‬‬
‫‪ 0.023‬‬
‫‪360‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪n‬‬
‫‪n  360‬‬
‫‪‬‬
‫‪P  0.25‬‬
‫‪P  0.22‬‬
‫‪142‬‬
‫‪P  0.22‬‬
‫‪H0 :‬‬
‫אחוזי הצפייה בתוכניתו של מומו לא עלו ביחס לעונה הקודמת‪.‬‬
‫‪P  0.22‬‬
‫‪H1 :‬‬
‫אחוזי הצפייה בתוכניתו של מומו עלו ביחס לעונה הקודמת‪.‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪ 0.22  1.65  0.023  0.2579‬‬
‫‪n‬‬
‫‪C  P  Z1‬‬
‫‪H0‬‬
‫‪0.25 0.258‬‬
‫‪0.22‬‬
‫אחוזי הצפיה ע"פ הסקר – ‪ 25%‬נמצא בתחום קבלת השערת האפס ‪ ,‬נקבל את השערת האפס –‬
‫אחוזי הצפיה בתוכנית לא עלו העונה ביחס לעונה הקודמת‪.‬‬
‫‪0.258  0.25‬‬
‫‪ 0.3478‬‬
‫‪0.023‬‬
‫‪‬‬
‫‪CP‬‬
‫‪‬‬
‫‪Z 1  ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1    0.6368‬‬
‫‪  0.3632‬‬
‫‪0.25  0.22‬‬
‫‪ 1.304‬‬
‫‪0.023‬‬
‫‪‬‬
‫‪‬‬
‫‪P P‬‬
‫‪Z1 ' ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1   '  0.9032‬‬
‫‪ '  0.0968‬‬
‫‪143‬‬
‫‪ , Z  1.65‬ערך ‪ Z‬נבדק‬
‫‪Z STAT  Z ‬‬
‫)‪ Z STAT (1.3)  Z (1.65‬מקבלים את השערת האפס‬
‫‪.6‬‬
‫מבחן חד כיווני כלפי מעלה ‪ -‬האם אחוזי המעבר בטסט ראשון אצל מוטי הילוכים גבוהים מהממוצע‪.‬‬
‫‪Z 0.99  2.33‬‬
‫‪‬‬
‫‪0.49  0.51‬‬
‫‪ 0.0242‬‬
‫‪425‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪n‬‬
‫‪n  425‬‬
‫‪‬‬
‫‪P  0.49‬‬
‫‪P  0.42‬‬
‫‪P  0.42‬‬
‫‪H0 :‬‬
‫אחוזי המעבר בטסט ראשון אצל מוטי הילוכים אינם גבוהים משאר המורים‬
‫‪P  0.42‬‬
‫‪H1 :‬‬
‫אחוזי המעבר בטסט ראשון אצל מוטי הילוכים גבוהים משאר המורים‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪‬‬
‫‪ 0.42  2.33  0.0242  0.4763‬‬
‫‪n‬‬
‫‪C  P  Z1‬‬
‫‪H0‬‬
‫‪0.42‬‬
‫‪0.4763 0.49‬‬
‫אחוזי המעבר בטסט ראשון אצל מוטי הילוכים – ‪ 49%‬גבוהים באופן מובהק מהממוצע (רמת מובהקות של ‪)1%‬‬
‫‪0.49  0.42‬‬
‫‪ 2.89‬‬
‫‪0.0242‬‬
‫‪‬‬
‫‪‬‬
‫‪P P‬‬
‫‪Z 1 ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1    0.9981‬‬
‫‪  0.0019‬‬
‫‪144‬‬
‫‪0.49  0.42‬‬
‫‪ 2.89‬‬
‫‪0.0242‬‬
‫‪‬‬
‫‪‬‬
‫‪P P‬‬
‫‪Z1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ P(1  P) ‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1   '  0.9981‬‬
‫‪ '  0.0019‬‬
‫‪‬‬
‫‪‬‬
‫לשגיאה הוא ‪0.19%‬‬
‫‪ , Z  2.33‬ערך ‪ Z‬נבדק‬
‫‪Z STAT  Z ‬‬
‫)‪Z STAT (2.89)  Z (2.33‬‬
‫‪( Z STAT  Z '  2.33‬בדיקה ע"פ ערך מוחלט)‬
‫‪145‬‬
‫שני מדגמים בלתי תלויים – השוואת פרופורציות‬
‫בפרק ‪ 6‬עסקנו בהסקה סטטיסטית על הפרשי ממוצעים בשני מדגמים בלתי תלויים ‪ ,‬אותו רעיון ישמש אותנו‬
‫בהשוואה פרופורציות בין שני מדגמים ב"ת ‪ ,‬השוני המהותי הוא – כאשר משווים פרופורציות אנו עוסקים‬
‫במדגמים גדולים (‪ ) n <30‬מאחר ופרופורציה מתוך מדגם קטן – חסרת משמעות‪.‬‬
‫) ‪P1 (1  P1‬‬
‫‪n1‬‬
‫‪S ‬‬
‫טעות התקן לפרופורציית מדגם אחד ‪. n1‬‬
‫‪P1‬‬
‫) ‪P2 (1  P2‬‬
‫‪n2‬‬
‫‪S ‬‬
‫טעות התקן לפרופורציית מדגם שני ‪. n2‬‬
‫‪P2‬‬
‫טעות התקן המשוקללת להפרש בין הפרופורציות‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P1 (1  P1 ) P 2 (1  P 2‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪S‬‬
‫רווח בר סמך להפרש פרופורציות‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P1 (1  P1 ) P 2 (1  P 2‬‬
‫) ‪P1 (1  P1 ) P 2 (1  P 2‬‬
‫‪‬‬
‫‪‬‬
‫‪ P1  P2  P1  P2  Z  ‬‬
‫‪‬‬
‫‪1‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪P1  P2  Z‬‬
‫‪1‬‬
‫מפעל עורך השוואת בקרת איכות של מוצר מסוים המיוצר בשני פסי יצור ‪ ,‬במדגם של ‪ 450‬מוצרים אשר יוצרו‬
‫בפס יצור ‪ A‬נמצאו ‪ 25‬מוצרים פגומים ‪ ,‬במדגם של ‪ 500‬מוצרים אשר יוצרו בפס יצור ‪ B‬נמצאו ‪ 38‬מוצרים‬
‫פגומים ‪ ,‬בנו רווח בר סמך להפרש הפרופורציות ברמת סמך של ‪.0.95‬‬
‫עיבוד נתונים‪:‬‬
‫‪B‬‬
‫‪41‬‬
‫‪ 0.082‬‬
‫‪500‬‬
‫‪A‬‬
‫‪‬‬
‫‪P1 ‬‬
‫‪‬‬
‫‪1  P1  0.918‬‬
‫‪n1  500‬‬
‫‪25‬‬
‫‪ 0.055‬‬
‫‪450‬‬
‫‪‬‬
‫‪P2 ‬‬
‫‪‬‬
‫‪1  P2  0.945‬‬
‫‪n2  450‬‬
‫‪146‬‬


P2  P1  0.082  0.055  0.027


P1  P 2



P1  P2  Z
1

2


Z
1

 Z 0.975  1.96
2
0.055  0.945 0.082  0.918

 0.01631
450
500








P1 (1  P1 ) P 2 (1  P 2 )
P1 (1  P1 ) P 2 (1  P 2 )


 P1  P2  P1  P2  Z  

1
n1
n2
n1
n2
2
0.027  1.96  0.01631  P1  P2  0.027  1.96  0.01631
 0.00496  P1  P2  0.05869
147
‫בדיקת השערות על הפרש פרופורציות‬
‫כאשר עוסקים בבדיקת השערות להפרש פרופורציות יש לחשב תחילה את הפרופורציה המשוקללת לשני‬
‫המדגמים ‪ , P‬בחישוב טעות התקן נעזר בפרופורציה המשוקללת לשני המדגמים‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪Pn  P n‬‬
‫‪P 1 1 2 2‬‬
‫‪n1  n2‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫טעות התקן‬
‫המשותפת להפרש‬
‫הפרופורציות‬
‫‪ ( p1 p 2) ‬‬
‫‪ - Z STAT‬ערך ה‪ Z -‬הסטטיסטי להפרש הפרופורציות (ערך ‪ Z‬לחישוב רמת מובהקות מינימאלית)‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪P1  P2‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫מפעל עורך השוואת בקרת איכות של מוצר מסוים המיוצר בשני פסי יצור ‪ ,‬במדגם של ‪ 450‬מוצרים אשר יוצרו‬
‫בפס יצור ‪ A‬נמצאו ‪ 25‬מוצרים פגומים ‪ ,‬במדגם של ‪ 500‬מוצרים אשר יוצרו בפס יצור ‪ B‬נמצאו ‪ 38‬מוצרים‬
‫פגומים ‪ ,‬האם קיים שוני באיכות המוצרים בין שני פסי היצור ‪ ,‬בדקו ברמת מובהקות של ‪.0.05‬‬
‫מבחן דו כיווני (האם קיים שוני ? אין כיוון ברור)‬
‫השערות‬
‫‪P1  P2  0‬‬
‫‪H0 :‬‬
‫אין שוני בין פרופורציית הפגומים בין שני פסי הייצור‬
‫‪P1  P2  0‬‬
‫‪H1 :‬‬
‫יש שוני בין פרופורציית הפגומים בין שני פסי הייצור‬
‫רמת מובהקות ‪  0.05 :‬‬
‫‪‬‬
‫‪B‬‬
‫‪‬‬
‫‪A‬‬
‫‪41‬‬
‫‪ 0.082‬‬
‫‪500‬‬
‫‪P1  P2  0.027‬‬
‫‪‬‬
‫‪P1 ‬‬
‫‪‬‬
‫‪1  P1  0.918‬‬
‫‪25‬‬
‫‪ 0.055‬‬
‫‪450‬‬
‫‪ Z 0.975  1.96‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪‬‬
‫‪n2  450‬‬
‫‪0.055  450  0.082  500‬‬
‫‪ 0.0692‬‬
‫‪950‬‬
‫‪0.0692  0.9308 0.0692  0.9308‬‬
‫‪‬‬
‫‪ 0.01649‬‬
‫‪450‬‬
‫‪500‬‬
‫‪P2 ‬‬
‫‪1  P2  0.945‬‬
‫‪n1  500‬‬
‫‪Z‬‬
‫‪‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪P‬‬
‫‪ ( p1 p 2) ‬‬
‫‪148‬‬
‫השיטה הקלאסית‪:‬‬
‫נחשב את הגבול הקריטי ‪ ,‬מבחן דו כיווני‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪ 0  1.96  0.01649  0.03232‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪‬‬
‫‪2‬‬
‫‪C  P1  P2  Z‬‬
‫‪1‬‬
‫‪H0‬‬
‫‪0.027 0.03232‬‬
‫‪ 0.03232‬‬
‫‪0‬‬
‫הפרש הפרופורציות נמצא בתחום קבלת השערת האפס‪ -‬נקבל את ‪H 0‬‬
‫שגיאה אפשרית‬
‫קיבלנו את השערת האפס לכן השגיאה האפשרית היא שגיאה מסוג שני ‪ - ‬קיבלנו את השערת האפס בזמן‬
‫שההשערה האלטרנטיבית – השערת המחקר נכונה‪.‬‬
‫בדיקה ע"י השוואת הסתברויות ‪ -‬רמות המובהקות‬
‫'‪‬‬
‫נחשב את רמת המובהקות המינימאלית ‪:‬‬
‫‪( P1  P2 )  0‬‬
‫‪0.027‬‬
‫‪‬‬
‫‪ 1.637‬‬
‫‪P(1  P) P(1  P) 0.01649‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪ '  0.101‬‬
‫‪ 0.0505‬‬
‫'‪‬‬
‫‪‬‬
‫‪ 0.9495‬‬
‫‪2‬‬
‫'‪‬‬
‫‪2‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪1‬‬
‫)‪  ' (0.101)   (0.05‬מקבלים את השערת האפס‬
‫‪Z STAT  1.637‬‬
‫‪ 1.96‬‬
‫‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪ Z  Z STAT‬מקבלים את השערת האפס‬
‫ראינו ב‪ 3-‬דרכים שונות כי אין הבדל בטיב המוצרים בין שני פסי היצור לכן נקבל את השערת האפס‬
‫‪149‬‬
‫‪.1‬‬
‫בבית ספר מסוים כי מתוך מדגם של ‪ 160‬בנים נמצא כי ל‪ 17-‬בנים יש יותר מציון שלילי אחד ‪ ,‬במדגם‬
‫של ‪ 240‬בנות נמצא כי ל‪ 19-‬יש יותר משלילי אחד ‪ ,‬האם נכונה הטענה כי פרופורציית הציונים השליליים בקרב‬
‫הבנים גבוהה יותר ‪ ,‬בדקו ברמת מובהקות של ‪.0.04‬‬
‫‪.2‬‬
‫חקלאי רצה להשוות את טיב היבול בין אבוקדו למנגו ‪ ,‬בדגימה של ‪ 520‬מנגו נמצאו ‪ 46‬פסולים למכירה‬
‫במדגם של ‪ 720‬אבוקדו נמצאו ‪ 75‬פסולים למכירה ‪ ,‬האם יש הבדל בטיב היבול ‪ ,‬בדקו ברמת מובהקות של ‪.5%‬‬
‫‪.3‬‬
‫מפלגה בודקת את השפעת תעמולת בחירות על אחוז מצביעה ‪ .‬במדגם של ‪ 854‬איש טרם התעמולה נמצא‬
‫כי ‪ 188‬איש תמכו במפלגה ‪ ,‬במדגם לאחר ימי התעמולה ‪ -‬מבין ‪ 658‬נשאלים ‪ 172‬איש הביעו תמיכה במפלגה‬
‫א‪.‬‬
‫האם נכון לומר כי התעמולה שיפרה את אחוז ההצבעה למפלגה ‪.   0.05‬‬
‫ב‪.‬‬
‫בנו רווח בר סמך להפרש הפרופורציות כתוצאה מהתעמולה ‪  0.05‬‬
‫‪.4‬‬
‫נערך מחקר במטרה לבדוק את הקשר בין עישון לרמות כולסטרול בדם ‪ ,‬נבדקו ‪ 500‬מעשנים ונמצא כי‬
‫ל‪ 46-‬מהם היו רמות כולסטרול גבוהות בדם‪ .‬נבדקו ‪ 500‬איש שאינם מעשנים ונמצא כי ל‪ 37-‬מהם היו רמות‬
‫כולסטרול גבוהות בדם ‪ ,‬האם ניתן לומר כי לקבוצת המעשנים ישנם רמות גבוהות יותר של כולסטרול בדם? בדקו‬
‫ברמת מובהקות של ‪.0.02‬‬
‫‪.5‬‬
‫חברת סלולאר מצאה כי מבין ‪ 400‬מנויים המקבלים שירות ‪ SMS‬חינם ‪ 225‬שולחים יותר מ‪500-‬‬
‫הודעות בחודש ואילו מבין ‪ 650‬מנויים המשלמים עבור שירותי ‪ 310 , SMS‬שולחים יותר מ‪ SMS 500-‬בחודש‬
‫א‪.‬‬
‫האם למחיר יש השפעה על כמות ה‪ SMS-‬בדקו ברמת מובהקות של ‪.2%‬‬
‫ב‪.‬‬
‫בנו רווח בר סמך להפרש הפרופורציות במחירי ה‪SMS-‬‬
‫‪.6‬‬
‫מנהל מסעדה בטיילת בדק ומצא כי מכל ‪ 50‬איש העוברים בטיילת ‪ 8‬נכנסים לאכול במסעדה ‪ ,‬במטרה‬
‫לשפר את פרופורציית הנכנסים למסעדה מכלל העוברים בטיילת החליט לחלק מנשרים בכניסה לטיילת לפרסום‪.‬‬
‫הממצאים הראו כי מתוך ‪ 350‬איש אשר עברו בטיילת נכנסו למסעדה ‪ 66‬איש‪.‬‬
‫האם הפרסום עובד – בדקו ברמת ביטחון של ‪.95%‬‬
‫‪.7‬‬
‫לבדיקת הטענה כי אימוני כושר לפני הצבא משפרים את סיכויי הקבלה לסיירת ‪ ,‬נלקחו שני מדגמים‪:‬‬
‫‪ – A‬מדגם של ‪ 84‬צעירים המתאמנים בכושר קרבי ‪ 146 – B .‬צעירים אשר אינם מתאמנים‪.‬‬
‫הממצאים הראו כי ‪ 23‬מבין הקבוצה הראשונה התקבלו לסיירות ואילו מהקבוצה השנייה ‪.38‬‬
‫בדקו את הטענה ברמת מובהקות של ‪.5%‬‬
‫‪150‬‬
‫‪.1‬‬
‫‪Z 0.96  1.75‬‬
‫‪‬‬
‫‪‬‬
‫‪19‬‬
‫‪ 0.0791‬‬
‫‪240‬‬
‫‪P1  P2  0.02715‬‬
‫‪0.09  0.91 0.09  0.91‬‬
‫‪‬‬
‫‪ 0.0292‬‬
‫‪160‬‬
‫‪240‬‬
‫‪‬‬
‫‪‬‬
‫‪17‬‬
‫‪ 0.10625‬‬
‫‪160‬‬
‫‪P1 ‬‬
‫‪0.10625  160  0.0791  240‬‬
‫‪ 0.09‬‬
‫‪400‬‬
‫‪P‬‬
‫‪P2 ‬‬
‫מבחן חד כיווני כלפי מעלה‪:‬‬
‫השערות‬
‫‪P1  P2  0‬‬
‫‪H0 :‬‬
‫פרופורציית הציונים השליליים בקרב הבנים אינה גבוהה מהבנות‪.‬‬
‫‪P1  P2  0‬‬
‫‪H1 :‬‬
‫פרופורציית הציונים השליליים בקרב הבנים גבוהה מהבנות‪.‬‬
‫רמת מובהקות ‪:‬‬
‫‪  0.04‬‬
‫א‪ .‬השיטה הקלאסית‪:‬‬
‫נחשב את הגבול הקריטי ‪ ,‬מבחן חד כיווני‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪ 0  1.75  0.0292  0.0511‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪C  P1  P2  Z1 ‬‬
‫‪H0‬‬
‫‪0.027 0.0511‬‬
‫‪0‬‬
‫הפרש הפרופורציות נמצא בתחום קבלת השערת האפס‪.‬‬
‫‪151‬‬
‫'‪‬‬
‫‪0.027‬‬
‫‪ 0.924‬‬
‫‪0.0292‬‬
‫‪‬‬
‫‪( P1  P2 )  0‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪ '  0.1788‬‬
‫‪Z1 ' ‬‬
‫‪1   '  0.8212‬‬
‫בדיקה ע"י השוואת ‪Z‬‬
‫‪Z  1.75‬‬
‫‪Z STAT  0.924‬‬
‫‪.2‬‬
‫מבחן דו כיווני ‪ ,‬נתונים וחישובים‪:‬‬
‫‪‬‬
‫‪Z 0.975  1.96‬‬
‫‪‬‬
‫‪P1  P2  0.0156‬‬
‫‪0.0975  0.9025 0.0975  0.9025‬‬
‫‪‬‬
‫‪ 0.017‬‬
‫‪720‬‬
‫‪520‬‬
‫‪46‬‬
‫‪ 0.0884‬‬
‫‪520‬‬
‫‪‬‬
‫‪‬‬
‫‪75‬‬
‫‪ 0.1041‬‬
‫‪720‬‬
‫‪P1 ‬‬
‫‪0.1041  720  0.0884  520‬‬
‫‪ 0.0975‬‬
‫‪1240‬‬
‫‪P‬‬
‫‪P2 ‬‬
‫השערות‬
‫‪P1  P2  0‬‬
‫‪H0 :‬‬
‫אין הבדל בטיב היבול בין שני המטעים‬
‫‪P1  P2  0‬‬
‫‪H1 :‬‬
‫קיים הבדל בטיב היבול בין שני המטעים‬
‫‪  0.05‬‬
‫‪152‬‬
‫נחשב את הגבול הקריטי ‪ ,‬מבחן דו כיווני‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪ 0  1.96  0.017  0.033‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪‬‬
‫‪2‬‬
‫‪C  P1  P2  Z‬‬
‫‪1‬‬
‫‪H0‬‬
‫‪0.0156 0.033‬‬
‫‪ 0.033‬‬
‫‪0‬‬
‫'‪‬‬
‫‪( P1  P2 )  0‬‬
‫‪0.0156‬‬
‫‪ 0.917‬‬
‫‪0.017‬‬
‫‪‬‬
‫‪ '  0.3576‬‬
‫‪ 0.1788‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫'‪‬‬
‫‪‬‬
‫‪ 0.8212‬‬
‫‪2‬‬
‫'‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z STAT  0.917‬‬
‫‪ 1.96‬‬
‫‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪153‬‬
‫‪.3‬‬
‫‪‬‬
‫‪Z 0.95  1.65‬‬
‫‪‬‬
‫‪P1  P2  0.041‬‬
‫‪188‬‬
‫‪ 0.22‬‬
‫‪854‬‬
‫‪0.2379  0.7621 0.2379  0.7621‬‬
‫‪‬‬
‫‪ 0.022‬‬
‫‪658‬‬
‫‪854‬‬
‫‪‬‬
‫‪‬‬
‫‪172‬‬
‫‪ 0.2613‬‬
‫‪658‬‬
‫‪P1 ‬‬
‫‪0.2613  658  0.22  854‬‬
‫‪ 0.2379‬‬
‫‪1512‬‬
‫‪P‬‬
‫‪P2 ‬‬
‫השערות‬
‫‪P1  P2  0‬‬
‫‪H0 :‬‬
‫תעמולת הבחירות אינה משפיעה את אחוז המצביעים‪.‬‬
‫‪P1  P2  0‬‬
‫‪H1 :‬‬
‫תעמולת הבחירות מעלה את אחוז המצביעים‪.‬‬
‫רמת מובהקות ‪  0.05 :‬‬
‫נחשב את הגבול הקריטי ‪ ,‬מבחן חד כיווני‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪ 0  1.65  0.022  0.0363‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪C  P1  P2  Z1 ‬‬
‫‪H0‬‬
‫‪0‬‬
‫‪0.036 0.041‬‬
‫הפרש הפרופורציות נמצא בתחום דחית השערת האפס‪.‬‬
‫דחינו את השערת האפס לכן השגיאה האפשרית היא שגיאה מסוג ראשון ‪ - ‬דחינו את השערת האפס בזמן‬
‫שהשערת האפס נכונה‪.‬‬
‫‪0.041‬‬
‫‪ 1.86‬‬
‫‪0.022‬‬
‫‪‬‬
‫‪( P1  P2 )  0‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪ '  0.0314‬‬
‫'‪‬‬
‫‪Z1 ' ‬‬
‫‪1   '  0.9686‬‬
‫)‪  ' (0.0314)   (0.05‬דוחים את השערת האפס‬
‫‪154‬‬
‫‪Z  1.65‬‬
‫‪Z STAT  1.86‬‬
‫‪ Z  Z STAT‬דוחים את השערת האפס‬
‫רווח בר סמך‪:‬‬
‫ב‪.‬‬
‫‪ Z 0.975  1.96‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪188‬‬
‫‪ 0.22‬‬
‫‪854‬‬
‫‪0.26  0.74 0.22  0.78‬‬
‫‪‬‬
‫‪ 0.0222‬‬
‫‪658‬‬
‫‪854‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P1 (1  P1 ) P 2 (1  P 2‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪‬‬
‫‪‬‬
‫‪P1  P2  0.04‬‬
‫‪‬‬
‫‪172‬‬
‫‪ 0.26‬‬
‫‪658‬‬
‫‪P2 ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪P1 ‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P1 (1  P1 ) P 2 (1  P 2‬‬
‫‪‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P1 (1  P1 ) P 2 (1  P 2‬‬
‫‪‬‬
‫‪ P  P1  P2  Z ‬‬
‫‪1‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪‬‬
‫‪P1  P2  Z‬‬
‫‪0.04  1.96  0.0222  P  0.04  1.96  0.0222‬‬
‫‪0.356  P  0.443‬‬
‫‪35.6%  P  44.3%‬‬
‫‪.4‬‬
‫‪Z 0.98  2.06‬‬
‫‪‬‬
‫‪‬‬
‫‪P1  P2  0.03‬‬
‫‪0.089  0.911 0.089  0.911‬‬
‫‪‬‬
‫‪ 0.018‬‬
‫‪500‬‬
‫‪500‬‬
‫‪S‬‬
‫‪37‬‬
‫‪ 0.074‬‬
‫‪500‬‬
‫‪‬‬
‫‪‬‬
‫‪52‬‬
‫‪ 0.104‬‬
‫‪500‬‬
‫‪P1 ‬‬
‫‪0.104  500  0.074  500‬‬
‫‪ 0.089‬‬
‫‪1000‬‬
‫‪P‬‬
‫‪P2 ‬‬
‫השערות‬
‫‪P1  P2  0‬‬
‫‪H0 :‬‬
‫רמות הכולסטרול בדם אצל מעשנים אינן גבוהות יותר מאשר אצל לא מעשנים‬
‫‪P1  P2  0‬‬
‫‪H1 :‬‬
‫רמות הכולסטרול בדם אצל מעשנים גבוהות יותר מאשר אצל לא מעשנים‪.‬‬
‫רמת מובהקות ‪  0.02 :‬‬
‫‪155‬‬
‫נחשב את הגבול הקריטי‬
‫‪H0‬‬
‫‪0.03 0.037‬‬
‫‪0‬‬
‫שהשערת המחקר נכונה‪.‬‬
‫‪0.03‬‬
‫‪ 0.81‬‬
‫‪0.037‬‬
‫‪‬‬
‫'‪‬‬
‫‪( P1  P2 )  0‬‬
‫‪Z1 ' ‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪1   '  0.7910‬‬
‫‪ '  0.209‬‬
‫‪Z  2.06‬‬
‫‪Z STAT  0.81‬‬
‫‪.5‬‬
‫מבחן דו כיווני – האם למחיר יש השפעה על כמות ה‪SMS -‬‬
‫‪ Z 0.99  2.33‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪‬‬
‫‪P1  P2  0.08‬‬
‫‪0.5095  0.4905 0.5095  0.4905‬‬
‫‪‬‬
‫‪ 0.0317‬‬
‫‪400‬‬
‫‪650‬‬
‫‪S‬‬
‫‪310‬‬
‫‪ 0.4769‬‬
‫‪650‬‬
‫‪‬‬
‫‪P2 ‬‬
‫‪225‬‬
‫‪ 0.5625‬‬
‫‪400‬‬
‫‪0.5625  400  0.4769  650‬‬
‫‪ 0.5095‬‬
‫‪1050‬‬
‫‪‬‬
‫‪P1 ‬‬
‫‪P‬‬
‫‪156‬‬
‫השערות‬
‫‪P1  P2  0‬‬
‫‪H0 :‬‬
‫למחיר ה‪ SMS-‬אין השפעה על כמות ה‪ SMS-‬הנשלחים‬
‫‪P1  P2  0‬‬
‫‪H1 :‬‬
‫למחיר ה‪ SMS-‬יש השפעה על כמות ה‪ SMS-‬הנשלחים‬
‫רמת מובהקות ‪  0.02 :‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪‬‬
‫‪ 0  2.33  0.0317  0.073‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪‬‬
‫‪2‬‬
‫‪C  P1  P2  Z‬‬
‫‪1‬‬
‫‪H0‬‬
‫‪0‬‬
‫‪0.073 0.08‬‬
‫‪0.073‬‬
‫הפרש הפרופורציות נמצא בתחום דחית השערת האפס‪.‬‬
‫דחינו את השערת האפס לכן השגיאה האפשרית היא שגיאה מסוג ראשון ‪- ‬‬
‫דחינו את השערת האפס בזמן שהשערת האפס נכונה‪.‬‬
‫'‪‬‬
‫‪( P1  P2 )  0‬‬
‫‪‬‬
‫‪0.08‬‬
‫‪ 2.52‬‬
‫‪0.0317‬‬
‫‪‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪ '  0.0118‬‬
‫‪ 0.9941‬‬
‫'‪‬‬
‫‪2‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪1‬‬
‫)‪  ' (0.0118)   (0.02‬דוחים את השערת האפס‬
‫‪Z STAT  2.52‬‬
‫‪Z  2.33‬‬
‫‪ Z  Z STAT‬דוחים את השערת האפס‬
‫‪157‬‬
‫ב‪ .‬רווח בר סמך‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P1 (1  P1 ) P 2 (1  P 2‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P1 (1  P1 ) P 2 (1  P 2‬‬
‫‪‬‬
‫‪ P  P1  P2  Z ‬‬
‫‪1‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪‬‬
‫‪P1  P2  Z‬‬
‫‪0.08  2.33  0.0317  P  0.08  2.33  0.0317‬‬
‫‪0.0061  P  0.1538‬‬
‫‪0.61%  P  15.38%‬‬
‫‪.6‬‬
‫‪‬‬
‫‪Z 0.95  1.65‬‬
‫‪‬‬
‫‪8‬‬
‫‪ 0.16‬‬
‫‪50‬‬
‫‪P1  P2  0.03‬‬
‫‪0.186  0.814 0.186  0.814‬‬
‫‪‬‬
‫‪ 0.058‬‬
‫‪350‬‬
‫‪50‬‬
‫‪S‬‬
‫‪‬‬
‫‪‬‬
‫‪66‬‬
‫‪ 0.19‬‬
‫‪350‬‬
‫‪P1 ‬‬
‫‪0.19  350  0.16  50‬‬
‫‪ 0.186‬‬
‫‪400‬‬
‫‪P‬‬
‫‪P2 ‬‬
‫השערות‬
‫‪P1  P2  0‬‬
‫‪H0 :‬‬
‫הפרסום אינו משפר את המכירות‬
‫‪P1  P2  0‬‬
‫‪H1 :‬‬
‫הפרסום משפר את המכירות‬
‫רמת מובהקות ‪  0.05 :‬‬
‫‪H0‬‬
‫‪0.03 0.097‬‬
‫‪0‬‬
‫‪0.03‬‬
‫‪ 0.51‬‬
‫‪0.0588‬‬
‫‪‬‬
‫‪( P1  P2 )  0‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪ '  0.305‬‬
‫'‪‬‬
‫‪Z1 ' ‬‬
‫‪1   '  0.6950‬‬
‫‪158‬‬
‫‪Z STAT  0.51‬‬
‫‪.7‬‬
‫‪Z  1.65‬‬
‫‪‬‬
‫‪Z 0.95  1.65‬‬
‫‪‬‬
‫‪30‬‬
‫‪ 0.205‬‬
‫‪146‬‬
‫‪P1  P2  0.069‬‬
‫‪0.23  0.77 0.23  0.77‬‬
‫‪‬‬
‫‪ 0.0576‬‬
‫‪84‬‬
‫‪146‬‬
‫‪S‬‬
‫‪‬‬
‫‪‬‬
‫‪23‬‬
‫‪ 0.274‬‬
‫‪84‬‬
‫‪P1 ‬‬
‫‪0.274  84  0.205  146‬‬
‫‪ 0.2302‬‬
‫‪230‬‬
‫‪P‬‬
‫‪P2 ‬‬
‫השערות‬
‫‪P1  P2  0‬‬
‫‪H0 :‬‬
‫אימוני כושר קרבי אינם משפרים את סיכויי הקבלה לסיירות‬
‫‪P1  P2  0‬‬
‫‪H1 :‬‬
‫אימוני כושר קרבי משפרים את סיכויי הקבלה לסיירות‬
‫רמת מובהקות ‪  0.05 :‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪ 0  1.65  0.0576  0.095‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪C  P1  P2  Z1 ‬‬
‫‪H0‬‬
‫‪0.069 0.095‬‬
‫‪0‬‬
‫‪0.069‬‬
‫‪ 1.19‬‬
‫‪0.0576‬‬
‫‪‬‬
‫‪( P1  P2 )  0‬‬
‫)‪P(1  P) P(1  P‬‬
‫‪‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪ '  0.117‬‬
‫'‪‬‬
‫‪Z STAT  0.51‬‬
‫‪Z  1.65‬‬
‫‪Z1 ' ‬‬
‫‪1   '  0.8830‬‬
‫‪159‬‬
‫הקירוב הנורמאלי לבינום‬
‫ניסוי בינומי ‪ /‬התפלגות בינומית – התפלגות הבנויה ממספר מאורעות בלתי תלויים כאשר לכל מאורע ישנם שני‬
‫מצבים אפשריים ‪ -‬הצלחה ‪/‬כשלון‪.‬‬
‫בהנחה כי ההסתברות להצלחה בכל מקרה היא ‪ p‬אזי ההסתברות לכישלון (המאורע המשלים ) היא ‪. 1-p‬‬
‫חישוב הסתברויות בהתפלגויות בינומיות נעשית באמצעות הנוסחה הידועה גם כנוסחת ברנולי‪:‬‬
‫ההסתברות ל‪ k -‬מקרים מתוך מדגם של ‪ n‬אפשרויות ‪.‬‬
‫‪n‬‬
‫!‪n‬‬
‫‪  ‬‬
‫!) ‪ k  k!(n  k‬‬
‫‪n‬‬
‫‪PK ( n)     p k  (1  p) nk‬‬
‫‪k‬‬
‫דוגמא לשאלה‪:‬‬
‫במדינת ישראל ‪ 35%‬מבעלי זכות ההצבעה מצביעים למפלגות שמאל ‪ ,‬בוחרים ‪ 5‬אנשים באקראי ‪ ,‬מה ההסתברות‬
‫ששניים מהם מצביעי שמאל‪:‬‬
‫‪p  0.35‬‬
‫‪1  p  0.65‬‬
‫‪n5‬‬
‫‪k 2‬‬
‫!‪5‬‬
‫‪ 0.352  0.653  0.3364‬‬
‫!‪2!3‬‬
‫‪P2(5) ‬‬
‫לא ארחיב בנושא זה מאחר וחומר זה אינו שייך לתחום עיסוקו של ספר זה‪.‬‬
‫כאשר אנו עוסקים במדגמים גדולים ‪ n  30 -‬וגם ‪ , n  p  10‬ניתן להניח כי ההתפלגות הבינומית שואפת‬
‫להתפלגות נורמאלית ולכן ניתן לבצע קירוב נורמאלי להתפלגות הבינומית‪.‬‬
‫ממוצע ההתפלגות הבינומית וסטית התקן מבוססים על ההנחות והמסקנות שהוכחו בהסקה סטטיסטית על‬
‫פרופורציה (ע"מ ‪ )120‬תוך הכפלתם בגודל המדגם‪:‬‬
‫)‪  np(1  p‬‬
‫‪ n p‬‬
‫ע"פ משפט הגבול המרכזי ‪:‬‬
‫‪‬‬
‫‪2‬‬
‫‪X ~ N   ,  ‬‬
‫‪‬‬
‫‪‬‬
‫שונות‬
‫מתפלגת‬
‫ממוצע האוכלוסייה‬
‫‪Xi  ‬‬
‫‪‬‬
‫אוכלוסיה‬
‫נחקרת‬
‫‪Z‬‬
‫‪160‬‬
‫קירוב התפלגות בינומית לנורמאלית‬
‫בינומית‬
‫‪X B ~ N  np , np(1  p) ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪X i  np‬‬
‫)‪np(1  p‬‬
‫‪Z‬‬
‫במדינת ישראל ‪ 35%‬מבעלי זכות ההצבעה מצביעים למפלגות שמאל ‪ ,‬בוחרים מדגם של ‪ 70‬אנשים באקראי ‪ ,‬מה‬
‫ההסתברות שלכל היותר ‪ 20‬מהם מצביעי שמאל‪:‬‬
‫על מנת שנוכל לבצע קירוב נורמאלי לבינום צריכים להתקיים התנאים‪:‬‬
‫‪ n  30‬וגם ‪n  p  10‬‬
‫נבדוק תחילה קיום תנאים אלו‪:‬‬
‫‪n  30‬‬
‫וגם‬
‫‪70  0.35  10‬‬
‫‪24.5  10‬‬
‫‪n  100‬‬
‫‪1  p  0.65‬‬
‫‪p  0.35‬‬
‫‪0.1292‬‬
‫‪ 4.5‬‬
‫‪ 1.13‬‬
‫‪3.99‬‬
‫‪‬‬
‫‪20  70  0.35‬‬
‫‪70  0.35  0.65‬‬
‫‪Z‬‬
‫‪p ( X i  20)  p ( Z  1.13)  0.1292‬‬
‫‪0.8708‬‬
‫‪np=24.5‬‬
‫‪20‬‬
‫ההסתברות שלכל היותר ‪ 20‬איש מתוך ‪ 70‬הם מצביעי שמאל היא ‪. 0.1292‬‬
‫באוכלוסייה מסוימת ‪ 26%‬מהגברים קרחים ‪ ,‬בוחרים מדגם של ‪ 78‬גברים‪.‬‬
‫א‪.‬‬
‫מה ההסתברות שלפחות ‪ 10‬גברים יהיו קרחים‪.‬‬
‫ב‪.‬‬
‫מה ההסתברות שבדיוק ‪ 21‬גברים יהיו קרחים‪.‬‬
‫‪161‬‬
‫א‪.‬‬
‫‪ 10.28‬‬
‫‪ 2.65‬‬
‫‪3.873‬‬
‫‪‬‬
‫‪10  78  0.26‬‬
‫‪78  0.26  0.74‬‬
‫‪Z‬‬
‫‪0.0040‬‬
‫‪0.996‬‬
‫‪p ( X i 10) ‬‬
‫‪ p ( Z 2.65)  0.0040‬‬
‫‪np=20.28‬‬
‫‪1  0.0040  0.996‬‬
‫‪10‬‬
‫ההסתברות שלפחות ‪ 10‬גברים מתוך ‪ 76‬קרחים היא ‪. 0.996‬‬
‫ב‪.‬‬
‫כאשר רוצים לענות על השאלה – בדיוק ‪ ,‬נוסיף ונפחית ‪ 0.5‬מהמספר המבוקש ונחשב את ההסתברות בין‬
‫שני ערכים אלו‪:‬‬
‫כאשר רוצים לחשב את ההסתברות שבדיוק ‪ 21‬גברים קרחים ‪ ,‬נחשב את ההסתברות לכל היותר ‪ , 21.5‬את‬
‫ההסתברות שלכל היותר ‪ 20.5‬נחסיר בין התוצאות ונקבל בדיוק ‪.21‬‬
‫‪1.22‬‬
‫‪ 0.32‬‬
‫‪3.873‬‬
‫‪‬‬
‫‪21.5  78  0.26‬‬
‫‪78  0.26  0.74‬‬
‫‪Z‬‬
‫‪p ( X i 21.5) ‬‬
‫‪ p ( Z 0.32)  0.6255‬‬
‫‪0.22‬‬
‫‪ 0.06‬‬
‫‪3.873‬‬
‫‪‬‬
‫‪20.5  78  0.26‬‬
‫‪78  0.26  0.74‬‬
‫‪Z‬‬
‫‪p ( X i 20.5) ‬‬
‫‪ p ( Z 0.06)  0.5239‬‬
‫‪0.6255  0.5239  0.1016‬‬
‫‪162‬‬
‫‪.1‬‬
‫מבין אוכלוסיית הבוחרים במדינה מסוימת ‪ 32%‬מצביעים למפלגת ‪ , XX‬בוחרים מדגם בין ‪ 140‬איש‪.‬‬
‫א‪.‬‬
‫מה ההסתברות שלכל היותר ‪ 50‬מהם מצביעי ‪.XX‬‬
‫ב‪.‬‬
‫לכל היותר ‪ 25‬מהם מצביעי ‪.XX‬‬
‫ג‪.‬‬
‫מהו מספר מצביעי ‪ XX‬המינימאלי שנצפה למצוא‪.‬‬
‫ד‪.‬‬
‫מה ההסתברות ש‪ 30-‬מהם מצביעי ‪.XX‬‬
‫‪.2‬‬
‫‪ 10%‬מהמחוסנים כנגד שפעת חולים במחלה ‪ ,‬בוחרים מדגם של ‪ 100‬מחוסנים‪.‬‬
‫א‪.‬‬
‫מה ההסתברות ש‪ 20-‬מהם יחלו בשפעת‪.‬‬
‫ב‪.‬‬
‫מה ההסתברות שבין ‪ 30‬ל‪ 40-‬מהם יחלו‪.‬‬
‫‪.3‬‬
‫תרופה מסוימת גורמת לריפוי ‪ 80%‬מהחולים הלוקחים אותה‪.‬‬
‫א‪.‬‬
‫מה ההסתברות שבמדגם של ‪ 100‬איש תרפא התרופה לפחות ‪ 75%‬מהמשתמשים בתרופה‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪.4‬‬
‫חברה מייצרת מוצר מסוים וטוענת כי ‪ 60%‬מהאוכלוסייה צורכת את המוצר‪.‬‬
‫מה ההסתברות שבמדגם של ‪ 500‬איש נקבל שפחות מ ‪ 45%‬משתמשים במוצר ?‬
‫מהו מספר האנשים המינימאלי אשר צורך את המוצר במדגם זה ?‬
‫‪163‬‬
‫‪.1‬‬
‫‪ n  30‬וגם ‪n  p  10‬‬
‫תנאים לקירוב הנורמאלי לבינום‬
‫‪ (n  140)  30‬וגם ‪140  0.32  10‬‬
‫‪44.8  10‬‬
‫א‪.‬‬
‫‪n  140‬‬
‫‪1  p  0.68‬‬
‫‪5.2‬‬
‫‪ 0.943‬‬
‫‪5.51‬‬
‫‪‬‬
‫‪p  0.32‬‬
‫‪50  140  0.32‬‬
‫‪140  0.32  0.68‬‬
‫‪0.1736‬‬
‫‪Z‬‬
‫‪0.8264‬‬
‫‪50‬‬
‫‪p ( X i 50) ‬‬
‫‪ p ( Z 0.94)  0.8264‬‬
‫‪np=44.8‬‬
‫ההסתברות שלכל היותר ‪ 50‬מצביעים מבין ‪ 140‬מצביעי ‪ XX‬היא ‪. 0.8264‬‬
‫ב‪.‬‬
‫‪p( X i 25) ‬‬
‫‪ ‬‬
‫‪ 19.8‬‬
‫‪ 3.59‬‬
‫‪5.51‬‬
‫‪‬‬
‫‪25  140  0.32‬‬
‫‪140  0.32  0.68‬‬
‫‪Z‬‬
‫טבלת ההתפלגות הנורמאלית מתארת תחום בין ‪(  3.49  3.49‬התחום הנוצר בין ‪) X  3‬‬
‫הערך ‪ -3.59‬חורג מגבולות הטבלה לכן תיאורטית בלתי אפשרי בתנאי הפרופורציות הנ"ל שמתוך מדגם‬
‫של ‪ 140‬איש יהיו מקסימום ‪ 25‬מצביעי ‪.XX‬‬
‫ג‪.‬‬
‫מספר האנשים המינימאלי יהיה כאשר ‪: Z=-3.49‬‬
‫‪X  44.8‬‬
‫‪5.51‬‬
‫‪‬‬
‫‪X  140  0.32‬‬
‫‪140  0.32  0.68‬‬
‫‪X  26‬‬
‫‪ 3.49 ‬‬
‫‪ 19.23  X  44.8‬‬
‫מספר מצביעי ‪ XX‬המינימאלי שנצפה למצוא במדגם של ‪ 140‬איש הוא‪ 26 :‬מצביעים‪.‬‬
‫ד‪.‬‬
‫כדי לחשב את ההסתברות שיהיו בדיוק ‪ 30‬מצביעים ‪ ,‬נחשב את ההסתברות שלכל היותר ‪ 30.5‬איש ‪,‬‬
‫את ההסתברות שלכל ‪ 29.5‬איש ונחסיר בין ההסתברויות‪.‬‬
‫‪ 14.3‬‬
‫‪ 2.6‬‬
‫‪5.51‬‬
‫‪‬‬
‫‪30.5  140  0.32‬‬
‫‪140  0.32  0.68‬‬
‫‪Z‬‬
‫‪p ( X i 30.5) ‬‬
‫‪ p ( Z 2.6)  0.0047‬‬
‫‪ 15.3‬‬
‫‪ 2.78‬‬
‫‪5.51‬‬
‫‪‬‬
‫‪29.5  140  0.32‬‬
‫‪140  0.32  0.68‬‬
‫‪Z‬‬
‫‪p ( X i 29.5) ‬‬
‫‪ p ( Z 2.78)  0.0027‬‬
‫‪0.0047  0.0027  0.002‬‬
‫‪164‬‬
‫‪.2‬‬
‫‪ n  30‬וגם ‪n  p  10‬‬
‫‪ (n  100)  30‬וגם‬
‫‪100  0.1  10‬‬
‫‪10  10‬‬
‫א‪.‬‬
‫‪20.5  100  0.1 10.5‬‬
‫‪‬‬
‫‪ 3.5‬‬
‫‪3‬‬
‫‪100  0.1  0.9‬‬
‫‪9.5‬‬
‫‪ 3.17‬‬
‫‪3‬‬
‫‪Z‬‬
‫‪p ( X i 20.5) ‬‬
‫‪ p ( Z 3.5)  0.9998‬‬
‫‪‬‬
‫‪19.5  100  0.1‬‬
‫‪100  0.1  0.9‬‬
‫‪Z‬‬
‫‪p ( X i 19.5) ‬‬
‫‪ p ( Z 3.17)  0.9992‬‬
‫‪0.9998  0.9992  0.0006‬‬
‫ב‪.‬‬
‫‪5‬‬
‫‪ 1.67‬‬
‫‪3‬‬
‫‪15  100  0.1‬‬
‫‪11  100  0.1‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪  0.33‬‬
‫‪100  0.1  0.9 3‬‬
‫‪p ( X i 15) ‬‬
‫‪ p ( Z 1.67)  0.9525‬‬
‫‪p ( X i 11) ‬‬
‫‪ p ( Z 0.33)  0.6293‬‬
‫‪‬‬
‫‪100  0.1  0.9‬‬
‫‪0.9525  0.6293  0.3232‬‬
‫‪.3‬‬
‫וגם‬
‫‪n  30‬‬
‫‪100  30‬‬
‫‪n  p  10‬‬
‫‪100  0.8  10‬‬
‫‪80  10‬‬
‫א‪.‬‬
‫‪X i (75%)  75‬‬
‫‪n  100‬‬
‫‪1  p  0.2‬‬
‫‪5‬‬
‫‪ 1.25‬‬
‫‪4‬‬
‫‪‬‬
‫‪p  0.8‬‬
‫‪75  100  0.8‬‬
‫‪100  0.8  0.2‬‬
‫‪Z‬‬
‫‪p ( X i 75) ‬‬
‫‪1  p ( Z 1.25)  1  0.1056  0.8944‬‬
‫ההסתברות שהתרופה תגרום לריפוי של לפחות ‪ 75%‬מהחולים היא ‪. 0.8944‬‬
‫ב‪.‬‬
‫‪ n  30‬וגם ‪n  p  10‬‬
‫‪n  30‬‬
‫‪200  30‬‬
‫וגם‬
‫‪n  p  10‬‬
‫‪200  0.8  10‬‬
‫‪160  10‬‬
‫‪165‬‬
‫‪n  200‬‬
‫‪X i (75%)  150‬‬
‫‪1  p  0.2‬‬
‫‪ 10‬‬
‫‪ 1.77‬‬
‫‪5.656‬‬
‫‪‬‬
‫‪p  0.8‬‬
‫‪150  200  0.8‬‬
‫‪200  0.8  0.2‬‬
‫‪Z‬‬
‫‪p ( X i 150) ‬‬
‫‪ 1  p ( Z  1.77)  1  0.0384  0.9616‬‬
‫ההסתברות שהתרופה תגרום לריפוי של לפחות ‪ 75%‬מתוך ‪ 200‬חולים היא ‪. 0.9616‬‬
‫ג‪.‬‬
‫‪n  30‬‬
‫‪400  30‬‬
‫‪n  p  10‬‬
‫וגם‬
‫‪400  0.8  10‬‬
‫‪320  10‬‬
‫‪n  400‬‬
‫‪X i (75%)  300‬‬
‫‪1  p  0.2‬‬
‫‪ 20‬‬
‫‪ 2.5‬‬
‫‪8‬‬
‫‪‬‬
‫‪p  0.8‬‬
‫‪300  400  0.8‬‬
‫‪400  0.8  0.2‬‬
‫‪Z‬‬
‫‪p ( X i 300) ‬‬
‫‪1  p ( Z  2.5)  1  0.0062  0.9938‬‬
‫ההסתברות שהתרופה תגרום לריפוי של לפחות ‪ 75%‬חולים מתוך ‪ 400‬היא ‪. 0.9938‬‬
‫‪.4‬‬
‫ע"פ טענת החברה ‪p=0.6‬‬
‫‪30‬וגם‪n ‬‬
‫‪n  p  10‬‬
‫‪500  30‬‬
‫‪500  0.6  10‬‬
‫‪300  10‬‬
‫‪X i (45%)  225‬‬
‫‪n  500‬‬
‫‪1  p  0.4‬‬
‫‪ 75‬‬
‫‪ 6.84‬‬
‫‪10.95‬‬
‫‪‬‬
‫‪p  0.6‬‬
‫‪225  500  0.6‬‬
‫‪500  0.6  0.4‬‬
‫‪Z‬‬
‫‪p ( Z 6.84)  ‬‬
‫לא יתכן שבמדגם של ‪ 500‬איש פחות מ‪ 45%-‬יצרכו את המוצר‪.‬‬
‫נבדוק מהו מספר האנשים המינימאלי שיצרוך את המוצר מתוך ‪ 500‬איש ‪ -‬נציב ‪: Z=-3.49‬‬
‫‪X  300‬‬
‫‪10.95‬‬
‫‪‬‬
‫‪X  262‬‬
‫‪X  500  0.6‬‬
‫‪500  0.6  0.4‬‬
‫‪ 3.49 ‬‬
‫‪ 38.21  X  300‬‬
‫ע"פ נתוני החברה מספר האנשים המינימאלי אשר יצרוך את המוצר‬
‫במדגם של ‪ 500‬איש הוא ‪ , 262‬מינימום ‪ 52%‬צורכים את המוצר‪.‬‬
‫‪166‬‬
‫הסקה סטטיסטית על שונות האוכלוסייה ‪ 2‬‬
‫שונות היא מדד פיזור – פיזור האוכלוסייה ביחס לתכונה הנבדקת ‪ ,‬כלומר ככל שהשונות קטנה יותר כך פיזור‬
‫התכונה הנבדקת קטן יותר – כך הפיזור של התכונה אותה היא מייצגת באוכלוסיה קטן יותר וההיפך‪.‬‬
‫כלומר שונות קטנה משמעותה אוכלוסיה הומוגנית יותר ביחס לתכונה הנבדקת ואילו ככל שהשונות גדלה כך‬
‫האוכלוסייה (ביחס לתכונה הנבדקת הטרוגנית יותר‪.‬‬
‫(מאחר והשונות היא ריבוע סטית התקן כל ההנחות שהנחנו לעיל מתייחסות גם לסטיית התקן)‪.‬‬
‫ישנם מצבים בהם אנו מעוניינים להסיק ממדגם לגבי השונות באוכלוסיה כלומר אנו מעוניינים להסיק ולבדוק לגבי‬
‫הפיזור באוכלוסיה – הפיזור הקיים בהכנסות (השונות בשכר) השונות ‪ /‬הפיזור של גיל אוכלוסיית מעשנים‬
‫במדינה מסוימת ביחס למדינה אחרת וכו'‪.‬‬
‫כפי שבנינו רווח בר סמך לממוצע האוכלוסייה ובדקנו השערות על ממוצעים והפרשי ממוצעים ‪ ,‬על בסיס אותו‬
‫רעיון אנו בודקים השערות על שונות האוכלוסייה ‪  2‬מתוך מדגם‪.‬‬
‫‪‬‬
‫באמצעות ‪ S 2‬אנו אומדים מתוך מדגם את השונות באוכלוסיה ‪.  2‬‬
‫בדומה למשפט הגבול המרכזי (המתייחס לממוצעי המדגמים) ניתן לנסח משפט לגבי השונות‪:‬‬
‫אם מתוך אוכלוסיה נורמאלית בעלת ממוצע ‪ ‬ושונות ‪  2‬נוציא את כל המדגמים האפשריים בגודל ‪ n‬מסוים‬
‫‪2‬‬
‫‪‬‬
‫)‪S (n  1‬‬
‫ולכל מדגם נחשב את הסטטיסטי ‪ S 2‬אז הביטוי‬
‫‪2‬‬
‫‪‬‬
‫‪ ( xi  x ) 2‬‬
‫‪2‬‬
‫מתפלג לפי התפלגות ‪(  2‬התפלגות חי בריבוע) ‪ ,‬עם ‪ n-1‬דרגות חופש‪.‬‬
‫‪df=6‬‬
‫‪df=4‬‬
‫‪df=10‬‬
‫התפלגות ‪ ‬היא התפלגות אסימטרית בעלת זנב ימני ‪ ,‬אולם ככל שמספר דרגות החופש ‪ df‬גדל‬
‫‪2‬‬
‫‪‬‬
‫ההתפלגות מתקרבת להתפלגות נורמאלית‪.‬‬
‫‪‬‬
‫השטח מתחת לעקומה = ‪1‬‬
‫‪‬‬
‫נסמן את‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪  0.05‬‬
‫‪ 14.067‬‬
‫‪‬‬
‫‪n8‬‬
‫‪2‬‬
‫‪7 , 0.95‬‬
‫‪‬‬
‫שימו לב כי ‪ 4‬העמודות הראשונות בטבלת ‪‬‬
‫‪2‬‬
‫מייצגות את ‪ ‬וארבע העמודות אחריהן את ‪1  ‬‬
‫‪167‬‬
‫רווח בר סמך לשונות ‪ 2‬‬
‫‪ 2‬‬
‫‪ 2‬‬
‫‪( n  1) S‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,‬‬
‫‪( n  1) S‬‬
‫‪ 2 ‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪‬‬
‫מבחן דו כיווני‬
‫גבול תחתון‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n 1,‬‬
‫‪C1  ‬‬
‫גבול עליון‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n1,1‬‬
‫‪C2  ‬‬
‫מבחן חד כיווני‬
‫השערה חד כיוונית כלפי מעלה‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪‬‬
‫‪C‬‬
‫השערה חד כיוונית כלפי מטה‬
‫‪2‬‬
‫‪n 1,‬‬
‫‪‬‬
‫‪C‬‬
‫הערך הנבדק ביחס לגבול הקריטי הוא‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪(n  1) S‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪168‬‬
‫בישוב קהילתי מסוים הוחלט כי שכר התושבים יהיה בנוי על שונות קבועה של ‪ ,  2  122500‬הועלתה טענה‬
‫כי הפערים בין משכורות עו"ד גבוהים יותר ‪ ,‬נלקח מדגם מקרי של ‪ 30‬עו"ד ונמצא כי השונות המתוקנת שלהם‬
‫‪2‬‬
‫‪. S  202500‬‬
‫א‪.‬‬
‫בנו רווח בר סמך לשונות משכורת עו"ד ברמת סמך של ‪.0.98‬‬
‫ב‪.‬‬
‫א‪.‬‬
‫נחשב רווח בר סמך לשונות מנת המשכל של צוערי קורס טיס‪.‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n 1,‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪  0.02‬‬
‫‪ 14.26‬‬
‫‪2‬‬
‫‪7,0.01‬‬
‫‪‬‬
‫‪( n  1) S‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n 1,‬‬
‫‪‬‬
‫‪n 1,1‬‬
‫‪n  30‬‬
‫‪ 49.59‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪29,0.99‬‬
‫‪‬‬
‫‪2‬‬
‫‪( n  1) S‬‬
‫‪2 ‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪‬‬
‫‪29  202500‬‬
‫‪29  202500‬‬
‫‪2 ‬‬
‫‪49.59‬‬
‫‪14.26‬‬
‫‪118421   2  411816‬‬
‫חשוב לשים לב כי הערכים גבוהים מאחר וזהו רווח בר סמך לשונות ובמונחי שכר ‪ ,‬אם נסתכל על סטיות תקן‬
‫הרווח הוא ‪ 344.12    641.72‬כלומר זהו הטווח בו לאומדן הפיזור סביב ממוצע השכר‪.‬‬
‫ב‪.‬‬
‫נבדוק את הטענה כי שונות שכר קבוצת עו"ד בישוב גבוהה יותר משונות השכר בישוב‬
‫אנו עוסקים במבחן חד כיווני – כלפי מעלה ‪.‬‬
‫ב‪1.‬‬
‫‪ 2  122500‬‬
‫‪H0 :‬‬
‫שונות שכר עו"ד בישוב אינה שונה משונות השכר בישוב‬
‫‪ 2  122500‬‬
‫‪H1 :‬‬
‫שונות שכר עו"ד בישוב גדולה משונות השכר בישוב‬
‫ב‪.2.‬‬
‫‪  0.05‬‬
‫‪169‬‬
‫ב‪.3.‬‬
‫‪ 2  122500‬‬
‫‪2‬‬
‫‪S  202500‬‬
‫‪n  30‬‬
‫‪ 42.56‬‬
‫‪29  202500‬‬
‫‪ 47.93‬‬
‫‪122500‬‬
‫‪2‬‬
‫‪29,0.95‬‬
‫‪C‬‬
‫‪2‬‬
‫‪‬‬
‫‪(n  1)  S‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪ ---‬הערך הנבדק מול הגבול הקריטי‬
‫תחום קבלת ‪H 0‬‬
‫‪47.93‬‬
‫ב‪.4.‬‬
‫מאחר ו‪-‬‬
‫‪2‬‬
‫‪‬‬
‫‪42.56‬‬
‫נמצא בתחום דחית השערת האפס – נדחה את השערת האפס ונקבל את השערת המחקר‬
‫שונות שכרם של עו"ד הדין גבוהה משונות השכר בישוב‪.‬‬
‫ב‪.5.‬‬
‫מאחר ודחינו את השערת האפס הטעות האפשרית היא טעות מסוג ראשון‪.‬‬
‫‪170‬‬
‫‪.1‬‬
‫שונות מנת המשכל לאוכלוסיית החיילים בצה"ל היא ‪ ,  2  38‬נבדקת הטענה כי בקורס טייס שונות מנת‬
‫המשכל אחידה יותר‪ .‬נלקח מדגם של ‪ 8‬צוערים ‪)IQ(. 122 , 114 , 111 , 115 , 120 , 122 , 115 , 113 :‬‬
‫א‪.‬‬
‫בנו רווח בר סמך לשונות מנת המשכל של צוערי קורס טיס‪( .‬ברמת סמך של ‪.)0.98‬‬
‫ב‪.‬‬
‫בדקו את הטענה ברמת מובהקות של ‪.   0.05‬‬
‫‪.2‬‬
‫ההכנסה הממוצעת לגבר במדינת ישראל היא ‪ , ₪ 4560‬סטיית תקן ‪ .₪ 620‬נלקח מדגם מקרי של ‪10‬‬
‫נשים להלן הכנסותיהן בש"ח‪5200 , 4700 , 5650 , 4950 , 7120 , 6250 , 4580 , 5470 , 4380 , 6530 :‬‬
‫א‪.‬‬
‫בנו רווח בר סמך לשונות שכר הנשים במדינה (ברמת סמך של ‪.)0.95‬‬
‫ב‪.‬‬
‫בדקו את הטענה כי הכנסתה הממוצעת של אישה גבוהה מההכנסה הממוצעת של גבר ‪.   0.05‬‬
‫ג‪.‬‬
‫בדקו את הטענה כי הכנסת הנשים הטרוגנית יותר מהכנסת הגברים ‪  0.05‬‬
‫‪.3‬‬
‫מחירה הממוצע של מכונית מסוימת מודל ‪ 2005‬הוא ‪ ₪ 95000‬עם סטית תקן של ‪.₪ 2250‬‬
‫נבדקת הטענה כי תושבי ירושלים שומרים טוב יותר על מכוניותיהם ולכן מחיר המכונית אחיד יותר‪.‬‬
‫נלקח מדגם של ‪ 8‬מכוניות "ירושלמיות" להלן מחירי המכירה שלהן באלפי ‪: ₪‬‬
‫‪ 96.5 , 97 , 94.5 , 92.5 , 95.3 , 94.2 , 95. 5 , 96‬בדקו את הטענה ברמת מובהקות של ‪  0.025‬‬
‫‪.4‬‬
‫סטית התקן (היומית) של מניה מסוימת היא ‪ 14‬נק' ‪ ,‬סוחר קנה ‪ 51‬מניות והחליט לרכוש מניות נוספות‬
‫כאשר מניה "מתעוררת" – שוברת את מחסום השונות היומית הממוצעת‪.‬‬
‫ביום מסוים סטית התקן של מניותיו הייתה ‪ 20‬נק' – בדקו האם עליו להתחיל ולרכוש מניות ‪  0.05‬‬
‫‪.5‬‬
‫מנתוני משרד הבריאות עולה כי תוחלת משך חיי גברים הוא ‪ 74‬שנים עם סטיית תקן ‪ 4‬שנים‪.‬‬
‫נלקח מדגם מקרי של ‪ 10‬נשים להלן משך חייהן‪. 93 , 76 , 85 , 95 , 72 , 69 , 95 , 54 , 48 , 65 :‬‬
‫א‪.‬‬
‫בנו רווח בר סמך לשונות משך חיי הנשים במדינה (ברמת סמך של ‪.)0.95‬‬
‫ב‪.‬‬
‫בדקו את הטענה כי תוחלת חיי אישה גבוהה מתוחלת חיי גבר ‪.   0.05‬‬
‫ג‪.‬‬
‫בדקו את הטענה כי תוחלת חיי הנשים הטרוגנית יותר מתוחלת חיי הגברים ‪  0.05‬‬
‫‪.6‬‬
‫מפעל המייצר ברגים משתמש במכונות המייצרות ברגים באורך של ‪ 5‬ס"מ ושונות של ‪ 0.25‬ס"מ‬
‫ידוע כי רק ברגים באורך של ‪ 4.5-5.5‬ס"מ נארזים והשאר נזרקים‪.‬‬
‫א‪.‬‬
‫בהנחה שהתפלגות הברגים נורמאלית האם נכון יהיה לומר כי המפעל מאבד כ‪ 30%-‬מתפוקתו ?‬
‫ב‪.‬‬
‫במטרה לשפר את המכירות המפעל בוחן מכונה חדשה ‪ .‬נלקח מדגם של ‪ 10‬ברגים שיצרה המכונה‬
‫להלן אורכם בס"מ ‪5.3 , 4.85 , 4.6 , 5.4 , 5.2 , 4.9 , 5.1 , 4.8 , 5.1 , 5.5 :‬‬
‫מה המלצתך ברמת מובהקות של ‪0.05‬‬
‫‪171‬‬
‫‪.1‬‬
‫נאמוד את סטית התקן (סטית תקן מתוקנת) מתוך מדגם שמונת הצוערים‪:‬‬
‫‪ 2  38‬‬
‫‪2‬‬
‫‪S  18‬‬
‫‪n8‬‬
‫הפער בין השונויות נראה גבוה ‪ ,‬אולם במונחי סטית תקן אנו מעוניינים לבדוק אם קיים פער מובהק בין‬
‫‪‬‬
‫‪  6.614‬‬
‫א‪.‬‬
‫‪ S  4.24‬פער שבהחלט יכול להיות זניח‪.‬‬
‫נחשב רווח בר סמך לשונות מנת המשכל של צוערי קורס טיס‪.‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n 1,‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪  0.02‬‬
‫‪ 1.24‬‬
‫‪2‬‬
‫‪7,0.01‬‬
‫‪‬‬
‫‪ 18.47‬‬
‫‪‬‬
‫‪n8‬‬
‫‪2‬‬
‫‪7,0.99‬‬
‫‪‬‬
‫‪2‬‬
‫‪( n  1) S‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n 1,‬‬
‫‪‬‬
‫‪2‬‬
‫‪( n  1) S‬‬
‫‪2 ‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪‬‬
‫‪7  18‬‬
‫‪7  18‬‬
‫‪2 ‬‬
‫‪18.47‬‬
‫‪1.24‬‬
‫‪6.82   2  101.61‬‬
‫ב‪.‬‬
‫נבדוק את הטענה כי שונות מנת המשכל אחידה יותר בקורס טיס (כלומר קטנה יותר) ביחס לכלל החיילים‬
‫אנו עוסקים במבחן חד כיווני – כלפי מטה ‪.‬‬
‫ב‪1.‬‬
‫‪ 2  38‬‬
‫‪H0 :‬‬
‫שונות מנת המשכל בקורס טיס אינה קטנה מהשונות בכלל צה"ל‬
‫‪ 2  38‬‬
‫‪H1 :‬‬
‫שונות מנת המשכל בקורס טיס נמוכה משונות מנת המשכל בכלל צה"ל‬
‫ב‪.2.‬‬
‫‪  0.05‬‬
‫‪172‬‬
‫ב‪.3.‬‬
‫‪ 2  38‬‬
‫‪2‬‬
‫‪S  18‬‬
‫‪n8‬‬
‫‪ 2.17‬‬
‫‪7  18‬‬
‫‪ 3.31‬‬
‫‪38‬‬
‫‪2‬‬
‫‪7,0.05‬‬
‫‪C‬‬
‫‪2‬‬
‫‪(n  1)  S‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫תחומי דחית ‪H 0‬‬
‫תחומי קבלת ‪H 0‬‬
‫‪3.31‬‬
‫ב‪.4.‬‬
‫‪2‬‬
‫‪‬‬
‫‪2.17‬‬
‫נמצא בתחום קבלת השערת האפס – נקבל את השערת האפס ונדחה את השערת המחקר‬
‫לצוערי קורס טיס יש שונות במנת המשכל השווה לשונות מנת המשכל של כלל חיילי צה"ל‪.‬‬
‫ב‪.5.‬‬
‫‪.2‬‬
‫מאחר וקיבלנו את השערת האפס הטעות האפשרית היא טעות מסוג שני‪.‬‬
‫נאמוד את שונות השכר באוכלוסיית הנשים מתוך מדגם הנשים‪:‬‬
‫א‪.‬‬
‫‪2‬‬
‫‪S  822401‬‬
‫‪‬‬
‫‪‬‬
‫‪S  906.8‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n 1,‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪  0.05‬‬
‫‪ 2.7‬‬
‫‪2‬‬
‫‪9,0.025‬‬
‫‪‬‬
‫‪(n  1) S‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n 1,‬‬
‫‪‬‬
‫‪n 1,1‬‬
‫‪n  10‬‬
‫‪ 19.02‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪9,0.975‬‬
‫‪‬‬
‫‪2‬‬
‫‪(n  1) S‬‬
‫‪2 ‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪‬‬
‫‪9  822401‬‬
‫‪9  822401‬‬
‫‪ 2 ‬‬
‫‪19.02‬‬
‫‪2.7‬‬
‫‪389148.79   2  2741336.67‬‬
‫‪623.81    1655.69‬‬
‫‪173‬‬
‫ב‪.‬‬
‫בדיקת השערות על ממוצע כאשר סטית התקן לא ידועה ‪,‬‬
‫בדיקת השערות חד כיוונית – כלפי מעלה ‪ -‬הכנסת הנשים גבוהה יותר‪.‬‬
‫ב‪.1.‬‬
‫‪  4560‬‬
‫‪H0 :‬‬
‫הכנסתם הממוצעת של נשים אינה שונה מהכנסתם הממוצעת של הגברים‬
‫‪  4560‬‬
‫‪H1 :‬‬
‫הכנסתם הממוצעת של נשים גבוהה מהכנסתם הממוצעת של הגברים‪.‬‬
‫ב‪.2.‬‬
‫‪  0.05‬‬
‫ב‪.3.‬‬
‫‪t( n 1),(1 )  t9,0.95  1.833‬‬
‫‪‬‬
‫‪S  906.8‬‬
‫‪X  5483‬‬
‫‪‬‬
‫‪S‬‬
‫‪C  0  t( n 1),(1 ) ‬‬
‫‪n‬‬
‫‪906.8‬‬
‫‪ 5085.6‬‬
‫‪10‬‬
‫‪C  4560  1.833 ‬‬
‫‪H0‬‬
‫‪5085.6 5483‬‬
‫ב‪.4.‬‬
‫‪4560‬‬
‫החלטה‬
‫נדחה את ‪ H 0‬ונקבל את השערת המחקר – הכנסתם הממוצעת של נשים גבוהה מהכנסתם הממוצעת של גברים‪.‬‬
‫ב‪.5.‬‬
‫מאחר ודחינו את ‪ H 0‬הטעות האפשרית ‪ -‬דחינו את השערת האפס בזמן שהשערת האפס נכונה ‪.‬‬
‫טעות מסוג ראשון ‪. ‬‬
‫‪174‬‬
‫ההסתברות ה"אמיתית" לטעות מסוג זה במחקר זה היא‪:‬‬
‫‪5483  4560‬‬
‫‪ 3.21‬‬
‫‪ 906.8 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 10 ‬‬
‫' ‪0.995  1  ‬‬
‫ג‪.‬‬
‫‪  0‬‬
‫‪‬‬
‫‪t9,(1 ') ‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫ברמה של ‪ 9‬דרגות חופש הערך אינו נמצא בטבלה‬
‫(‬
‫‪ ,  '  0.005‬כלומר הסיכוי לשגיאה במסקנה קטן מ‪.0.5%-‬‬
‫בדיקת השערות של שונות ‪ ,‬השערה חד כיוונית כלפי מעלה – אם הכנסת הנשים הטרוגנית יותר אזי‬
‫השונות שלהן גבוהה יותר‪.‬‬
‫‪ 2  384400‬‬
‫ג‪1.‬‬
‫‪2‬‬
‫‪S  822401‬‬
‫‪n  10‬‬
‫‪ 2  384400‬‬
‫‪H0 :‬‬
‫שונות שכר הנשים אינה גבוהה משונות שכר הגברים‬
‫‪ 2  384400‬‬
‫‪H1 :‬‬
‫שונות שכר הנשים גבוהה משונות שכר הגברים‪.‬‬
‫ג‪.2.‬‬
‫‪  0.05‬‬
‫ג‪..3.‬‬
‫‪ 16.92‬‬
‫‪9  822401‬‬
‫‪ 19.25‬‬
‫‪384400‬‬
‫‪2‬‬
‫‪9 , 0.95‬‬
‫‪C‬‬
‫‪2‬‬
‫‪‬‬
‫‪(n  1)  S‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪19.25‬‬
‫ב‪.4.‬‬
‫‪2‬‬
‫‪‬‬
‫‪16.92‬‬
‫שונות ההכנסה של נשים גבוהה משונות ההכנסה של גברים‪.‬‬
‫ב‪.5.‬‬
‫מאחר ודחינו את השערת האפס ‪ ,‬השגיאה האפשרית היא שגיאה מסוג ראשון‪.‬‬
‫‪175‬‬
‫‪.3‬‬
‫תושבי ירושלים שומרים טוב יותר על מכוניותיהם ולכן מחירם אחיד יותר ‪ ,‬כלומר שונות מחירי‬
‫המכוניות בירושלים נמוכה יותר – מבחן חד כיווני כלפי מטה ‪.‬‬
‫א‪.‬‬
‫‪ 2  2250 2‬‬
‫‪H0 :‬‬
‫שונות מחירי המכונית בירושלים אינה שונה מהשונות בכלל הארץ‬
‫‪ 2  2250 2‬‬
‫‪H1 :‬‬
‫שונות מחירי המכונית בירושלים נמוכה מהשונות במחירה בכלל הארץ‪.‬‬
‫ב‪..‬‬
‫‪  0.05‬‬
‫ג‪.‬‬
‫‪ 2  22502‬‬
‫‪2‬‬
‫‪S  14362‬‬
‫‪n8‬‬
‫‪ 1.69‬‬
‫‪ 2.85‬‬
‫‪7 1436 2‬‬
‫‪2250 2‬‬
‫‪2‬‬
‫‪7,0.025‬‬
‫‪C‬‬
‫‪2‬‬
‫‪‬‬
‫‪(n  1)  S‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪2.85‬‬
‫ד‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪1.69‬‬
‫נמצא בתחום קבלת השערת האפס – נקבל את השערת האפס ונדחה את השערת המחקר‬
‫שונות מחירי המכונית בירושלים אינה שונה משונות מחירה בכלל הארץ‪.‬‬
‫ה‪.‬‬
‫מאחר וקיבלנו את השערת האפס הטעות האפשרית היא טעות מסוג שני‪.‬‬
‫‪176‬‬
‫‪.4‬‬
‫מבחן חד כיווני כלפי מעלה – מניה "מתעוררת" התנודתיות גדלה – השונות גדלה ‪.‬‬
‫א‪.‬‬
‫השערות‬
‫‪ 2  196‬‬
‫‪H0 :‬‬
‫שונות המניה אינה גבוהה מהשונות בד"כ‬
‫‪ 2  196‬‬
‫‪H1 :‬‬
‫שונות המניה גבוהה משונות בד"כ‬
‫ב‪.‬‬
‫‪  0.05‬‬
‫ג‪.‬‬
‫תחומי קבלה ודחייה ל‪H 0 -‬‬
‫‪2‬‬
‫‪S  400‬‬
‫‪n  51‬‬
‫‪ 67.5‬‬
‫‪C‬‬
‫‪50  400‬‬
‫‪ 102.04‬‬
‫‪196‬‬
‫‪‬‬
‫‪(n  1)  S‬‬
‫‪2‬‬
‫ד‪.‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪102.04‬‬
‫‪2‬‬
‫‪50,0.95‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪67.5‬‬
‫המניה "מתעוררת ושברה את מחסום השונות ‪ ,‬כלומר שונות המניה גבוהה מהשונות שלה בד"כ‪.‬‬
‫ה‪.‬‬
‫‪177‬‬
‫נאמוד את שונות משך חיי הנשים באוכלוסייה מתוך מדגם הנשים‪:‬‬
‫‪.5‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫בדיקת השערות על ממוצע כאשר סטית התקן לא ידועה ‪ ,‬בדיקת השערות חד כיוונית כלפי מעלה –‬
‫‪2‬‬
‫‪X  75.2‬‬
‫‪‬‬
‫‪S  16.79‬‬
‫‪S  281.9‬‬
‫‪2‬‬
‫‪( n  1) S‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,‬‬
‫‪‬‬
‫‪2‬‬
‫‪( n  1) S‬‬
‫‪2 ‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪‬‬
‫‪9  281.9‬‬
‫‪9  281.9‬‬
‫‪2 ‬‬
‫‪19.02‬‬
‫‪2.7‬‬
‫‪2‬‬
‫‪133.39    939.67‬‬
‫‪11.55    30.65‬‬
‫האם תוחלת חיי הנשים גבוהה מתוחלת חיי הגברים‪.‬‬
‫ב‪.1.‬‬
‫‪  74‬‬
‫‪H0 :‬‬
‫תוחלת חיי הנשים אינה גבוהה מתוחלת חיי הגברים‪.‬‬
‫‪  74‬‬
‫‪H1 :‬‬
‫תוחלת חיי הנשים גבוהה מתוחלת חיי הגברים‪.‬‬
‫ב‪.2.‬‬
‫‪  0.05‬‬
‫ב‪.3.‬‬
‫‪‬‬
‫‪S  16.79‬‬
‫‪t( n 1), (1 )  t9, 0.95  1.833‬‬
‫‪X  75.2‬‬
‫‪‬‬
‫‪16.79‬‬
‫‪ 83.73‬‬
‫‪10‬‬
‫‪S‬‬
‫‪C  0  t( n 1), (1 ) ‬‬
‫‪n‬‬
‫‪C  74  1.833 ‬‬
‫‪H0‬‬
‫‪75.2 83.73‬‬
‫‪74‬‬
‫‪178‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫' ‪0.4  ‬‬
‫‪df  9 ‬‬
‫‪ 1   '  0.6‬‬
‫‪75.2  74‬‬
‫‪ 0.226‬‬
‫‪16.79‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪t9,1 ' ‬‬
‫)‪  ' ( 0.4)   (0.05‬מקבלים את השערת האפס‪.‬‬
‫השוואת ערכי ‪t‬‬
‫‪t9,0.95  1.833‬‬
‫‪72.5  74‬‬
‫‪ 0.226‬‬
‫‪16.79‬‬
‫(‬
‫)‬
‫‪10‬‬
‫‪  0‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪ n ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪t STAT  t( n1)(1 ') ‬‬
‫)‪t STAT (0.226)  t (1.833‬‬
‫ב‪.4.‬‬
‫החלטה‬
‫נקבל את השערת האפס ונדחה את השערת המחקר – תוחלת חיי הנשים אינה גבוהה מתוחלת חיי הגברים‪.‬‬
‫ב‪.5.‬‬
‫מאחר וקיבלנו את ‪ H 0‬הטעות האפשרית היא טעות מסוג שני ‪ - ‬קיבלנו את השערת האפס בזמן שהשערת‬
‫המחקר נכונה‪.‬‬
‫‪179‬‬
‫ההסתברות לטעות מסוג זה במחקר זה היא‪:‬‬
‫‪83.73  75.2‬‬
‫‪ 1.606‬‬
‫‪ 16.79 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 10 ‬‬
‫‪‬‬
‫‪‬‬
‫‪S‬‬
‫)‬
‫‪n‬‬
‫‪0.9  1    0.95‬‬
‫ג‪.‬‬
‫‪C‬‬
‫‪t9,(1 ) ‬‬
‫(‬
‫‪ , 0.05    0.1‬הסיכוי לשגיאה במסקנה הוא בין ‪ 5%‬ל‪. 10%-‬‬
‫בדיקת השערות של שונות ‪ ,‬השערה חד כיוונית כלפי מעלה – האם משך חיי הנשים בעל הטרוגניות‬
‫גבוהה יותר ממשך חיי הגברים‪.‬‬
‫ג‪1.‬‬
‫ברמה של ‪ 9‬דרגות חופש הערך אינו נמצא בטבלה‬
‫‪ 2  144‬‬
‫‪n  10‬‬
‫‪S  281.9‬‬
‫‪ 2  144‬‬
‫‪H0 :‬‬
‫שונות חיי הנשים אינה גבוהה משונות חיי הגברים‬
‫‪ 2  144‬‬
‫‪H1 :‬‬
‫שונות חיי הנשים גבוהה משונות חיי הגברים‪.‬‬
‫ג‪.2.‬‬
‫ג‪..3.‬‬
‫‪ 16.92‬‬
‫‪9  281.9‬‬
‫‪ 17.61‬‬
‫‪144‬‬
‫‪2‬‬
‫‪9 , 0.95‬‬
‫‪C‬‬
‫‪2‬‬
‫‪(n  1)  S‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪17.61‬‬
‫ב‪.4.‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪16.92‬‬
‫שונות חיי הנשים גבוהה משונות חייהם של גברים‪.‬‬
‫ב‪.5.‬‬
‫‪180‬‬
‫‪.6‬‬
‫א‪.‬‬
‫על פי ממוצע וסטית תקן ניתן לקבל אומדן כלל של פיזור האוכלוסייה ידוע כי בתחומים‪:‬‬
‫‪ ‬‬
‫‪  2‬‬
‫‪  3‬‬
‫בנתוני השאלה‬
‫מהאוכלוסייה‬
‫נמצאים ‪ 68.26%‬מהאוכלוסיה‬
‫נמצאים ‪ 95.44%‬מהאוכלוסייה‬
‫נמצאים ‪ 99.74%‬מהאוכלוסייה‬
‫‪  0.5‬‬
‫‪4.5  5.5‬‬
‫‪ 5‬‬
‫כ‪ 70%-‬מהברגים נמצאים בתחום זה – התחום בו הם‬
‫נארזים המשמעות היא ‪ 30%-‬נזרקים – אובדן של ‪30%‬‬
‫מהתפוקה‬
‫ב‪.‬‬
‫שיפור המכירות – הקטנת מספר הברגים הנזרקים – הקטנת פיזור הברגים – הקטנת השונות‪.‬‬
‫מבחן חד כיווני כלפי מטה במטרה לבחון אם המכונה החדשה מייצרת ברגים בעלי שונות קטנה יותר‪.‬‬
‫ב‪1.‬‬
‫‪ 2  0.25‬‬
‫‪ H 0 :‬שונות המכונה החדשה אינה קטנה משונות המכונות הקיימות‬
‫‪ 2  0.25‬‬
‫‪ H1 :‬שונות המכונה החדשה קטנה משונות המכונות הקיימות‪.‬‬
‫ב‪.2.‬‬
‫‪  0.05‬‬
‫ב‪.3.‬‬
‫תחומי קבלה ודחייה ל‪H 0 -‬‬
‫‪ 3.33‬‬
‫‪ 2  0.25‬‬
‫‪n  10‬‬
‫‪2‬‬
‫‪S  0.0818‬‬
‫‪9  0.0818‬‬
‫‪‬‬
‫‪ 2.94‬‬
‫‪0.25‬‬
‫ב‪.4.‬‬
‫‪2‬‬
‫‪9 , 0.05‬‬
‫‪C‬‬
‫‪2‬‬
‫‪(n  1)  S‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪3.33‬‬
‫‪‬‬
‫‪2‬‬
‫‪2.94‬‬
‫המכונה החדשה מייצרת ברגים עם שונות קטנה באופן מובהק מהמכונה הקודמת‪.‬‬
‫ב‪.5.‬‬
‫מאחר ודחינו את השערת האפס הטעות האפשרית היא טעות מסוג ראשון‪.‬‬
‫‪181‬‬
‫ניתוח שונות ‪ANOVA – Analysis Of Variance -‬‬
‫ניתוח שונות חד כיווני ‪One way Analysis of Variance -‬‬
‫ניתוח שונות הוא מבחן באמצעותו משווים בין תוחלות של מספר אוכלוסיות ‪ K -‬אוכלוסיות בלתי‬
‫תלויות‪ K  3 .‬כלומר‪ :‬מינימום ‪ 3‬קבוצות‪.‬‬
‫ניתוח השונות נעשה באמצעות ניתוח והשוואת השונות בתוך כל קבוצה‪/‬מדגם לבין השונות בין הקבוצות‪.‬‬
‫שונות בתוך הקבוצה – ‪" - Variance Within Groups‬שונות בלתי מוסברת"‬
‫שונות זו נובעת מהשפעת משתנים שאין באפשרותנו לפקח עליהם וממשתנים שלא נלקחו בחשבון בעת תכנון‬
‫הניסוי‪/‬בניית המדגם‪.‬‬
‫•‬
‫כל אחת מן הקבוצות מורכבת מאינדוידואלים ‪ ,‬פרטים אלו ‪ ,‬שונים אלה מאלה‪( .‬שוני במשתנה התלוי –‬
‫המשתנה אותו בודקים ‪ /‬מנסים לנבא)‪.‬‬
‫שונות בין הקבוצות – ‪" - Variance Between Groups‬שונות מוסברת"‬
‫השונות בין תוחלות הקבוצות שונות זו מורכבת משני סוגי שונויות‪ :‬שונות גורמים מוסברים ושונות גורמים בלתי‬
‫מוסברים ‪ ,‬ולכן נקראת "השונות המוסברת"‪.‬‬
‫•‬
‫שוני בין קבוצות כאשר ההבדלים בין אנשים בתוך כל קבוצה קטנים מן ההבדלים שקיימים בין הקבוצות‪.‬‬
‫לצורך השוואה בין שלוש שיטות שונות ללימוד אנגלית ‪ ,‬נלקחו ‪ 3‬מדגמים בלתי תלויים של ‪ 10‬סטודנטים כ"א‪.‬‬
‫כל קבוצה למדה אנגלית בשיטה שונה ולאחר ‪ 4‬חודשים נערך מבחן זהה לכל הקבוצות‪.‬‬
‫שונות בתוך קבוצה – מדוע לא נצפה שהשונות בכל קבוצה תהיה שווה לאפס? אנו מבינים אינטואיטיבית מתוך‬
‫הכרת המושג שונות כי לא תיתכן זהות בין כל הסטודנטים למרות שנחשפו לאותה שיטת לימוד ולכן קיימת שונות‬
‫בין הפרטים‪.‬‬
‫שונות זו נובעת משני סוגי גורמים – גורמים הניתנים לשליטה ובקרה אך לא ניתנה להם תשומת לב ‪ /‬בקרה בעת‬
‫בניית המחקר ‪( -‬פערי רמות בין הסטודנטים ‪ ,‬מין הסטודנט ‪ ,‬מצב סוציואקונומי ‪ ,‬במידה וקבוצה חולקה לתת‬
‫קבוצות – הבדלים בין מרצים ‪ ,‬כיתות לימוד ‪ ,‬שעות לימוד ‪ ,‬בודקי בחינות וכו')‬
‫גורמים אשר אינם ניתנים לשליטה – קשיי ריכוז ‪ ,‬מצב בריאותי וכו'‪.‬‬
‫שונות בין הקבוצות ‪ -‬מדוע קיים שוני בין תוחלות ציוניי הסטודנטים בשלוש הקבוצות השונות ?‬
‫השונות בין תוחלות הציונים בין הקבוצות יכולה לנבוע משלושה גורמים‪:‬‬
‫א‪.‬‬
‫הבדל בין שיטות ההוראה השונות ‪ ,‬זוהי למעשה השערת המחקר‪/‬מטרת המחקר (הבדל מוסבר)‪.‬‬
‫ב‪.‬‬
‫גורמים שלא נלקחו בשיקול בעת עריכת ותכנון המחקר (שוני בין מרצים ‪ ,‬מיקום ‪ ,‬שעות לימוד ‪ ,‬פערים‬
‫בין הקבוצות וכו')‪.‬‬
‫ג‪.‬‬
‫גורמים שאינם בשליטתנו‪( .‬מצב בריאותי של סטודנטים ‪ /‬מרצים וכו')‬
‫‪182‬‬
‫ה"שונות בין הקבוצות" מבטאת את השונות שבין ממוצעי ציוני תלמידים בקבוצות השונות והיא מורכבת משני‬
‫סוגי שונויות‪ :‬שונות גורמים בלתי מוסברים ושונות גורם מוסבר (שיטות ההוראה)‪.‬‬
‫תהליך בדיקת השערות על הפרש תוחלות המתבסס על ניתוח שונות‪ ,‬יוצא מנקודת הנחה כי ככל שהיחס בין‬
‫השונות בין הקבוצות לבין השונות בתוך הקבוצות יגדל ‪ ,‬מתחזקת הטענה כי השונות בין הקבוצות נובעת‬
‫מהגורם המוסבר כלומר המשתנה הנבדק (במקרה זה שיטת הלימוד)‪.‬‬
‫אם אין הבדל בין שיטות ההוראה ‪ -‬השונות בין הקבוצות והשונות בתוך הקבוצות צריכות להיות שוות ‪ ,‬מאחר‬
‫ושתיהן אומדות את השונות הבלתי מוסברת‪.‬‬
‫אם קיים הבדל בין שיטות ההוראה ‪ -‬השונות בין הקבוצות צריכה להיות גדולה יותר מהשונות בתוך הקבוצות‪.‬‬
‫הסיבה היא ‪ -‬השונות בין הקבוצות היא סכום של שתי שונויות‪ :‬השונות הבלתי מוסברת בתוספת השונות המוסברת‪.‬‬
‫לכן היחס בין השונות בין הקבוצות לבין השונות בתוך הקבוצות משמש לנו ככלי בבדיקת ההשערה‪.‬‬
‫היחס בין השונויות מסומן באות ‪F‬‬
‫שונות מוסברת‬
‫שונות בלתי מוסברת‬
‫‪‬‬
‫שונות בין הקבוצות‬
‫שונות בתוך הקבוצות‬
‫‪F‬‬
‫כאשר ‪ F  1‬ניתן לומר כי אין הבדל בין הקבוצות‪.‬‬
‫*‬
‫*‬
‫‪ F‬קיים הבדל בין הקבוצות – האם הפער מובהק?‬
‫כאשר ‪1‬‬
‫בדיקת המובהקות תעשה מול גבול קריטי ‪ FC -‬המתקבל מתוך טבלת התפלגות ‪ F‬בהתאם לדרגות חופש ורמת‬
‫מובהקות‪.‬‬
‫התפלגות ‪F‬‬
‫התפלגות ‪ F‬היא התפלגות אסימטרית חיובית ‪ ,‬למשתנה רציף ‪. F  0 ,‬‬
‫התפלגות ‪ F‬תלויה בשני גורמים של דרגות חופש ‪ F - df1 , df 2 ,‬הוא היחס בין שני משתנים המתפלגים ‪ 2‬‬
‫ולכן היחס תלוי בשתי דרגות חופש – למונה ולמכנה‪.‬‬
‫הנחות‬
‫*‬
‫המדגמים בלתי תלויים‪.‬‬
‫*‬
‫התפלגות כל אחת מהאוכלוסיות היא נורמאלית‪.‬‬
‫*‬
‫קיים שוויון שונויות בין האוכלוסיות‪.‬‬
‫‪ 12   2 2   3 2   4 2‬‬
‫אוכלוסייה ‪1‬‬
‫אוכלוסייה ‪2‬‬
‫נלקח מדגם בגודל ‪n1‬‬
‫נלקח מדגם בגודל ‪n 2‬‬
‫וחושב בו הגודל‪:‬‬
‫‪2‬‬
‫‪  xi  x1 ‬‬
‫‪‬‬
‫‪n1  1‬‬
‫וחושב בו הגודל ‪:‬‬
‫‪2‬‬
‫‪Sˆ12‬‬
‫‪  xi  x2 ‬‬
‫‪‬‬
‫‪n2  1‬‬
‫‪2‬‬
‫‪Sˆ2‬‬
‫‪183‬‬
‫נגדיר את היחס בין השונויות של שתי אוכלוסיות‬
‫‪-‬‬
‫‪2‬‬
‫‪S 1 / 12‬‬
‫‪2‬‬
‫‪S 2 /  22‬‬
‫על פי הנחות המודל יש שוויון שונויות באוכלוסיות אזי היחס הוא‪:‬‬
‫‪2‬‬
‫‪Sˆ1‬‬
‫‪2‬‬
‫ˆ‪S‬‬
‫‪2‬‬
‫אם נחזור על התהליך אינסוף פעמים‪ .‬דהינו נחשב אינסוף יחסים נקבל‪:‬‬
‫‪2‬‬
‫‪Sˆ1‬‬
‫‪ Fn1 1,n2 1‬‬
‫‪2‬‬
‫ˆ‪S‬‬
‫במילים ‪ :‬יחס זה מתפלג התפלגות ‪.F‬‬
‫‪2‬‬
‫‪2‬‬
‫‪Sˆ1‬‬
‫‪F 2‬‬
‫ˆ‪S‬‬
‫‪2‬‬
‫תכונות התפלגות ‪F‬‬
‫‪ .1‬ערכי ‪ F‬חיוביים‪.‬‬
‫‪ .2‬לכל שני גדלי מדגמים יש התפלגות ‪ F‬אחרת‪.‬‬
‫‪ .3‬ההתפלגות א‪-‬סימטרית חיובית ‪ -‬זנב לימין‪.‬‬
‫‪ .4‬המדגמים נלקחים מאוכלוסיות בלתי תלויות המתפלגות נורמאלית‪.‬‬
‫ניתוח השונות נעשה ע"י ניתוח היחס בין ‪ SSB‬לבין ‪SSW‬‬
‫‪ - SSB‬סכום ריבועים בין קבוצות ‪Sum of Squares Between Groups :‬‬
‫‪ - SSW‬סכום ריבועים בתוך קבוצות ‪Sum of Squares Within Groups :‬‬
‫היחס נותן ערך ‪ F( F‬מחושב) הנבדק מול ערך ‪ F‬קריטי המחושב מטבלת התפלגות ‪F‬‬
‫חישוב ערכים בטבלת ‪– F‬‬
‫*‬
‫לכל רמת מובהקות קיימת טבלת ‪F‬‬
‫*‬
‫החישוב מתייחס לשתי דרגות חופש‬
‫‪ k-1 , Fk 1,nk ,‬אופקי ‪ n-k ,‬אנכי ‪.‬‬
‫אם ‪ F  Fk 1,n  k ,‬מחושב (יחס ‪ ) F‬דוחים את ‪H 0‬‬
‫‪184‬‬
‫טבלת ניתוח שונות ‪ANOVA -‬‬
‫מקור‬
‫סכום‬
‫דרגות‬
‫השונות‬
‫ריבועים‬
‫חופש‬
‫בין‬
‫‪SSB‬‬
‫‪k-1‬‬
‫‪SSB‬‬
‫‪k 1‬‬
‫‪n-k‬‬
‫‪SSW‬‬
‫‪nk‬‬
‫‪MSW ‬‬
‫קבוצות‬
‫בתוך‬
‫‪SSW‬‬
‫קבוצות‬
‫סה"כ‬
‫‪= K‬מספר קבוצות‬
‫‪SST‬‬
‫‪,‬‬
‫ממוצע ריבועים‬
‫‪MSB ‬‬
‫יחס ‪F‬‬
‫‪MSB‬‬
‫‪MSW‬‬
‫‪Fk 1,nk ,1‬‬
‫‪F‬‬
‫‪n-1‬‬
‫‪=n‬סה"כ תצפיות‬
‫על מנת לחשב את ערכי ‪ SSB‬ו‪ SSW-‬כפי שמפורט בהמשך יש לחשב תחילה ממוצע ‪ , X‬ואומדן סטיית תקן‬
‫‪‬‬
‫‪2‬‬
‫‪ S‬לכל מדגם ‪ ,‬ואת הממוצע המשוקלל לכלל המדגמים שסימונו ‪X -‬‬
‫‪n1  x1  n2  x2  ....‬‬
‫ממוצע משוקלל ל – ‪ K‬המדגמים‬
‫‪n1  n2  n3  n4  ....‬‬
‫‪X ‬‬
‫‪ - SSB‬סכום ריבועים בין קבוצות ‪Sum of Squares Between Groups :‬‬
‫סכום ריבועי הסטיות הבין קבוצתי משקף את השוני בין ממוצעי הקבוצות השונות – סכום ריבועי הסטיות בין‬
‫הממוצע המשוקלל לממוצע כל מדגם ‪.‬‬
‫‪SSB   ni  xi  x ‬‬
‫‪2‬‬
‫‪i‬‬
‫‪ - SSW‬סכום ריבועים בתוך קבוצות ‪Sum of Squares Within Groups :‬‬
‫סכום ריבועי הסטיות הפנים קבוצתי משקף את השונות הטבעית של הנתונים הנקייה מהגורמים היוצרים את‬
‫הקבוצות השונות‪.‬‬
‫‪2‬‬
‫‪k‬‬
‫‪SSW   ni  1sˆi‬‬
‫‪i 1‬‬
‫‪185‬‬
‫כלל החלטה ‪:‬‬
‫אם‬
‫‪ F  Fk 1,nk ,1‬מחושב (יחס ‪ ) F‬דוחים את ‪H 0‬‬
‫גבול קריטי ‪FC‬‬
‫‪‬‬
‫‪1‬‬
‫‪Fk 1,nk ,1‬‬
‫קבלת ‪H 0‬‬
‫דחיית ‪H 0‬‬
‫ההשערות הנבדקות הן ‪:‬‬
‫השערת האפס – אין שוני בין תוחלות האוכלוסיות‬
‫‪H0 : 1  2  .......  k‬‬
‫השערה אלטרנטיבית (השערת המחקר) ‪ -‬קיים שוני בין תוחלות האוכלוסיות‬
‫‪H1 : 1  2  .......  k‬‬
‫מסעדה רוצה לבדוק האם קיים הבדל בין ארבעת מלצריה העובדים ב‪ 4-‬אזורים שונים במסעדה ‪ ,‬בגובה השכר‬
‫(טיפים) שהם מרוויחים ליום ‪.‬‬
‫להלן נתוני השכר של כל מלצר כפי שנאספו בדגימה מקרית של מספר ימים‪.‬‬
‫א‬
‫‪110‬‬
‫‪125‬‬
‫‪147‬‬
‫‪106‬‬
‫ב‬
‫‪100‬‬
‫‪130‬‬
‫‪160‬‬
‫‪98‬‬
‫‪100‬‬
‫‪115‬‬
‫ג‬
‫‪120‬‬
‫‪104‬‬
‫‪150‬‬
‫‪109‬‬
‫‪115‬‬
‫‪120‬‬
‫ד‬
‫‪145‬‬
‫‪90‬‬
‫‪110‬‬
‫‪105‬‬
‫‪120‬‬
‫‪135‬‬
‫‪110‬‬
‫‪109‬‬
‫האם קיים הבדל בין השכר היומי הממוצע של ארבעת המלצרים ?‬
‫בדוק את הטענה ברמת מובהקות ‪.5%‬‬
‫‪186‬‬
‫פתרון‬
‫‪ - H 0 : 1   2   3   4‬אין הבדל בין השכר היומי הממוצע של ארבעת המלצרים‬
‫‪ - H1 : 1  2  3  4‬יש הבדל בין השכר היומי הממוצע של ארבעת המלצרים‪.‬‬
‫רמת מובהקות ‪  0.05 :‬‬
‫נחשב עבור כל מדגם ממוצע ואומדן לסטיית התקן (עיין בנספח לשימוש סטטיסטי במחשבון)‪:‬‬
‫ב‬
‫א‬
‫ד‬
‫ג‬
‫‪n1  4‬‬
‫‪n2  6‬‬
‫‪n3  6‬‬
‫‪n4  8‬‬
‫‪x1  122‬‬
‫‪x2  117.17‬‬
‫‪x3  119.67‬‬
‫‪x4  115.5‬‬
‫‪Sˆ12  344.67‬‬
‫‪Sˆ22  592.17‬‬
‫‪Sˆ32  260.27‬‬
‫‪Sˆ42  304.86‬‬
‫‪122  4  117.17  6  119.67  6  115.5  8‬‬
‫‪ 118.0417‬‬
‫‪4668‬‬
‫‪ X ‬ממוצע משוקלל‬
‫‪SSB   ni   xi  x   4 122  118.04   6 117.17  118.04  ‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪i‬‬
‫‪6 119.67  118.04   8 115.15  118.04   134.79‬‬
‫‪2‬‬
‫‪2‬‬
‫‪k‬‬
‫‪SSW    ni  1 sˆi 2  3  344.67  5  592.17  5  260.27  7  304.86  7430.167‬‬
‫‪i 1‬‬
‫מקור‬
‫סכום ריבועים‬
‫דרגות חופש‬
‫השונות‬
‫בין‬
‫‪SSB=134.79‬‬
‫‪k-1=4-1=3‬‬
‫קבוצות‬
‫בתוך‬
‫‪SSW=7430.1‬‬
‫‪n-k=24-4=20‬‬
‫קבוצות‬
‫סה"כ‬
‫‪SST=7564.89‬‬
‫‪SSB‬‬
‫‪=44.93‬‬
‫‪k 1‬‬
‫‪SSW‬‬
‫‪=371.5‬‬
‫‪nk‬‬
‫‪MSB ‬‬
‫‪MSW ‬‬
‫‪MSB‬‬
‫‪MSW‬‬
‫‪=0.12 F ‬‬
‫‪n-1=23‬‬
‫‪187‬‬
‫‪FC  Fk 1,nk ,  F3,20,0.05  3.1‬‬
‫)‪ - FC (3.1)  F (0.12‬ברמת מובהקות של ‪ , 0.05‬מקבלים את השערת האפס‬
‫אין הבדל בין הכנסות המלצרים‪.‬‬
‫‪‬‬
‫‪FC  3.1‬‬
‫‪0.12‬‬
‫‪188‬‬
‫‪.1‬‬
‫נערך מחקר להשוואת הישגי הסטודנטים‪ ,‬בקורס למיקרו כלכלה בין ‪ 4‬אוניברסיטאות (‪. )A,B,C,D‬‬
‫בדקו את הטענה כי קיים פער בהישגי הסטודנטים בין האוניברסיטאות‪ ,‬ברמת מובהקות של ‪.0.05‬‬
‫להלן נתוני הציונים מארבעת המדגמים‪:‬‬
‫‪A‬‬
‫‪70‬‬
‫‪67‬‬
‫‪85‬‬
‫‪84‬‬
‫‪95‬‬
‫‪60‬‬
‫‪50‬‬
‫‪70‬‬
‫‪B‬‬
‫‪88‬‬
‫‪46‬‬
‫‪75‬‬
‫‪60‬‬
‫‪70‬‬
‫‪85‬‬
‫‪70‬‬
‫‪40‬‬
‫‪C‬‬
‫‪95‬‬
‫‪90‬‬
‫‪50‬‬
‫‪55‬‬
‫‪60‬‬
‫‪71‬‬
‫‪73‬‬
‫‪85‬‬
‫‪48‬‬
‫‪D‬‬
‫‪100‬‬
‫‪96‬‬
‫‪98‬‬
‫‪45‬‬
‫‪47‬‬
‫‪51‬‬
‫‪76‬‬
‫‪82‬‬
‫‪72‬‬
‫‪.2‬‬
‫‪49‬‬
‫חברה מסוימת מנוייה ב‪ 3-‬חברות סלולאריות (א ‪ ,‬ב ‪ ,‬ג) ‪ ,‬החברה מעוניינת לבדוק האם קיים פער‬
‫בעלויות החודשיות הממוצעות המשולמות לכל חברת סלולארית‪.‬‬
‫נבדקו המדגמים הבלתי תלויים הבאים‪:‬‬
‫חברה א – ‪ 6‬חשבונות ‪ :‬עלות ממוצעת ‪ ₪ 246‬וסטית תקן ‪.₪ 36‬‬
‫חברה ב‪ 10 -‬חשבונות ‪ :‬עלות ממוצעת ‪ ₪ 226‬וסטית תקן ‪. ₪ 26‬‬
‫חברה ג – ‪ 7‬חשבונות ‪ :‬עלות ממוצעת ‪ ₪ 265‬וסטית תקן ‪. ₪ 49‬‬
‫‪.3‬‬
‫מנהל תיקים רצה לבדוק האם קיים הבדל בתשואות היומיות בין ‪ 4‬תיקי השקעות שהוא מנהל ‪ ,‬לצורך‬
‫הבדיקה דגם מנהל התיקים את תשואות התיקים במשך ‪ 7‬ימי עסקים‪.‬‬
‫התשואות הנדגמות נתונות בטבלה (באחוזים) ‪ ,‬בדקו את הטענה ברמת מובהקות של ‪0.025‬‬
‫מס' תיק‬
‫‪.4‬‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪1‬‬
‫‪2‬‬
‫‪1‬‬
‫‪3‬‬
‫‪3‬‬
‫‪1‬‬
‫‪1.5‬‬
‫‪5‬‬
‫‪2‬‬
‫‪-2‬‬
‫‪0.5‬‬
‫‪4‬‬
‫‪0.5‬‬
‫‪0.5‬‬
‫‪0.75‬‬
‫‪1.6‬‬
‫‪-1‬‬
‫‪-1‬‬
‫‪2‬‬
‫‪-1‬‬
‫‪-3‬‬
‫‪3‬‬
‫‪1.5‬‬
‫‪-2‬‬
‫‪4‬‬
‫‪2‬‬
‫‪1.75‬‬
‫‪5‬‬
‫‪ 3‬תרופות להורדת לחץ דם נבדקו על מדגם של ‪ 32‬איש‪ ,‬בדקו את הטענה כי קיים הבדל בין תוחלות לחץ‬
‫הדם בין הקבוצות השונות ברמת מובהקות של ‪. 0.05‬‬
‫נתוני לחץ הדם של כל קבוצה לאחר חודש של לקיחת התרופה נתונים בטבלה‪:‬‬
‫‪189‬‬
‫קבוצה‬
‫‪125‬‬
‫‪127‬‬
‫‪130‬‬
‫‪125‬‬
‫‪124‬‬
‫‪134‬‬
‫‪129‬‬
‫‪122‬‬
‫‪133‬‬
‫‪123‬‬
‫‪A‬‬
‫קבוצה‬
‫‪124‬‬
‫‪128‬‬
‫‪131‬‬
‫‪129‬‬
‫‪119‬‬
‫‪125‬‬
‫‪124‬‬
‫‪129‬‬
‫‪131‬‬
‫‪135‬‬
‫‪B‬‬
‫קבוצה‬
‫‪119‬‬
‫‪128‬‬
‫‪125‬‬
‫‪132‬‬
‫‪140‬‬
‫‪131‬‬
‫‪127‬‬
‫‪117‬‬
‫‪128‬‬
‫‪124‬‬
‫‪135‬‬
‫‪126‬‬
‫‪C‬‬
‫‪.1‬‬
‫‪ - H0 : 1  2  3  4‬אין הבדל בין ממוצע ציוני הסטודנטים בקורסים במיקרו כלכלה‪.‬‬
‫‪ - H1 : 1  2  3  4‬יש הבדל בין ממוצע ציוני הסטודנטים בקורסים במיקרו כלכלה‪.‬‬
‫רמת מובהקות ‪  0.05 :‬‬
‫ב‬
‫א‬
‫ד‬
‫ג‬
‫‪n1  8‬‬
‫‪n1  8‬‬
‫‪n1  9‬‬
‫‪n1  10‬‬
‫‪x1  72.625‬‬
‫‪x1  66.75‬‬
‫‪x1  69.66‬‬
‫‪x1  71.6‬‬
‫‪‬‬
‫‪S12  214.267‬‬
‫‪‬‬
‫‪S12  295.07‬‬
‫‪‬‬
‫‪‬‬
‫‪S 1  497.155‬‬
‫‪2‬‬
‫‪S12  308.5‬‬
‫‪ X  72.66  8  66.75  8  69.66  9  71.6  10  70.228‬ממוצע משוקלל‬
‫‪8  8  9  10‬‬
‫‪SSB   n i  ( x i  x )2  8  72.625  70.2282  8  66.75  70.2282 ‬‬
‫‪i‬‬
‫‪9  69.66  70.2282  10  71.6  70.2282  164.39‬‬
‫‪‬‬
‫‪SSW   (n i  1) Si 2 7  214.267  7  295.07  8  308.5  9  497.155  10507.78‬‬
‫‪i‬‬
‫‪190‬‬
‫מקור‬
‫השונות‬
‫בין‬
‫‪k-1=4-1=3‬‬
‫‪SSB=164.39‬‬
‫קבוצות‬
‫בתוך‬
‫‪SSW=10507.78‬‬
‫‪n-k=35-4=31‬‬
‫קבוצות‬
‫סה"כ‬
‫‪SST=10672.17‬‬
‫‪SSB‬‬
‫‪=54.79‬‬
‫‪k 1‬‬
‫‪SSW‬‬
‫‪=338.9‬‬
‫‪nk‬‬
‫‪MSB ‬‬
‫‪MSW ‬‬
‫‪MSB‬‬
‫‪MSW‬‬
‫‪=0.16 F ‬‬
‫‪n-1=34‬‬
‫‪FC  FK 1,n K,  F3,31,0.05  2.92‬‬
‫)‪ - FC (2.92)  F(0.16‬ברמת מובהקות של ‪ , 0.05‬מקבלים את השערת האפס‬
‫אין הבדל בין הקורסים‪.‬‬
‫‪‬‬
‫)‪FC (2.92‬‬
‫‪0.16‬‬
‫‪ .2‬השערות ‪:‬‬
‫‪ - H0 : 1  2  3‬אין הבדל בעלויות בין חברות הסלולר‪.‬‬
‫‪ - H1 : 1  2  3‬קיים הבדל בעלויות בין חברות הסלולר‪.‬‬
‫רמת מובהקות ‪  0.05 :‬‬
‫ב‬
‫ג‬
‫א‬
‫‪n1  6‬‬
‫‪n1  10‬‬
‫‪n1  7‬‬
‫‪x1  246‬‬
‫‪x1  226‬‬
‫‪x1  265‬‬
‫‪‬‬
‫‪S12  1296‬‬
‫‪‬‬
‫‪S12  676‬‬
‫‪‬‬
‫‪S12  2401‬‬
‫‪191‬‬
‫‪ X  246  6  226  10  265  7  243.08‬ממוצע משוקלל‬
‫‪6  10  7‬‬
‫‪SSB   n i  ( x i  x ) 2  6  246  243.082  10  226  243.082 ‬‬
‫‪i‬‬
‫‪7  265  243.082  6331.82‬‬
‫‪‬‬
‫‪SSW   (n i  1) Si 2 5  1296  9  676  6  2401  26970‬‬
‫‪i‬‬
‫מקור‬
‫השונות‬
‫בין‬
‫‪SSB=6331.82‬‬
‫‪k-1=3-1=2‬‬
‫קבוצות‬
‫בתוך‬
‫‪SSW=26970‬‬
‫‪n-k=23-3=20‬‬
‫קבוצות‬
‫סה"כ‬
‫‪SST=33301.82‬‬
‫‪SSB‬‬
‫‪=3165.91‬‬
‫‪k 1‬‬
‫‪SSW‬‬
‫‪=1348.5‬‬
‫‪nk‬‬
‫‪MSB ‬‬
‫‪MSW ‬‬
‫‪MSB‬‬
‫‪MSW‬‬
‫‪2.347 F ‬‬
‫‪n-1=22‬‬
‫‪FC  FK 1,n K,  F2,16,0.05  3.63‬‬
‫אין הבדל בין חברות הסלולר‪.‬‬
‫‪‬‬
‫)‪FC (3.63‬‬
‫‪2.347‬‬
‫‪192‬‬
‫‪.3‬‬
‫‪ - H0 : 1  2  3  4‬אין הבדל בין התשואות הממוצעות בתיקי ההשקעות‪.‬‬
‫‪ - H1 : 1  2  3  4‬קיים הבדל בין התשואות הממוצעות בתיקי ההשקעות‪.‬‬
‫‪  0.025‬‬
‫ב‬
‫א‬
‫ד‬
‫ג‬
‫‪n1  7‬‬
‫‪n1  7‬‬
‫‪n1  7‬‬
‫‪n1  7‬‬
‫‪x1  0.928‬‬
‫‪x1  0.785‬‬
‫‪x1  1.285‬‬
‫‪x1  2.228‬‬
‫‪‬‬
‫‪S12  5.7‬‬
‫‪‬‬
‫‪S12  3.154‬‬
‫‪‬‬
‫‪‬‬
‫‪S12  7.965‬‬
‫‪S12  0.3‬‬
‫‪ X  2.28  7  1.285  7  0.785  7  0.928  7  1.307‬ממוצע משוקלל‬
‫‪28‬‬
‫‪SSB   n i  ( x i  x ) 2  7  0.928  1.307 2  7  0.785  1.307 2 ‬‬
‫‪i‬‬
‫‪7  1.285  1.307 2  7  2.228  1.307 2  8.852‬‬
‫‪‬‬
‫‪SSW   (n i  1) Si 2 6  5.7  6  3.154  6  0.3  6  7.965  102.74‬‬
‫‪i‬‬
‫מקור‬
‫השונות‬
‫בין‬
‫‪SSB=8.852‬‬
‫‪k-1=4-1=3‬‬
‫קבוצות‬
‫בתוך‬
‫‪SSW=102.74‬‬
‫‪n-k=28-4=24‬‬
‫קבוצות‬
‫סה"כ‬
‫‪SST=111.59‬‬
‫‪SSB‬‬
‫‪=2.95‬‬
‫‪k 1‬‬
‫‪SSW‬‬
‫‪=4.28‬‬
‫‪nk‬‬
‫‪MSB ‬‬
‫‪MSW ‬‬
‫‪MSB‬‬
‫‪MSW‬‬
‫‪=0.68 F ‬‬
‫‪n-1=27‬‬
‫‪193‬‬
‫‪FC  FK 1,n K,  F3,24,0.025  3.72‬‬
‫‪‬‬
‫)‪0.68 FC (3.72‬‬
‫‪.4‬‬
‫‪ - H0 : 1  2  3‬אין הבדל (בין התרופות) בתוחלות לחץ הדם בין הקבוצות‪.‬‬
‫‪ - H1 : 1  2  3‬קיים הבדל (בין התרופות) בתוחלות לחץ הדם בין הקבוצות‪.‬‬
‫רמת מובהקות ‪  0.05 :‬‬
‫א‬
‫ג‬
‫ב‬
‫‪n1  10‬‬
‫‪n1  10‬‬
‫‪n1  12‬‬
‫‪x 1  127.2‬‬
‫‪x 1  127.5‬‬
‫‪x1  127.66‬‬
‫‪‬‬
‫‪S 1  17.28‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  20.94‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  40.78‬‬
‫‪2‬‬
‫‪ X  127.66  13  127.5  11  127.2  11  127.46‬ממוצע משוקלל‬
‫‪10  10  12‬‬
‫‪SSB   n i  ( x i  x ) 2  11  127.2  127.462  11  127.5  127.462 ‬‬
‫‪i‬‬
‫‪13  127.66  127.462  1.314‬‬
‫‪‬‬
‫‪SSW   (n i  1) Si 2 11  17.28  11  20.94  13  40.78  871.78‬‬
‫‪i‬‬
‫‪194‬‬
‫מקור‬
‫השונות‬
‫בין‬
‫‪SSB=1.314‬‬
‫‪k-1=3-1=2‬‬
‫‪SSB‬‬
‫‪=0.657‬‬
‫‪k 1‬‬
‫קבוצות‬
‫בתוך‬
‫‪SSW=871.78‬‬
‫‪n-k=35-3=32‬‬
‫קבוצות‬
‫סה"כ‬
‫‪SST=873.09‬‬
‫‪SSW‬‬
‫‪=36.32‬‬
‫‪nk‬‬
‫‪MSB ‬‬
‫‪MSW ‬‬
‫‪MSB‬‬
‫‪MSW‬‬
‫‪=0.018 F ‬‬
‫‪n-1= 34‬‬
‫‪FC  FK 1,n K,  F2,32,0.05  3.32‬‬
‫‪‬‬
‫)‪FC (3.32‬‬
‫‪1.87‬‬
‫‪195‬‬
‫קשר סטטיסטי בין שני משתנים‬
‫קשר סטטיסטי בין שני משתנים משמעותו – שינוי ערך במשתנה אחד גורר אחריו שינוי ערך במשתנה שני‪.‬‬
‫אם קיים קשר סטטיסטי בין לחץ דם להתקפי לב ‪ ,‬המשמעות היא ששינוי בלחץ הדם יגרור שינוי בכמות התקפי‬
‫הלב או שינוי בסיכוי‪/‬הסתברות להתקף לב‪.‬‬
‫כאשר קיים קשר סטטיסטי בין שני משתנים חשוב לדעת את טיב הקשר – קשר חיובי‪/‬שלילי ואת עוצמתו (נושאים‬
‫בהם נדון בהמשך) ידיעת פרמטרים אלו לקשר תאפשר לנו לערוך ניבוי – לנבא ערכים של משתנה אחד כאשר‬
‫ידועים לנו ערכי המשתנה השני‪.‬‬
‫אם נדע את לחץ הדם נוכל לנבא את הסיכוי להתקף לב‪.‬‬
‫קשר סטטיסטי בין שני משתנים יכול לנבוע מגורמים שונים לכן לפירוש משמעות הקשר יש חשיבות רבה‪.‬‬
‫נמצא כי קיים קשר בין רמות אלכוהול בדם לבין תאונות דרכים – לא נסיק מכך כי אלכוהול גורם לתאונות דרכים‬
‫מאחר וישנם גורמים מתערבים נוספים היכולים להשפיע או לגרום לקשר אולי הנטייה לשתיית אלכוהול מאפיינת‬
‫סוג אנשים מסוים אשר הסיכוי שלהם להיות מעורבים תאונה גדול וכו' ‪ ,‬קימות שיטות סטטיסטיות לבדיקת‬
‫סיבתיות ועוצמת הקשר בין שני משתנים ‪ ,‬בשיטות אלו נדון‪.‬‬
‫קשר ליניארי בין שני משתנים‬
‫קשר ליניארי – קשר קווי בין שני משתנים ‪ ,‬נדון במספר סוגי קשר ליניארי‪:‬‬
‫אין קשר‬
‫‪Y‬‬
‫‪X‬‬
‫קשר שלילי‬
‫מושלם‬
‫‪Y‬‬
‫‪X‬‬
‫קשר חיובי חלש‬
‫‪Y‬‬
‫‪X‬‬
‫‪X‬‬
‫קשר שלילי‬
‫‪X‬‬
‫קשר חיובי‬
‫מושלם‬
‫‪Y‬‬
‫‪Y‬‬
‫קשר חיובי‬
‫‪Y‬‬
‫‪X‬‬
‫‪196‬‬
‫כאשר רוצים לבדוק קשר בין שני משתנים יש להגדיר לכל נבדק את שני המשתנים המבוקשים – משתנה ‪X‬‬
‫ומשתנה ‪.Y‬‬
‫דוגמה‪ :‬לשבעה שחקני כדורסל נמדד הגובה ומס' הקליעות אשר קלעו לסל ב‪ 10-‬משחקים ‪:‬‬
‫מס' קליעות לסל – ‪Y‬‬
‫גובה בסמ' ‪X -‬‬
‫שחקן מס'‬
‫‪74‬‬
‫‪172‬‬
‫‪1‬‬
‫‪76‬‬
‫‪178‬‬
‫‪2‬‬
‫‪79‬‬
‫‪181‬‬
‫‪3‬‬
‫‪84‬‬
‫‪184‬‬
‫‪4‬‬
‫‪89‬‬
‫‪186‬‬
‫‪5‬‬
‫‪87‬‬
‫‪191‬‬
‫‪6‬‬
‫‪92‬‬
‫‪195‬‬
‫‪7‬‬
‫נציג את הנתונים בדיאגראמת פיזור‪:‬‬
‫‪95‬‬
‫‪90‬‬
‫‪80‬‬
‫קליעות לסל ‪Y‬‬
‫‪85‬‬
‫‪75‬‬
‫‪200‬‬
‫‪195‬‬
‫‪190‬‬
‫‪185‬‬
‫גובה ‪X‬‬
‫‪180‬‬
‫‪175‬‬
‫‪70‬‬
‫‪170‬‬
‫ניתן לראות ע"פ דיאגראמת הפיזור כי קיים קשר ליניארי חיובי בין שני המשתנים ‪ ,‬הקשר הוא קשר חזק מאחר‬
‫ואוסף הנקודות מרוכז סביב קו ישר‪.‬‬
‫את עוצמת הקשר ניתן לחשב ע"י מדד סטטיסטי הנקרא – מקדם המתאם ‪.‬‬
‫ע"פ מקדם המתאם ניתן להעריך את עוצמת הקשר כאשר הקשר הוא קשר חזק ניתן ע"פ מקדם המתאם לבנות קו‬
‫ישר – קו התחזית – ישר אשר באמצעותו ניתן לערוך ניבוי ‪ ,‬כאשר הקשר בין המשתנים הוא קשר חלש יהיו‬
‫סטיות גדולות בניבוי ולכן אינו אפקטיבי‪.‬‬
‫‪197‬‬
‫מקדם המתאם בין שני משתנים‬
‫מקדם המתאם מסומן באות ‪.r‬‬
‫מקדם המתאם מקבל ערכים בין ‪ -1‬ל‪1-‬‬
‫‪ r =1‬קשר חיובי מושלם‬
‫‪,‬‬
‫‪1  r  1‬‬
‫‪ r = 0‬אין קשר ‪ r = -1 ,‬קשר שלילי מושלם‬
‫ככל ש‪ r -‬שואף ל‪ 1-‬הקשר הליניארי החיובי חזק יותר והפוך לכיוון השלילי‪.‬‬
‫סימנו של ‪ )  r ( r‬מעיד על כיוון הקשר‪ .‬ערכו המוחלט ‪ r‬על עוצמת הקשר‪.‬‬
‫מקדם המתאם הליניארי ‪Coefficient of Correlation r-‬‬
‫היחס בין השונות המשותפת של שני משתנים לבין מכפלת סטיות התקן שלהם הוא המדד לכוון הקשר ועוצמתו‪.‬‬
‫השונות המשותפת של שני משתנים – ‪COVE(XY) - Covariance‬‬
‫)‪ ( xi  x)( yi  y‬‬
‫‪n‬‬
‫דרך נוספת לחישוב )‪COV(XY‬‬
‫‪COV ( XY ) ‬‬
‫‪ xi yi  n  x  y   xi yi  x  y‬‬
‫‪n‬‬
‫‪n‬‬
‫‪COV ( XY ) ‬‬
‫השונות המשותפת מתארת את ההשתנות של שני המשתנים בו זמנית ‪ -‬אם הם מתפתחים באותו כיוון אזי קיים‬
‫ביני הם יחס ישר ולכן השונות המשותפת חיובית ‪ ,‬כאשר הם מתפתחים בכיוונים מנוגדים ‪ ,‬קיים יחס הפוך לכן‬
‫השונות המשותפת שלילית‪.‬‬
‫*‬
‫ה – ‪ Covariance‬מקבל כל ערך‪ .‬כלומר ‪   covx, y    :‬‬
‫*‬
‫‪  covx, y   0‬הקשר הליניארי הוא קשר ישר (חיובי)‬
‫*‬
‫‪  covx, y   0‬הקשר הליניארי הוא קשר הפוך (שלילי)‬
‫*‬
‫‪  covx, y   0‬אין מתאם‬
‫מקדם המתאם‬
‫) ‪COV ( XY‬‬
‫‪ x  y‬‬
‫‪r‬‬
‫מקדם המתאם הינו מספר טהור ‪ -‬אינו תלוי ביחידות מדידה‪.‬‬
‫‪198‬‬
‫נחשב את מקדם המתאם בשאלת הכדורסלנים‪:‬‬
‫)‪( xi  x)( yi  y‬‬
‫‪yi  y‬‬
‫‪( xi  x) 2‬‬
‫‪xi  x‬‬
‫‪yi‬‬
‫‪xi‬‬
‫‪106.74‬‬
‫‪81‬‬
‫‪9-‬‬
‫‪140.42‬‬
‫‪11.86-‬‬
‫‪74‬‬
‫‪172‬‬
‫‪41.02‬‬
‫‪49‬‬
‫‪7-‬‬
‫‪34.22‬‬
‫‪5.86-‬‬
‫‪76‬‬
‫‪178‬‬
‫‪11.44‬‬
‫‪16‬‬
‫‪4-‬‬
‫‪8.1225‬‬
‫‪2.86-‬‬
‫‪79‬‬
‫‪181‬‬
‫‪0.14‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0.0225‬‬
‫‪0.14‬‬
‫‪84‬‬
‫‪184‬‬
‫‪12.84‬‬
‫‪36‬‬
‫‪6‬‬
‫‪4.6225‬‬
‫‪2.14‬‬
‫‪89‬‬
‫‪186‬‬
‫‪28.56‬‬
‫‪16‬‬
‫‪4‬‬
‫‪51.1225‬‬
‫‪7.14‬‬
‫‪87‬‬
‫‪191‬‬
‫‪100.26‬‬
‫‪81‬‬
‫‪9‬‬
‫‪124.32‬‬
‫‪11.14‬‬
‫‪92‬‬
‫‪195‬‬
‫‪301‬‬
‫‪280‬‬
‫‪Y  83‬‬
‫‪( yi  y ) 2‬‬
‫‪362.85‬‬
‫‪X  183.86‬‬
‫ניתן לחשב את מקדם המתאם גם בדרך הבאה‪:‬‬
‫‪ y  6.324‬‬
‫‪ ( xi  x)( yi  y)  301  43‬‬
‫‪ x  7.199‬‬
‫‪COV ( XY ) ‬‬
‫‪n‬‬
‫‪7‬‬
‫) ‪COV ( XY‬‬
‫‪43‬‬
‫‪r‬‬
‫‪‬‬
‫‪ 0.944‬‬
‫‪ x  y‬‬
‫‪7.199  6.324‬‬
‫הקשר הוא חיובי ומאחר והוא קרוב ל‪ 1-‬הוא חזק ‪ ,‬כמעט קשר מושלם‪.‬‬
‫‪199‬‬
‫רגרסיה ליניארית‬
‫כאשר קיים קשר ליניארי בין שני משתנים ‪ ,‬ניתן למצוא חוקיות בקשר – חוקיות אשר תאפשר לנו לבצע תחזית –‬
‫לערוך ניבוי כל ערכו של משתנה אחד כאשר ידוע המשתנה השני‪.‬‬
‫ניתן לחשב את ערכו של ‪ X‬כאשר ידוע ‪ , X/Y Y‬או את ערכו של ‪ Y‬כאשר ידוע ‪.Y/X X‬‬
‫מאחר והקשר בין שני המשתנים הינו קשר ליניארי ‪ ,‬החיזוי מתבטא בקו ישר המקשר בין שני המשתנים ‪ ,‬קו‬
‫חיזוי‪/‬תחזית נקרא קו הרגרסיה‪.‬‬
‫ככל שהקשר בין שני המשתנים חזק יותר ‪ ,‬כך החיזוי מדויק יותר‪.‬‬
‫כאשר עורכים מחקר מגדירים משתנה תלוי ומשתנה בלתי תלוי ‪ ,‬המשתנה התלוי – ‪ Y‬המשתנה הבלתי תלוי ‪, X‬‬
‫בשאלת שחקני הכדורסל בדקנו את הקשר בין גובה השחקן למספר הקליעות לסל – גובה השחקן ‪ ,‬המשתנה התלוי‬
‫היה מס' הקליעות –‪ Y‬והבלתי תלוי – גובה השחקן ‪ , X‬כלומר מס' הקליעות תלוי בגובה ולא ההיפך‪.‬‬
‫‪ -Y‬משתנה תלוי‪.‬‬
‫‪ -X‬משתנה בלתי תלוי‪.‬‬
‫קו הרגרסיה הוא קו ישר ולכן מתבסס על משוואת הקו הישר ‪y  mx  n -‬‬
‫‪ m‬מייצג את שיפוע הקו (קצב התקדמות הקו – התזוזה ב‪ y-‬על כל תזוזה אחת ב‪) x-‬‬
‫‪ n‬מייצג את נקודת החיתוך של הקו עם ציר ‪. y‬‬
‫מאחר ובד"כ בין המשתנים אין התאמה מלאה כמעט אף פעם אי אפשר להעביר ישר שכל נקודות המדידה נמצאות‬
‫בדיוק עליו‪ .‬לכן ‪ ,‬השאיפה היא למצוא את הישר המתאים ביותר לאוסף הנקודות )‪ (xi,yi‬שמדדנו‪.‬‬
‫הקו "המדויק ביותר" צריך להיות קרוב לערכים האמיתיים (נקודות המדגם) כלומר על הקו לעבור במקום בו‬
‫הסטיות מהנקודות במדגם הן הקטנות ביותר‪.‬‬
‫הדרך המקובלת היא שיטת הריבועים פחותים ( ‪. ) Least squares‬‬
‫הסימנים השליליים של הסטיות מבוטלים באמצעות העלאה בריבוע ‪.‬‬
‫לפי קריטריון זה ‪ " :‬הקו הטוב ביותר " הוא הקו המביא למינימום את סכום ריבועי הסטיות‪.‬‬
‫כאשר הקשר בין שני המשתנים הוא קשר חיובי‪/‬שלילי מלא – התאמה מלאה מתקבל קו הרגרסיה המדויק ביותר ‪,‬‬
‫אולם בפועל לא קיימים משתנים בעלי התאמה מלאה ולכן נוצר קו דמיוני הקו המדויק ביותר – קו הרגרסיה יהיה‬
‫הקו שסך הסטיות ממנו אל הערכים הוא הקטן ביותר‪.‬‬
‫‪95‬‬
‫קו הרגרסיה הוא למעשה מעין ממוצע ריבועי הסטיות‪.‬‬
‫‪90‬‬
‫‪80‬‬
‫קליעות לסל ‪Y‬‬
‫‪85‬‬
‫‪75‬‬
‫‪200‬‬
‫‪195‬‬
‫‪190‬‬
‫‪185‬‬
‫גובה ‪X‬‬
‫‪180‬‬
‫‪175‬‬
‫‪70‬‬
‫‪170‬‬
‫‪200‬‬
‫‪‬‬
‫‪ - Yi  m y xi  n y‬קו הרגרסיה לחיזוי ‪ y‬ע"פ ‪.x‬‬
‫‪x‬‬
‫‪x‬‬
‫) ‪COV ( XY‬‬
‫‪ 2x‬‬
‫‪my ‬‬
‫‪x‬‬
‫‪ny Y my  X‬‬
‫‪x‬‬
‫‪x‬‬
‫בשאלת הכדורסלנים‪:‬‬
‫‪Y  83‬‬
‫‪COV ( XY )  43‬‬
‫‪ 2 x  51.84‬‬
‫‪43‬‬
‫‪‬‬
‫‪ 0.83‬‬
‫‪Y  m y  X  83  0.86  183.86  69.6‬‬
‫‪51.84‬‬
‫‪x‬‬
‫‪X  183.85‬‬
‫) ‪COV ( XY‬‬
‫‪ 2x‬‬
‫‪‬‬
‫‪Y  m y xi  n y‬‬
‫‪x‬‬
‫‪ Xi  Y  my  X‬‬
‫‪x‬‬
‫קו הרגרסיה‬
‫‪x‬‬
‫) ‪COV ( XY‬‬
‫‪ 2x‬‬
‫‪‬‬
‫‪Y‬‬
‫‪‬‬
‫‪Y  0.83 X  69.6‬‬
‫שונות מוסברת ‪r2 -‬‬
‫מדד זה מציג את יכולת מודל הרגרסיה להסביר את ניבוי המשתנה התלוי על ידי המשתנה הבלתי תלוי‪ .‬ככל שמדד‬
‫זה גבוה יותר היכולת לומר שהמשתנה התלוי מוסבר על ידי השתנה הבלתי תלוי גבוהה יותר‪.‬‬
‫הערך של השונות המוסברת נמדד באחוזים‪.‬‬
‫כאשר ‪ - r2=1‬השונות המוסברת מקסימאלית כלומר יכולת הניבוי היא מוחלטת‪.‬‬
‫ככל שהשונות המוסברת גדולה הסיכוי לטעות בניבוי קטנה ‪.‬‬
‫‪201‬‬
‫לפניכם נתונים על ‪ 7‬עובדות ‪ -‬מס' ילדים לכל עובדת ומס' איחורים לעבודה בחודש‪:‬‬
‫‪1.‬‬
‫‪6‬‬
‫‪2‬‬
‫‪3‬‬
‫‪7‬‬
‫‪5‬‬
‫‪6‬‬
‫‪4‬‬
‫‪1‬‬
‫‪2‬‬
‫‪5‬‬
‫‪3‬‬
‫‪4‬‬
‫‪2‬‬
‫‪5‬‬
‫‪4‬‬
‫‪3‬‬
‫‪4‬‬
‫‪2‬‬
‫‪1‬‬
‫‪3‬‬
‫‪4‬‬
‫א‪.‬‬
‫הציגו את הנתונים בדיאגראמת פיזור‪.‬‬
‫ב‪.‬‬
‫מהו מקדם המתאם בין מס' הילדים למס' האיחורים בחודש‪.‬‬
‫ג‪.‬‬
‫חשבו את קו הרגרסיה לחיזוי מס' האיחורים בחודש ע"פ מספר הילדים‪.‬‬
‫ד‪.‬‬
‫מהי תחזית האיחורים (הניבוי) ע"פ קו הרגרסיה לעובדת עם ‪ 8‬ילדים‪.‬‬
‫‪.2‬‬
‫להלן מס' נתונים על שני משתנים‪:‬‬
‫‪r  0.82‬‬
‫‪y  6‬‬
‫‪x  4‬‬
‫‪Y  81‬‬
‫מס עובדת‬
‫מס ילדים‬
‫מס' איחורים‬
‫‪X  70‬‬
‫‪ y‬משתנה תלוי ‪ x ,‬משתנה בלתי תלוי‬
‫חשבו את ערכו של ‪ y‬כאשר ‪.X=85‬‬
‫להלן נתונים על מס' השיעורים הפרטיים שתלמידים לומדים לפני מבחן במתמטיקה והציון במבחן‪:‬‬
‫‪.3‬‬
‫‪4‬‬
‫‪82‬‬
‫‪5‬‬
‫‪90‬‬
‫‪1‬‬
‫‪95‬‬
‫‪6‬‬
‫‪85‬‬
‫‪0‬‬
‫‪100‬‬
‫‪2‬‬
‫‪75‬‬
‫‪8‬‬
‫‪95‬‬
‫מס' שיעורים‬
‫ציון‬
‫א‪.‬‬
‫מהו המשתנה התלוי ומהו המשתנה הבלתי תלוי ? הציגו את הנתונים בדיאגראמת פיזור‬
‫ב‪.‬‬
‫מהו מקדם המתאם‬
‫ג‪.‬‬
‫חשבו את קו הרגרסיה ומצאו כמה שיעורים פרטיים יש ללמוד כדי לקבל ציון של ‪? 94‬‬
‫‪.4‬‬
‫הנהלת בנק החליטה לבדוק האם קיים קשר בין מספר שנות הניסיון של היועץ בענף ההשקעות‪ ,‬לבין‬
‫התשואה שהשיג בתיק ההשקעות שלו‪ .‬התקבלו התוצאות הבאות ‪:‬‬
‫היועץ‬
‫‪ -Y‬תשואה שהשיג היועץ‬
‫‪ – X‬מספר שנות ניסיון‬
‫א‬
‫‪13‬‬
‫‪6‬‬
‫ב‬
‫‪8‬‬
‫‪2.5‬‬
‫ג‬
‫‪2‬‬‫‪1‬‬
‫ד‬
‫‪4‬‬
‫‪3‬‬
‫ה‬
‫‪5‬‬
‫‪2.5‬‬
‫ו‬
‫‪10‬‬
‫‪5‬‬
‫א‪.‬‬
‫מה תוכל לומר על הקשר בין התשואה שהשיג היועץ למספר שנות הניסיון שלו ?‬
‫ב‪.‬‬
‫האם ניתן לבצע תחזית לתשואה שישיג יועץ בעל ‪ 3‬שנות ותק ? אם כן‪ ,‬תן תחזית והסבר מדוע‬
‫היא שונה מהתוצאות הקיימות בלוח עבור ותק זהה‪ .‬אם לא‪ ,‬נמק מדוע‪.‬‬
‫ג‪.‬‬
‫האם ניתן לבצע תחזית לתשואה שישיג יועץ בעל ‪ 20‬שנות ותק ? אם כן‪ ,‬תן תחזית‪ .‬אם לא‪ ,‬נמק מדוע‪.‬‬
‫‪202‬‬
‫‪.5‬‬
‫במחקר שנערך בקרב טניסאים נתגלה מתאם חיובי בין הצלחותיהם בתחרויות על דשא לבין הצלחותיהם‬
‫בתחרויות על משטח קשה‪ .‬משמעות הדבר היא‪( :‬בחר בתשובה הנכונה)‬
‫א‪.‬‬
‫רוב הטניסאים שנוטים להיכשל בתחרויות על דשא‪ ,‬נוטים להצליח בתחרויות על משטח קשה‪.‬‬
‫ב‪.‬‬
‫אין קשר בין הצלחה על דשא לבין הצלחה על משטח קשה‪.‬‬
‫ג‪.‬‬
‫לטניסאי שהצליח בתחרות על משטח קשה כדאי להתחרות גם על דשא‪.‬‬
‫ד‪.‬‬
‫רוב הטניסאים שנוטים להצליח בתחרות על דשא זוכים בפרסים כספיים גבוהים‪.‬‬
‫‪.6‬‬
‫במדגם בגודל ‪ 20‬תצפיות על שני משתנים ‪ X :‬ו ‪ Y‬התקבלו התוצאות הבאות‪:‬‬
‫‪20‬‬
‫‪20‬‬
‫‪ X  Y  17800‬‬
‫‪20‬‬
‫‪ Y 2  232000‬‬
‫‪i 1‬‬
‫‪ X 2  2320‬‬
‫‪i 1‬‬
‫‪Y  100‬‬
‫‪X  10‬‬
‫‪i 1‬‬
‫מה ערכו של מקדם המתאם הליניארי ( ‪ ) rx , y‬בין ‪ X‬ו‪? Y -‬‬
‫א‪- 0.6875 .‬‬
‫ג‪- 0.000214 .‬‬
‫ב‪0.3125 .‬‬
‫ד‪0.48 .‬‬
‫‪.7‬‬
‫נתונה משוואת הרגרסיה הבאה‪ .Y = 50 + 0.5X1 – 0.8X2 :‬בחר תשובה אפשרית לגבי ‪.X2 ,X1 ,Y‬‬
‫א‪.‬‬
‫‪ Y‬שכר של פועל כפונקציה של ‪ – X1‬מספר הפריטים שמייצר ו‪ X2-‬מספר תלונות נגדו מצד הממונה עליו‪.‬‬
‫ב‪.‬‬
‫‪ Y‬שכר של פועל כפונקציה של ‪ – X1‬מספר שנות ותק ו‪ – X2-‬מספר שנות לימוד‪.‬‬
‫ג‪.‬‬
‫‪ Y‬שכר של פועל כפונקציה של ‪ – X1‬מספר היעדרויות לא מוצדקות ו‪ – X2-‬מספר פריטים שהוא מייצר‪.‬‬
‫ד‪.‬‬
‫התשובות א‪ ',‬ב'‪ ,‬ג' נכונות‬
‫‪.8‬‬
‫סטודנט ערך חישובים לבדיקת הקשר בין שני משתנים ‪ X‬ו‪ .Y-‬הוא מצא שמשוואת הרגרסיה היא‪:‬‬
‫‪ Y=4.13-0.6X‬וכי מקדם המתאם ‪ .R= - 1.55‬לאור הממצאים ניתן לקבוע כי‪:‬‬
‫א‪ .‬קיים קשר חיובי חזק בין שני המשתנים‪.‬‬
‫ב‪ .‬קיים קשר שלילי חלש בין המשתנים‪.‬‬
‫ג‪ .‬קיים קשר חיובי חלש בין שני המשתנים‪.‬‬
‫ד‪ .‬הסטודנט טעה בחישוביו‪.‬‬
‫‪.9‬‬
‫סטודנט המבצע מעבדה בפיסיקה התבקש לבנות מודל רגרסיה ליניארית כדי להסביר את ‪Y‬‬
‫בעזרת ‪ . X‬הוא קיבל את הנתונים הבאים המבוססים על מדגם הכולל ‪ 8‬מדידות‪:‬‬
‫‪8‬‬
‫כמו כן‪ ,‬שיפוע קו הרגרסיה הוא ‪ 0.4569‬מקדם המתאם בין המשתנים הוא‪:‬‬
‫א‪.‬‬
‫‪0.69‬‬
‫ב‪.‬‬
‫‪0.46‬‬
‫ג‪.‬‬
‫‪0.78‬‬
‫ד‪.‬‬
‫‪0.91‬‬
‫‪ X i2  14.24‬‬
‫‪X  1.25‬‬
‫‪i 1‬‬
‫‪8‬‬
‫‪ Yi2  4.83‬‬
‫‪Y  0.7125‬‬
‫‪i 1‬‬
‫‪203‬‬
‫‪.1‬‬
‫א‪.‬‬
‫‪5‬‬
‫‪6‬‬
‫‪3‬‬
‫‪4‬‬
‫‪2‬‬
‫‪0‬‬
‫מס ילדים ‪X‬‬
‫ב‪ .‬נחשב את מקדם המתאם‪:‬‬
‫‪ ( xi  x)  ( yi  y)  7.857‬‬
‫‪ y  1.293‬‬
‫‪ ( xi  x)( yi  y)  7.857  1.1224‬‬
‫‪7‬‬
‫‪1‬‬
‫מס איחורים ‪Y‬‬
‫‪7‬‬
‫‪6‬‬
‫‪5‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫‪0‬‬
‫‪n‬‬
‫) ‪COV ( XY‬‬
‫‪1.1224‬‬
‫‪‬‬
‫‪ 0.626‬‬
‫‪ x  y‬‬
‫‪1.385  1.293‬‬
‫‪ x  1.385‬‬
‫‪Y  3.571‬‬
‫‪X  3.285‬‬
‫‪COV ( XY ) ‬‬
‫‪r‬‬
‫מקדם המתאם בין מס' הילדים למס' האיחורים בחודש הוא ‪ – 0.626‬מתאם חיובי ‪.‬‬
‫ג‪.‬‬
‫‪‬‬
‫חישוב קו הרגרסיה‪:‬‬
‫‪Y  m y xi  n y‬‬
‫‪x‬‬
‫‪ 0.585‬‬
‫‪1.1224‬‬
‫‪(1.385) 2‬‬
‫‪‬‬
‫‪x‬‬
‫) ‪COV ( XY‬‬
‫‪x‬‬
‫‪2‬‬
‫‪‬‬
‫‪my ‬‬
‫‪x‬‬
‫‪n y  Y  m y  X  3.571  0.585  3.285  1.649‬‬
‫‪x‬‬
‫‪x‬‬
‫‪‬‬
‫‪Y  0.585 X i  1.649‬‬
‫‪‬‬
‫‪Y  0.585 X i  1.649‬‬
‫ד‪.‬‬
‫נציב בקו הרגרסיה ‪x=8‬‬
‫‪.2‬‬
‫כדי לחשב את ערכו של ‪ y‬עלינו למצוא את משוואת קו הרגרסיה ‪ ,‬מתוך הנתונים נמצא את )‪COV(XY‬‬
‫‪‬‬
‫‪Y  0.585  8  1.649  6.329‬‬
‫‪r  0.82‬‬
‫) ‪19.68  COV ( XY‬‬
‫‪y 6‬‬
‫‪Y  81‬‬
‫‪x  4‬‬
‫‪X  70‬‬
‫) ‪COV ( XY‬‬
‫) ‪COV ( XY‬‬
‫‪‬‬
‫‪ 0.82 ‬‬
‫‪‬‬
‫) ‪ 0.82  24  COV ( XY‬‬
‫‪ x  y‬‬
‫‪46‬‬
‫‪r‬‬
‫‪204‬‬
‫‪‬‬
‫‪Y  m y xi  n y‬‬
‫‪x‬‬
‫‪ 1.23‬‬
‫‪19.68‬‬
‫‪(4) 2‬‬
‫‪‬‬
‫‪x‬‬
‫) ‪COV ( XY‬‬
‫‪ 2x‬‬
‫‪my ‬‬
‫‪x‬‬
‫‪n y  Y  m y  X  81  1.23  70  5.1‬‬
‫‪x‬‬
‫‪x‬‬
‫‪‬‬
‫‪Y  1.23  X i  5.1‬‬
‫‪‬‬
‫‪Y  1.23  85  5.1  99.45‬‬
‫ערכו של ‪ y‬הוא ‪. 99.45‬‬
‫‪.3‬‬
‫א‪.‬‬
‫הציון הוא המשתנה התלוי מאחר הוא תלוי במס' השיעורים הפרטיים‪.‬‬
‫שעורים פרטיים – בלתי תלוי‪.‬‬
‫‪10‬‬
‫‪6‬‬
‫‪8‬‬
‫‪2‬‬
‫‪4‬‬
‫ציון מבחן‬
‫‪120‬‬
‫‪100‬‬
‫‪80‬‬
‫‪60‬‬
‫‪40‬‬
‫‪20‬‬
‫‪0‬‬
‫‪0‬‬
‫שיעורים פרטיים‬
‫ע"פ דיאגראמת הפיזור ניתן לראות כי אין קשר בין שני המשתנים – העקומה חסרת כיוון ברור‪.‬‬
‫ב‪.‬‬
‫נחשב את מקדם המתאם‪:‬‬
‫‪ ( xi  x)  ( yi  y)  17.2857‬‬
‫‪ y  8.06‬‬
‫‪Y  88.85‬‬
‫‪ ( xi  x)( yi  y)   17.2857  2.4693‬‬
‫‪ x  2.657‬‬
‫‪X  3.714‬‬
‫‪COV ( XY ) ‬‬
‫‪n‬‬
‫‪7‬‬
‫) ‪COV ( XY‬‬
‫‪ 2.4693‬‬
‫‪r‬‬
‫‪‬‬
‫‪ 0.115‬‬
‫‪ x  y‬‬
‫‪2.657  8.06‬‬
‫מקדם המתאם ‪ r  0.115‬המשמעות היא שאין קשר בין שיעורים פרטיים לציון ‪ ,‬מקדם המתאם שואף ל‪.0-‬‬
‫ג‪.‬‬
‫מאחר ואין מתאם ‪ ,‬אין יכולת ניבוי ולכן קו הרגרסיה אינו רלוונטי‪.‬‬
‫‪205‬‬
‫‪.4‬‬
‫נחשב את מקדם המתאם‪:‬‬
‫‪x  y  21.08‬‬
‫‪ xi yi  170.5‬‬
‫‪ y  4.784‬‬
‫‪ x  1.675‬‬
‫‪Y  6.33‬‬
‫‪X  3.33‬‬
‫נשתמש בנוסחה השנייה לחישוב ה‪COV(XY) -‬‬
‫‪ xi yi  x  y  170.5  21.11  7.3066‬‬
‫‪n‬‬
‫‪6‬‬
‫) ‪COV ( XY‬‬
‫‪7.3066‬‬
‫‪‬‬
‫‪ 0.911‬‬
‫‪ x  y‬‬
‫‪1.675  4.784‬‬
‫‪COV ( XY ) ‬‬
‫‪r‬‬
‫מקדם המתאם בין מס שנות הוותק לתשואה הוא ‪ – 0.911‬מתאם חיובי חזק ‪ ,‬כלומר קיים קשר חיובי חזק בין מס'‬
‫שנות הוותק לתשואה‪.‬‬
‫ב‪.‬‬
‫‪‬‬
‫חישוב קו הרגרסיה‪:‬‬
‫‪Y  m y xi  n y‬‬
‫‪x‬‬
‫‪ 2.6‬‬
‫‪7.3066‬‬
‫‪(1.675) 2‬‬
‫‪‬‬
‫‪x‬‬
‫) ‪COV ( XY‬‬
‫‪x‬‬
‫‪2‬‬
‫‪‬‬
‫‪my ‬‬
‫‪x‬‬
‫‪n y  Y  m y  X  6.33  2.6  3.33  2.33‬‬
‫‪x‬‬
‫‪x‬‬
‫‪‬‬
‫‪Y  2.6 X i  2.33‬‬
‫נבצע תחזית לתשואה שישיג יועץ בעל ‪ 3‬שנות וותק ‪:‬‬
‫תחזית ליועץ בעל ‪ 3‬שנות ותק – נציב ‪xi  3‬‬
‫‪‬‬
‫‪y  2.6  3  2.35  5.45‬‬
‫יועץ בעל ‪ 3‬שנות ותק ישיג תשואה של ‪.5.45%‬‬
‫התחזית אינה זהה לתצפיות בלוח מאחר וקו הרגרסיה בנוי על ריבועי הסטיות מהקו ולכן מתקיים קירוב ‪ ,‬ככל‬
‫שמקדם המתאם גבוהה יותר כך הסטיות מקו האמצע קטנות – החיזוי טוב יותר ‪,‬‬
‫כאשר המתאם הוא ‪ r  1‬החיזוי מדויק‪.‬‬
‫ג‪.‬‬
‫מתמטית ניתן לבצע חיזוי מאחר ויצרנו קו רגרסיה לכן ניתן להציב ‪ xi  20‬ונקבל‬
‫‪‬‬
‫‪ . y  2.6  20  2.35  49.65‬בפועל חיזוי זה בעייתי – ברמה מציאותית קשה להניח שהתשואה גדלה באופן‬
‫ליניארי בכל שנת ותק ‪ -‬אדם עם ‪ 30‬שנות ותק יצור תשואות של ‪ ? 75%‬הסיבה לכך נובעת מכך שהערך ‪20‬‬
‫גבוה באופן חריג מכל ערכי חמשת ערכי המדגם ‪ ,‬עליהם נבנה קו הרגרסיה סביר להניח כי אם היינו משלבים‬
‫במדגם גם אנשים ברמות וותק כאלו היינו מקבלים מתאם אחר וקו רגרסיה אחר‪.‬‬
‫‪206‬‬
‫‪.5‬‬
‫ניתן לראות ע"פ השאלה כי קיים קשר חיובי בין ההצלחה בתחרויות על דשא להצלחה בתחרויות על‬
‫משטח קשה לכן התשובה הנכונה היא ג‪.‬‬
‫א – מצביעה על קשר שלילי ‪ ,‬ב – מצביעה כי לא קיים קשר ‪ ,‬ד – אין כל קשר למתאם בין שתי התחרויות‪.‬‬
‫) ‪COV ( XY‬‬
‫חישוב מקדם המתאם ‪:‬‬
‫‪ x  y‬‬
‫‪.6‬‬
‫‪r‬‬
‫‪ xi yi  n  x  y   xi yi  x  y‬‬
‫‪n‬‬
‫‪n‬‬
‫‪COV ( XY ) ‬‬
‫‪ xi 2  X 2‬‬
‫‪17800  20 10 100  110‬‬
‫תשובה א נכונה‪.‬‬
‫‪232000‬‬
‫‪ 100 2  40‬‬
‫‪20‬‬
‫‪20‬‬
‫‪COV ( XY ) ‬‬
‫‪2320‬‬
‫‪ 10 2  4‬‬
‫‪20‬‬
‫‪y ‬‬
‫‪ 110‬‬
‫‪ 0.6875‬‬
‫‪4  40‬‬
‫‪.7‬‬
‫‪n‬‬
‫‪‬‬
‫‪x ‬‬
‫‪r‬‬
‫ע"פ המשוואה הפועל מקבל תוספת של ‪ ₪ 0.5‬עבור ‪ X1‬ומורידים לו ‪ ₪ 0.8‬עבור ‪X2‬‬
‫התשובה הנכונה א‪.‬‬
‫מקבל תוספת עבור מספר הפריטים ומנקים לו עבור מס' התלונות‪.‬‬
‫‪.8‬‬
‫‪  1  r  1‬בתשובה בשאלה ‪ r=-1.55‬נתון זה בלתי אפשרי ‪.‬‬
‫תשובה ד' נכונה‬
‫‪.9‬‬
‫‪8‬‬
‫‪ Yi 2  4.83‬‬
‫‪8‬‬
‫‪ X i 2  14.25‬‬
‫‪Y  0.7125‬‬
‫‪i 1‬‬
‫) ‪COV ( XY‬‬
‫‪ x  y‬‬
‫‪X  1.25‬‬
‫‪i 1‬‬
‫‪r‬‬
‫‪ Xi2  X 2‬‬
‫‪n‬‬
‫‪‬‬
‫) ‪COV ( XY‬‬
‫‪2‬‬
‫‪x‬‬
‫‪my ‬‬
‫‪x‬‬
‫נעזר בנתונים ובנוסחאות הנ"ל ‪ ,‬נחשב את סטיות התקן לשני המשתנים‪:‬‬
‫‪14.24‬‬
‫‪4.83‬‬
‫‪ 1.25 2  0.2175‬‬
‫‪y ‬‬
‫‪ 0.7125 2  0.096‬‬
‫‪8‬‬
‫‪8‬‬
‫) ‪COV ( XY‬‬
‫‪0.4569 ‬‬
‫) ‪0.09937575  COV ( XY‬‬
‫‪0.2175‬‬
‫‪0.09937575‬‬
‫‪r‬‬
‫‪ 0.6877‬‬
‫‪0.2175  0.096‬‬
‫‪x ‬‬
‫‪207‬‬
‫‪2‬‬
‫מבחן ‪ ‬לאי תלות‬
‫מבחן ‪  2‬שייך לקבוצת מבחנים סטטיסטיים הנקראת סטטיסטיקה א – פרמטרית‬
‫במבחני סטטיסטיים קודמים בהם עסקנו הנחת היסוד הייתה ‪ -‬האוכלוסייה מתפלגת נורמאלית ‪ ,‬מאחר ועסקנו‬
‫במשתנים כמותיים‪.‬‬
‫קבוצה זו של מבחנים סטטיסטיים מאופיינת בכך שלא ניתן להניח התפלגות נורמאלית של האוכלוסיות שכן‬
‫המשתנים הם משתנים איכותיים (או נומינליים או מסולם סדר ) ‪.‬‬
‫מבחנים אלו נקראים מבחנים פרמטריים‪.‬‬
‫מבחן ‪  2‬הוא מבחן באמצעותו בודקים האם יש תלות (קשר) בין משתנים איכותיים‬
‫משתנים איכותיים – משתנים אשר לא ניתן לבצע עליהם ניתוחים כמותיים כמו ממוצע ‪ ,‬פיזור וכו' – צבע עיניים ‪,‬‬
‫שיער ‪ ,‬נמוך ‪ /‬גבוה וכו' משתנים נומינליים – משתנים שמיים ‪.‬‬
‫מבחן לאי תלות‬
‫המבחן מבוסס על השוואת בין נתונים בטבלת שכיחויות המבוססת על ניסוי (הנקראת ‪ , )observed‬לבין לטבלה‬
‫תיאורטית מקבילה (הנקראת ‪ ) expected‬המתארת מצב של אי תלות (חוסר קשר) בין שני המשתנים‬
‫שבטבלה במקורית‪.‬‬
‫כאשר הטבלה הנתונה שונה משמעותית מהטבלה התיאורטית – המשמעות היא קיום קשר ( תלות ) בטבלה המקורית‪.‬‬
‫הטבלה התיאורטית המקבילה (‪ )expected‬היא טבלה אותה אנו בונים בהסתמך על ידע הסתברותי המאפיין אי‬
‫תלות – כאשר אין תלות בין שני משתנים מתקיים ‪P A  B   P( A)  P( B) :‬‬
‫נתאר מצב של אי תלות בין שני משתנים בטבלה‪:‬‬
‫‪A‬‬
‫‪A‬‬
‫‪B‬‬
‫)‪P( A)  P( B‬‬
‫)‪P( A)  P( B‬‬
‫)‪P(B‬‬
‫‪B‬‬
‫)‪P( A)  P( B‬‬
‫)‪P( A)  P( B‬‬
‫)‪P(B‬‬
‫)‪P(A‬‬
‫)‪P(A‬‬
‫סה"כ =‪)100%( 1‬‬
‫כאשר שני משתנים מקיימים את התנאים הנ"ל אזי הם משתנים בלתי תלויים‪.‬‬
‫שאלה‬
‫במדינה מסוימת נבדק האם יש קשר בין מין (גבר‪/‬אישה) לצבע המכונית בה הוא נוהג‬
‫יש לבדוק האם קיים קשר בין מין הנהג לצבע הרכב ברמת מובהקות של ‪. 0.05‬‬
‫‪208‬‬
‫צבע המכונית‬
‫מין הנהג‬
‫אדום‬
‫שחור‬
‫צבע אחר‬
‫סה"כ‬
‫גברים‬
‫‪40‬‬
‫‪37‬‬
‫‪48‬‬
‫‪125‬‬
‫נשים‬
‫‪50‬‬
‫‪23‬‬
‫‪2‬‬
‫‪75‬‬
‫סה"כ‬
‫‪90‬‬
‫‪60‬‬
‫‪50‬‬
‫‪200‬‬
‫על בסיס נתונים אלו ועל בסיס הטבלה המראה מצב של אי תלות ‪ -‬נבנה טבלה המעידה על אי תלות‪.‬‬
‫אדום‬
‫צבע אחר‬
‫שחור‬
‫סה"כ‬
‫גברים‬
‫‪125‬‬
‫נשים‬
‫‪75‬‬
‫סה"כ‬
‫‪90‬‬
‫‪60‬‬
‫‪50‬‬
‫‪90‬‬
‫‪200‬‬
‫נהפוך את הטבלה לטבלת הסתברויות‪:‬‬
‫‪200‬‬
‫‪125‬‬
‫‪200‬‬
‫אדום‬
‫צבע אחר‬
‫שחור‬
‫סה"כ‬
‫גברים‬
‫‪0.625‬‬
‫נשים‬
‫‪0.375‬‬
‫סה"כ‬
‫‪0.45‬‬
‫‪0.3‬‬
‫ע"פ הגדרת טבלה המקיימת שני משתנים בלתי תלויים‬
‫נבנה את טבלת ההסתברויות‪:‬‬
‫‪0.25‬‬
‫‪0.45*0.625‬‬
‫‪1‬‬
‫‪0.25*0.625‬‬
‫אדום‬
‫שחור‬
‫צבע אחר‬
‫סה"כ‬
‫גברים‬
‫‪0.28125‬‬
‫‪0.1875‬‬
‫‪0.15625‬‬
‫‪0.625‬‬
‫נשים‬
‫‪0.16875‬‬
‫‪0.1125‬‬
‫‪0.09375‬‬
‫‪0.375‬‬
‫סה"כ‬
‫‪0.45‬‬
‫‪0.3‬‬
‫‪0.25‬‬
‫‪1‬‬
‫נכפיל את ערכי ההסתברות בסה"כ של הטבלה המקורית (‪ )200‬ונקבל טבלה החדשה המתארת את הערכים‬
‫המתארים מצב של אי תלות – טבלת ה‪.expected-‬‬
‫אדום‬
‫שחור‬
‫צבע אחר‬
‫סה"כ‬
‫גברים‬
‫‪56.25‬‬
‫‪37.5‬‬
‫‪31.25‬‬
‫‪125‬‬
‫נשים‬
‫‪33.75‬‬
‫‪22.5‬‬
‫‪18.75‬‬
‫‪75‬‬
‫סה"כ‬
‫‪90‬‬
‫‪60‬‬
‫‪50‬‬
‫‪200‬‬
‫‪209‬‬
‫הטבלה אשר יצרנו הינה טבלת הערכים במצב בו אין תלות בין המשתנים את טבלה זו נבחן מול הטבלה המקורית‪.‬‬
‫הטבלה המקורית – טבלת התצפית – ‪Observed‬‬
‫אדום‬
‫שחור‬
‫צבע אחר‬
‫סה"כ‬
‫גברים‬
‫‪40‬‬
‫‪37‬‬
‫‪48‬‬
‫‪125‬‬
‫נשים‬
‫‪50‬‬
‫‪23‬‬
‫‪2‬‬
‫‪75‬‬
‫סה"כ‬
‫‪90‬‬
‫‪60‬‬
‫‪50‬‬
‫‪200‬‬
‫הטבלה אשר בנינו – הטבלה אשר נצפה למצוא כאשר אין קשר בין המשתנים ‪Expected -‬‬
‫אדום‬
‫שחור‬
‫צבע אחר‬
‫סה"כ‬
‫גברים‬
‫‪56.25‬‬
‫‪37.5‬‬
‫‪31.25‬‬
‫‪125‬‬
‫נשים‬
‫‪33.75‬‬
‫‪22.5‬‬
‫‪18.75‬‬
‫‪75‬‬
‫סה"כ‬
‫‪90‬‬
‫‪60‬‬
‫‪50‬‬
‫‪200‬‬
‫מטרת המבחן – לבדוק האם קיים קשר בין המשתנים‪.‬‬
‫ביצוע המבחן בפועל – בדיקה האם הפער בין כל נתון בטבלה הצפויה המייצגת חוסר קשר לבין טבלת הנתונים‬
‫אשר נצפו בפועל הוא פער מובהק‪.‬‬
‫כאשר הפער הוא פער מובהק‪ ,‬המשמעות היא שהנתונים אשר התקבלו מעידים כי קיים קשר בין המשתנים‪.‬‬
‫‪210‬‬
‫א‪.‬‬
‫‪H0‬‬
‫‪:‬‬
‫אין תלות בין מין הנהג לצבע המכונית אותה הוא נוהג‬
‫‪H1‬‬
‫‪:‬‬
‫יש תלות בין מין הנהג לצבע המכונית‬
‫ב‪.‬‬
‫רמת מובהקות המבחן ‪  0.05‬‬
‫ג‪.‬‬
‫תחומי דחייה ‪ /‬קבלה ל‪H 0 -‬‬
‫את הגבול הקריטי מוצאים בטבלת‬
‫‪2‬‬
‫‪‬‬
‫‪C 2 R 1C 1,1‬‬
‫דרגות החופש נקבעות ע"י העמודות והשורות בטבלה – ‪( R‬שורות) ‪( C ,‬עמודות)‪.‬‬
‫‪ C 2 21 31,0.95   C 2 2,0.95  5.99‬‬
‫מה בוחנים מול הגבול הקריטי ?‬
‫הערך הנבחן מול הגבול הקריטי הוא סכום ריבוע הסטיות בין טבלת הנצפה לצפוי ביחס לצפוי‪:‬‬
‫‪Expected‬‬
‫‪(40  56.25) 2 (50  33.75) 2 (37  37.5) 2 (23  22.5) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪56.25‬‬
‫‪33.75‬‬
‫‪37.5‬‬
‫‪22.5‬‬
‫‪‬‬
‫‪oij  eij 2‬‬
‫‪eij‬‬
‫‪(48  31.25) 2 (2  18.75) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪ 36.48‬‬
‫‪31.25‬‬
‫‪18.75‬‬
‫‪2  ‬‬
‫‪Observed‬‬
‫אם הערך הנבדק גבוה מהגבול הקריטי – דוחים את ‪H 0‬‬
‫‪36.48‬‬
‫ד‪.‬‬
‫ערך‬
‫ה‪.‬‬
‫‪5.99‬‬
‫החלטה‬
‫‪2‬‬
‫‪‬‬
‫הנבדק ‪ , 36.48‬גבוה מהגבול הקריטי ‪ , 5.99‬לכן נדחה את השערת האפס‪ -‬בין המשתנים קיימת תלות‪.‬‬
‫מאחר ודחינו את השערת האפס השגיאה האפשרית היא שגיאה מסוג ראשון ‪‬‬
‫‪211‬‬
‫‪.1‬‬
‫לבדיקת הטענה הרווחת כי לכדורגלנים יש משיכה לדוגמניות נבדקו כדורגלנים ונשאלו על בנות הזוג‬
‫שלהן – הנתונים בטבלה‪:‬‬
‫בדקו האם קיים קשר ברמת מובהקות של ‪.0.05‬‬
‫כדורגלן‬
‫‪65‬‬
‫‪33‬‬
‫‪98‬‬
‫דוגמנית‬
‫לא דוגמנית‬
‫‪.2‬‬
‫לא כדורגלן‬
‫‪62‬‬
‫‪40‬‬
‫‪102‬‬
‫‪127‬‬
‫‪73‬‬
‫‪200‬‬
‫נבדקו הרגלי שתית האלכוהול של ‪ 100‬מהמרים ו‪ 100-‬שאינם מהמרים במטרה לבדוק האם קיימת תלות‬
‫בין אלכוהול והימורים‪ .‬בדקו את הטענה ברמת מובהקות של ‪. 0.01‬‬
‫בקבוק אלכוהול ביום‬
‫‪22‬‬
‫‪13‬‬
‫‪35‬‬
‫מהמרים‬
‫לא מהמרים‬
‫‪.3‬‬
‫‪100‬‬
‫‪100‬‬
‫‪200‬‬
‫בדקו האם קיימת תלות בין אזור מגורים לקבלה לקורס טיס ברמת מובהקות של ‪.0.05‬‬
‫קיבוצים‬
‫‪36‬‬
‫‪19‬‬
‫‪55‬‬
‫מתקבלים‬
‫לא מתקבלים‬
‫‪.4‬‬
‫‪ 2‬כוסות אלכוהול ביום‬
‫‪45‬‬
‫‪34‬‬
‫‪79‬‬
‫מקסימום כוס ביום‬
‫‪33‬‬
‫‪53‬‬
‫‪86‬‬
‫מושבים‬
‫‪24‬‬
‫‪21‬‬
‫‪45‬‬
‫עירונים‬
‫‪48‬‬
‫‪42‬‬
‫‪90‬‬
‫‪108‬‬
‫‪82‬‬
‫‪190‬‬
‫במטרה לבדוק הבדלים במספר האיחורים בשנה בין עובדים וותיקים לחדשים בחברה מסוימת ‪ ,‬נרשמו‬
‫ציונים למספר האיחורים לכל עובד ‪:‬‬
‫עובדים ותיקים‬
‫עובדים חדשים‬
‫סה"כ‬
‫ציון לא טוב‬
‫‪29‬‬
‫‪28‬‬
‫‪57‬‬
‫ציון טוב‬
‫‪95‬‬
‫‪35‬‬
‫‪130‬‬
‫‪124‬‬
‫‪63‬‬
‫‪187‬‬
‫האם ניתן לומר ברמת מובהקות של ‪ 5%‬שקיימת תלות בין מספר האיחורים לוותק העובד ?‬
‫‪.5‬‬
‫חברה בודקת צוות את צוות השיווק במטרה לבדוק האם קיים הבדל ביכולת בין עובדים בעלי תואר ראשון‬
‫לבין עובדים ללא השכלה אקדמית‪ .‬האם קיימת תלות בין היכולת השיווקית להצלחה ‪  0.05‬‬
‫עסקאות‬
‫עובדים‬
‫מוצלחות‬
‫סה"כ‬
‫חדשים‬
‫בעל תואר‬
‫‪30‬‬
‫‪10‬‬
‫‪40‬‬
‫חסר תואר‬
‫‪14‬‬
‫‪46‬‬
‫‪60‬‬
‫‪44‬‬
‫‪56‬‬
‫‪100‬‬
‫‪212‬‬
‫‪.1‬‬
‫‪65‬‬
‫‪33‬‬
‫‪98‬‬
‫סה"כ‬
‫‪62‬‬
‫‪40‬‬
‫‪102‬‬
‫‪127‬‬
‫‪73‬‬
‫‪200‬‬
‫הטבלה היא טבלת הצפייה –‪. o‬‬
‫נבנה את הטבלה הצפויה למצב של אי תלות – ‪. e‬‬
‫‪62.23‬‬
‫‪35.77‬‬
‫‪98‬‬
‫סה"כ‬
‫‪64.77‬‬
‫‪37.23‬‬
‫‪102‬‬
‫‪127‬‬
‫‪73‬‬
‫‪200‬‬
‫א‪.‬‬
‫‪H0‬‬
‫‪:‬‬
‫אין משיכה‪/‬תלות בין כדורגלנים לדוגמניות‬
‫‪H1‬‬
‫‪:‬‬
‫יש משיכה‪/‬תלות בין כדורגלנים לדוגמניות‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪C 2 R 1C 1,1‬‬
‫‪C 22121,0.95  C 21,0.95  3.84‬‬
‫הערך הנבחן מול הגבול הקריטי‪:‬‬
‫‪oij  eij 2  (65  62.23)2  (33  35.77)2  (62  64.77)2  (40  37.23)2  0.66‬‬
‫‪37.23‬‬
‫‪64.775‬‬
‫‪35.77‬‬
‫‪62.23‬‬
‫‪eij‬‬
‫‪ ‬‬
‫‪2‬‬
‫‪213‬‬
‫‪3.84‬‬
‫ד‪.‬‬
‫ערך‬
‫‪0.66‬‬
‫החלטה‬
‫‪2‬‬
‫‪‬‬
‫הנבדק ‪ , 0.66‬קטן מהגבול הקריטי ‪ , 3.84‬לכן נקבל את השערת האפס אין תלות בין כדורגלנים‬
‫לדוגמניות‪.‬‬
‫ה‪.‬‬
‫מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני ‪.‬‬
‫‪.2‬‬
‫מהמרים‬
‫‪22‬‬
‫‪13‬‬
‫‪35‬‬
‫‪45‬‬
‫‪34‬‬
‫‪79‬‬
‫‪33‬‬
‫‪53‬‬
‫‪86‬‬
‫‪100‬‬
‫‪100‬‬
‫‪200‬‬
‫הטבלה היא טבלת הצפייה – ‪. o‬‬
‫מהמרים‬
‫‪17.5‬‬
‫‪17.5‬‬
‫‪35‬‬
‫‪39.5‬‬
‫‪39.5‬‬
‫‪79‬‬
‫‪43‬‬
‫‪43‬‬
‫‪86‬‬
‫‪100‬‬
‫‪100‬‬
‫‪200‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫‪H0‬‬
‫‪:‬‬
‫אין תלות בין אלכוהול להימורים‬
‫‪H1‬‬
‫‪:‬‬
‫יש תלות בין אלכוהול להימורים לדוגמניות‬
‫‪214‬‬
‫ג‬
‫‪2‬‬
‫‪‬‬
‫‪C 2 R 1C 1,1‬‬
‫‪C 22131,0.99  C 22,0.95  9.21‬‬
‫‪(22  17.5) 2 (13  17.5) 2 (45  39.5) 2 (34  39.5) 2 (33  43) 2 (53  43) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ 8.49‬‬
‫‪17.5‬‬
‫‪17.5‬‬
‫‪39.5‬‬
‫‪39.5‬‬
‫‪43‬‬
‫‪43‬‬
‫‪‬‬
‫‪oij  eij 2‬‬
‫‪eij‬‬
‫‪ ‬‬
‫‪2‬‬
‫אזור קבלת ‪H 0‬‬
‫אזור דחית ‪H 0‬‬
‫‪9.21‬‬
‫ד‪.‬‬
‫ערך‬
‫‪8.49‬‬
‫החלטה‬
‫‪2‬‬
‫‪‬‬
‫הנבדק ‪ 8.49‬קטן מהגבול הקריטי ‪ , 9.21‬לכן נקבל את השערת האפס אין תלות בין אלכוהול להימורים‪.‬‬
‫חשוב לציין – אם נבדוק בטבלה נוכל לראות כי עבור רמת מובהקות גבוהה יותר – ‪ 0.05 0.025‬היינו דוחים את‬
‫השערת האפס‬
‫ה‪.‬‬
‫מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני‪.‬‬
‫‪215‬‬
‫‪.3‬‬
‫טבלת הצפייה – ‪. o‬‬
‫‪36‬‬
‫‪19‬‬
‫‪55‬‬
‫‪48‬‬
‫‪42‬‬
‫‪90‬‬
‫מושבים‬
‫‪24‬‬
‫‪21‬‬
‫‪45‬‬
‫‪108‬‬
‫‪82‬‬
‫‪190‬‬
‫‪31.26‬‬
‫‪23.74‬‬
‫‪55‬‬
‫‪51.16‬‬
‫‪38.84‬‬
‫‪90‬‬
‫מושבים‬
‫‪25.58‬‬
‫‪19.42‬‬
‫‪45‬‬
‫‪108‬‬
‫‪82‬‬
‫‪190‬‬
‫א‪.‬‬
‫‪H0‬‬
‫‪:‬‬
‫אין תלות בין אזור מגורים לקבלה לקורס טיס‬
‫‪H1‬‬
‫‪:‬‬
‫יש תלות בין אזור מגורים לקבלה לקורס טיס‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪C 2 R 1C 1,1‬‬
‫‪C 22131,0.95  C 22,0.95  5.99‬‬
‫‪oij  eij 2  (36  31.26)2  (19  23.74)2  (24  25.58)2  (21  19.42)2  (48  51.16)2  (42  38.84)2  2.34‬‬
‫‪38.84‬‬
‫‪51.16‬‬
‫‪19.42‬‬
‫‪25.58‬‬
‫‪23.74‬‬
‫‪31.26‬‬
‫‪eij‬‬
‫‪ ‬‬
‫‪2‬‬
‫‪216‬‬
‫‪5.99‬‬
‫ד‪.‬‬
‫ערך‬
‫‪2.34‬‬
‫החלטה‬
‫‪2‬‬
‫‪‬‬
‫הנבדק ‪ 2.34‬קטן מהגבול הקריטי ‪ , 5.99‬לכן נקבל את השערת האפס אין תלות בין אזור מגורים‬
‫לקבלה לקורס טיס‪.‬‬
‫ה‪.‬‬
‫מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני‪.‬‬
‫‪.4‬‬
‫‪95‬‬
‫‪35‬‬
‫‪130‬‬
‫סה"כ‬
‫‪29‬‬
‫‪28‬‬
‫‪57‬‬
‫‪124‬‬
‫‪63‬‬
‫‪187‬‬
‫‪86.2‬‬
‫‪43.8‬‬
‫‪130‬‬
‫סה"כ‬
‫‪37.8‬‬
‫‪19.2‬‬
‫‪57‬‬
‫‪124‬‬
‫‪63‬‬
‫‪187‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫‪H0‬‬
‫‪:‬‬
‫אין תלות בין מספר האיחורים לוותק‬
‫‪H1‬‬
‫‪:‬‬
‫יש תלות בין מספר האיחורים לוותק‬
‫‪217‬‬
‫ג‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪C 2 R 1C 1,1‬‬
‫‪C 22121,0.95  C 21,0.95  3.84‬‬
‫‪oij  eij 2  (95  86.2)2  (35  43.8)2  (29  37.8)2  (28  19.2)2  8.74‬‬
‫‪19.2‬‬
‫‪37.8‬‬
‫‪86.2‬‬
‫‪43.8‬‬
‫‪eij‬‬
‫‪ ‬‬
‫‪2‬‬
‫‪8.74‬‬
‫ד‪.‬‬
‫ערך‬
‫‪3.84‬‬
‫החלטה‬
‫‪2‬‬
‫‪‬‬
‫הנבדק ‪ , 8.74‬ערך זה גבוה מהגבול הקריטי ‪ - , 3.84‬נמצא בתחום דחיית השערת האפס‪.‬‬
‫נדחה את השערת האפס יש תלות בין מספר האיחורים לוותק‪.‬‬
‫ה‪.‬‬
‫מאחר ודחינו את השערת האפס השגיאה האפשרית היא שגיאה מסוג ראשון ‪.‬‬
‫‪218‬‬
‫‪.5‬‬
‫‪30‬‬
‫‪10‬‬
‫‪40‬‬
‫עסקאות מוצלחות‬
‫סה"כ‬
‫‪14‬‬
‫‪46‬‬
‫‪60‬‬
‫‪44‬‬
‫‪56‬‬
‫‪100‬‬
‫‪17.6‬‬
‫‪22.4‬‬
‫‪40‬‬
‫עסקאות מוצלחות‬
‫סה"כ‬
‫‪26.4‬‬
‫‪33.6‬‬
‫‪60‬‬
‫‪44‬‬
‫‪56‬‬
‫‪100‬‬
‫א‪.‬‬
‫‪H0‬‬
‫‪:‬‬
‫אין תלות בין יכולת השיווק להשכלה האקדמית‪.‬‬
‫‪H1‬‬
‫‪:‬‬
‫יש תלות בין יכולת השיווק להשכלה האקדמית‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪C 2 R 1C 1,1‬‬
‫‪C 22121,0.95  C 21,0.95  3.84‬‬
‫‪oij  eij 2  (30  17.6)2  (10  22.4)2  (14  26.4)2  (46  33.6)2  26‬‬
‫‪33.6‬‬
‫‪26.4‬‬
‫‪22.4‬‬
‫‪17.6‬‬
‫‪eij‬‬
‫‪ ‬‬
‫‪2‬‬
‫‪219‬‬
‫‪26‬‬
‫ד‪.‬‬
‫ערך‬
‫‪3.84‬‬
‫החלטה‬
‫‪2‬‬
‫‪‬‬
‫הנבדק ‪ , 26‬ערך זה גבוה מהגבול הקריטי ‪ - , 3.84‬נמצא בתחום דחיית השערת האפס‪.‬‬
‫נדחה את השערת האפס יש תלות השכלה אקדמית ליכולת השיווק‪.‬‬
‫ה‪.‬‬
‫מאחר ודחינו את השערת האפס השגיאה האפשרית היא שגיאה מסוג ראשון ‪.‬‬
‫‪220‬‬
‫שימוש בתוכנת ‪ Excel‬להסקה סטטיסטית‬
‫בפרק זה נדון בשימוש באקסל לצורך הסקה סטטיסטית‪.‬‬
‫לפני שמתחילים בניתוח סטטיסטי באקסל יש לבחור במבחן‪ /‬פעולה הסטטיסטית המבוקשת ‪ ,‬באופן הבא‪:‬‬
‫בוחרים בתפריט כלים ‪Data Analysis ‬‬
‫אם האופציה ‪ Data Analysis‬לא קיימת יש להתקינה ע"י כלים ‪ ‬תוספות ‪ ‬וסימון ‪Analysis Tool Pack‬‬
‫יופיע החלון הבא‪( :‬ניתן לבחור כל מבחן סטטיסטי כרצוננו)‪.‬‬
‫‪221‬‬
‫מבחני הסקה סטטיסטית‬
‫מבחן ‪ t‬להפרש תוחלות ‪ 2 -‬מדגמים בלתי תלויים ‪ ,‬שונויות לא ידועות אך שוות‬
‫שאלה‬
‫בית ספר רצה לבחון אם תוכנית לימוד חדשה תשפר את הישגי התלמידים בספרות ‪.‬‬
‫נלקח מדגם אקראי של ‪ 10‬תלמידים אשר למדו בתוכנית החדשה ‪ ,‬ו‪ 10-‬תלמידים אשר למדו בתוכנית הרגילה‬
‫תוכנית חדשה‬
‫‪68 , 81 , 85 , 75 , 79 , 91 , 84 , 86 , 95 , 78‬‬
‫תוכנית רגילה‬
‫‪75 , 85 , 71 , 74 , 88 , 91 , 95 , 71 ,76 , 84‬‬
‫בדקו את הטענה ברמת מובהקות של ‪  0.05‬‬
‫שלבי עבודה ב‪Excel -‬‬
‫‪.1‬‬
‫פתח חוברת עבודה ב – ‪ .Excel‬צור גיליון בשם תוכניות לימודים ורשמו את תצפיות שני המדגמים‪.‬‬
‫‪.2‬‬
‫בחר ב – כלים ‪t – Test: Two – Sample assuming equal variances :Data Analysis‬‬
‫לחצו ‪ ok‬לאישור‪.‬‬
‫‪222‬‬
‫טווחי הנתונים‬
‫‪ .3‬ייפתח התפריט הבא‪:‬‬
‫רמת‬
‫מובהקות‬
‫כותרות‬
‫במידה ורוצים‬
‫להוסיף‬
‫הפרש‬
‫הממוצעים‬
‫ע"פ‬
‫השערת‬
‫האפס ‪0 -‬‬
‫סימון מיקום‬
‫הופעת הפלט‬
‫‪ .4‬לחצו ‪ ok‬לאישור‪ ,‬וקבלו את הפלט היכן שביקשת‪.‬‬
‫‪ .5‬יתקבל הפלט הבא‪:‬‬
‫ממוצע‬
‫‪Mean‬‬
‫חדשה‬
‫רגילה‬
‫‪83.4‬‬
‫‪76‬‬
‫‪37.6‬‬
‫‪25.11‬‬
‫‪10‬‬
‫‪10‬‬
‫^‬
‫אומדן השונות מתוך המדגם ‪S‬‬
‫‪Variance‬‬
‫– מס' תצפיות – גודל המדגם ‪n‬‬
‫‪Observations‬‬
‫שונות משוקללת‬
‫‪Pooled Variance‬‬
‫‪H0‬‬
‫‪Hypothesized Mean Difference‬‬
‫‪Df‬‬
‫‪t Stat‬‬
‫‪P(T<=t) one-tail‬‬
‫‪-‬‬
‫‪  0‬‬
‫‪‬‬
‫‪1‬‬
‫‪1‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪31.355‬‬
‫‪0‬‬
‫‪18‬‬
‫‪ t n1 n 22,1 ‬‬
‫‪t18,1 ‬‬
‫‪2.955014‬‬
‫ההסתברות לשגיאה ( ‪ ‬האמיתית) השערה חד כיוונית‬
‫‪0.004237‬‬
‫‪ t Critical one-tail‬ערך ‪ t‬בטבלה – חד כיווני‬
‫‪1.734‬‬
‫‪ P(T<=t) two-tail‬הסתברות לשגיאה ( ‪ ‬האמיתית) ‪ ,‬השערה דו כיוונית‬
‫‪0.008474‬‬
‫‪ t Critical two-tail‬ערך ‪ t‬בטבלה – דו כיווני‬
‫‪2.100924‬‬
‫באמצעות פלט מחשב זה ניתן להגיע למסקנות בדרך מהירה יותר – בוחנים באמצעות ההסתברויות ללא צורך לחשב‬
‫את הגבול הקריטי אם‬
‫במקרה של שני מדגמים אם‬
‫‪ Tstat  Tn1,1‬דוחים את ‪H 0‬‬
‫‪ Tstat  Tn1n22,1‬דוחים את ‪. H 0‬‬
‫‪223‬‬
‫‪ .6‬ננתח את התוצאות ע"פ שתי הדרכים שלמדנו – שתי הדרכים המקובלות‪:‬‬
‫השערה חד כיוונית – כלפי מעלה – המטרה היא לבדוק האם שיטת הלימוד החדשה משפרת את הישגי‬
‫א‪.‬‬
‫התלמידים בספרות‪.‬‬
‫‪.1‬‬
‫‪1   2  0‬‬
‫‪1    0‬‬
‫‪2‬‬
‫‪ H 0 :‬השיטה החדשה אינה משפרת את הישגי התלמידים‬
‫‪H1 :‬‬
‫השיטה החדשה משפרת את הישגי התלמידים‪.‬‬
‫‪.2‬‬
‫דרך גבולות קריטיים‪:‬‬
‫תחום י קבלה ודחית ‪H 0‬‬
‫‪.3‬‬
‫‪2‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪C  1   2  tn1 n 22,1 ‬‬
‫‪2‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪31.355 31.355‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ 2.5041‬‬
‫‪n1 n2‬‬
‫‪10‬‬
‫‪10‬‬
‫‪t18,0.95  1.734‬‬
‫‪1   2  0‬‬
‫‪C  0  1.734  2.504  4.34‬‬
‫‪H0‬‬
‫‪7.4‬‬
‫‪.4‬‬
‫‪4.34‬‬
‫‪0‬‬
‫נדחה את השערת האפס ונקבל את השערת המחקר – מאחר וההפרש בין הממוצעים ‪ ,7.4‬נמצא בתחום דחיית‬
‫השערת האפס – השיטה החדשה משפרת את הישגי התלמידים בספרות‪.‬‬
‫‪.5‬‬
‫מאחר ודחינו את השערת האפס ‪ ,‬השגיאה האפשרית ‪ -‬דחינו את השערת האפס בזמן שהיא נכונה כלומר שגיאה‬
‫מסוג ‪‬‬
‫ההסתברות האמיתית לשגיאה היא בעצם רמת המובהקות הקטנה ביותר בה עדיין נקבל את אותן מסקנות ‪-‬‬
‫ההסתברות לקבל ערך גבוה מהערך שקיבלנו להפרש ‪.7.4‬‬
‫‪224‬‬
‫‪1‬‬
‫‪1‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪‬‬
‫‪C  0  t n1 n 22,1  S‬‬
‫‪7.4  0  t18,1  2.5041‬‬
‫‪2.955  t18,1‬‬
‫שימו לב – זהו הערך המופיע בפלט המחשב ‪t Stat --‬‬
‫‪0.995  1    0.9995‬‬
‫‪0.0005    0.005‬‬
‫באמצעות המחשב ניתן להגיע לתוצאה מדויקת יותר מאשר בטבלאות‬
‫‪  0.00423‬‬
‫הערך המופיע בפלט ‪-‬‬
‫ב‪ .‬דרך תוצאות הפלט כפי שהן – דרך ההסתברויות‪:‬‬
‫‪.3‬‬
‫תחום קבלה ודחית ‪H 0‬‬
‫‪Tstat  2.955‬‬
‫‪Tn1 n 22,1  1.734‬‬
‫‪H0‬‬
‫‪0‬‬
‫‪1.734 2.955‬‬
‫ערכים אלו מתייחסים להסתברויות ‪ /‬לשטחים הנמצאים מתחת לעקומת ההתפלגות משמאל לערכים‪.‬‬
‫‪.4‬‬
‫אם ‪ Tstat  Tn1n22,1‬דוחים את השערת האפס ‪2.955  1.734‬‬
‫נדחה את השערת האפס ונקבל את השערת המחקר – השיטה החדשה משפרת את הישגי התלמידים בספרות‪.‬‬
‫‪.5‬‬
‫באמצעות המחשב ניתן להגיע לתוצאה מדויקת יותר מאשר בטבלאות‬
‫‪  0.00423‬‬
‫הערך המופיע בפלט ‪-‬‬
‫יכולנו לערוך את המבחן ע"פ ‪ - ‬בהגדרת המחקר שלנו ‪   0.05‬ע"פ‬
‫פלט המחשב ‪   0.00423‬לכן אנחנו דוחים את השערת האפס‬
‫‪225‬‬
‫מבחן ‪ t‬לשני מדגמים תלויים (מזווגים)‬
‫שאלה‬
‫חברת סופרמן רצתה לבדוק את השפעת משקה האנרגיה שברשותה על שיפור הערנות‪.‬‬
‫נלקח מדגם של ‪ 10‬סטודנטים כאשר נבדק משך ערנותם ביום במשך שבוע ללא המשקה ולאחר שתייה יומית של‬
‫חצי ליטר משקה במשך שבוע ‪( :‬בטבלה נתונים משך שעות הערנות ביום)‬
‫‪14‬‬
‫‪17‬‬
‫‪14‬‬
‫‪12‬‬
‫‪17‬‬
‫‪13‬‬
‫‪15‬‬
‫‪14‬‬
‫‪12‬‬
‫‪13‬‬
‫לפני‬
‫‪15‬‬
‫‪19‬‬
‫‪12‬‬
‫‪14‬‬
‫‪19‬‬
‫‪15‬‬
‫‪12‬‬
‫‪18‬‬
‫‪12‬‬
‫‪14‬‬
‫אחרי‬
‫א‪ .‬בדקו את הטענה ברמת מובהקות של ‪0.05‬‬
‫שלבי עבודה ב‪EXCEL -‬‬
‫‪ .1‬פתחו חוברת עבודה ב – ‪ Excel‬והזינו את הנתונים ‪.‬‬
‫‪ .2‬בחר ב – ‪Tools | Data Analysis‬‬
‫‪226‬‬
‫‪.3‬‬
‫יפתח לפניכם מסך להזנת הנתונים‪:‬‬
‫טווחי הנתונים‬
‫מובהקות‬
‫השערת‬
‫האפס‬
‫‪.4‬‬
‫כותרות‬
‫לחצו על ‪ O.K‬ותקבלו בגיליון אחר את טופס הנתונים ‪ -‬בתחתית עמוד האקסל מצד ימין ניתן לעבור בין‬
‫הגיליונות‪:‬‬
‫הגיליון המתקבל הוא‪:‬‬
‫‪t-Test: Paired Two Sample for Means‬‬
‫לפני‬
‫אחרי‬
‫‪ Mean‬ממוצע‬
‫‪14.1‬‬
‫‪15‬‬
‫‪ Variance‬שונות מתוקנת (אומדן לשונות באוכלוסיה) ‪S‬‬
‫‪7.777778 3.211111‬‬
‫^‬
‫‪ - Observations‬גודל המדגם‬
‫‪10‬‬
‫‪ - Pearson Correlation‬מקדם המתאם ‪r‬‬
‫‪0.666996‬‬
‫‪ Hypothesized Mean Difference‬הפרש הממוצעים ע"פ השערת האפס‬
‫‪0‬‬
‫‪ - df‬דרגות חופש (שני מדגמים מזווגים הם למעשה מדגם אחד של ‪ n‬תצפיות‬
‫‪9‬‬
‫‪ t 9,1 t Stat‬נלקח תמיד בערכו המוחלט‬
‫‪-1.36895‬‬
‫‪ P(T<=t) one-tail‬ה‪  -‬האמיתית בהתאם לתוצאות (חד כיווני)‬
‫‪0.102102‬‬
‫‪ t Critical one-tail‬ערך ‪ t‬בטבלה (חד כיווני)‬
‫‪1.833114‬‬
‫‪ P(T<=t) two-tail‬ה‪  -‬האמיתית בהתאם לתוצאות (דו כיווני)‬
‫‪0.204205‬‬
‫‪ t Critical two-tail‬ערך ‪ t‬בטבלה – דו כיווני‬
‫‪2.262159‬‬
‫‪10‬‬
‫‪227‬‬
‫‪ .5‬ננתח את התוצאות בשלוש שיטות שונות‪:‬‬
‫השערה חד כיוונית – כלפי מעלה – המטרה היא לבדוק האם המשקה משפר את הערנות‪.‬‬
‫א‪.‬‬
‫‪D  0‬‬
‫‪H0 :‬‬
‫המשקה אינו משפר את הערנות‬
‫‪D  0‬‬
‫‪H1 :‬‬
‫המשקה משפר את הערנות‪.‬‬
‫ב‪.‬‬
‫שיטה ראשונה – ע"פ רמת המובהקות ‪ :‬מאחר ורמת מובהקות המבחן היא ‪ 0.05‬וע"פ פלט המחשב ה‪ -‬‬
‫האמיתית היא ‪ - 0.102‬רצינו רמת שגיאה של ‪ 5%‬וקיבלנו רמת שגיאה של ‪ 10%‬המשמעות היא קבלת‬
‫השערת האפס – כאשר המובהקות גבוהה מהנדרשת התוצאות נמצאות בתחום קבלת השערת האפס‪.‬‬
‫שיטה שנייה ‪ -‬דרך גבולות קריטיים‪:‬‬
‫‪‬‬
‫פלט המחשב אינו מתוכנן לשיטה זו ולכן חסרים בו שני ערכים ‪S‬‬
‫‪‬‬
‫של ההפרשים חישוב ערכים אלו נותן ‪S  2.079‬‬
‫‪ d‬ממוצע ההפרשים ואומדן סטיית התקן‬
‫‪d  0.9‬‬
‫‪ = d‬הפרש הממוצעים שהוא גם ממוצע ההפרשים‪.‬‬
‫‪‬‬
‫את ‪ S‬ניתן לחשב גם באמצעות האקסל – בחירת בתפריט הפונקציות בפונקציות סטטיסטיות בפונקציה ‪STDEV‬‬
‫והכנסת הפרשי הערכים בין שני המדגמים‪.‬‬
‫ג‪.‬‬
‫‪‬‬
‫‪S‬‬
‫‪C  d  t n 1,1 ‬‬
‫‪n‬‬
‫‪‬‬
‫‪t 9,0.95  1.833‬‬
‫‪2.079‬‬
‫‪ 0.657‬‬
‫‪10‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪‬‬
‫‪D  0‬‬
‫‪C  0  1.833  0.657  1.205‬‬
‫תחום‬
‫קבלת‬
‫‪H0‬‬
‫‪1.205‬‬
‫‪.4‬‬
‫‪0.9‬‬
‫‪0‬‬
‫נקבל את השערת האפס – מאחר וההפרש בין הממוצעים ‪ ,0.9‬נמצא בתחום קבלת השערת האפס – המשקה אינו‬
‫משפר את הערנות‪.‬‬
‫‪228‬‬
‫‪.5‬‬
‫מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני ‪ -‬‬
‫שיטה שלישית דרך תוצאות הפלט כפי שהן – דרך ההסתברויות‪:‬‬
‫‪.1‬‬
‫‪Tstat  1.368‬‬
‫‪T9,0.95  1.833‬‬
‫‪H0‬‬
‫‪1.833‬‬
‫‪1.368‬‬
‫‪0‬‬
‫ערכים אלו מתייחסים להסתברויות ‪ /‬לשטחים הנמצאים מתחת לעקומת ההתפלגות משמאל לערכים‪.‬‬
‫‪.4‬‬
‫אם ‪ Tstat  Tn1n22,1‬מקבלים את השערת האפס ‪1.368  1.833‬‬
‫נקבל את השערת האפס ונדחה את השערת המחקר – המשקה אינו משפר את הערנות‪.‬‬
‫ברמת מובהקות ‪ 5%‬נדחה את השערת האפס‪ .‬ניתן להסיק מהתוצאות שיש עליה בתוחלת שעות העבודה ליום‬
‫כתוצאה מהמעבר לשעות עבודה גמישות‪.‬‬
‫‪229‬‬
‫‪2‬‬
‫מבחן ‪ ‬לאי תלות בעזרת ‪Excel‬‬
‫מטרת המבחן היא לבדוק האם קיימת תלות‪ /‬קשר מובהק בין שני משתנים איכותיים‪.‬‬
‫לשם ביצוע המבחן‪ ,‬בונים טבלת שכיחויות משותפת לשני המשתנים ומשווים בין השכיחות הנצפית במדגם‬
‫(‪ )Observed‬לבין השכיחות הצפויה בהנחת היעדר קשר בין שני המשתנים (‪.)Expected‬‬
‫הערך של ‪  2‬מבוסס על הסטיות בין השכיחות הנצפית לבין השכיחות הצפויה‪ .‬ככל שמרחקים אלו גדולים יותר‪,‬‬
‫אז הקשר בין שני המשתנים חזק יותר – ככל שהסטייה בין הטבלה שמציינת מצב של אי תלות לטבלה הנבדקת‬
‫גדלים המשמעות היא שהתלות‪/‬הקשר חזק יותר‪.‬‬
‫ככל ש ‪  2‬רחוק יותר מ‪ 0 -‬כך יש סיכוי גבוה יותר להסיק שיש קשר מובהק בין שני המשתנים ( דחיית השערת האפס)‪.‬‬
‫דוגמה‬
‫בדקו האם קיימת תלות בין אזור מגורים לקבלה לקורס טיס ברמת מובהקות של ‪.0.05‬‬
‫א‪.‬‬
‫‪36‬‬
‫‪19‬‬
‫‪55‬‬
‫מושבים‬
‫‪24‬‬
‫‪21‬‬
‫‪45‬‬
‫‪48‬‬
‫‪42‬‬
‫‪90‬‬
‫השערות ‪: H 0‬‬
‫אין קשר בין אזור מגורים לקבלה לקורס טיס‬
‫‪: H1‬‬
‫יש קשר בין אזור מגורים לקבלה לקורס טיס‬
‫‪108‬‬
‫‪82‬‬
‫‪190‬‬
‫הטבלה הנתונה היא טבלת הנתונים אשר התקבלו במחקר – טבלת ה‪Observed -‬‬
‫נבנה טבלה זו באקסל ומתחתיה נבנה את הטבלה הצפויה למצב של אי תלות (עמ' הבא)‬
‫‪.1‬‬
‫מתחת לטבלת ה ‪ , Observed -‬נבנה את טבלת ה‪ . Expected -‬נקבל את הטבלה הבאה‪:‬‬
‫‪230‬‬
‫נחשב את מובהקות התוצאה בעזרת הפונקציה ‪. CHITEST‬‬
‫‪.2‬‬
‫בחלון הפונקציות נבחר ב"פונקציות סטטיסטיות" ומתוכה את הפונקציה ‪.CHITEST‬‬
‫ב‪-‬‬
‫‪ ACTUAL _RANGE‬נזין את נתוני ‪ Observed‬לא כולל שמות הקטגוריות והסיכומים בשוליים‪.‬‬
‫ב‪-‬‬
‫‪ EXPECTED RANGE‬נזין את נתוני טבלת ‪Expected‬‬
‫ונלחץ ‪ OK‬לאישור‬
‫הערך המוחזר הוא ערך הסתברותי ל‪  -‬נסמנו כ‪  ' -‬למעשה רמת המובהקות במבחן שהתבצע כדי שנדחה את‬
‫השערת האפס ‪  '  ‬לכן נקבל את השערת האפס‪.‬‬
‫אם נרצה לתרגם תוצאה זו ולקבל את ההחלטה בדרך שלמדנו במבחן אי תלות ‪ ,‬ניתן לתרגם ערך זה לערכי‬
‫‪2‬‬
‫‪‬‬
‫באמצעות האקסל – נשתמש בפונקציה ‪. CHIINV‬‬
‫מיקום התא בו‬
‫נמצאת תוצאת‬
‫הנוסחה‬
‫הקודמת או‬
‫הצבת הערך‬
‫שמצאנו‬
‫דרגות החופש‬
‫)‪(r-1)(c-1‬‬
‫‪231‬‬
‫בהתאם למבחן ‪  2‬יש לחשב את הערך הקריטי באמצעות הטבלה‬
‫‪  C 2 21 31,0.95   C 2 2,0.95  5.99‬מאחר והתוצאה שקיבלנו באקסל – ‪ 2.34‬קטנה מהערך הקריטי‬
‫נקבל את השערת האפס‪.‬‬
‫התוצאה שהתקבלה היא מאוד מובהקת ( אלפא מינימאלית קטנה מאוד ‪ .)  '  0.001‬לכן נדחה את השערת‬
‫האפס ונסיק כי קיים קשר בין מין הנהג ומספר עבירות התנועה שעשה‪.‬‬
‫‪232‬‬
‫רגרסיה ליניארית‬
‫לפניכם נתונים על ‪ 7‬עובדות ‪ -‬מס' ילדים לכל עובדת ומס' איחורים לעבודה בחודש‪:‬‬
‫‪7‬‬
‫‪5‬‬
‫‪6‬‬
‫‪6‬‬
‫‪2‬‬
‫‪3‬‬
‫‪5‬‬
‫‪3‬‬
‫‪4‬‬
‫‪3‬‬
‫‪4‬‬
‫‪2‬‬
‫‪4‬‬
‫‪1‬‬
‫‪2‬‬
‫‪2‬‬
‫‪5‬‬
‫‪4‬‬
‫א‪.‬‬
‫מהו מקדם המתאם בין מס' הילדים למס' האיחורים בחודש‪.‬‬
‫ב‪.‬‬
‫חשבו את קו הרגרסיה לחיזוי מס' האיחורים בחודש ע"פ מספר הילדים‪.‬‬
‫‪1‬‬
‫‪3‬‬
‫‪4‬‬
‫מס עובדת‬
‫מס ילדים‬
‫מס' איחורים‬
‫שלבי העבודה‪:‬‬
‫‪.1‬‬
‫פתח חוברת עבודה ב – ‪. Excel‬והזינו את הנתונים‪.‬‬
‫‪ .2‬בוחרים בתפריט כלים ‪Data Analysis ‬‬
‫‪.3‬‬
‫‪:‬‬
‫לחץ ‪ ok‬לאישור‪.‬‬
‫‪233‬‬
‫יפתח התפריט הבא‪:‬‬
‫ערכי ציר ‪y‬‬
‫המשתנה‬
‫התלוי‬
‫ערכי ציר ‪X‬‬
‫משתנה בלתי‬
‫תלוי‬
‫לאחר שהזנתם את הנתונים ‪ ,‬לחצו ‪ O.K‬ותקבלו קובץ נתונים בגיליון אחר של אותה חוברת עבודה (מעבר בין‬
‫הגיליונות בתחתית העמוד‬
‫‪234‬‬
‫תוצאות הפלט‬
SUMMARY
OUTPUT
‫מקדם‬
‫המתאם‬
Regression Statistics
0.626458
Multiple R
0.392449
R Square
Adjusted R
-1.4
1.193065
Square
Standard Error
1
Observations
ANOVA
Significance
F
Upper
Lower
Upper
95.0%
95.0%
95%
F
MS
SS
Df
3.229767
0.656752
4.597264
7
Regression
1.423404
7.117021
5
Residual
11.71429
12
Total
Standard
Lower 95%
P-value
t Stat
Error
Coefficients
-9E+177
4E+177
Intercept
0
0
X Variable 1
5.887655
-2.58978
X Variable 2
3.3E-292
-1E-292
X Variable 3
-4E+291
-4E+291
X Variable 4
-8.5E+40
-8.5E+40
X Variable 5
4.633122
-1.33525
4.633122
-1.33525
0.214734
1.420393
1.160901
1.648936
X Variable 6
1.422019
-0.25181
1.422019
-0.25181
0.132241
1.797155
0.325574
0.585106
X Variable 7
ny
x
‫ שיפוע קו הרגרסיה‬-

Yi  m y xi  n y
x

x
x
Yi  0.585 xi  1.646
235
my
– ‫ניתן לחשב את קו הרגרסיה‬
‫מבחן מס ‪1‬‬
‫פרק ראשון (‪(48%‬‬
‫בפרק זה שתי שאלות‪ .‬ענה על ‪ 4‬סעיפים בלבד בכל אחת מבין השאלות‪ .‬משקל כל סעיף ‪.6%‬‬
‫שאלה ‪ :1‬ענו על ארבעה סעיפים בלבד‬
‫בנק ההשקעות "השקעת הרווחת" השיג עבור משקיעיו במהלך שנת ‪ ,2005‬תשואות נמוכות ממתחריו בשוק‪.‬‬
‫על מנת לשנות את התדמית הגרועה ולהוות גורם תחרותי בשוק‪ ,‬החליטה הנהלת הבנק לשלוח את יועצי ההשקעות‬
‫לקורס "ניתוח ניירות ערך"‪.‬‬
‫כדי לבדוק אם הקורס משפר את תשואות תיקי ההשקעות של היועצים‪ ,‬נבחרה קבוצה של שישה יועצי השקעות‬
‫אשר השתתפו בקורס‪ ,‬ונבדקה תשואת תיקי ההשקעות שלהם לפני ואחרי הקורס‪.‬‬
‫התוצאות שהתקבלו (אחוזים) ‪:‬‬
‫היועץ‬
‫לאחר הקורס‬
‫לפני הקורס‬
‫א‬
‫‪16‬‬
‫‪13‬‬
‫ב‬
‫‪14‬‬
‫‪8‬‬
‫ג‬
‫‪4‬‬
‫‪2-‬‬
‫ד‬
‫‪4‬‬
‫‪4‬‬
‫ה‬
‫‪7‬‬
‫‪5‬‬
‫ו‬
‫‪11‬‬
‫‪10‬‬
‫התקבל הפלט הבא ‪:‬‬
‫‪Mean‬‬
‫‪Pearson Correlation‬‬
‫‪Hypothesized Mean‬‬
‫‪Difference‬‬
‫‪Df‬‬
‫‪t Stat‬‬
‫‪t Critical one-tail‬‬
‫‪P(T<=t) two-tail‬‬
‫‪t Critical two-tail‬‬
‫‪Variable‬‬
‫‪1‬‬
‫‪9.33‬‬
‫‪26.27‬‬
‫‪6‬‬
‫‪0.881113‬‬
‫‪0‬‬
‫‪Variable‬‬
‫‪2‬‬
‫‪6.33‬‬
‫‪27.47‬‬
‫‪6‬‬
‫‪5‬‬
‫‪2.904738‬‬
‫‪0.016802‬‬
‫‪3.36493‬‬
‫‪0.033605‬‬
‫‪4.032143‬‬
‫הערות ‪ - variable1 :‬לאחר הקורס‬
‫‪ - variable2‬לפני הקורס‬
‫ענה על השאלות הבאות בעזרת הפלט‪:‬‬
‫א‪.‬‬
‫האם לקורס "ניתוח ניירות ערך" יש השפעה חיובית ברמת מובהקות של ‪ ? 1%‬מהו המבחן בו אתה‬
‫משתמש? נסח את ההנחות וההשערות המתאימות‪.‬‬
‫ב‪.‬‬
‫מה תהיה מסקנתך אם תבצע מבחן לבדיקת ההשערות ‪ H 0 :  d  2‬לעומת‬
‫‪. H1 :  d  2‬באותה רמת מובהקות? נמק‪.‬‬
‫‪236‬‬
‫בהמשך לתוצאות הקודמות‪ ,‬החליטה הנהלת הבנק לבדוק האם קיים קשר בין מספר שנות הניסיון של היועץ בענף‬
‫ההשקעות‪ ,‬לבין התשואה שהשיג‪ .‬התקבלו התוצאות הבאות ‪:‬‬
‫א‬
‫‪13‬‬
‫‪6‬‬
‫היועץ‬
‫‪ -Y‬תשואה שהשיג היועץ‬
‫‪ – X‬מספר שנות ניסיון‬
‫ב‬
‫‪8‬‬
‫‪2.5‬‬
‫ג‬
‫‪2‬‬‫‪1‬‬
‫ד‬
‫‪4‬‬
‫‪3‬‬
‫ו‬
‫‪10‬‬
‫‪5‬‬
‫ה‬
‫‪5‬‬
‫‪2.5‬‬
‫תוצאות הפלט ‪:‬‬
‫‪SUMMARY OUTPUT‬‬
‫‪Regression Statistics‬‬
‫‪0.9116570 Multiple R‬‬
‫‪0.8311184 R Square‬‬
‫‪0.7888980 Adjusted R‬‬
‫‪Square‬‬
‫‪2.4079592 Standard Error‬‬
‫‪6 Observations‬‬
‫‪ANOVA‬‬
‫‪Regression‬‬
‫‪Residual‬‬
‫‪Total‬‬
‫‪Df‬‬
‫‪1‬‬
‫‪4‬‬
‫‪5‬‬
‫‪Intercept‬‬
‫‪X‬‬
‫‪Coefficient‬‬
‫‪s‬‬
‫‪-2.35‬‬
‫‪2.60‬‬
‫‪SS‬‬
‫‪MS‬‬
‫‪114.1‬‬
‫‪5.8‬‬
‫‪F‬‬
‫‪19.685‬‬
‫‪Significance F‬‬
‫‪0.0113‬‬
‫‪Standard‬‬
‫‪Error‬‬
‫‪2.189‬‬
‫‪0.587‬‬
‫‪t Stat‬‬
‫‪P-value‬‬
‫‪Upper‬‬
‫‪95%‬‬
‫‪3.732‬‬
‫‪4.233‬‬
‫‪114.1‬‬
‫‪23.2‬‬
‫‪137.3‬‬
‫‪-1.072‬‬
‫‪4.437‬‬
‫‪0.344‬‬
‫‪0.011‬‬
‫‪Lower‬‬
‫‪95%‬‬
‫‪-8.425‬‬
‫‪0.974‬‬
‫‪Upper‬‬
‫‪95.0%‬‬
‫‪3.732‬‬
‫‪4.233‬‬
‫‪Lower‬‬
‫‪95.0%‬‬
‫‪-8.425‬‬
‫‪0.974‬‬
‫ענה על השאלות הבאות בעזרת הפלט‪:‬‬
‫ג‪.‬‬
‫האם ניתן לבצע תחזית לתשואה שישיג יועץ בעל ‪ 3‬שנות ותק ? אם כן‪ ,‬תן תחזית והסבר מדוע‬
‫היא שונה מהתוצאות הקיימות בלוח עבור ותק זהה‪ .‬אם לא‪ ,‬נמק מדוע‪.‬‬
‫ד‪.‬‬
‫האם ניתן לבצע תחזית לתשואה שישיג יועץ בעל ‪ 20‬שנות ותק ? אם כן‪ ,‬תן תחזית‪ .‬אם לא‪ ,‬נמק מדוע‪.‬‬
‫ה‪.‬‬
‫מה תוכל לומר על הקשר בין התשואה שהשיג היועץ למספר שנות הניסיון שלו ?‬
‫חברה מסוימת מספקת ללקוחותיה שרותי תמיכה טלפוניים לגלישה באינטרנט‪ .‬אחד המדדים לטיב השירות הוא‬
‫הזמן הנדרש לעובד על מנת למצוא ולטפל בבעיה‪.‬‬
‫מנהל החברה חושב שהעובדים הוותיקים ( העובדים לפחות שנה אחת ) נותנים שירות מהיר יותר מאשר העובדים‬
‫החדשים ( פחות משנה אחת )‪.‬‬
‫לבדיקת הטענה נלקח מדגם של ‪ 122‬עובדי החברה הוותיקים ו‪ 65-‬עובדי החברה החדשים‪ .‬התקבלו התוצאות‪:‬‬
‫מדגם עובדים וותיקים ‪ :‬זמן שירות ממוצע של ‪ 6.5‬דקות עם סטיית תקן מדגמית של ‪ 3‬דקות‪.‬‬
‫מדגם עובדים חדשים ‪ :‬זמן שירות ממוצע של ‪ 7‬דקות עם סטיית תקן מדגמית של ‪ 3.4‬דקות‪.‬‬
‫‪237‬‬
‫הניחו שזמן השירות מתפלג נורמאלית וקיים שוויון שונויות‪.‬‬
‫א‪.‬‬
‫בדוק את טענת המנהל ברמת מובהקות של ‪ .1%‬ציין מהו המבחן בו אתה משתמש ‪ ,‬נסח את‬
‫ההשערות ואת ההנחות המתאימות‪.‬‬
‫ב‪.‬‬
‫בעבר ממוצע זמן השירות של עובדים חדשים היה ‪ 7.5‬דקות‪ .‬האם ניתן לומר על סמך תוצאות‬
‫המדגם שחל שיפור בשירות של העובדים החדשים ? רמת מובהקות ‪.5%‬‬
‫ציין מהו המבחן בו אתה משתמש ‪ ,‬נסח את ההשערות ואת ההנחות המתאימות‪.‬‬
‫לפתרון סעיפים ג' ו‪-‬ד' הנח שסטיית התקן של זמן השרות של עובדים חדשים ידועה והיא ‪ 4‬דקות‪.‬‬
‫ג‪.‬‬
‫סטטיסטיקאי חישב רווח סמך לתוחלת זמן השירות של עובדים חדשים וקיבל ‪5.72    8.28‬‬
‫מהי רמת הביטחון (רמת הסמך) לפיה חושב הרווח ?‬
‫ד‪.‬‬
‫הוחלט לבדוק שוב את טיב השירות של עובדים חדשים‪ .‬מהו גודל המדגם המינימאלי שצריך‬
‫לקחת אם רוצים שאורך הרווח לא יעלה על ‪ 0.5‬דקה וזאת ברמת בטחון (רמת סמך) ‪? 95%‬‬
‫ה‪.‬‬
‫בתום קבלת השירות מדרג כל לקוח את רמת המקצועיות של השירות שקיבל‪.‬התקבלו התוצאות הבאות ‪:‬‬
‫סה"כ‬
‫‪90‬‬
‫‪32‬‬
‫‪122‬‬
‫‪40‬‬
‫‪25‬‬
‫‪65‬‬
‫סה"כ‬
‫‪130‬‬
‫‪57‬‬
‫‪187‬‬
‫האם ניתן לומר ברמת מובהקות של ‪ 5%‬שקיימת תלות בין רמת המקצועיות לוותק של העובדים ?‬
‫‪238‬‬
‫פרק שני (‪)52%‬‬
‫ענו על ‪ 10‬שאלות בלבד בפרק זה (כל שאלה ‪ .)5.2%‬סמן את התשובה הנכונה או את התשובה הקרובה‬
‫ביותר לתשובה הנכונה ‪.‬‬
‫‪.1‬‬
‫משקל חיילים בשרות סדיר מתפלג נורמאלית עם ממוצע ‪ 75‬ק"ג וסטיית תקן ‪ 12‬ק"ג‪.‬‬
‫ליום ספורט נבחרו ‪ 16‬חיילים באופן מקרי לתחרות משיכת חבל‪.‬‬
‫ההסתברות שמשקלם הכולל עולה על ‪ 1128‬ק"ג היא ‪:‬‬
‫א‪0.0668 .‬‬
‫‪.2‬‬
‫ב‪0 .‬‬
‫ג‪0.9332 .‬‬
‫ד‪1 .‬‬
‫ידוע כי משך זמן הייבוש (תחת תנאים קבועים) של צבע מסוים לעץ מתפלג נורמאלית עם‬
‫ממוצע ‪ 90‬דקות‪ .‬כימאי הציע תוסף לצבע‪ ,‬אשר לדבריו יקצר את משך זמן‬
‫הייבוש‪ .‬במדגם מקרי בגודל ‪ 4‬עם התוסף התקבלו זמני הייבוש הבאים בדקות ‪90 ,85 ,85 ,80 :‬‬
‫זמן הייבוש עם התוסף מתפלג גם כן נורמאלית‪.‬‬
‫מהי רמת המובהקות המינימאלית לקבלת טענת הכימאי?‬
‫א‪ 0     0.025 .‬ב‪ 0.025     0.05 .‬ג‪ 0.05     0.1 .‬ד‪   0.1.‬‬
‫‪.3‬‬
‫בונים רווח סמך לתוחלת של אוכלוסיה נורמאלית אחת על סמך מדגם בן ‪ N‬תצפיות‪ .‬אם נבנה רווח‬
‫סמך צר פי שלושה‪ ,‬באותה רמת סמך‪ ,‬נזדקק למדגם בגודל‪:‬‬
‫א‪3N .‬‬
‫‪.4‬‬
‫ב‪1.73N .‬‬
‫ג‪9N .‬‬
‫ד‪0.33N .‬‬
‫חוקר ביצע ניסוי ‪ .‬הוא ניסח את ההשערות הבאות ‪:‬‬
‫‪H0 :   0‬‬
‫‪H1 :   0‬‬
‫‪.‬לצורך בדיקה הוא לקח‬
‫מדגם מקרי בגודל ‪ 5‬מתוך אוכלוסיה המתפלגת נורמאלית עם שונות לא ידועה‪ .‬על סמך‬
‫תוצאות המדגם הוא חישב וקיבל ‪. t  stat  2.611 t x  2.611 :‬‬
‫לכן המסקנה היא ‪:‬‬
‫א‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 0.1‬אך לא כן ברמת מובהקות ‪.0.05‬‬
‫ב‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 0.05‬אך לא כן ברמת מובהקות ‪.0.025‬‬
‫ג‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 0.025‬אך לא כן ברמת מובהקות ‪0.01‬‬
‫ד‪ .‬הוא לא ידחה ‪ H 0‬ברמת מובהקות ‪. 0.1‬‬
‫‪239‬‬
‫‪.5‬‬
‫בדקת השערה כנגד אלטרנטיבה חד צדדית ברמת מובהקות של ‪ 5%‬ודחית את השערת האפס‪.‬‬
‫לפניך שני משפטים‪:‬‬
‫‪.1‬‬
‫אילו תבדוק את אותה השערה‪ ,‬על סמך אותו המדגם‪ ,‬כנגד אלטרנטיבה דו צדדית‪,‬‬
‫ברמת מובהקות של ‪ ,2.5%‬תגיע לאותה מסקנה‪.‬‬
‫‪.2‬‬
‫‪.6‬‬
‫רמת המובהקות המינימאלית לדחיית השערת האפס עבור מבחן דו צדדי היא ‪.10%‬‬
‫א‪.‬‬
‫שתי הטענות נכונות‪.‬‬
‫ב‪.‬‬
‫שתי הטענות לא נכונות‪.‬‬
‫ג‪.‬‬
‫רק הטענה הראשונה נכונה‪.‬‬
‫ד‪.‬‬
‫רק הטענה השנייה נכונה‪.‬‬
‫השערת האפס ( ‪ ) Ho‬היא שאין הבדל בין תוחלות ההכנסות בין שתי ערים‪.‬‬
‫ההשערה האלטרנטיבית ( ‪ ) H1‬היא שתוחלות ההכנסות בשתי הערים שונות‪.‬‬
‫לבדיקת השערות אלו נלקחו שני מדגמים ב"ת (אחד מכל עיר) וחושבו הנתונים הבאים באלפי‬
‫שקלים‪:‬‬
‫עיר א'‬
‫עיר ב'‬
‫‪7.98‬‬
‫‪4.32‬‬
‫‪4.84‬‬
‫‪3.61‬‬
‫‪10‬‬
‫‪12‬‬
‫בהנחה שההכנסות בשתי הערים בלתי תלויות ומתפלגות נורמאלית‪,‬‬
‫א‪ .‬ברמת מובהקות של ‪ 5%‬נדחה את ‪ ,Ho‬אך לא ברמת מובהקות של ‪.1%‬‬
‫ב‪ .‬ברמת מובהקות ‪ 1%‬נדחה את ‪.Ho‬‬
‫ג‪ .‬ברמת מובהקות ‪ 5%‬נקבל את ‪Ho‬‬
‫ד תשובות א' עד ג' אינן נכונות‪.‬‬
‫‪ .7‬נבנה רווח סמך לתוחלת אוכלוסייה נורמאלית ‪ 100    200‬ברמת סמך (ביטחון) של ‪.99%‬‬
‫לפניך מספר טענות לגבי המשמעות של רווח הסמך‪:‬‬
‫‪ .1‬הסיכוי שתוחלת האוכלוסייה שווה ל ‪ 150 -‬הוא ‪.99%‬‬
‫‪ .2‬בסיכוי של ‪ 99%‬נמצאת תוחלת האוכלוסייה בין ‪ 100‬ל ‪.200 -‬‬
‫‪ .3‬הסיכוי שתוחלת האוכלוסייה היא בין ‪ 100‬ל ‪ 200 -‬הוא ‪.1%‬‬
‫‪ .4‬הסיכוי שתוחלת האוכלוסייה לא נמצאת בתוך הרווח שבין ‪ 100‬ל ‪ 200 -‬הוא ‪.1%‬‬
‫רק אחת מבין התשובות הבאות נכונה ‪:‬‬
‫א‪ .‬רק טענה ‪ 1‬וטענה ‪ 3‬נכונות‪.‬‬
‫ב‪ .‬רק טענה ‪ 1‬וטענה ‪ 3‬נכונות‪.‬‬
‫ג‪ .‬רק טענה ‪ 1‬וטענה ‪ 4‬נכונות‬
‫ד‪ .‬רק טענה ‪ 2‬וטענה ‪ 4‬נכונות‪.‬‬
‫‪240‬‬
‫‪ .8‬במבחן שנערך נמצא כי רמת המובהקות המינימאלית לדחיית ‪ H0‬היא ‪ .3%‬משמעות הדבר היא‪:‬‬
‫א‪ .‬ניתן לדחות את ‪ H0‬ברמת מובהקות של ‪.1%‬‬
‫ב‪ .‬לא ניתן לדחות את ‪ H0‬ברמת מובהקות של ‪.10%‬‬
‫ג‪ .‬לא ניתן לדחות את ‪ H0‬ברמת מובהקות של ‪.1%‬‬
‫ד‪ .‬לא ניתן לדחות את ‪ H0‬ברמת מובהקות של ‪ ,10%‬אך ניתן לדחות את ‪ H0‬ברמת מובהקות של ‪.1%‬‬
‫‪ .9‬חברה לסוכר אורזת על פי משקל‪ .‬משקל השקיות מפולג נורמאלית עם סטיית תקן של ‪ 0.06‬ק"ג‪.‬לצורך‬
‫בדיקת השערת האפס (‪ )Ho‬הטוענת כי תוחלת משקל הארוזה בייצור שווה ‪ 2‬ק"ג לעומת האלטרנטיבה‬
‫האומרת כי התוחלת שונה מ‪ 2-‬ק"ג‪ .‬נלקח מדגם של ‪ 50‬שקיות‪ .‬במדגם התקבל ממוצע ‪ 1.99‬ק"ג‪ .‬על כן‪:‬‬
‫א‪ .‬יש לדחות את השערת האפס ברמת מובהקות של ‪.0.01‬‬
‫ב‪ .‬יש לדחות את השערת האפס ברמת מובהקות של ‪.0.05‬‬
‫ג‪ .‬יש לדחות את השערת האפס ברמת מובהקות של ‪ ,0.1‬אך לא ברמת מובהקות ‪.0.05‬‬
‫ד‪ .‬אין לדחות את השערת האפס ברמת מובהקות של ‪.0.1‬‬
‫‪10‬‬
‫כמו כן‪ ,‬שיפוע קו הרגרסיה הוא ‪ .0.4569-‬מקדם המתאם בין המשתנים הוא‪:‬‬
‫א‪0.69 .‬‬
‫ב‪0.46 .‬‬
‫ג‪.‬‬
‫‪0.78‬‬
‫ד‪.‬‬
‫‪0.91‬‬
‫‪ 11‬סטטיסטיקאי החליט על מדיניות לפיה הוא משתמש תמיד ברמת מובהקות של ‪.1%‬‬
‫לטווח הארוך‪ ,‬הוא החליט נכונה‪:‬‬
‫א‪ .‬בערך ב ‪ 1%‬ממספר בדיקת ההשערות שביצע‪.‬‬
‫ב‪ .‬בערך ב ‪ 99%‬ממספר בדיקת ההשערות שביצע‪.‬‬
‫ג‪.‬‬
‫בערך ב ‪ 1%‬ממספר השערות האפס הנכונות שבדק‪.‬‬
‫ד‪ .‬בערך ב ‪ 99%‬מספר השערות האפס הנכונות שבדק‪.‬‬
‫‪241‬‬
‫במסגרת המאמצים לשיפור הישגי הספורט במדינה ‪ ,‬נערכו מספר מחקרים‪ .‬כאן נתמקד בתחום הרמת המשקולות‪.‬‬
‫כדי לבדוק אם אכילת תרד מגבירה את הכושר הפיסי בחרו קבוצה של חמישה מרימי משקולות ובדקו את המשקל‬
‫שכל אחד מהם הצליח להרים ביום שבו הם אכלו תרד וביום שבו לא אכלו תרד‪.‬‬
‫התוצאות שהתקבלו (ק"ג) ‪:‬‬
‫עם תרד‬
‫בלי תרד‬
‫א‬
‫‪152‬‬
‫‪145‬‬
‫ב‬
‫‪170‬‬
‫‪170‬‬
‫ד‬
‫ג‬
‫‪141 153‬‬
‫‪145 150‬‬
‫ה‬
‫‪148‬‬
‫‪144‬‬
‫‪t-Test: Paired Two‬‬
‫‪Sample for Means‬‬
‫בלי תרד‬
‫עם תרד‬
‫‪Variable Variable‬‬
‫‪2‬‬
‫‪1‬‬
‫‪150.8‬‬
‫‪152.8 Mean‬‬
‫‪120.7‬‬
‫‪114.7 Variance‬‬
‫‪5‬‬
‫‪0.925959 Pearson Correlation‬‬
‫‪0 Difference‬‬
‫‪4 Df‬‬
‫‪1.069045 t Stat‬‬
‫‪0.172636 P(T<=t) one-tail‬‬
‫‪2.131846 t Critical one-tail‬‬
‫‪0.345271 P(T<=t) two-tail‬‬
‫‪2.776451 t Critical two-tail‬‬
‫בעזרת הפלט ענה על השאלות הבאות‪:‬‬
‫א‪.‬‬
‫האם לאכילת התרד יש השפעה חיובית ברמת מובהקות של ‪ .5%‬מהו המבחן בו אתם‬
‫משתמשים ? נסחו את ההנחות וההשערות המתאימות‪.‬‬
‫ב‪.‬‬
‫על סמך המחקרים בתחום הספורט ידוע שממוצע המשקל שמצליח מרים משקולות להרים בדרך כלל (ללא‬
‫אכילת תרד) הוא ‪ 146‬ק"ג האם על סמך התוצאות לאחר אכילת התרד ניתן לומר שהתרד משפר את התוצאות‬
‫משמעותית ברמת מובהקות של ‪ . 1%‬נמקו‪ ( .‬עליכם להתייחס לנתונים על המשקל לאחר אכילת התרד )‪.‬‬
‫‪242‬‬
‫בהמשך לתוצאות הקודמות הוחלט להעמיק את הבדיקות בקרב מרימי המשקולות‪ .‬החוקרים היו מעוניינים לבדוק‬
‫האם יש קשר בין מספר שעות האימון שקדמו להרמת המשקלות לבין המשקל שכל אחד מחמשת מרימי המשקלות‬
‫הצליח להרים לאחר האימון‪ .‬התקבלו התוצאות הבאות ‪:‬‬
‫‪ -Y‬משקל שמרים כל ספורטאי‬
‫‪ – X‬מספר שעות אימון‬
‫א‬
‫‪145‬‬
‫‪5‬‬
‫ב‬
‫‪170‬‬
‫‪7‬‬
‫ד‬
‫ג‬
‫‪145 150‬‬
‫‪4 5.5‬‬
‫ה‬
‫‪144‬‬
‫‪3.5‬‬
‫תוצאות הפלט ‪:‬‬
‫‪0.897386 Multiple R‬‬
‫‪0.805302 R Square‬‬
‫‪0.740403 Adjusted R‬‬
‫‪Square‬‬
‫‪5.597619 Standard‬‬
‫‪Error‬‬
‫‪5 Observation‬‬
‫‪s‬‬
‫‪ANOVA‬‬
‫‪df‬‬
‫‪1 Regression‬‬
‫‪3 Residual‬‬
‫‪4 Total‬‬
‫‪388.8‬‬
‫‪94‬‬
‫‪482.8‬‬
‫‪F‬‬
‫‪MS‬‬
‫‪SS‬‬
‫‪0.038846 12.40851‬‬
‫‪388.8‬‬
‫‪31.33333‬‬
‫‪Upper‬‬
‫‪Lower‬‬
‫‪Upper‬‬
‫‪Lower‬‬
‫‪P-value t Stat‬‬
‫‪Standard Coefficien‬‬
‫‪95.0%‬‬
‫‪95.0%‬‬
‫‪95%‬‬
‫‪95%‬‬
‫‪Error‬‬
‫‪ts‬‬
‫‪148.2855 81.31448 148.2855 81.31448 0.001648 10.91054 10.52193‬‬
‫‪114.8 Intercept‬‬
‫‪13.7048 0.695197 13.7048 0.695197 0.038846 3.522572 2.043961‬‬
‫‪7.2 X Variable‬‬
‫‪1‬‬
‫בעזרת הפלט ענה על השאלות הבאות ‪:‬‬
‫ג‪ .‬תן תחזית למשקל שירים משקולן שמתאמן ‪ 7‬שעות‪ .‬מדוע תחזית זו‬
‫אינה זהה לאחד מהנתונים שבלוח (התצפית השנייה) ?‬
‫ד‪ .‬אמוד את השינוי שיחול במשקל שירים כל ספורטאי אם יוריד חצי שעה מאימוניו ‪.‬‬
‫ה‪ .‬מה תוכל לומר על עוצמת הקשר בין המשתנים וטיב החיזוי ?‬
‫‪243‬‬
‫שאלה ‪2‬‬
‫לעמותת "תנו לחיות בכבוד"‪ ,‬המסייעת לאזרחים המצויים בקשיים כלכליים‪ ,‬ישנם ‪ 100‬מתנדבים מתוכם ‪60‬‬
‫צעירים ו‪ 40 -‬מבוגרים ‪ .‬כל אחד מהם מקבל בתחילת שנה רשימה של תורמים פוטנציאלים‪ ,‬מהם הוא אמור‬
‫לנסות ולגייס‬
‫תרומות לטובת פעילות העמותה‪ .‬בסיכום שנערך לשנת ‪ 2005‬התקבלו הנתונים הבאים‪:‬‬
‫סה"כ‬
‫‪44‬‬
‫‪56‬‬
‫‪100‬‬
‫א‪.‬‬
‫צעיר‬
‫‪14‬‬
‫‪46‬‬
‫‪60‬‬
‫מבוגר‬
‫‪30‬‬
‫‪10‬‬
‫‪40‬‬
‫לא הצליחו לגייס תרומות‬
‫הצליחו לגייס תרומות‬
‫סה"כ‬
‫האם ניתן לומר שקיימת תלות בין גילו של המתנדב לבין הצלחתו בגיוס תרומות ? ‪  0.01‬‬
‫אברהם יצחק ויעקב הם מתנדבים בעמותה‪ .‬בסוף שנת ‪ 2005‬נמצא שאברהם גייס תרומות מ‪ 11-‬תורמים והקדיש‬
‫בממוצע ‪ 33‬דקות עם אומדן סטיית תקן של ‪ 4‬דקות לכל תורם ואילו יצחק גייס תרומות מ‪ 16 -‬תורמים והקדיש‬
‫בממוצע ‪ 41‬דקות עם אומדן סטיית תקן של ‪ 4.5‬דקות לכל תורם‪ .‬יעקב גייס תרומות מ‪ 13 -‬תורמים והקדיש‬
‫בממוצע ‪ 35‬דקות עם אומדן סטיית תקן של ‪ 4‬דקות לכל תורם‪.‬‬
‫הנח שהזמן שמקדיש כל אחד מהמתנדבים מפולג נורמאלית ושקיים שוויון שונויות בין הזמנים וכן אי תלות בין‬
‫שלושת המתנדבים‪.‬‬
‫ב‪.‬‬
‫האם ניתן להסיק ברמת מובהקות של ‪ 5%‬שאברהם משכנע יותר מהר מיעקב ?‬
‫ג‪.‬‬
‫יצחק חישב רווח סמך לתוחלת משך הזמן שהוא מקדיש לשכנוע תורם‪.‬‬
‫רווח הסמך שהתקבל הוא ‪ .) 38.25 , 43.25( :‬מהי רמת הסמך (רמת הביטחון) שבה חושב הרווח ?‬
‫ד‪.‬‬
‫כדי לעודד את המתנדבים ולדרבן אותם להצליח יותר באיסוף התרומות הוחלט על מבצע‬
‫פרסים שיוענקו לכל מי שיצליח להעלות את מספר התורמים מהם הצליח לגייס תרומות‪ .‬נבחרו ‪ 4‬מתנדבים‬
‫ולכל אחד מהם נבדק ‪ :‬מספר התורמים לפני מבצע הפרסים ואחרי מבצע הפרסים ‪ .‬נמצא ששניים העלו את‬
‫מספר התורמים ‪ ,‬אחד ירד במספר התורמים ואחד לא שינה כלל‪ .‬לאור ההפרשים הבאים ‪:‬‬
‫‪ ,-2 ,0, 3 , 5‬האם מספר התורמים עלה באופן משמעותי ברמת מובהקות של ‪? 5%‬‬
‫‪244‬‬
‫פרק שני (‪)52%‬‬
‫ענה על ‪ 10‬שאלות בלבד בפרק זה (כל שאלה ‪ .)5.2%‬סמן את התשובה הנכונה או את התשובה הקרובה‬
‫ביותר לתשובה הנכונה‪.‬‬
‫‪.1‬‬
‫במחקר חינוכי על תלמידי בית ספר מסוים התגלה מתאם שלילי בין ציוני מבחן הגמר בספרות לבין ציוני‬
‫מבחן הגמר בפיסיקה‪ .‬משמעות המתאם השלילי היא‪( :‬בחר בתשובה הנכונה)‬
‫א‪.‬‬
‫רוב התלמידים שנוטים להיכשל במבחן אחד נכשלים גם בשני‪.‬‬
‫ב‪.‬‬
‫אין קשר בין הצלחה במבחן אחד להצלחה בשני‪.‬‬
‫ג‪.‬‬
‫רוב התלמידים שהצליחו במבחן השני קיבלו ציון שלילי‪.‬‬
‫ד‪.‬‬
‫רוב התלמידים שנוטים להצליח במבחן אחד נוטים שלא להצליח במבחן השני‬
‫‪.2‬‬
‫משקל ארגז אבוקדו מתפלג נורמאלית עם תוחלת של ‪ 10‬ק"ג וסטיית תקן של ‪ 2‬ק"ג ‪.‬‬
‫מה ההסתברות כי משקלו הכולל של משטח אבוקדו שנבחר באקראי ומכיל ‪ 36‬ארגזים‬
‫יהיה לפחות ‪ 340‬ק"ג ? בחר בתשובה הקרובה ביותר‬
‫א‪0.9525 .‬‬
‫‪.3‬‬
‫ג‪0.0475 .‬‬
‫ב‪1 .‬‬
‫ד‪0.4335 .‬‬
‫מכון התקנים רוצה לבדוק את תוחלת המשקל של בלוקים המיוצרים במפעל מסוים‪ .‬ידוע‬
‫כי סטיית התקן של משקל הבלוקים היא ‪ 200‬גרם‪ .‬מהו גודל המדגם המינימאלי שעליהם‬
‫לבדוק אם רוצים שברמת ביטחון של ‪ 95%‬המרחק בין תוחלת המשקל האמיתית לממוצע‬
‫המשקל במדגם לא יעלה על ‪ 50‬גרם ? (בחר בתשובה הקרובה ביותר )‬
‫א‪174 .‬‬
‫‪.4‬‬
‫ב‪246 .‬‬
‫ג‪8 .‬‬
‫ד‪62 .‬‬
‫הממוצע של בדיקת דם מסוימת הוא ‪ .200‬חוקר טוען כי נטילת סמים מורידה את הערך הנמדד‪ .‬נבדק‬
‫מדגם מקרי של ‪ 25‬מכורים לסמים‪ ,‬ובמדגם נמצא כי ממוצע בדיקת הדם הוא ‪ 188.6‬עם סטיית תקן של המדגם‬
‫‪ .30‬ה‪ α-‬המינימאלית לדחיית ‪ H 0‬היא‪( :‬בחר בתשובה הקרובה ביותר)‬
‫א‪0    0.001 .‬‬
‫ב‪0.001    0.01 .‬‬
‫ג‪0.01  α ≤ 0.025 .‬‬
‫‪.5‬‬
‫‪.I‬‬
‫ככל שהמדגם לפיו חושב הרווח גדול יותר‪ ,‬רווח הסמך ארוך יותר‪.‬‬
‫‪.II‬‬
‫ככל שרמת הביטחון (רמת הסמך) של הרווח קטנה יותר‪ ,‬הרווח ארוך יותר‪.‬‬
‫ד‪0.025 > α ≤ 0.05 .‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪245‬‬
‫השערת האפס (‪ )Ho‬היא שאין הבדל בין תוחלות ההוצאות החודשיות על שימוש בטלפון נייד בין חיילים‬
‫‪.6‬‬
‫לחיילות‪ .‬ההשערה האלטרנטיבית (‪ )H1‬היא שתוחלות ההוצאות החודשיות הן שונות‪.‬‬
‫לבדיקת השערות אלו נלקחו שני מדגמים בלתי תלויים של חיילים ושל חיילות והתקבל‪:‬‬
‫חיילות‬
‫חיילים‬
‫‪₪ 192‬‬
‫‪₪ 180‬‬
‫‪₪ 31.5‬‬
‫‪₪ 26‬‬
‫סטיית תקן מדגמית ‪ sˆ ‬‬
‫‪17‬‬
‫‪15‬‬
‫בהנחה שהוצאות השימוש של חיילים וחיילות בלתי תלויות ומתפלגות נורמאלית‪ ,‬אזי ‪:‬‬
‫א‪ .‬ברמת מובהקות של ‪ 5%‬נדחה את ‪ ,Ho‬אך לא ברמת מובהקות של ‪ .10%‬ב‪.‬‬
‫ד‪.‬‬
‫ג‪ .‬ברמת מובהקות ‪ 10%‬נדחה את ‪.Ho‬‬
‫‪ .7‬במדגם בגודל ‪ 20‬תצפיות על שני משתנים ‪ X :‬ו ‪ Y‬התקבלו התוצאות הבאות‪:‬‬
‫‪20‬‬
‫‪ X  Y  17800‬‬
‫‪i 1‬‬
‫‪20‬‬
‫‪ Y 2  232000‬‬
‫‪i 1‬‬
‫‪20‬‬
‫‪ X 2  2320‬‬
‫‪Y  100‬‬
‫‪X  10‬‬
‫‪i 1‬‬
‫מה ערכו של מקדם המתאם הליניארי ( ‪ ) rx , y‬בין ‪ X‬ו‪? Y -‬‬
‫א‪- 0.6875 .‬‬
‫ב‪0.3125 .‬‬
‫‪ H 0 :   200‬לעומת‬
‫‪ .8‬יהי‬
‫ג‪- 0.000214 .‬‬
‫ד‪0.48 .‬‬
‫‪ . H1 :   200‬כדי לבדוק השערות אלה באוכלוסיה בעלת התפלגות‬
‫נורמאלית וסטית תקן ‪ 40‬נלקח מדגם בגודל ‪ 16‬והוחלט לדחות את ‪ H 0‬אם ממוצע המדגם יהיה מעל ‪. 218‬‬
‫אזי רמת המובהקות היא‪:‬‬
‫א‪0.0359 .‬‬
‫ב‪0.0446 .‬‬
‫ד‪0.05 .‬‬
‫ג‪0.9641 .‬‬
‫‪ .9‬במבחן שנערך נמצא כי רמת המובהקות המינימאלית לדחיית ‪ H0‬היא ‪ .5%‬משמעות הדבר היא ‪:‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪ .I .10‬אם בבדיקת השערת אפס מסוימת כנגד אלטרנטיבה חד צדדית ‪ , H 1 ‬הוחלט ברמת מובהקות ‪‬‬
‫לדחות את השערת האפס‪ ,‬אז בכל רמת מובהקות הקטנה מ‪  -‬תתקבל אותה מסקנה‪.‬‬
‫‪. II‬‬
‫אם בבדיקת השערת אפס מסוימת כנגד אלטרנטיבה חד צדדית ‪ , H 1 ‬הוחלט ברמת מובהקות ‪ ‬לא‬
‫לדחות את השערת האפס‪ ,‬אז בכל רמת מובהקות הקטנה מ‪  -‬תתקבל אותה מסקנה‪.‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫שתי הטענות אינן נכונות‪.‬‬
‫ג‪.‬‬
‫רק טענה ‪ I‬נכונה‪.‬‬
‫ד‪.‬‬
‫רק טענה ‪ II‬נכונה‪.‬‬
‫‪246‬‬
‫בדיקת גובה החשבון החודשי עבור השימוש בטלפון הסלולארי בקרב לקוחות בגילאים שונים הראתה תוצאות‬
‫הבאות‪:‬‬
‫‪20-30‬‬
‫‪30-40‬‬
‫‪8‬‬
‫‪7‬‬
‫‪200‬‬
‫‪190‬‬
‫סטית התקן של המדגם‬
‫‪40‬‬
‫‪43‬‬
‫‪160 ,240 170 ,160 ,160 ,230 ,150, 210 ,200‬‬
‫הנח שגובה החשבון החודשי בכל קבוצת גיל מפולג נורמאלית וקיים שוויון שונויות בין גובה החשבון החודשי‬
‫בקבוצות הגיל השונות‪.‬‬
‫א‪.‬‬
‫השווה בין תוחלות גובה החשבון של לקוחות בגילאים ‪ 20-30‬ובגילאים ‪ 40 -30‬רמת מובהקות של ‪.5%‬‬
‫ב‪.‬‬
‫בנה רווח סמך לתוחלת גובה החשבון החודשי בגילאים ‪ 20-30‬ברמת סמך של ‪ . 90%‬פי כמה‬
‫יגדל הרווח אם רמת הסמך תעלה ל‪?98%-‬‬
‫בסעיפים ג' ו‪ -‬ד' הנח שסטית התקן של גובה החשבון החודשי בקרב לקוחות בני ‪ 40-50‬ידועה ושווה ל‪.35-‬‬
‫ג‪.‬‬
‫מצא את רמת המובהקות המינימאלית בה ניתן לדחות את השערת האפס כאשר בודקים השערה שתוחלת‬
‫גובה התשלום של לקוחות בגילאים ‪ 50-40‬שווה ל‪ 210-‬שקלים כנגד אלטרנטיבה שתוחלת זו נמוכה יותר‪.‬‬
‫ד‪.‬‬
‫מהו מספר החשבונות המינימאלי שיש לבחור במטרה לבנות רווח סמך לתוחלת גובה החשבון‬
‫החודשי של לקוחות בגילאים ‪ 50-40‬ברמת סמך של ‪ 95%‬כדי שאורך הרווח לא יעלה על ‪ 15‬שקלים‪.‬‬
‫‪247‬‬
‫שאלה ‪ :2‬ענה על ארבעה סעיפים בלבד בהסתמך על הפלט המצורף‪.‬‬
‫עושים סקר על שימוש בטלפון סלולארי בקרב אחים‪ .‬לצורך בצוע הסקר בוחרים במדגם של ‪ 6‬זוגות אחים‪.‬‬
‫תוצאות הסקר הם בלוח שלפניך‪.‬‬
‫זמן האוויר החודשי של האח הבכור בדקות ‪200 170 160 150 120‬‬
‫‪220‬‬
‫זמן האוויר החודשי של האח הצעיר בדקות ‪240 215 200 190 170 150‬‬
‫‪Mean‬‬
‫‪Pearson Correlation‬‬
‫‪Hypothesized Mean Difference‬‬
‫‪Df‬‬
‫‪T Stat‬‬
‫‪t Critical one-tail‬‬
‫‪P(T<=t) two-tail‬‬
‫‪t Critical two-tail‬‬
‫‪Multiple R‬‬
‫‪R Square‬‬
‫‪Adjusted R Square‬‬
‫‪Standard Error‬‬
‫צעיר‬
‫‪194.1667‬‬
‫‪1024.167‬‬
‫‪6‬‬
‫‪0.986934‬‬
‫‪20‬‬
‫‪5‬‬
‫‪1.535738‬‬
‫‪0.092599‬‬
‫‪2.015049‬‬
‫‪0.185199‬‬
‫‪2.570578‬‬
‫בכור‬
‫‪170‬‬
‫‪1280‬‬
‫‪6‬‬
‫‪0.986934067‬‬
‫‪0.974038853‬‬
‫‪0.967548566‬‬
‫‪6.444985309‬‬
‫‪6‬‬
‫‪ANOVA‬‬
‫‪df‬‬
‫‪1‬‬
‫‪4‬‬
‫‪5‬‬
‫‪Regression‬‬
‫‪Residual‬‬
‫‪Total‬‬
‫‪Intercept‬‬
‫צעיר‬
‫‪F‬‬
‫‪MS‬‬
‫‪SS‬‬
‫‪0.000255 150.07646233.84866 6233.848657‬‬
‫‪41.5378356 166.1513426‬‬
‫‪6400‬‬
‫‪Upper 95% Lower 95% P-value‬‬
‫‪t Stat Standard Error Coefficients‬‬
‫‪4.86843959 -93.3306 0.066684 -2.5011532 17.68427547 -44.23108218‬‬
‫‪1.35339453 0.8532776 0.00025512.2505672 0.090064079 1.103336046‬‬
‫בהסתמך על הפלט‬
‫א‪.‬‬
‫בדוק השערה על כך שתוחלת זמן האוויר החודשי של האחים הצעירים גדולה ביותר מ‪ 20-‬דקות מתוחלת‬
‫זמן האוויר של האחים הבכורים ברמת מובהקות של ‪.10%‬‬
‫ב‪.‬‬
‫מה תהיה מסקנתך ברמת מובהקות של ‪ 5%‬אם תתייחס למבחן הדו‪-‬צדדי(דו‪-‬זנבי) בסעיף הקודם‪.‬‬
‫ג‪.‬‬
‫תן תחזית לזמן האוויר החודשי של האח הבכור אם אחיו הצעיר קיבל חשבון חודשי של ‪ 180‬דקות זמן אוויר‪.‬‬
‫ד‪.‬‬
‫תאפיין את עוצמת הקשר ומהותו בין זמן האוויר החודשי של האחים הבכורים והאחים הצעירים‪ .‬מהו אחוז‬
‫השונות המוסברת על‪-‬ידי הרגרסיה?‬
‫‪248‬‬
‫פרק שני (‪)52%‬‬
‫ענו על ‪ 8‬שאלות בלבד בפרק זה (כל שאלה ‪ .)6.5%‬סמן את התשובה הנכונה או את התשובה הקרובה ביותר‬
‫לתשובה הנכונה ‪.‬‬
‫השערת האפס נדחית ברמת מובהקות של ‪ 5%‬כנגד אלטרנטיבה חד‪-‬צדדית‪ .‬אם תבצע אותו המבחן על‬
‫‪.1‬‬
‫סמך אותם הנתונים כנגד אלטרנטיבה דו‪-‬צדדית‪:‬‬
‫א‪ .‬השערת האפס בטוח תדחה ברמת מובהקות של ‪.2.5%‬‬
‫ב‪ .‬השערת האפס בטוח תדחה ברמת מובהקות של ‪.5%‬‬
‫ג‪ .‬השערת האפס בטוח תדחה ברמת מובהקות של ‪.10%‬‬
‫ד‪ .‬השערת האפס בטוח תתקבל ברמת מובהקות של ‪.5%‬‬
‫הנהלת חברה החליטה לאמוד זמן ש"מבלה" לקוח ממוצע בתחנת השרות של החברה‪ .‬סטית תקן של הזמן‬
‫‪.2‬‬
‫היא ‪ 12.481‬דקות‪ .‬על סמך מדגם של ‪ 20‬לקוחות חושב רווח סמך לתוחלת הזמן ‪ 29.43-40.37:‬דקות‪.‬‬
‫רמת הסמך של הרווח היא‪:‬‬
‫א‪95% .‬‬
‫‪.3‬‬
‫ב‪97.5% .‬‬
‫ד‪99% .‬‬
‫ג‪98% .‬‬
‫הוחלט לבדוק האם קיים קשר בין מידת שביעות הרצון של לקוח מהמכשיר הסלולארי שלו לבין מין‪.‬‬
‫נתוני המדגם הראו את התוצאות הבאות‪:‬‬
‫גברים‬
‫נשים‬
‫מין‬
‫‪160‬‬
‫‪130‬‬
‫‪40‬‬
‫‪70‬‬
‫מרוצה‬
‫לא מרוצה‬
‫א‪.‬‬
‫ניתן לומר שיש קשר בין שביעות הרצון למין בר‪.‬מ‪ .‬של ‪ 2.5%‬ו‪.5% -‬‬
‫ב‪.‬‬
‫ניתן לומר שאין קשר בין שביעות הרצון למין בר‪.‬מ‪ .‬של ‪ 2.5%‬ו‪.5% -‬‬
‫ג‪.‬‬
‫ניתן לומר שאין קשר בין שביעות הרצון למין בר‪.‬מ‪ .‬של ‪ 2.5%‬ויש קשר בר‪.‬מ‪ .‬של ‪.5%‬‬
‫שביעות רצון‬
‫ד‪ .‬ניתן לומר שאין קשר בין שביעות הרצון למין בר‪.‬מ‪ .‬של ‪ 5%‬ויש קשר בר‪.‬מ‪ .‬של ‪.2.5%‬‬
‫‪.4‬‬
‫הרווחים זהה‪ .‬הרווח הראשון נבנה על סמך מדגם בגודל ‪ ,100‬בעוד שהרווח השני נבנה על סמך מדגם בגודל‬
‫‪ .500‬הרווח הראשון ‪:‬‬
‫א‪ .‬ארוך פי ‪ 5‬מהרווח השני‪.‬‬
‫ג‪.‬‬
‫ב‪ .‬ארוך פי ‪ 25‬מהרווח השני‪.‬‬
‫ד‪ .‬קצר פי ‪ 5‬מהרווח השני‪.‬‬
‫‪249‬‬
‫‪.5‬‬
‫ילד מחייג במהלך יום ל‪ 8-‬חברים בממוצע בעוד שסטיית התקן של מספר החיוגים היומי היא ‪ .2‬מה‬
‫הסיכוי שב‪ 60-‬יום שנבחרו באקראי יחייג הילד בסה"כ לפחות ‪ 512‬פעם לחבריו?‬
‫ב‪.‬‬
‫‪0.0032‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪0.0394‬‬
‫‪0.451‬‬
‫א‪.‬‬
‫‪0.0197‬‬
‫‪.6‬‬
‫סטודנט ערך חישובים לבדיקת הקשר בין שני משתנים ‪ X‬ו‪ .Y-‬הוא מצא שמשוואת הרגרסיה היא‪:‬‬
‫‪ Y=4.13-0.6X‬וכי מקדם המתאם ‪ .R= - 1.55‬לאור הממצאים ניתן לקבוע כי‪:‬‬
‫ה‪ .‬קיים קשר חיובי חזק בין שני המשתנים‪.‬‬
‫ו‪ .‬קיים קשר שלילי חלש בין המשתנים‪.‬‬
‫ז‪ .‬קיים קשר חיובי חלש בין שני המשתנים‪.‬‬
‫ח‪ .‬הסטודנט טעה בחישוביו‪.‬‬
‫‪.7‬‬
‫בונים רווח סמך לשיעור הצרכנים המשתכנעים לקנות טלפון סלולארי חדש לאחר שראו את הפרסומת‬
‫שלו‪ .‬במדגם של ‪ 100‬צרכנים השתכנעו ‪ 21‬לקנות טלפון סלולארי חדש לאחר שראו את הפרסומת שלו‪.‬רווח‬
‫הסמך שנבנה ברמת סמך של ‪ 98%‬הוא‪:‬‬
‫א‪(0.21  0.1073) .‬‬
‫‪.8‬‬
‫ב‪ (0.21  0.041) .‬ג‪ (0.21  0.095 .‬ד‪(0.21  0.061) .‬‬
‫עיר א'‬
‫‪7.98‬‬
‫‪4.84‬‬
‫‪10‬‬
‫בהנחה שזמני השיחה בשתי הערים בלתי תלויים ומתפלגים נורמאלית‪,‬‬
‫עיר ב'‬
‫‪4.32‬‬
‫‪3.61‬‬
‫‪12‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‬
‫‪.9‬‬
‫נתונה משוואת הרגרסיה הבאה‪ .Y = 50 + 0.5X1 – 0.8X2 :‬בחר תשובה אפשרית לגבי ‪.X2 ,X1 ,Y‬‬
‫ד‪.‬‬
‫‪ Y‬שכר של פועל כפונקציה של ‪ – X1‬מספר הפריטים שמייצר ו‪ X2-‬מספר תלונות נגדו מצד הממונה עליו‪.‬‬
‫ה‪.‬‬
‫‪ Y‬שכר של פועל כפונקציה של ‪ – X1‬מספר שנות ותק ו‪ – X2-‬מספר שנות לימוד‪.‬‬
‫ו‪.‬‬
‫‪ Y‬שכר של פועל כפונקציה של ‪ – X1‬מספר היעדרויות לא מוצדקות ו‪ – X2-‬מספר פריטים שהוא מייצר‪.‬‬
‫ד‪.‬‬
‫התשובות א‪ ',‬ב'‪ ,‬ג' נכונות‪.‬‬
‫‪250‬‬
‫שאלה ‪ :1‬ענה על ארבעה סעיפים בלבד‬
‫ספקית אינטרנט עורכת סקר כללי בקרב גולשים באינטרנט ‪ .‬במדגם מקרי של ‪ 20‬נשים ובמדגם מקרי של ‪20‬‬
‫גברים נבדק זמן הגלישה באינטרנט בשעות במשך חודש‪ .‬הנח אי תלות בין שני‬
‫המדגמים‪.‬‬
‫‪t-Test: Two-Sample‬‬
‫‪Assuming Equal‬‬
‫‪Variances‬‬
‫נשים‬
‫גברים‬
‫‪Variable Variable‬‬
‫‪2‬‬
‫‪1‬‬
‫‪16.65‬‬
‫‪19 Mean‬‬
‫‪121.5026 207.4737 Variance‬‬
‫‪20‬‬
‫‪164.4882 Pooled Variance‬‬
‫‪0 Difference‬‬
‫‪38 Df‬‬
‫‪0.579429 t Stat‬‬
‫‪0.282859 P(T<=t) one-tail‬‬
‫‪1.685954 t Critical one-tail‬‬
‫‪0.565719 P(T<=t) two-tail‬‬
‫‪2.024394 t Critical two-tail‬‬
‫ענה בעזרת הפלט על השאלות הבאות ‪:‬‬
‫א‪ .‬האם ניתן לומר שתוחלת זמן הגלישה באינטרנט של גברים גבוה משמעותית מזה של הנשים ברמת‬
‫מובהקות של ‪ . ? 10%‬מהו המבחן בו אתם משתמשים ? נסחו את ההשערות המתאימות ואת הנחות המבחן‪.‬‬
‫ב‪ .‬בדקו את ההשערה ‪:‬‬
‫‪H 0 : 1   2  2‬‬
‫‪H 1 : 1   2  2‬‬
‫ברמת מובהקות של ‪. 10%‬‬
‫ג‪ .‬חשבו רווח סמך לתוחלת זמן הגלישה החודשי של הגברים ברמת בטחון (רמת סמך) של ‪.95%‬‬
‫‪251‬‬
‫ספקית האינטרנט מתעניינת בקשר בין גיל הגולשים לזמן השימוש החודשי בשעות‪ .‬במדגם של ‪ 20‬גולשים‬
‫‪0.842371 Multiple R‬‬
‫‪0.70959 R Square‬‬
‫‪Adjusted R‬‬
‫‪0.693456 Square‬‬
‫‪3.357133 Standard Error‬‬
‫‪ANOVA‬‬
‫‪df‬‬
‫‪1 Regression‬‬
‫‪18 Residual‬‬
‫‪19 Total‬‬
‫‪Significance‬‬
‫‪F‬‬
‫‪F‬‬
‫‪MS‬‬
‫‪3.17E-06 43.98126 495.6838‬‬
‫‪11.27034‬‬
‫‪SS‬‬
‫‪495.6838‬‬
‫‪202.8662‬‬
‫‪698.55‬‬
‫‪Standard‬‬
‫‪Error‬‬
‫‪Coefficients‬‬
‫‪2.131305‬‬
‫‪38.37872 Intercept‬‬
‫‪0.051543‬‬
‫‪0.34183 X Variable 1‬‬
‫‪P-value‬‬
‫‪t Stat‬‬
‫‪5.85E-13 18.00714‬‬
‫‪3.17E-06 -6.63184‬‬
‫‪Lower 95%‬‬
‫‪33.90101‬‬
‫‪-0.45012‬‬
‫ענה על השאלות הבאות בעזרת הפלט ‪:‬‬
‫מה תוכל לומר על הקשר בין גיל הגולשים לזמן הגלישה ?‬
‫ד‪.‬‬
‫ה‪.‬‬
‫מהי התחזית לזמן הגלישה באינטרנט של גולש שגילו הוא ‪? 25‬‬
‫שאלה ‪ :2‬ענה על ארבעה סעיפים בלבד‬
‫חברת "הרזייה כדרך חיים" משווקת ערכות הרזיה בקופסאות‪ .‬על הקופסאות מצוין שמשקל הקופסה הוא בממוצע‬
‫‪ 500‬גרם עם סטיית תקן של ‪ 6‬גרם ‪.‬‬
‫צרכנים פנו בתלונה לרשות להגנת הצרכן בטענה שמשקל הקופסה נמוך מהמצוין על‪-‬גבי הקופסה‪.‬‬
‫לשם בדיקת הטענה נלקח מדגם של ‪ 9‬קופסאות ונמצא כי משקלן היה‪:‬‬
‫‪ 475, 493, 502, 500, 495,490 , 496, 498,503‬הנח שמשקל קופסה מתפלג נורמאלית באוכלוסיה‪.‬‬
‫א‪.‬‬
‫בדוק את טענת הצרכנים ברמת מובהקות של ‪2.5%‬‬
‫מה תהיה מסקנתך ברמות מובהקות של ‪1%‬‬
‫ו ‪ ? 10% -‬נמק ללא חישוב מחדש!‬
‫ב‪.‬‬
‫מהי רמת המובהקות המינימאלית לקבלת טענת הצרכנים?‬
‫ג‪.‬‬
‫חשב רווח בר סמך ברמת ביטחון של ‪ 95%‬לתוחלת משקל הקופסאות‪.‬‬
‫הנח כי סטיית התקן של ערכות ההרזיה אינה ידועה לך!‬
‫‪252‬‬
‫ד‪.‬‬
‫לחברה קו ייצור חדש העובד בשתי משמרות‪ :‬משמרת יום ומשמרת לילה‪.‬‬
‫התקבלו התוצאות הבאות על תפוקת ‪ 160‬עובדי שתי המשמרות ‪:‬‬
‫סה"כ‬
‫‪60‬‬
‫‪100‬‬
‫‪160‬‬
‫משמרת לילה‬
‫‪25‬‬
‫‪25‬‬
‫‪50‬‬
‫משמרת יום‬
‫‪35‬‬
‫‪75‬‬
‫‪110‬‬
‫תפוקה נמוכה‬
‫תפוקה גבוהה‬
‫סה"כ‬
‫האם יש תלות בין המשמרת לגובה התפוקה ? רמת מובהקות ‪.5%‬‬
‫ה‪.‬‬
‫כדי לבחון את יעילות הערכות נבחרו ‪ 5‬אנשים באופן מקרי ונבדק משקלם לפני השימוש בערכת‬
‫ההרזיה של החברה וחודש לאחר מכן‪ .‬להלן תוצאות הבדיקה‪:‬‬
‫לפני השימוש בערכת ההרזיה‬
‫‪78 68 73 85 87‬‬
‫אחרי השימוש בערכת ההרזיה ‪74 64 74 82 82‬‬
‫האם ניתן לומר ברמת מובהקות של ‪ 5%‬כי תוחלת המשקל לאחר השימוש בערכות ההרזיה של‬
‫"רזה לתמיד" קטנה לעומת המשקל לפני השימוש בה?‬
‫‪253‬‬
‫פרק שני (‪)52%‬‬
‫ענה על ‪ 10‬שאלות בלבד בפרק זה (כל שאלה ‪ .)5.2%‬סמן את התשובה הנכונה או את התשובה הקרובה ביותר ‪.‬‬
‫‪.1‬‬
‫‪ 200‬גרם וסטיית תקן של ‪ 50‬גרם‪.‬‬
‫משקל תפוח "גרנד" מתפלג נורמאלית עם תוחלת של‬
‫ירקן מוכר תפוחי "גרנד" באריזות של ‪ 16‬תפוחים‪ .‬ההסתברות שממוצע משקל של תפוח באריזה‬
‫ינוע בין ‪ 175‬גר' ל‪ 215 -‬גר' היא‪:‬‬
‫א‪0.8621 .‬‬
‫‪.2‬‬
‫ג‪0.6628 .‬‬
‫ב‪0.8849 .‬‬
‫ד‪0.7431 .‬‬
‫במאמר פורסם שרמת המובהקות המינימאלית לדחיית השערת האפס היא ‪ .5%‬משמעות הדבר הוא‪:‬‬
‫א‪ .‬שהשערת האפס תידחה ברמת מובהקות של ‪ 5%‬בלבד‪.‬‬
‫ב‪ .‬שהשערת האפס תידחה בכל רמת מובהקות של ‪ 5%‬לפחות ותתקבל בכל רמת מובהקות הנמוכה מ‪.5% -‬‬
‫ג‪ .‬שהשערת האפס תתקבל בכל רמת מובהקות של ‪ 5%‬לפחות ותידחה בכל רמת מובהקות הנמוכה מ‪.5% -‬‬
‫ד‪ .‬שהשערת האפס תידחה רק ברמת מובהקות בין ‪ 5%‬ל‪.10% -‬‬
‫‪.3‬‬
‫מכון התקנים רוצה לבדוק את תוחלת המשקל של בלוקים המיוצרים במפעל מסוים‪ .‬ידוע כי סטיית התקן של‬
‫משקל הבלוקים היא ‪ 200‬גרם‪ .‬מהו גודל המדגם המינימאלי שעליהם לבדוק אם רוצים שברמת ביטחון של ‪95%‬‬
‫אורך רווח הסמך לתוחלת לא יעלה על ‪ 100‬גרם? (בחר בתשובה הקרובה ביותר)‪.‬‬
‫א‪248 .‬‬
‫‪.4‬‬
‫ג‪53 .‬‬
‫ב‪110 .‬‬
‫ד‪62 .‬‬
‫בונים שני רווחי סמך לתוחלת של האוכלוסייה נורמאלית כאשר סטיית התקן ידועה‪ .‬רמת הסמך‬
‫של שני הרווחים זהה‪ .‬הרווח הראשון נבנה על סמך מדגם בגודל ‪ ,100‬בעוד שהרווח השני נבנה‬
‫על סמך מדגם בגודל ‪ .500‬הרווח הראשון ‪:‬‬
‫א‪ .‬ארוך פי ‪ 5‬מהרווח השני‪.‬‬
‫ב‪.‬‬
‫ג‪ .‬ארוך פי ‪ 2.236‬מהרווח השני‪.‬‬
‫ד‪ .‬קצר פי ‪ 5‬מהרווח השני‪.‬‬
‫‪.5‬‬
‫בונים רווח סמך לתוחלת של אוכלוסייה נורמאלית אחת‪ .‬לפניך שתי טענות‪:‬‬
‫‪.1‬‬
‫ככל שהמדגם לפיו חושב הרווח גדול יותר‪ ,‬רווח הסמך ארוך יותר‪.‬‬
‫‪.2‬‬
‫ככל שרמת הסמך של הרווח גדולה יותר‪ ,‬הרווח ארוך יותר‪.‬‬
‫א‪.‬‬
‫שתי הטענות נכונות‬
‫ב‪.‬‬
‫שתי הטענות לא נכונות‬
‫ג‪.‬‬
‫רק טענה ראשונה נכונה‬
‫ד‪.‬‬
‫רק טענה שנייה נכונה‬
‫‪254‬‬
‫‪.6‬‬
‫יצרן מזרונים רוכש קפיצים מספק הטוען כי ממוצע עמידתם בלחץ של הקפיצים שלו הינו ‪ 40‬ק"ג עם‬
‫סטיית תקן של ‪ 12‬ק"ג‪ .‬עקב תלונות קונים חושד היצרן כי ממוצע עמידתם בלחץ של הקפיצים נמוך מכפי שטוען‬
‫הספק‪ .‬לשם כך בוחר היצרן מדגם מקרי של ‪ 36‬קפיצים מתוצרת הספק ומוצא כי ממוצע עמידתם בלחץ הוא‬
‫‪ 38.5‬ק"ג‪ .‬רמת המובהקות המינימאלית עבורה תתקבל טענת היצרן היא‪:‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫‪0.28‬‬
‫‪0.2266‬‬
‫‪0.2‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪1‬‬
‫‪ .7‬חברה לסוכר אורזת על פי משקל‪ .‬משקל השקיות מפולג נורמאלית עם סטיית תקן של ‪ 0.06‬ק"ג‪.‬לצורך‬
‫בדיקת השערת האפס (‪ )Ho‬הטוענת כי תוחלת משקל הארוזה בייצור שווה ‪ 2‬ק"ג לעומת האלטרנטיבה האומרת‬
‫כי התוחלת שונה מ‪ 2-‬ק"ג‪ .‬נלקח מדגם של ‪ 50‬שקיות‪ .‬במדגם התקבל ממוצע ‪ 1.99‬ק"ג‪ .‬על כן‪:‬‬
‫א‪.‬‬
‫יש לדחות את השערת האפס ברמת מובהקות של ‪.0.01‬‬
‫ב‪.‬‬
‫יש לדחות את השערת האפס ברמת מובהקות של ‪.0.05‬‬
‫ג‪.‬‬
‫יש לדחות את השערת האפס ברמת מובהקות של ‪ ,0.1‬אך לא ברמת מובהקות ‪.0.05‬‬
‫ד‪.‬‬
‫אין לדחות את השערת האפס ברמת מובהקות של ‪.0.1‬‬
‫‪.8‬‬
‫בדקת השערה חד צדדית ברמת מובהקות ‪   0.05‬וקיבלת את השערת האפס‪.‬‬
‫סמן את התשובה הנכונה‪:‬‬
‫א‪ .‬מסקנה זהה תקבל גם ב ‪  0.1 -‬‬
‫ב‪ H 0 .‬תידחה ב‪.   0.01 -‬‬
‫ג‪ .‬מסקנה זהה תקבל גם ב – ‪  0.02‬‬
‫ד‪ H 0 .‬תידחה בהכרח ב‪.   0.07 -‬‬
‫‪.9‬‬
‫הנח כי הציונים בקורס מסוים באוניברסיטה מפולגים נורמאלית‪ .‬להלן ציוני בחינה של ‪ 6‬נבחנים‬
‫שנדגמו מקרית‪ .86 ,65 ,70 ,49 ,99 ,63 :‬רווח בר סמך ברמת ביטחון ‪ 0.95‬לממוצע הציונים בקורס הוא‪:‬‬
‫א‪.‬‬
‫‪.10‬‬
‫‪72 ± 17.07‬‬
‫ב‪.‬‬
‫‪72 ± 18.71‬‬
‫‪72 ± 17.81‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪72 ± 14.27‬‬
‫‪8‬‬
‫כמו כן‪ ,‬שיפוע קו הרגרסיה הוא ‪ 0.4569‬מקדם המתאם בין המשתנים הוא‪:‬‬
‫ב‪.‬‬
‫‪0.46‬‬
‫ג‪.‬‬
‫‪0.78‬‬
‫ד‪.‬‬
‫‪0.91‬‬
‫‪ X i2  14.24‬‬
‫‪X  1.25‬‬
‫‪i 1‬‬
‫‪8‬‬
‫‪ Yi2  4.83‬‬
‫א‪.‬‬
‫‪0.69‬‬
‫‪.11‬‬
‫סטטיסטיקאי החליט על מדיניות לפיה הוא משתמש תמיד ברמת מובהקות של ‪.2.5%‬‬
‫‪Y  0.7125‬‬
‫‪i 1‬‬
‫לטווח הארוך‪ ,‬הוא החליט נכונה‪:‬‬
‫א‪.‬‬
‫בערך ב ‪ 2.5%‬ממספר השערות האפס הנכונות שבדק‪.‬‬
‫ב‪ .‬בערך ב ‪ 97.5%‬ממספר השערות האפס הנכונות שבדק‪.‬‬
‫ג‪ .‬בערך ב ‪ 2.5%‬ממספר בדיקת ההשערות שביצע‪.‬‬
‫ד‪ .‬בערך ב ‪ 97.5%‬ממספר בדיקת ההשערות שביצע‪.‬‬
‫‪255‬‬
‫מבחן מס' ‪5‬‬
‫פרק ראשון – ‪40%‬‬
‫‪ .1‬בבורסה לני"ע בודקים את מחזורי העסקות במדד המעוף במשך מספר ימים‪ ,‬כמה ימים לאחר מכן נערכה‬
‫בדיקה דומה על מדד ת"א ‪ ,100‬להלן הממצאים (מס' עסקות במיליונים) ‪:‬‬
‫מדד‬
‫מעוף‬
‫‪2‬‬
‫‪1.5‬‬
‫‪4‬‬
‫‪3.2‬‬
‫‪1.5‬‬
‫‪4.7‬‬
‫‪3.9‬‬
‫‪2‬‬
‫‪1.8‬‬
‫ת"א‬
‫‪100‬‬
‫‪1.5‬‬
‫‪2.3‬‬
‫‪2‬‬
‫‪2.5‬‬
‫‪4.1‬‬
‫‪2.7‬‬
‫‪5.1‬‬
‫‪1.8‬‬
‫‪2.4‬‬
‫א‪ .‬האם קיים פער במחזורי העסקות בין המדדים השונים‪ ,‬בדקו ברמת מובהקות ‪?0.05‬‬
‫ב‪ .‬השנה שעברה הייתה ידועה כשנת מיתון ומחזורי המסחר היו נמוכים‪ ,‬מחזור המסחר היומי הממוצע‬
‫במדד המעוף היה כ‪ 2.1-‬מיליון ‪ ₪‬עם סטית תקן של ‪ ,₪ 300000‬האם נכונה הטענה כי המשק‬
‫מתאושש ומחזורי המסחר השנה גבוהים יותר? (‪)0.05‬‬
‫ג‪ .‬הנהלת הבורסה מעוניינת להכניס לבדיקה גם את מדדי הנדל"ן ומדד האג"ח (תל בונד)‪ ,‬להלן הממצאים (מס'‬
‫עסקאות במיליונים)‪:‬‬
‫נדל"ן‬
‫‪1.2‬‬
‫‪1.4‬‬
‫‪1‬‬
‫‪2.1‬‬
‫‪2.5‬‬
‫‪1.8‬‬
‫‪1.9‬‬
‫‪2‬‬
‫‪2.4‬‬
‫תל‬
‫בונד‬
‫‪1.4‬‬
‫‪1.8‬‬
‫‪2.3‬‬
‫‪2.1‬‬
‫‪2.5‬‬
‫‪1.7‬‬
‫‪0.9‬‬
‫‪1.4‬‬
‫‪2.2‬‬
‫בדקו האם קיים שוויון במחזורי העסקאות בין ארבעת מדדי הבורסה הנ"ל (‪)0.05‬‬
‫‪ .2‬תנועת הצופים מעוניינת לבדוק האם קיים קשר בין גיל לבין המוטיבציה להיות בתנועה‪ ,‬לצורך הבדיקה נערך‬
‫מדגם של ‪ 235‬חניכים‪ ,‬ונאספו הנתונים הבאים‪:‬‬
‫רמת מוטיבציה‬
‫כיתות ד‪-‬ו‬
‫כיתות ו‪-‬ט‬
‫כיתות י‪-‬יב‬
‫גבוהה‬
‫‪35‬‬
‫‪42‬‬
‫‪51‬‬
‫‪128‬‬
‫נמוכה‬
‫‪28‬‬
‫‪35‬‬
‫‪44‬‬
‫‪107‬‬
‫סה"כ‬
‫‪63‬‬
‫‪77‬‬
‫‪95‬‬
‫‪235‬‬
‫בצעו את הבדיקה עבור התנועה ברמת מובהקות של ‪.0.01‬‬
‫‪256‬‬
‫פרק שני – ‪60%‬‬
‫‪ .1‬אחוז המצביעים לראש הממשלה עמד על ‪ ,45%‬במסגרת קמפיין לשיפור מעמדו של ראש הממשלה‪ ,‬נדגמו‬
‫‪ 500‬איש ונמצא כי ‪ 255‬מתוכם תומכים בראש הממשלה‪.‬‬
‫החוקרים החליטו כי הקמפיין שיפר את התמיכה בראש הממשלה‪.‬‬
‫מהם סיכויי השגיאה בהחלטה?‬
‫א‪0.2% .‬‬
‫ב‪0.14% .‬‬
‫ג‪0.1% .‬‬
‫ד‪ .‬אף תשובה אינה נכונה‬
‫‪ .2‬בהמשך לשאלה ‪ ,1‬אחד החוקרים ניסח את השערות המחקר באופן הבא‪:‬‬
‫‪H1 : ___  0‬‬
‫החלטת החוקרים הייתה זה להחלטתם בסעיף ‪1‬‬
‫מהם סיכויי השגיאה בהחלטה? ___________‬
‫‪H0 :   7‬‬
‫‪.3‬‬
‫‪H1 :   7‬‬
‫מדגם מקרי בגודל ‪ 15‬מתוך אוכלוסיה המתפלגת נורמאלית עם שונות לא ידועה‪ .‬על סמך‬
‫תוצאות המדגם הוא חישב וקיבל ‪t  1.88 :‬‬
‫‪.4‬‬
‫רופא בדק את משך הזמן הלוקח לתרופה נגד כאבים להורדת הכאב‪ ,‬ביחס לתרופה קודמת‬
‫אשר משך זמן השפעתה הוא ‪ 40‬דקות‪,‬‬
‫בדגימה של ‪ 10‬חולים התקבלו התוצאות הבאות‪:‬‬
‫‪38,40,37,35,41,42,39,35,37,40‬‬
‫מהי רמת המובהקות המינימאלית לקבלת טענת הרופא?‬
‫א‪ 0     0.025 .‬ב‪ 0.025     0.05 .‬ג‪ 0.05     0.1 .‬ד‪   0.1.‬‬
‫‪.5‬‬
‫במסגרת המאמצים לשיפור הישגי הרצים למרחקים קצרים‪ ,‬נערך מחקר לבדיקת ההישגים ע"י מאמנת‬
‫ביחס להישגים ע"י מאמן‪ ,.‬להלן התוצאות‪ ,‬בשניות בריצת ‪ 500‬מטר‬
‫ד‬
‫ה‬
‫ג‬
‫ב‬
‫א‬
‫‪74 70.5 76.5‬‬
‫‪85‬‬
‫‪76‬‬
‫מאמן‬
‫‪72 72.5‬‬
‫‪75‬‬
‫‪85 72.5‬‬
‫מאמנת‬
‫מהי השגיאה האפשרית בטענה כי מאמנות טובות יותר ממאמנים ‪?   0.05‬‬
‫א‪ 0.1    0.15 .‬ב‪ 0.1    0.25 .‬ג‪ 0.05    0.1 .‬ד‪0.05    0.1 .‬‬
‫‪257‬‬
‫‪.6‬‬
‫מבחן חי בריבוע לאי תלות התבסס על טבלת ‪ ,2/2‬הערך הנבדק היה ‪ 9‬וברמת מובהקת של ‪ 0.05‬נדחתה‬
‫השערת האפס‬
‫כיצד תשתנה ההחלטה במעבר לטבלת ‪? 5/2‬‬
‫א אין שינוי בהחלטה‬
‫ב מקבלים את השערת האפס‬
‫ג לא ניתן לקבל החלטה ללא נתונים‬
‫ד לא ניתן לנתח נתונים בטבלת ‪5/2‬‬
‫‪.7‬‬
‫בדקת השערה כנגד אלטרנטיבה דו צדדית ברמת מובהקות של ‪ 5%‬ודחית את השערת האפס‪.‬‬
‫‪.1‬‬
‫אילו תבדוק את אותה השערה‪ ,‬על סמך אותו המדגם‪ ,‬כנגד אלטרנטיבה חד צדדית‪,‬‬
‫ברמת מובהקות של ‪ ,2.5%‬תגיע לאותה מסקנה‪.‬‬
‫‪.2‬‬
‫‪.8‬‬
‫רמת המובהקות המינימאלית לדחיית השערת האפס עבור מבחן חד צדדי היא ‪2.5%‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫פנצ'ר מאכר רוצה לבדוק את תוחלת המשקל של הצמיגים במחסן‪.‬‬
‫ידוע כי סטיית התקן של משקל הצמיגים היא ‪ 1100‬גרם‪.‬‬
‫מהו גודל המדגם המינימאלי שעליו לבדוק‪ ,‬אם הוא מעוניין שברמת ביטחון של ‪ 95%‬המרחק בין המשקל‬
‫הנמוך למשקל הגבוה לא יעלה על ‪ 300‬גרם? (בחר בתשובה הקרובה ביותר )‬
‫א‪52 .‬‬
‫‪.9‬‬
‫ב‪26 .‬‬
‫ד‪244 .‬‬
‫ג‪206 .‬‬
‫*‬
‫ככל שהמדגם לפיו חושב הרווח קטן יותר‪ ,‬רווח הסמך קצר יותר‪.‬‬
‫*‬
‫ככל שרמת הביטחון (רמת הסמך) של הרווח גדולה יותר‪ ,‬הרווח קצר יותר‪.‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪258‬‬
‫‪.10‬‬
‫השערת האפס (‪ )Ho‬היא שאין הבדל בין ההוצאות החודשיות הממוצעות למשלוח מסרונים‬
‫בין גברים ונשים‪ .‬ההשערה האלטרנטיבית (‪ )H1‬היא שההוצאות החודשיות הן שונות‪.‬‬
‫לבדיקת השערות אלו נלקחו שני מדגמים בלתי תלויים של גברים ונשים והתקבל‪:‬‬
‫א‪.‬‬
‫נשים‬
‫גברים‬
‫‪₪ 98‬‬
‫‪₪ 90‬‬
‫‪₪ 16‬‬
‫‪₪ 10‬‬
‫סטיית תקן מדגמית‬
‫‪17‬‬
‫‪15‬‬
‫ברמת מובהקות של ‪ 5%‬נדחה את ‪ ,Ho‬אך לא ברמת מובהקות של ‪.10%‬‬
‫ב‪.‬‬
‫ברמת מובהקות ‪ 10%‬נדחה את ‪ .Ho‬ג‪ .‬ברמת מובהקות ‪ 5%‬נקבל את ‪Ho‬‬
‫ד‪ .‬ברמות מובהקות של ‪ 10%‬וגם של ‪ 5%‬מקבלים את ‪Ho‬‬
‫ה‪ .‬אף תשובה אינה נכונה‪.‬‬
‫‪ .11‬השערת האפס נדחית ברמת מובהקות של ‪ 2%‬כנגד אלטרנטיבה דו‪-‬צדדית‪ .‬אם תבצע אותו המבחן על סמך‬
‫אותם הנתונים כנגד אלטרנטיבה חד‪-‬צדדית‪:‬‬
‫א‪ .‬השערת האפס בטוח תדחה ברמת מובהקות של ‪.3%‬‬
‫ב‪ .‬השערת האפס בטוח תדחה ברמת מובהקות של ‪.1%‬‬
‫ג‪ .‬השערת האפס בטוח תדחה ברמת מובהקות של ‪.10%‬‬
‫ד‪ .‬השערת האפס בטוח תתקבל ברמת מובהקות של ‪.4%‬‬
‫‪.12‬‬
‫הנהלת תחנת דלק‪ ,‬בדקה את הזמן הממוצע בו נמצא לקוח בתחנה‪.‬‬
‫לצורך הבדיקה דגמה התחנה ‪ 26‬לקוחות‪ ,‬סטית תקן של הזמן היא ‪ 4‬דקות‪.‬‬
‫החישוב הראה כי תוחלת הזמן היא‪ 11 - 6 :‬דקות‪.‬‬
‫מהנתונים ניתן להסיק כי רמת הביטחון במסקנה היא‪:‬‬
‫א‪ .‬גדולה מ‪99%-‬‬
‫ב‪ .‬קטנה מ‪99%-‬‬
‫ג‪ .‬קטנה מ‪99.5% -‬‬
‫ד‪ .‬אף תשובה לא נכונה‬
‫ה‪ .‬יש יותר מתשובה אחת נכונה‬
‫‪259‬‬
‫מבחן ‪6‬‬
‫‪ .1‬מסעדה בדקה את הטיפים אשר מרוויחים ארבעת מלצריה במשך מספר ימים‪.‬‬
‫להלן נתוני השכר של כל מלצר כפי שנאספו בדגימה מקרית של מספר ימים‪.‬‬
‫א‬
‫‪48‬‬
‫‪55‬‬
‫‪60‬‬
‫‪81‬‬
‫‪105‬‬
‫‪120‬‬
‫‪74‬‬
‫ב‬
‫‪62‬‬
‫‪75‬‬
‫‪70‬‬
‫‪69‬‬
‫‪125‬‬
‫‪80‬‬
‫‪61‬‬
‫ד‬
‫‪78‬‬
‫‪71‬‬
‫‪80‬‬
‫‪88‬‬
‫‪95‬‬
‫‪110‬‬
‫‪85‬‬
‫ג‬
‫‪85‬‬
‫‪90‬‬
‫‪50‬‬
‫‪44‬‬
‫‪98‬‬
‫‪75‬‬
‫‪80‬‬
‫א‪ .‬האם קיים פער בין השכר של עובד ג לעובד ד‪( .‬בדקו ברמת מובהקות של ‪)0.05‬‬
‫ב‪ .‬ידוע כי אחיו של מלצר ד‪ ,‬אשר עבד במסעדה לפניו‪ ,‬השתכר בממוצע ‪ ₪ 93‬למשמרת‪ ,‬האם נכון לומר כי‬
‫שכרו של האח היה גבוה יותר משכרו של מלצר ד' (‪.)0.01‬‬
‫ג‪.‬‬
‫האם נכונה הטענה כי ברמת מובהקות של ‪ 0.05‬רמת השכר של כל המלצרים זהה‪.‬‬
‫‪ .2‬חברת ביטוח מעוניינת לבדוק האם קיים קשר בין גיל הנהג למספר התאונות אותן עבר בשנה‪.‬‬
‫מספר תאונות‬
‫‪17-22‬‬
‫‪23-30‬‬
‫מעל ‪30‬‬
‫עד ‪1‬‬
‫‪15‬‬
‫‪30‬‬
‫‪40‬‬
‫‪85‬‬
‫מעל ‪1‬‬
‫‪25‬‬
‫‪25‬‬
‫‪35‬‬
‫‪85‬‬
‫סה"כ‬
‫‪40‬‬
‫‪55‬‬
‫‪75‬‬
‫‪170‬‬
‫בצעו את הבדיקה עבור התנועה ברמת מובהקות של ‪.0.01‬‬
‫‪260‬‬
‫פרק שני – ‪60%‬‬
‫‪ .1‬חברת סלולר החליטה לאמוד את משך זמן ש"מבלה" לקוח ממוצע בתחנת השרות של החברה‪ .‬סטית תקן‬
‫של הזמן היא ‪ 12.481‬דקות‪ .‬על סמך מדגם של ‪ 20‬לקוחות חושב רווח סמך לתוחלת הזמן ‪29.43-:‬‬
‫‪ 40.37‬דקות‪ .‬רמת הסמך של הרווח היא‪:‬‬
‫א‪95% .‬‬
‫ב‪97.5% .‬‬
‫ג‪98% .‬‬
‫ד‪99% .‬‬
‫‪.2‬‬
‫במבחן שנערך נמצא כי רמת המובהקות המינימאלית לדחיית ‪ H0‬היא ‪ .5%‬המשמעות היא ‪:‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪.3‬‬
‫‪H 0 :   15‬‬
‫‪H1 :   15‬‬
‫מדגם מקרי בגודל ‪ 30‬מתוך אוכלוסייה המתפלגת נורמאלית עם שונות לא ידועה‪ .‬על סמך‬
‫תוצאות המדגם הוא חישב וקיבל ‪ , t  2.45 :‬לכן המסקנה היא ‪:‬‬
‫‪.4‬‬
‫עיר א'‬
‫‪7.98‬‬
‫‪4.84‬‬
‫‪10‬‬
‫בהנחה שזמני השיחה בשתי הערים בלתי תלויים ומתפלגים נורמאלית‪.‬‬
‫עיר ב'‬
‫‪4.32‬‬
‫‪3.61‬‬
‫‪12‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‬
‫‪261‬‬
‫‪.5‬‬
‫לבדיקת הצלחת דיאטה להרזיה ניתן תפריט לחמישה גברים ונבדק משקלם לאחר שבוע‬
‫משה‬
‫דוד‬
‫שאול דני‬
‫יוסי‬
‫‪74 70.5 76.5‬‬
‫‪85‬‬
‫‪76‬‬
‫לפני‬
‫‪72 72.5‬‬
‫‪75‬‬
‫‪85 72.5‬‬
‫אחרי‬
‫מהי השגיאה האפשרית בטענה כי התפריט החדש גורם לירידה במשקל ‪?   0.05‬‬
‫א‪ 0.1    0.15 .‬ב‪ 0.1    0.25 .‬ג‪ 0.05    0.1 .‬ד‪0.05    0.1 .‬‬
‫‪.6‬‬
‫הרווחים זהה‪ .‬הרווח הראשון נבנה על מדגם בגודל ‪ ,100‬הרווח השני נבנה על מדגם בגודל ‪ .500‬הרווח הראשון ‪:‬‬
‫ב‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫קצר פי ‪ 5‬מהרווח השני‪.‬‬
‫‪.7‬‬
‫חוקר ביצע ניסוי ‪ .‬הוא ניסח את ההשערות הבאות ‪. H 0 :   0 H1 :   0 :‬‬
‫לצורך בדיקה הוא לקח מדגם מקרי בגודל ‪ 5‬מתוך אוכלוסייה המתפלגת נורמאלית עם שונות לא ידועה‪ .‬על סמך‬
‫תוצאות המדגם הוא חישב וקיבל ‪:‬‬
‫‪ . t stat  2.776‬לכן המסקנה היא ‪:‬‬
‫א‪.‬‬
‫ידחה ‪ H 0‬ברמת מובהקות ‪ 0.1‬אך לא כן ברמת מובהקות ‪.0.05‬‬
‫ב‪.‬‬
‫ידחה ‪ H 0‬ברמת מובהקות ‪ 0.05‬אך לא ברמת ‪.0.025‬‬
‫ג‪.‬‬
‫ידחה ‪ H 0‬ברמת מובהקות ‪ 0.025‬אך לא ברמת ‪0.01‬‬
‫‪.8‬‬
‫ד‪ .‬הוא לא ידחה ‪ H 0‬ברמת מובהקות ‪.0.1‬‬
‫בדקת השערה כנגד אלטרנטיבה חד צדדית ברמת מובהקות של ‪ 5%‬וקיבלת את השערת האפס‪.‬‬
‫‪.1‬‬
‫אילו תבדוק את אותה השערה‪ ,‬על סמך אותו המדגם‪ ,‬כנגד אלטרנטיבה דו צדדית‪,‬‬
‫ברמת מובהקות של ‪ ,10%‬תגיע לאותה מסקנה‪.‬‬
‫‪.2‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪.9‬‬
‫‪.I‬‬
‫ככל שהמדגם לפיו חושב הרווח גדול יותר‪ ,‬כך רווח הסמך יהיה קצר יותר‪.‬‬
‫‪.II‬‬
‫ככל שרמת הביטחון (רמת הסמך) של הרווח גדולה יותר‪ ,‬יהיה הרווח ארוך יותר‪.‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪262‬‬
‫בדקו‬
‫‪.10‬‬
‫‪ H 0 :   100‬לעומת‬
‫‪ . H1 :   100‬כדי לבדוק השערות אלה באוכלוסייה בעלת‬
‫התפלגות נורמאלית וסטית תקן ‪ ,20‬נלקח מדגם בגודל ‪ ,8‬והוחלט לדחות את ‪ H 0‬אם ממוצע המדגם יהיה מעל‬
‫‪.110‬‬
‫א‪0.0359 .‬‬
‫ג‪0.9641 .‬‬
‫ב‪0.0793 .‬‬
‫ד‪0.05 .‬‬
‫‪ .11‬הנח כי הציונים בקורס מסוים באוניברסיטה מפולגים נורמאלית‪ .‬להלן ציוני בחינה של ‪ 8‬נבחנים‬
‫שנדגמו מקרית‪,86 ,65 ,70 ,49 ,99 ,63,71,94 :‬‬
‫רווח בר סמך ברמת ביטחון ‪ 0.95‬לממוצע הציונים בקורס הוא‪:‬‬
‫ב‪.‬‬
‫‪72 ± 18.71‬‬
‫ג‪.‬‬
‫‪74.62 ± 11.76‬‬
‫ד‪72 ± 7.57 .‬‬
‫א‪.‬‬
‫‪74.62 ± 7.57‬‬
‫‪.12‬‬
‫סטטיסטיקאי חישב רווח בר סמך לתוחלת זמן השירות של עובדי שירות לקוחות ‪5.72    8.28‬‬
‫גודל המדגם ‪ 65 -‬עובדים ונמצא כי ‪ X  7‬וסטית התקן של כלל העובדים היא ‪ 3.4‬ד'‪.‬‬
‫מהו גודל המדגם המינימאלי על מנת שאורך הרווח לא יעלה על ‪ 0.5‬דקה‪ ,‬ברמת בטחון של ‪? 95%‬‬
‫א‪.‬‬
‫‪711‬‬
‫ב‪860 .‬‬
‫ג‪.‬‬
‫‪1040‬‬
‫ד‪ .‬אף תשובה אינה נכונה‪ ,‬התשובה הנכונה היא_____‬
‫‪263‬‬
‫‪ .1‬רשת פיצריות בדקה את הפדיון היומי בארבעה סניפים מבין סניפי הרשת‪.‬‬
‫להלן הנתונים היומיים אשר (באלפי שקלים)‪.‬‬
‫נתניה‬
‫רמת גן‬
‫הרצליה‬
‫ירושלים‬
‫‪18‬‬
‫‪14‬‬
‫‪12‬‬
‫‪15‬‬
‫‪15‬‬
‫‪15‬‬
‫‪14‬‬
‫‪12‬‬
‫‪19‬‬
‫‪21‬‬
‫‪17‬‬
‫‪18‬‬
‫‪16‬‬
‫‪16‬‬
‫‪14‬‬
‫‪12‬‬
‫‪14‬‬
‫‪11‬‬
‫‪16‬‬
‫‪15‬‬
‫‪21‬‬
‫‪14‬‬
‫‪16‬‬
‫‪15‬‬
‫א‪ .‬האם קיים הבדל בין הכנסות הרשת בסניפים השונים (רמת מובהקות ‪?.)5%‬‬
‫ב‪ .‬האם נכונה הטענה כי צריכת הפיצות של תושבי רמת גן אינה זהה לצריכת הפיצות של תושבי נתניה? (ברמת‬
‫מובהקות של ‪.)5%‬‬
‫ג‪.‬‬
‫ממוצע הפדיון היומי בכל סניפי הרשת עומד על ‪ 15.1‬עם סטית תקן של ‪ ,2.5‬האם נכונה הטענה כי סניף‬
‫נתניה הוא סניף "חזק" וממוצע ההכנסות בו גבוה מהממוצע הרשתי (יש לבצע בדיקה מלאה ברמת מובהקות‬
‫של ‪.)3%‬‬
‫ד‪ .‬מנהל סניף נתניה מעונין להוכיח להנהלה כי הסניף שלו בעל הכנסות גבוהות‬
‫מהממוצע הרשתי‪ ,‬מהי רמת המובהקות בה עליו להשתמש כדי להוכיח את טענתו‪.‬‬
‫‪ .2‬אוניברסיטה בדקה האם יש תלות בין אישיות הסטודנט לבין תחום לימודיו‪ ,‬הסטודנטים חולקו לשני טיפוסי‬
‫אישיות‪ ,‬נתוני התצפיות בטבלה‬
‫מדעי החברה‬
‫מדעי הטבע‬
‫מדעי הרוח‬
‫סה"כ‬
‫טיפוס אישיות א'‬
‫‪56‬‬
‫‪47‬‬
‫‪50‬‬
‫‪153‬‬
‫טיפוס אישיות ב'‬
‫‪8‬‬
‫‪14‬‬
‫‪5‬‬
‫‪27‬‬
‫סה"כ‬
‫‪64‬‬
‫‪61‬‬
‫‪55‬‬
‫‪180‬‬
‫בדקו האם יש תלות בין טיפוס אישיות‪ ,‬אליו משתייך הסטודנט לבין תחום הלימוד שלו ברמת מובהקות ‪.0.05‬‬
‫‪264‬‬
‫פרק שני – ‪60%‬‬
‫‪.1‬‬
‫חוקר קיבל את השערת האפס על סמך הנתונים הבאים‪:‬‬
‫‪n9‬‬
‫‪  14.5‬‬
‫‪ 6‬‬
‫‪0  10‬‬
‫‪C  15‬‬
‫מנתונים אלה עולה כי סיכויי השגיאה במסקנות הם‪:‬‬
‫א‪.‬‬
‫‪.2‬‬
‫‪1.22%‬‬
‫ב‪.‬‬
‫ג‪0.62% .‬‬
‫‪40.13%‬‬
‫ד‪35.6% .‬‬
‫במבחן שנערך נמצא כי ברמת מובהקות של ‪ 5%‬דחינו את ‪ .H0‬המשמעות היא ‪:‬‬
‫א‪ .‬ניתן לדחות את ‪ H0‬ברמת מובהקות של ‪.3%‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪ .‬נדחה את ‪ H0‬ברמת מובהקות של ‪ ,10%‬אך לא ניתן לדעת לגבי רמת מובהקות של ‪.3%‬‬
‫‪ .3‬חוקר ביצע ניסוי ‪ .‬הוא ניסח את ההשערות הבאות ‪H 0 :   4 H1 :   4 :‬‬
‫לצורך בדיקה הוא לקח מדגם מקרי בגודל ‪ 20‬מתוך אוכלוסייה המתפלגת נורמאלית‪ ,‬עם סטית תקן ‪ ,2‬לאור תוצאות‬
‫המדגם הוא חישב וקיבל בטבלה את הערך ‪:2.33‬‬
‫א‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות של ‪ 4%‬אך לא כן ברמת מובהקות ‪.1%‬‬
‫ב‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 5%‬אך לא כן ברמת מובהקות ‪.2.5%‬‬
‫ג‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 2.5%‬אך לא כן ברמת מובהקות ‪1.5%‬‬
‫ה‪ .‬יש יותר מתשובה אחת נכונה‪.‬‬
‫ידוע כי ‪ 80%‬מהאוכלוסייה עובדים‪ .‬בעקבות תוכנית ויסקונסין יש הטוענים כי אחוז העובדים‬
‫‪.4‬‬
‫באוכלוסייה עלה ויש הטוענים כי אחוז העובדים לא השתנה‪.‬‬
‫כדי לבדוק זאת נלקח מדגם מקרי של ‪ 400‬איש ונמצא כי ‪ 336‬מתוכם עובדים‬
‫מהי רמת המובהקות המינימלית לדחיית השערת האפס?‬
‫א‪0.05 .‬‬
‫‪.5‬‬
‫ג‪0.0146 .‬‬
‫ב‪0.0137 .‬‬
‫ד‪_____ .‬‬
‫בהמשך לתרגיל ‪ ,4‬מהם אחוזי השגיאה במסקנה אם הטענה נבדקה ברמת מובהקות של ‪.1%‬‬
‫א‪44.04% .‬‬
‫ב‪40.13% .‬‬
‫ג‪0.62% .‬‬
‫ד‪0.52% .‬‬
‫‪265‬‬
‫‪ .6‬לבדיקת השפעת שיעורי תגבור‪ ,‬בחינה נערכה פעמיים‪ ,‬לפני שעורי תגבור ולאחר ‪ 10‬שיעורי תגבור‪,‬‬
‫להלן הציונים‪.‬‬
‫מספר נבחן‬
‫לפני‬
‫אחרי‬
‫‪1‬‬
‫‪74‬‬
‫‪76‬‬
‫‪2‬‬
‫‪81‬‬
‫‪85‬‬
‫‪3‬‬
‫‪76‬‬
‫‪81‬‬
‫‪4‬‬
‫‪78‬‬
‫‪83‬‬
‫‪5‬‬
‫‪84‬‬
‫‪80‬‬
‫רשמו את סוג המבחן‪:‬‬
‫________________________________________________________________‬
‫רשמו את ההשערות‪:‬‬
‫‪_____________________________________________________________ H 0‬‬
‫‪_____________________________________________________________ H 1‬‬
‫בהמשך לשאלה ‪ ,6‬מהי רמת המובהקות המינימאלית לדחיית השערת האפס?‬
‫‪.7‬‬
‫א‪ 0.1   '  0.15 .‬ב‪ 0.2   '  0.5 .‬ג‪ 0.05   '  0.1 .‬ד‪ 0.05   '  0.1 .‬ה‪_____   '  ____ .‬‬
‫בונים רווח בר סמך לתוחלת של אוכלוסייה נורמאלית כאשר סטיית התקן ידועה‪ .‬הרווח נבנה על סמך‬
‫‪.8‬‬
‫מדגם של ‪ 10‬איש ורמת מובהקות של ‪.10%‬‬
‫לאחר מכן בונים רווח חדש על סמך מדגם של ‪ 40‬איש ורמת מובהקות של ‪.5%‬‬
‫א‪ .‬לא יהיה שינוי באורך הרווח המקורי‬
‫ב‪ .‬הרווח החדש יהיה קצר יותר אך בפחות מפי ‪ 2‬מהקודם‬
‫ג‪.‬‬
‫הרווח החדש יהיה קצר ביותר מפי ‪ 2‬מהקודם‪.‬‬
‫ד‪ .‬הרווח החדש יהיה קצר פי ‪ 2‬מהרווח הקודם‪.‬‬
‫ה‪ .‬בגלל שני השינויים‪ ,‬לא ניתן יהיה לדעת מה יקרה לרווח‪.‬‬
‫ביבי רוצה לפרסם לציבור כי אחוזי התמיכה בו בעליה‪ ,‬ע"פ סקר קודם אחוזי התמיכה בו היו ‪,35%‬‬
‫‪.9‬‬
‫בסקר חדש שנערך על ‪ 500‬איש נמצא כי ‪ 200‬איש תומכים בביבי‪.‬‬
‫באיזו רמת מובהקות עליו לנתח את הנתונים כדי שיוכל לפרסם כי אחוזי התמיכה בו עלו‪.‬‬
‫א‪ .‬רמת מובהקות נמוכה מ‪1%-‬‬
‫ב‪ .‬רמת מובהקות גבוהה מ‪1.5%-‬‬
‫ג‪.‬‬
‫רמת מובהקות נמוכה מ‪5%-‬‬
‫ד‪ .‬רמת מובהקות נמוכה מ‪.1.13%-‬‬
‫‪266‬‬
‫‪.10‬‬
‫בדקת השערה כנגד אלטרנטיבה חד צדדית ומצאת כי רמת המובהקות המינימאלית היא ‪.2%‬‬
‫‪.11‬‬
‫‪.1‬‬
‫באלטרנטיבה דו צדדית‪ ,‬ברמת מובהקות של ‪ 5%‬תדחה את השערת האפס‬
‫‪.2‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫בדקו‬
‫‪ H 0 :   100‬לעומת‬
‫‪ . H1 :   100‬כדי לבדוק השערות אלה באוכלוסייה בעלת‬
‫התפלגות נורמאלית וסטית תקן מדגמית של ‪ 20‬נלקח מדגם בגודל ‪ ,8‬הוחלט לדחות את ‪ H 0‬אם ממוצע המדגם‬
‫יהיה מעל ‪. 110‬‬
‫א‪0.0359 .‬‬
‫ג‪0.9641 .‬‬
‫ב‪0.1 .‬‬
‫ד‪0.05 .‬‬
‫‪ .12‬חברה מייצרת ברגים ומתחייבת לקוטר בורג של ‪ 5‬מ"מ‪.‬‬
‫במדגם מקרי של ‪ 9‬ברגים נמצאו הקטרים הבאים ב‪-‬מ"מ‪:‬‬
‫‪4.2 3.9 5.1 5 4.8 4.5 5.2 4.6 4.9‬‬
‫רווח בר סמך ברמת ביטחון ‪ 2%‬לממוצע קוטר הברגים הוא‪:‬‬
‫א‪.‬‬
‫‪5 ± 0.333‬‬
‫ב‪.‬‬
‫‪4.68 ± 0.333‬‬
‫ג‪.‬‬
‫‪4.68 ± 0.1765‬‬
‫ד‪5 ± 0.415 .‬‬
‫‪267‬‬
‫‪ .1‬לקראת החגים נערכה השוואת מחיר "סל קניות לחג" בין מספר רשתות שיווק (בסניפים שונים) להלן‬
‫הנתונים אשר התקבלו (המספרים מציינים מחיר סל קניות ב‪)₪-‬‬
‫רשת‬
‫הריבוע‬
‫העגול‬
‫רשת‬
‫הלקוח‬
‫התמוי‬
‫‪900‬‬
‫‪960‬‬
‫‪1020‬‬
‫‪860‬‬
‫‪960‬‬
‫‪1100‬‬
‫‪1420‬‬
‫‪1020‬‬
‫‪860‬‬
‫‪1100‬‬
‫‪940‬‬
‫‪1020‬‬
‫‪1100‬‬
‫‪840‬‬
‫‪1240‬‬
‫‪980‬‬
‫א‪ .‬האם קיים פער במחיר "סל קניות לחג" בין שתי הרשתות? בדקו ברמת מובהקות ‪?10%‬‬
‫ב‪ .‬במסע פרסום של רשת הריבוע העגול‪ ,‬מפרסמת הרשת כי עלות סל קניות לחג ברשת בשנה שעברה‬
‫עמדה על ‪ ,₪ 1120‬ואילו השנה סל קניות לחג ברשת זול יותר‪ .‬האם יש אמת בפרסום (רמת‬
‫מובהקות ‪)0.05‬‬
‫ג‪ .‬לאור טענת צרכנים לקרטל ולהתאמת מחירים בין הרשתות‪ ,‬ערכה המועצה לצרכנות בדיקה של שתי רשתות‬
‫נספות‪ .‬בדקו ברמת מובהקות של ‪ ,0.05‬האם טענת הצרכנים נכונה‪.‬‬
‫רשת‬
‫‪A‬‬
‫רשת‬
‫‪B‬‬
‫‪840‬‬
‫‪920‬‬
‫‪960‬‬
‫‪880‬‬
‫‪1020‬‬
‫‪840‬‬
‫‪1060‬‬
‫‪856‬‬
‫‪780‬‬
‫‪1020‬‬
‫‪900‬‬
‫‪1080‬‬
‫‪1000‬‬
‫‪970‬‬
‫‪1100‬‬
‫‪830‬‬
‫‪920‬‬
‫‪ .2‬תחנת דלק מעסיקה עובדים בשלוש משמרות‪ ,‬מנהל התחנה רוצה לבדוק את הטענה כי יש קשר בין שעות‬
‫העבודה לבין התפוקה‪ ,‬לצורך בדיקת הטענה נלקח מדגם של ‪ 390‬מעובדי המאפיה‬
‫ונבדקה תפוקת העובדים (כמה מכוניות תודלקו ע"י העובדים בכל משמרת) ביחס למשמרת‪ ,‬בדקו את‬
‫הטענה ברמת מובהקות של ‪.0.01‬‬
‫תפוקה‬
‫סה"כ‬
‫משמרת בוקר‬
‫‪35‬‬
‫‪20‬‬
‫‪55‬‬
‫משמרת צהרים‬
‫‪20‬‬
‫‪30‬‬
‫‪50‬‬
‫משמרת ערב‬
‫‪40‬‬
‫‪25‬‬
‫‪65‬‬
‫‪95‬‬
‫‪75‬‬
‫‪170‬‬
‫‪268‬‬
‫פרק שני – ‪60%‬‬
‫‪ .3‬מכונאי בדק האם בלמים חדשים של מכוניות שונים מבלמים ישנים יותר‪ ,‬הבדיקה נעשתה ביחס לבלמים‬
‫שמשך זמן העצירה שלהם במהירות של ‪ 60‬קמ"ש הוא ‪ 51.58‬שניות‪.‬‬
‫בדגימה של ‪ 10‬מכוניות נבדקו זמני הבלימה במהירות של ‪ 60‬קמ"ש‪ ,‬להלן התוצאות‪:‬‬
‫‪39,53,52,48,61,49,48,42,32,37‬‬
‫מהי רמת המובהקות המינימאלית לקבלת טענת המכונאי?‬
‫א‪2.31% .‬‬
‫ב‪.‬‬
‫‪1.1%‬‬
‫ג‪.‬‬
‫‪0.55%‬‬
‫ד‪.‬‬
‫‪5%‬‬
‫ד‪.‬‬
‫‪ .4‬במסגרת המאמצים לבדיקת השפעת אכילת קורנפלקס לפני תחרות‪ ,‬על הישגי רצי מרתון ‪ ,‬נערך מחקר‬
‫לבדיקת ההישגים לאחר אכילת קורנפלקס וללא אכילת קורנפלקס (טבלת זמנים בדקות)‪.‬‬
‫להלן התוצאות בדקות‪:‬‬
‫איתן‬
‫‪205‬‬
‫‪195‬‬
‫משה איתי‬
‫דוד‬
‫יוסי‬
‫שם הרץ‬
‫‪220 185 200‬‬
‫ללא קורנפלקס ‪180‬‬
‫‪200 190 190‬‬
‫‪172‬‬
‫קורנפלקס‬
‫מהי השגיאה האפשרית בטענה כי קורנפלקס טוב להישגים ‪?   0.05‬‬
‫א‪ 0.1   '  0.15 .‬ב‪ 0.1    0.25 .‬ג‪ 0.025   '  0.05 .‬ד‪ 0.5    0.8 .‬ה‪____ .‬‬
‫‪.3‬‬
‫בשנה שעברה מחיר ממוצע של אופני שטח חדשות עמד על ‪ ,₪ 7580‬לבדיקת הטענה כי מחירי האופנים‬
‫ירדו השנה ביחס לשנה שעברה ברמת מובהקות של ‪ ,5%‬נלקח מדגם של ‪ 7‬זוגות אופני שטח חדשות ונבדק‬
‫מחירם‪.‬‬
‫להלן הממצאים‪6740 ,6880 , 6440 ,7300 ,7860 ,7580 ,7720 :‬‬
‫על פי נתונים אלו‪ ,‬מהו הסיכוי לשגיאה במסקנה‪:‬‬
‫א‪ 0.025    0.05 .‬ב‪ 0.1    0.25 .‬ג‪ 0.05    0.1 .‬ד‪ 0.05    0.1 .‬ה‪____    ___.‬‬
‫‪.4‬‬
‫בדקתם השערה כנגד אלטרנטיבה חד צדדית ברמת מובהקות של ‪ 5%‬ודחית את השערת האפס‪.‬‬
‫‪.1‬‬
‫אם תבצעו את אותה בדיקה עם מדגם גדול יותר‪ ,‬בהנחה שבכל הנתונים האחרים אין שינוי רמת‬
‫המובהקות המינימאלית תקטן‪.‬‬
‫‪.2‬‬
‫אם תבצעו את אותה בדיקה עבור אלטרנטיבה דו צדדית‪ ,‬ברמת מובהקות כפולה תגיעו לאותה מסקנה‪.‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪269‬‬
‫‪ .5‬אחוז הצפייה בתוכנית "הפח הגדול" בשיא העונה‪ ,‬עמד בשנה שעבר על ‪ 28%‬לתוכנית‪.‬‬
‫בשיא העונה החדש של "הפח" נדגמו ‪ 780‬בתי אב‪ ,‬ונמצא כי ‪ 241‬בתי אב צפו בתוכנית‪.‬‬
‫ברמת מובהקות של ‪ ,5%‬החליטו בהפקת התוכנית‪ ,‬כי השנה יש גידול באחוזי הצפייה‪.‬‬
‫מהם סיכויי השגיאה בהחלטה?‬
‫א‪5% .‬‬
‫ב‪4.09% .‬‬
‫ג‪2.5% .‬‬
‫ה‪ .‬אף תשובה אינה נכונה‬
‫ד‪6.5% .‬‬
‫‪ .6‬בהמשך לשאלה ‪ ,5‬מה היו אחוזי השגיאה במסקנה‪ ,‬אם ההפקה הייתה עובדת עם רמת מובהקות של ‪,2%‬‬
‫ומקבלת את אותה מסקנה – "השנה יש גידול באחוזי הצפייה"‪.‬‬
‫א‪5% .‬‬
‫ב‪4.8% .‬‬
‫ג‪21.5% .‬‬
‫ד‪38.21% .‬‬
‫‪ .7‬חוקר ביצע ניסוי‪ .‬הוא ניסח את ההשערות הבאות ‪H1 :   100 :‬‬
‫ה‪ .‬אף תשובה אינה נכונה‬
‫‪ H 0 :   100‬לצורך הבדיקה הוא‬
‫לקח מדגם מקרי בגודל ‪ 16‬מתוך אוכלוסייה המתפלגת נורמאלית עם שונות ידועה‪.‬‬
‫על סמך תוצאות המדגם הוא קיבל בטבלה ערך של ‪.1.96‬‬
‫ג‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 0.2‬כמו כן גם ברמת מובהקות ‪0.09‬‬
‫ה‪ .‬תשובות א‪-‬ג נכונות‪.‬‬
‫‪.8‬‬
‫בעל דוכן פלאפל‪ ,‬רוצה לבדוק את תוחלת משקל כדורי הפלאפל‪.‬‬
‫ידוע כי סטיית התקן של למשקל הכדורים היא ‪ 12‬גרם‪.‬‬
‫מהו גודל המדגם המינימאלי שעליו לבדוק‪ ,‬אם הוא מעוניין שברמת ביטחון של ‪ 98%‬המרחק בין משקל‬
‫הכדור הקטן ביותר‪ ,‬למשקל הכדור הגדול ביותר‪ ,‬לא יעלה על ‪ 9‬גרם? (בחר בתשובה הקרובה ביותר )‬
‫א‪30 .‬‬
‫ב‪38 .‬‬
‫ד‪39 .‬‬
‫ג‪52 .‬‬
‫ה‪____________ .‬‬
‫‪.9‬‬
‫בודקים השערות על אוכלוסייה נורמלית אחת‪ ,‬כאשר סטיית התקן ידועה‪.‬‬
‫‪.I‬‬
‫בבדיקה חד צדדית תגיעו לאותן מסקנות ולאותה שגיאה כמו בבדיקה דו צדדית ובלבד שגודל המדגם יהיה‬
‫פי ‪ ,2‬לטובת המבחן הדו צדדי‪.‬‬
‫‪.II‬‬
‫בבדיקה חד צדדית תגיעו לאותן מסקנות ולאותה שגיאה כמו בבדיקה דו צדדית ובלבד שהיחס בין‬
‫המדגמים יהיה פי ‪2‬‬
‫לטובת המבחן הדו צדדי‪.‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪270‬‬
‫‪.10‬‬
‫השערת האפס (‪ )Ho‬היא שאין הבדל בין ההוצאות החודשיות הממוצעות לנסיעות לעבודה‬
‫בין גברים ונשים‪ .‬ההשערה האלטרנטיבית (‪ )H1‬היא גברים מוציאים יותר על נסיעות לעבודה‪.‬‬
‫לבדיקת השערות אלו נלקחו שני מדגמים של גברים ונשים והתקבל‪:‬‬
‫סטיית תקן‬
‫נשים‬
‫‪₪ 180‬‬
‫‪₪ 20‬‬
‫‪15‬‬
‫גברים‬
‫‪₪ 197.8‬‬
‫‪₪ 36‬‬
‫‪17‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ברמת מובהקות ‪ 10%‬נדחה את ‪.Ho‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫ברמות מובהקות של ‪ 10%‬וגם של ‪ 5%‬מקבלים את ‪Ho‬‬
‫‪ .11‬חוקר ביצע ניסוי חד כווני על מדגם של ‪ 16‬איש‪ ,‬הוא מצא כי סטיית התקן היא ‪.6‬‬
‫לאור תוצאות המדגם‪ ,‬חישב החוקר ומצא כי הערך בטבלה הוא ‪ ,2.13‬לאור ממצאים אלו ניתן להסיק‪:‬‬
‫ב‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 2%‬אך לא כן ברמת מובהקות ‪. 3%‬‬
‫ג‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות של ‪ 3%‬כמו גם ברמת מובהקות ‪5.5%‬‬
‫ד‪ .‬הוא ידחה את ‪ H 0‬בכל רמת מובהקות הגבוהה מ‪2.5% -‬‬
‫‪.12‬‬
‫נערך מדגם של ‪ 30‬איש‪ ,‬לבדיקת לחץ הדם‪ ,‬ונמצא כי לחץ הדם הממוצע הוא ‪ 134‬עם סטית תקן של ‪.11‬‬
‫מהו רווח הסמך ללחץ הדם באוכלוסייה‪ ,‬ברמת מובהקות של ‪?1%‬‬
‫_____________________________________________‬
‫‪271‬‬
‫‪ .1‬רשת דוכני פלאפל המונה ‪ 40‬סניפים‪ ,‬מעוניינת להוסיף גם נקניקיות וחביתות ירק לתפריט‪.‬‬
‫‪‬‬
‫ידוע כי הרווח החודשי הממוצע לסניף ‪ ,₪ 52500‬עם סטיית תקן של ‪.₪ 8500‬‬
‫‪‬‬
‫לצורך בדיקת כדאיות‪ ,‬עורכת הרשת מבחן על מדגם מייצג של ‪ 30%‬מסניפיה‪ ,‬בהם החלו למכור‬
‫חביתות ירק‪ ,‬המבחן נערך ברמת מובהקות של ‪ ,4%‬ונמצא כי הרווח החודשי הממוצע עמד על‬
‫‪. ₪ 57500‬‬
‫‪‬‬
‫לצורך בדיקת כדאיות‪ ,‬עורכת הרשת מבחן על מדגם מייצג של ‪ 45%‬מסניפיה‪ ,‬בהם החלו למכור‬
‫נקניקיות‪ ,‬המבחן נערך ברמת מובהקות של ‪ ,5%‬ונמצא כי הרווח החודשי הממוצע עמד על ‪.₪ 58200‬‬
‫א‪ .‬איזה שינוי אם בכלל ישפר את רווחי הרשת‪.‬‬
‫(יש לערוך מבחן מלא כולל חישובי שגיאה‪ ,‬לכל תוספת מוצעת)‪.‬‬
‫ב‪ .‬אחד ממנהלי הרשת טוען‪ ,‬כי שתי התוספות (נקניקיות וחביתות ירק) משפרות את רווחי הסניפים‪ ,‬ולכן‬
‫אפשר לאפשר לכל מנהל סניף להחליט מה להוסיף לתפריט‪,‬‬
‫בדקו את טענתו ברמת מובהקות של ‪( 5%‬מבחן מלא)‪.‬‬
‫ג‪ .‬הנהלת מעוניינת לבדוק האם קיים הבדל בהכנסות בין סניפי הרשת‪ ,‬לצורך הבדיקה חולקו כל הסניפים לארבע‬
‫קבוצות שוות‪ ,‬להלן נתוני ההכנסות (בעשרות אלפי ‪ )₪‬בכל קבוצה במשך מספר ימים‪:‬‬
‫קבוצה א‬
‫קבוצה ב‬
‫קבוצה ג‬
‫קבוצה ד‬
‫‪4‬‬
‫‪4.9‬‬
‫‪5.2‬‬
‫‪3.9‬‬
‫‪5‬‬
‫‪5.1‬‬
‫‪5.1‬‬
‫‪4.5‬‬
‫‪5.2‬‬
‫‪4.5‬‬
‫‪4.6‬‬
‫‪4.9‬‬
‫‪5.3‬‬
‫‪5.5‬‬
‫‪4.3‬‬
‫‪5.3‬‬
‫‪5.5‬‬
‫‪4.9‬‬
‫‪5.8‬‬
‫‪5.5‬‬
‫‪4.4‬‬
‫‪5.6‬‬
‫‪5.6‬‬
‫‪5.9‬‬
‫‪4.3‬‬
‫‪5.4‬‬
‫‪5.7‬‬
‫‪4.8‬‬
‫‪5.4‬‬
‫‪5.3‬‬
‫ערכו בדיקה לבקשת החברה ברמת מובהקות של ‪.5%‬‬
‫‪ .2‬חוקר מעוניין לבדוק האם קיימת תלות בין מצב משפחתי‪ ,‬לבין לקיחת סיכונים בהשקעות‪ ,‬לצורך הבדיקה‬
‫נלקחו ‪ 500‬גברים‪ ,‬אשר חולקו לרווקים ונשואים‪ ,‬ונמדדו מספר ההשקעות שלהם בסיכון‪ ,‬בסיכון נמוך‬
‫וללא סיכון‪ .‬בדקו האם קיימת תלות בין מצב משפחתי‪ ,‬לבין רמת הסיכון בהשקעה‪ ,‬ברמת מובהקות של‬
‫‪.0.05‬‬
‫סה"כ‬
‫‪312‬‬
‫‪188‬‬
‫‪500‬‬
‫השקעות ללא סיכון‬
‫‪100‬‬
‫‪60‬‬
‫‪160‬‬
‫השקעות בסיכון נמוך‬
‫‪92‬‬
‫‪78‬‬
‫‪170‬‬
‫השקעות בסיכון‬
‫‪120‬‬
‫‪50‬‬
‫‪170‬‬
‫רווקים‬
‫נשואים‬
‫סה"כ‬
‫‪272‬‬
‫פרק שני – ‪60%‬‬
‫‪.1‬‬
‫‪ 42%‬מתושבי המדינה תומכים במועמד ‪ ,B‬לראשות הממשלה‪ .‬במדגם ‪ 500‬איש ונמצא ‪ 230‬איש מתוכם‬
‫תומכים במועמד‪:‬‬
‫האם חל גידול באחוז התומכים במועמד ‪ .B‬ברמת מובהקות של ‪?4%‬‬
‫____________________________________________________________________‬
‫____________________________________________________________________‬
‫‪.2‬‬
‫ע"פ נתוני שאלה ‪ ,1‬סיכויי השגיאה במסקנה הם‪:‬‬
‫א‪4% .‬‬
‫‪.3‬‬
‫ג‪5.46% .‬‬
‫ב‪3.67% .‬‬
‫ה‪________.‬‬
‫ד‪96% .‬‬
‫נערך מחקר ברמת מובהקות של ‪ ,5%‬השפעת תרופה ‪ B‬על הורדת לחץ ‪ ,‬להלן הנתונים‪.‬‬
‫לפני‬
‫‪120‬‬
‫‪135‬‬
‫‪140‬‬
‫‪128‬‬
‫‪136‬‬
‫‪164‬‬
‫אחרי‬
‫‪115‬‬
‫‪125‬‬
‫‪145‬‬
‫‪120‬‬
‫‪132‬‬
‫‪141‬‬
‫מהם הסיכויים לשגיאה במסקנה?‬
‫א‪2.28% .‬‬
‫‪.4‬‬
‫ב‪4.67% .‬‬
‫ד‪40.25% .‬‬
‫ג‪2.5% .‬‬
‫ה‪________.‬‬
‫חוקר ביצע ניסוי דו כווני על מדגם של ‪ 30‬איש‪ ,‬הוא מצא כי סטיית התקן המדגמית היא ‪.6‬‬
‫לאור תוצאות המדגם‪ ,‬חישב החוקר ומצא כי הערך בטבלה הוא ‪,2.462‬‬
‫לאור ממצאים אלו ניתן להסיק‪:‬‬
‫ב‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 5.5%‬אך לא כן ברמת מובהקות ‪.2.5%‬‬
‫ג‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 2.5%‬אך לא כן ברמת מובהקות ‪5.5%‬‬
‫ד‪ .‬הוא ידחה את ‪ H 0‬בכל רמת מובהקות שהיא לפחות ‪.2.5%‬‬
‫‪.5‬‬
‫‪ 175‬איש עוברים ליד דוכן לוטו ביום‪ 35 ,‬אנשים מהם נעצרים וקונים כרטיס הגרלה‪ .‬ביום מסוים החליט מפעל‬
‫הפיס להעניק שי לכל קונה כרטיס‪ ,‬במטרה לבדוק האם השי תורם לשווק‪ .‬נמצא כי מבין ‪ 350‬איש שעברו ליד‬
‫הדוכן‪ 84 ,‬איש קנו כרטיס הגרלה‪ .‬מהי רמת המובהקות המינימלית לדחיית השערת האפס?‬
‫א‪.‬‬
‫‪.6‬‬
‫‪18.94%‬‬
‫ב‪15.15% .‬‬
‫ג‪17.6% .‬‬
‫ד‪_____ .‬‬
‫בשנה שעברה היה ממוצע ציוני הקורס בסטטיסטיקה ‪ ,76‬השנה נבחרו ‪ 16‬סטודנטים ולמדו עם תוכנית לימוד‬
‫חדשה‪ ,‬במטרה לשפר את ההישגים‪ ,‬ממוצע הציונים של קבוצה זו היה ‪ 79.73‬עם סטיית תקן ‪ .7‬מהי רמת‬
‫המובהקות המינימלית לדחיית השערת האפס?‬
‫א‪5% .‬‬
‫ב‪2.5% .‬‬
‫ג‪0.62% .‬‬
‫ד‪2.37% .‬‬
‫ה‪_____.‬‬
‫‪273‬‬
‫‪.7‬‬
‫בהמשך לשאלה ‪ ,6‬החוקר בדק את הטענה ברמת מובהקות של ‪ ,1%‬מהם סיכויי השגיאה במסקנה שקיבל?‬
‫א‪ 0.1   '  0.15 .‬ב‪ 0.25    0.4 .‬ג‪ 0.05    0.1 .‬ד‪ ____    ____ .‬ה‪___   '  ___ .‬‬
‫‪.8‬‬
‫בטבלה נתוני דקות דיבור בטלפון סלולארי בשבוע‪ ,‬כפי שנמדדו על קבוצת בנים וקבוצת בנות בגילאי ‪25‬‬
‫במטרה למצוא את ההבדלים (אם קיימים)‪ ,‬הבדיקה נעשתה ברמת מובהקות של ‪.6%‬‬
‫בנים ‪178 184 146 180 176 160 178 165 150‬‬
‫בנות ‪184 143 198 208 210 186 220 189 183‬‬
‫א‪ .‬רשמו את ההשערות‪________________________ :‬‬
‫ב‪ .‬מהי מסקנת החוקר?‬
‫_______________________________________________________________________‬
‫‪.9‬‬
‫בהמשך לשאלה ‪ ,8‬מהם סיכויי השגיאה במסקנות החוקר‪ ,‬אם החליט לעבוד עם רמת מובהקות של ‪? 1%‬‬
‫א‪ 0.1   '  0.15 .‬ב‪ 0.5    0.8 .‬ג‪ 0.05    0.1 .‬ד‪ ____    ____ .‬ה‪___   '  ___ .‬‬
‫‪.10‬‬
‫בדקת השערה כנגד אלטרנטיבה דו צדדית ומצאת כי רמת המובהקות המינימאלית‪ ,‬לדחיית השערת‬
‫האפס היא ‪ ,4%‬לפניך שני טענות‪:‬‬
‫‪.11‬‬
‫‪.1‬‬
‫באלטרנטיבה חד צדדית‪ ,‬ברמת מובהקות של ‪ ,2.5%‬תדחה את השערת האפס‬
‫‪.2‬‬
‫באלטרנטיבה דו צדדית‪ ,‬ברמת מובהקות של ‪ 3%‬תדחה את השערת האפס‪.‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪ 4800    6500‬הוא רווח בר סמך לממוצע השכר באוכלוסייה‪ ,‬הרווח נערך מתוך מדגם של ‪ 40‬איש‪,‬‬
‫אם נגדיל את המדגם ל‪ 100-‬איש‪ ,‬יהיה הרווח‪:‬‬
‫א‪ 4000    7000 .‬ב‪ 3035    4111.‬ג‪ 3456    8344 .‬ד‪_____    _____ .‬‬
‫‪ .12‬במדגם של ‪ 20‬איש‪ ,‬נמצא כי משקלם הממוצע הוא ‪ 78‬ק"ג עם סטית תקן של ‪ 6‬ק"ג‪.‬‬
‫מהו רווח הסמך למשקל באוכלוסייה‪ ,‬ברמת מובהקות ‪.5%‬‬
‫א‪ 75.37    80.62 .‬ב‪ 75.19    80.80 .‬ג‪ 74.23    81.35 .‬ד‪_____    _____ .‬‬
‫‪274‬‬
‫מבחן ‪10‬‬
‫‪ .1‬להלן אחוזי התשואה היומיים אשר נצפו במשך ‪ 10‬ימים במדד המעוף ובמדד ת"א ‪.75‬‬
‫מדד‬
‫מעוף‬
‫‪2‬‬
‫‪0.75‬‬
‫‪-1‬‬
‫‪3.6‬‬
‫‪1.6‬‬
‫‪4.1‬‬
‫‪2.1‬‬
‫‪-3‬‬
‫‪-0.9‬‬
‫‪1‬‬
‫ת"א‬
‫‪100‬‬
‫‪1.6‬‬
‫‪0.1‬‬
‫‪-2‬‬
‫‪2.1‬‬
‫‪3.5‬‬
‫‪2.2‬‬
‫‪5.1‬‬
‫‪-2.5‬‬
‫‪-1.2‬‬
‫‪0.2‬‬
‫ברמת מובהקות של ‪ ,5%‬האם על פי מדגם זה ניתן לקבוע כי יש מדד שההשקעה בו עדיפה?‬
‫א‪ .‬הגבול הקריטי בבדיקה זו הוא‪:‬‬
‫__________________________________________________________‬
‫ב‪ .‬החלטת החוקר היא‪:‬‬
‫__________________________________________________________________‬
‫_______________________‬
‫_____________________‬
‫ג‪ .‬השגיאה בהחלטת החוקר היא‪:‬‬
‫א‪20% .‬‬
‫ב‪50% .‬‬
‫ג‪30% .‬‬
‫ד‪ .‬בהנחה שהחוקר בדק האם השקעה במדד המעוף טובה יותר‪ ,‬אזי רמת המובהקות המינימאלית בבדיקה‬
‫זו היא‪:‬‬
‫ב‪40% .‬‬
‫א‪0.2% .‬‬
‫ג ‪10%.‬‬
‫‪ .2‬אוניברסיטה בדקה האם קיים קשר בין גיל הסטודנט להישגיו בלימודים‪ ,‬עזרו לאוניברסיטה לבדוק ברמת‬
‫מובהקות של ‪.5%‬‬
‫הישגים‪/‬גיל‬
‫‪18-22‬‬
‫‪22-26‬‬
‫‪26-30‬‬
‫טובים ומעולים‬
‫‪10‬‬
‫‪20‬‬
‫‪40‬‬
‫‪70‬‬
‫בינוניים ונמוכים‬
‫‪40‬‬
‫‪20‬‬
‫‪15‬‬
‫‪75‬‬
‫סה"כ‬
‫‪50‬‬
‫‪40‬‬
‫‪55‬‬
‫‪145‬‬
‫הגבול הקריטי הוא‪:‬‬
‫א‪5.99 .‬‬
‫ב‪7.81 .‬‬
‫ג‪9.49 .‬‬
‫הערך הנבדק מול הגבול הקריטי הוא‪:‬‬
‫א‪29.21 .‬‬
‫ב‪35.47 .‬‬
‫ג‪19.17 .‬‬
‫‪275‬‬
‫‪ .3‬המכללה בודקת את הישגי הסטודנטים‪ ,‬על מדגם של ‪ 12‬סטודנטים מכל כיתה (ארבע ככיתות לומדות במקביל)‬
‫להלן ציוני הסטודנטים בכל כיתה‪:‬‬
‫א‬
‫‪60‬‬
‫‪75‬‬
‫‪64‬‬
‫‪100‬‬
‫‪85‬‬
‫‪91‬‬
‫‪75‬‬
‫‪67‬‬
‫‪40‬‬
‫‪70‬‬
‫‪85‬‬
‫‪40‬‬
‫ב‬
‫‪100‬‬
‫‪95‬‬
‫‪55‬‬
‫‪48‬‬
‫‪100‬‬
‫‪45‬‬
‫‪60‬‬
‫‪95‬‬
‫‪100‬‬
‫‪80‬‬
‫‪40‬‬
‫‪55‬‬
‫ג‬
‫‪75‬‬
‫‪66‬‬
‫‪100‬‬
‫‪95‬‬
‫‪40‬‬
‫‪35‬‬
‫‪100‬‬
‫‪95‬‬
‫‪86‬‬
‫‪60‬‬
‫‪70‬‬
‫‪80‬‬
‫ד‬
‫‪35‬‬
‫‪100‬‬
‫‪95‬‬
‫‪100‬‬
‫‪40‬‬
‫‪60‬‬
‫‪70‬‬
‫‪80‬‬
‫‪40‬‬
‫‪90‬‬
‫‪60‬‬
‫‪50‬‬
‫‪‬‬
‫מנתונים אלו עולה כי ברמת מובהקות של ‪ ,5%‬הגבול הקריטי לבדוק את הטענה הוא‪:‬‬
‫א‪2.75 .‬‬
‫ג‪2.83 .‬‬
‫ב‪8.59 .‬‬
‫‪ ‬מנתונים אלו עולה כי הערך הנבדק מול הגבול הקריטי הוא‪:‬‬
‫ג‪4.77 .‬‬
‫ב‪8.53 .‬‬
‫א‪4.46 .‬‬
‫‪‬‬
‫מניתוח הנתונים המסקנה היא דוחים ‪ /‬מקבלים את השערת האפס‪.‬‬
‫‪ .4‬אחוז המצביעים ליו"ר אגודת הסטודנטים‪ ,‬בבחירות בשנה שעברה עמד על ‪ .41%‬במסגרת הנתונים שאוספת‬
‫מפלגתו של היו"ר לקראת הבחירות הקרבות‪ ,‬נמצא כי מבין ‪ 280‬סטודנטים‪,‬‬
‫‪ 126‬תומכים ביו"ר הנוכחי‪.‬‬
‫במטרה לבדוק האם מספר תומכיו של היו"ר עלה‪ ,‬נבדקו נתונים אלו ברמת מובהקות של ‪.5%‬‬
‫והוחלט‪:‬‬
‫א‪ .‬לדחות השערת האפס‪.‬‬
‫ב‪.‬‬
‫לקבל את השערת האפס‪.‬‬
‫‪ .5‬בהמשך לשאלה ‪ ,4‬סיכויי השגיאה בהחלטה הם?‬
‫ב‪38.21% .‬‬
‫ב‪30.27% .‬‬
‫‪ .6‬חוקר ניסח את ההשערות הבאות ‪H1 :   10 :‬‬
‫ג‪5% .‬‬
‫‪. H 0 :   10‬‬
‫לצורך בדיקה הוא לקח מדגם מקרי בגודל ‪ 14‬איש‪ ,‬מתוך אוכלוסייה המתפלגת נורמאלית‪,‬‬
‫על סמך תוצאות המדגם הוא חישב וקיבל ‪t  2.16 :‬‬
‫א‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 1%‬אך לא כן ברמת מובהקות ‪.5%‬‬
‫ב‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 3%‬אך לא כן ברמת מובהקות ‪.2%‬‬
‫ג‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 4%‬אך לא כן ברמת מובהקות ‪1%‬‬
‫‪276‬‬
‫ד‪ .‬הוא לא ידחה ‪ H 0‬ברמת מובהקות ‪. 1.5%‬‬
‫ב‪ .‬יש יותר מתשובה אחת נכונה‪.‬‬
‫‪ .7‬מרצה בדק את השפעת שיטת לימוד חדשה בשיפור הישגי הסטודנטים‪ ,‬ממוצע ציוני הסטודנטים בשיטה הישנה‬
‫עומד על ‪ ,69‬השיטה החדשה נוסתה על ‪ 16‬סטודנטים‪ ,‬ובמבחן התקבלו הציונים ‪:‬‬
‫‪60 71 74 68 76 71 95 55 84 76 70 95 84 63 80 65‬‬
‫מהי רמת המובהקות המינימאלית לקבלת טענת המרצה?‬
‫ב‪0.025     0.05 .‬‬
‫א‪0     0.025 .‬‬
‫ג‪0.05     0.1 .‬‬
‫ד‪   0.1.‬‬
‫‪ .8‬במסגרת בדיקת פורמולה חדשה להרזיה‪ ,‬ניתנה הפורמולה ל‪ 5-‬אנשים (הנתונים בטבלה)‪.‬‬
‫החוקרים בדקו ברמת מובהקות של ‪ ,5%‬והחליטו כי הפורמולה אינה מסייעת בהורדה במשקל‪.‬‬
‫מהי השגיאה האפשרית בהחלטת החוקרים?‬
‫נבדק‬
‫משקל לפני‬
‫משקל אחרי‬
‫א‬
‫‪85‬‬
‫‪87‬‬
‫ב‬
‫‪94‬‬
‫‪85‬‬
‫א‪ 0.1    0.15 .‬ב‪0.1    0.25 .‬‬
‫‪.9‬‬
‫ג‬
‫‪96‬‬
‫‪94‬‬
‫ד‬
‫‪83‬‬
‫‪88‬‬
‫ג‪0.05    0.1 .‬‬
‫ה‬
‫‪105‬‬
‫‪96‬‬
‫ד‪  25% .‬‬
‫מבחן חי בריבוע לאי תלות התבסס על טבלת ‪ ,4/3‬הערך הנבדק היה ‪ ,15‬ורמת המובהקת ‪.5%‬‬
‫כיצד תשתנה ההחלטה במעבר ל‪? 4/4 -‬‬
‫א‪ .‬אין שינוי בהחלטה‬
‫ב‪ .‬בטבלה הראשונה דוחים את השערת האפס‪ ,‬ובטבלה השנייה מקבלים‪.‬‬
‫ג‪ .‬לא ניתן לקבל החלטה ללא נתונים‪.‬‬
‫ד‪ .‬ברמת מובהקות של ‪ ,1%‬מקבלים את השערת האפס בשתי הטבלאות‪.‬‬
‫‪ .10‬בדקת השערה כנגד אלטרנטיבה חד צדדית ברמת מובהקות של ‪ 3%‬ודחית את השערת האפס‪.‬‬
‫המשמעות היא בשכל רמת מובהקות גבוהה מ‪ 3%‬תדחה את השערת האפס‪ ,‬וברמת מובהקות נמוכה‬
‫‪.1‬‬
‫מ‪ 3%-‬תקבל את השערת האפס‪.‬‬
‫יתכן כי ברמת בטחון גבוהה יותר‪ ,‬תקבל את השערת האפס‪.‬‬
‫‪.2‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪277‬‬
‫‪ .11‬נבדק רווח בר סמך‪ ,‬ונמצא כי אורך הרווח הוא ‪ ,30‬ידוע כי סטיית התקן של אוכלוסיית הגורם הנבדק היא‬
‫‪ ,85‬ורמת הביטחון היא ‪ ,98%‬מהו גודל המדגם הנדרש כדי שאורך הרווח לא יעלה על ‪?15‬‬
‫ב‪697 .‬‬
‫א‪277 .‬‬
‫ג‪395 .‬‬
‫‪ .12‬בונים רווח סמך לתוחלת של אוכלוסייה נורמאלית אחת‪ .‬לפניך ‪ 2‬טענות‪:‬‬
‫‪ .1‬רווח מדויק יותר במונחי מדגם‪ ,‬ורווח מדויק יותר במונחי רמת מובהקות הם בעלי כיוונים מנוגדים‪.‬‬
‫‪ .2‬גבולות קריטיים באלטרנטיבה דו צדדית‪ ,‬יהיו זהים לגבולות הרווח שנבנה‪.‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪ .13‬השערת האפס (‪ – )Ho‬אין הבדל בשכר השעתי בתפקידי ניהול בין גברים לנשים‪.‬‬
‫ההשערה האלטרנטיבית (‪ )H1‬השכר השעתי של נשים גבוה יותר‪.‬‬
‫לבדיקת השערות אלו נלקחו שני מדגמים‪ ,‬של גברים ונשים בתפקידי ניהול בכירים‪.‬‬
‫הנתונים להלן נלקחו מתוך המדגמים‪:‬‬
‫גברים‬
‫‪₪ 240‬‬
‫‪₪ 32‬‬
‫‪25‬‬
‫נשים‬
‫‪₪ 254‬‬
‫‪₪ 21‬‬
‫‪20‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫ו‪ .‬יש יותר מתשובה אחת נכונה‪.‬‬
‫‪.14‬‬
‫בהמשך לשאלה ‪..13‬‬
‫התברר כי חלה טעות בחישוב סטית התקן במדגם הגברים והיא ‪ ,40‬כתוצאה מכך‪ ,‬בהנחה כי הבדיקה נערכה ברמת‬
‫מובהקות של ‪,5%‬‬
‫השגיאה האפשרית במסקנות היא‪:‬‬
‫א‪5% .‬‬
‫ב‪10% .‬‬
‫ג‪ .‬בין ‪ 20%‬ל‪30%-‬‬
‫ד‪ .‬בין ‪ 25%‬ל‪40%-‬‬
‫ה‪ .‬אין תשובה נכונה‪.‬‬
‫‪278‬‬
‫‪ .15‬קיבלתם את השערת האפס‪ ,‬כאשר ביצעתם מחקר דו כיווני‪.‬‬
‫א‪ .‬אם תבצעו את מחקר זהה בהשערה חד כיוונית‪ ,‬יש סיכוי שתידחו את השערת האפס‪.‬‬
‫ב‪ .‬אם תבצעו מחקר זהה‪ ,‬בהשערה חד כיוונית‪ ,‬וברמת מובהקות כפולה‪ ,‬תגיעו בדיוק לאותם מסקנות‪.‬‬
‫ג‪ .‬ברמת מובהקות נמוכה יותר‪ ,‬תגיעו בוודאות לאותן מסקנות‪.‬‬
‫ה‪ .‬ברמת מובהקות גבוהה יותר‪ ,‬יתכן ותגיעו למסקנות הפוכות‪.‬‬
‫‪.16‬‬
‫לפני חמש שנים‪ ,‬הוצאות משפחה ממוצעת בחודש היו ‪ ,₪ 4800‬עם סטיית תקן של ‪ . ₪ 750‬במטרה לבדוק האם‬
‫הוצאות משפחה כיום גבוהות יותר‪ ,‬נלקח מדגם של ‪ 20‬משפחות‪ ,‬ונמצא כי ההוצאה הממוצעת למשפחה היא‬
‫‪ ,₪ 5150‬הטענה נבדקת ברמת ביטחון של ‪.96%‬‬
‫‪‬‬
‫לעניות דעתכם הסטטיסטית‪ ,‬החוקרים צריכים לדחות ‪ /‬לקבל את השערת האפס‪.‬‬
‫‪‬‬
‫השגיאה האפשרית בתוצאות היא‪:‬‬
‫א ‪2.5%‬‬
‫ב‪1.88% .‬‬
‫ג‪4% .‬‬
‫ד‪3.6% .‬‬
‫‪279‬‬
‫מבחן ‪11‬‬
‫‪ .1‬להלן נתוני משקל של ‪ 10‬נבדקים‪ ,‬לפני דיאטה ואחרי ‪ 3‬חודשי דיאטה‪.‬‬
‫לפני‬
‫‪65‬‬
‫‪84‬‬
‫‪95‬‬
‫‪84‬‬
‫‪88‬‬
‫‪78‬‬
‫‪90‬‬
‫‪72‬‬
‫‪76‬‬
‫‪92‬‬
‫אחרי‬
‫‪62‬‬
‫‪80‬‬
‫‪82‬‬
‫‪78‬‬
‫‪92‬‬
‫‪74‬‬
‫‪85‬‬
‫‪75‬‬
‫‪72‬‬
‫‪89‬‬
‫ברמת מובהקות של ‪ ,5%‬האם ניתן לקבוע כי הדיאטה יעילה?‬
‫א‪ .‬הגבול הקריטי בבדיקה זו הוא‪:‬‬
‫__________________________________________________________‬
‫__________________________________________________________________‬
‫_____________________‬
‫_______________________‬
‫ג‪ .‬השגיאה בהחלטת החוקר היא‪:‬‬
‫___________________________________________________________________‬
‫_______________________________________________________‬
‫‪ .2‬אוניברסיטה בדקה האם קיים קשר בין גיל הסטודנט להישגיו בלימודים‪ ,‬עזרו לאוניברסיטה לבדוק ברמת‬
‫מובהקות של ‪.5%‬‬
‫הישגים‪/‬גיל‬
‫‪18-22‬‬
‫‪22-26‬‬
‫‪26-30‬‬
‫טובים ומעולים‬
‫‪40‬‬
‫‪30‬‬
‫‪20‬‬
‫‪90‬‬
‫בינוניים ונמוכים‬
‫‪20‬‬
‫‪40‬‬
‫‪50‬‬
‫‪110‬‬
‫סה"כ‬
‫‪60‬‬
‫‪70‬‬
‫‪70‬‬
‫‪200‬‬
‫א‪ .‬הגבול הקריטי הוא‪:‬‬
‫____________________________________________________________________‬
‫___________________________________________________________________________‬
‫___________________________________________________________________________‬
‫_________________________________________________________‬
‫‪280‬‬
‫‪ .3‬מסעדה בודקת את הטיפים שמקבלים שלושה מלצרים בערב‪:‬‬
‫א‬
‫‪95‬‬
‫‪110‬‬
‫‪120‬‬
‫‪80‬‬
‫‪80‬‬
‫‪100‬‬
‫‪120‬‬
‫ב‬
‫‪120‬‬
‫‪130‬‬
‫‪60‬‬
‫‪50‬‬
‫‪100‬‬
‫‪120‬‬
‫‪90‬‬
‫ג‬
‫‪85‬‬
‫‪140‬‬
‫‪100‬‬
‫‪120‬‬
‫‪85‬‬
‫‪95‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪85‬‬
‫‪80‬‬
‫מנתונים אלו עולה כי ברמת מובהקות של ‪ ,5%‬הגבול הקריטי לבדוק את הטענה הוא‪:‬‬
‫________________________________________________________‬
‫מנתונים אלו עולה כי הערך הנבדק מול הגבול הקריטי הוא‪:‬‬
‫________________________________________________________‬
‫מניתוח הנתונים המסקנה היא דוחים ‪ /‬מקבלים את השערת האפס‪.‬‬
‫‪ .4‬אחוז המצביעים לראשות הממשלה‪ ,‬בבחירות הקודמות עמד על ‪ .62%‬במסגרת הנתונים שאוספת מפלגתו‬
‫של לקראת הבחירות הקרבות‪ ,‬נמצא כי מבין ‪ 600‬מצביעים‪,‬‬
‫‪ 396‬תומכים בראש הממשלה‪.‬‬
‫האם ברמת מובהקות של ‪ ,5%‬נקבל או נדחה את ההשערה כי אחוזי התמיכה בראש הממשלה עלו‪.‬‬
‫ב‪ .‬עלו‪.‬‬
‫ב‪ .‬לא עלו‪.‬‬
‫‪ .5‬בהמשך לשאלה ‪ ,4‬סיכויי השגיאה בהחלטה הם?‬
‫ג‪1.97% .‬‬
‫ב‪2.06% .‬‬
‫ג‪5% .‬‬
‫‪ .6‬חוקר ניסח את ההשערות הבאות ‪H1 :   50 :‬‬
‫‪. H 0 :   50‬‬
‫לצורך בדיקה הוא לקח מדגם מקרי בגודל ‪ 30‬איש‪ ,‬מתוך אוכלוסייה המתפלגת נורמאלית‪,‬‬
‫על סמך תוצאות המדגם הוא חישב וקיבל ‪t  2.462 :‬‬
‫א‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 1%‬אך לא כן ברמת מובהקות ‪.5%‬‬
‫ב‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 3%‬אך לא כן ברמת מובהקות ‪.2%‬‬
‫ג‪ .‬הוא ידחה ‪ H 0‬ברמת מובהקות ‪ 4%‬אך לא כן ברמת מובהקות ‪1%‬‬
‫ד‪ .‬הוא לא ידחה ‪ H 0‬ברמת מובהקות ‪. 1.5%‬‬
‫ד‪ .‬יש יותר מתשובה אחת נכונה‪.‬‬
‫‪281‬‬
‫‪ .7‬מרצה בדק את השפעת שיטת לימוד חדשה על הישגי הסטודנטים‪ ,‬ממוצע ציוני הסטודנטים בשיטה הישנה עומד‬
‫על ‪ ,73.98‬השיטה החדשה נוסתה על ‪ 12‬סטודנטים‪ ,‬ובמבחן התקבלו הציונים ‪:‬‬
‫‪76 100 95 60 70 97 68 62 88 81 76 78‬‬
‫‪ ‬מהי רמת המובהקות המינימאלית לקבלת טענת המרצה?‬
‫‪10%‬‬
‫א‪.‬‬
‫ב‪5% .‬‬
‫ג‪25% .‬‬
‫‪ ‬ברמת מובהקות של ‪ ,5%‬המרצה ידחה ‪ /‬יקבל את השערת האפס‪.‬‬
‫‪ .8‬במסגרת בדיקת פורמולה חדשה להרזיה‪ ,‬ניתנה הפורמולה ל‪ 10-‬אנשים (הנתונים בטבלה)‪.‬‬
‫החוקרים בדקו ברמת מובהקות של ‪ ,5%‬והחליטו כי הפורמולה אינה מסייעת בהורדה במשקל‪.‬‬
‫מהי השגיאה האפשרית בהחלטת החוקרים?‬
‫משקל ממוצע‬
‫א‪31.92% .‬‬
‫‪.9‬‬
‫ב‪12.6% .‬‬
‫לפני אחרי‬
‫‪79 88‬‬
‫‪12 21‬‬
‫ג‪25.06% .‬‬
‫ד‪5% .‬‬
‫מבחן חי בריבוע לאי תלות התבסס על טבלת ‪ ,4/3‬הערך הנבדק היה ‪ ,14‬ורמת המובהקת ‪.2.5%‬‬
‫כיצד תשתנה ההחלטה במעבר ל‪ 4/4 -‬ורמת מובהקות של ‪?10%‬‬
‫ג‪ .‬אין שינוי בהחלטה‬
‫ד‪ .‬בטבלה הראשונה דוחים את השערת האפס‪ ,‬ובטבלה השנייה מקבלים‪.‬‬
‫ג‪ .‬לא ניתן לקבל החלטה ללא נתונים‪.‬‬
‫ד‪ .‬ברמת מובהקות של ‪ ,1%‬מקבלים את השערת האפס בשתי הטבלאות‪.‬‬
‫‪ .10‬בדקת השערה כנגד אלטרנטיבה חד צדדית ברמת מובהקות של ‪ 3%‬וקיבלת את השערת האפס‪.‬‬
‫‪.1‬‬
‫המשמעות היא שהגבול הקריטי נקבע ברמת מובהקות נמוכה יותר‪.‬‬
‫‪.2‬‬
‫יתכן כי ברמת בטחון גבוהה יותר‪ ,‬תקבל את השערת האפס‪.‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪282‬‬
‫‪ .11‬נבדק רווח בר סמך‪ ,‬ידוע כי סטיית התקן של אוכלוסיית הגורם הנבדק היא ‪ ,90‬ורמת הביטחון היא ‪,95%‬‬
‫גודל המדגם הוא ‪ 16‬איש‪ ,‬מהו אורך הרווח?‬
‫א‪.‬‬
‫ב‪1.37 .‬‬
‫‪4.56‬‬
‫ג‪24 .‬‬
‫‪ .12‬בונים רווח סמך לתוחלת של אוכלוסייה נורמאלית אחת‪ .‬לפניך ‪ 2‬טענות‪:‬‬
‫‪ .1‬ככל שרמת הביטחון גבוהה יותר‪ ,‬הרווח יהיה גדול יותר‪.‬‬
‫‪ .2‬ככל שהמדגם גדול יותר‪ ,‬הרווח יהיה גדול יותר‪.‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪ .13‬השערת האפס (‪ – )Ho‬אין הבדל בשכר החודשי בתפקידי ניהול בין גברים לנשים‪.‬‬
‫ההשערה האלטרנטיבית (‪ )H1‬השכר החודשי של נשים גבוה יותר‪.‬‬
‫לבדיקת השערות אלו נלקחו שני מדגמים‪ ,‬של גברים ונשים בתפקידי ניהול בכירים‪.‬‬
‫הנתונים להלן נלקחו מתוך המדגמים‪:‬‬
‫גברים‬
‫‪₪ 15600‬‬
‫‪₪ 3800‬‬
‫‪25‬‬
‫סטיית תקן באוכלוסיה‬
‫נשים‬
‫‪₪ 18800‬‬
‫‪₪ 4200‬‬
‫‪20‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫ד‪.‬‬
‫‪.14‬‬
‫בהמשך לשאלה ‪ ,13‬התברר כי חלה טעות בחישוב סטית התקן במדגם הגברים והיא ‪ ,4200‬כתוצאה מכך‪ ,‬בהנחה‬
‫כי הבדיקה נערכה ברמת מובהקות של ‪,5%‬‬
‫השגיאה האפשרית במסקנות היא‪:‬‬
‫א ‪2.5%‬‬
‫ב‪0.41% .‬‬
‫ג‪ .‬בין ‪5%-10%‬‬
‫ד‪ .‬בין ‪ 25%‬ל‪ .40%-‬ה‪ .‬אין תשובה נכונה‪.‬‬
‫‪283‬‬
‫‪ .15‬דחיתם את השערת האפס‪ ,‬כאשר ביצעתם מחקר דו כיווני‪.‬‬
‫א‪ .‬אם תבצעו את מחקר זהה בהשערה חד כיוונית‪ ,‬בוודאות תידחו את השערת האפס‪.‬‬
‫ב‪ .‬אם תבצעו מחקר זהה‪ ,‬בהשערה חד כיוונית‪ ,‬וברמת מובהקות כפולה‪ ,‬תגיעו לאותו גבול קריטי‪.‬‬
‫ג‪ .‬ברמת מובהקות נמוכה יותר‪ ,‬תגיעו בוודאות לאותן מסקנות‪.‬‬
‫ו‪ .‬ברמת מובהקות גבוהה יותר‪ ,‬יתכן ותגיעו למסקנות הפוכות‪.‬‬
‫ז‪ .‬יש יותר מתשובה אחת נכונה‪.‬‬
‫‪.16‬‬
‫לפני חמש שנים‪ ,‬עלות סל קניות לחג הייתה ‪ ,₪ 785‬עם סטיית תקן של ‪ .₪ 100‬במטרה לבדוק האם‬
‫עלות סל קניות היום גבוהה יותר‪ ,‬נלקח מדגם של ‪ 16‬משפחות‪ ,‬ונמצא כי ההוצאה הממוצעת לסל קניות‬
‫הייתה ‪ ,₪ 840‬הטענה נבדקת ברמת ביטחון של ‪.96%‬‬
‫‪‬‬
‫לעניות דעתכם הסטטיסטית‪ ,‬החוקרים צריכים לדחות ‪ /‬לקבל את השערת האפס‪.‬‬
‫‪‬‬
‫השגיאה האפשרית בתוצאות היא‪:‬‬
‫א ‪2.5%‬‬
‫ב‪2% .‬‬
‫ג‪1.39% .‬‬
‫ד‪0.5% .‬‬
‫‪284‬‬
‫פתרון מבחן לדוגמה מס ‪1‬‬
‫‪.1‬‬
‫שני מדגמים מזווגים ‪ ,‬מבחן חד כיווני כלפי מעלה (האם הקורס משפר את התשואות) ‪,‬‬
‫שונויות‪/‬סטיות תקן באוכלוסיות אינן ידועות ‪ ,‬מבחן ‪.t‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬הקורס אינו משפר את התשואה‬
‫‪1   2  0‬‬
‫‪H1 :‬‬
‫הקורס משפר את התשואה‬
‫החלטה ‪ :‬מאחר ולפנינו פלט מחשב נעזר בפלט ולכן אין צורך בחישוב גבול קריטי‪:‬‬
‫שתי אפשרויות החלטה ‪:‬‬
‫א‪ .‬רמת מובהקות המחקר ‪  0.01‬‬
‫כלומר עבור כל ‪ ‬הקטנה מרמת מובהקות זו נדחה את ‪ H 0‬וההיפך‪.‬‬
‫ע"פ הפלט ניתן לראות כי הסיכוי ה"אמיתי" לשגיאה – ‪.  ' 0.016‬‬
‫)‪ ( '  0.0168)  (  0.01‬לכן נקבל את השערת האפס‪.‬‬
‫הסיכוי האמיתי לשגיאה הוא ‪ 1.68%‬לעומת הסיכוי לשגיאה המוגדר שהוא ‪.1%‬‬
‫‪ t stat  t n1,1‬נדחה את ‪H 0‬‬
‫דרך נוספת ע"פ ערכי ‪t‬‬
‫‪ t stat  t n1,1‬נקבל את ‪H 0‬‬
‫)‪ (t stat  2.904)  (t5,0.99  3.364‬לכן נקבל את ‪H 0‬‬
‫ב‪.‬‬
‫כאשר ‪ - H 0 :  D  2‬המבחן הוא מבחן דו כיווני ( ‪) H1 :  D  2‬‬
‫‪‬‬
‫נתונים‪ 0  2 :‬‬
‫‪S d  2.53‬‬
‫‪d 3‬‬
‫‪  0.01‬‬
‫‪n6‬‬
‫‪‬‬
‫‪ 6.16‬‬
‫‪2.53‬‬
‫‪6‬‬
‫‪ d C‬‬
‫‪ 2  4.032 ‬‬
‫‪S‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1,1‬‬
‫‪C  0  t‬‬
‫‪ - 3  6.16‬הפרש הממוצעים נמצא בתחום קבלת ‪H 0‬‬
‫לכן נקבל את ‪ - H 0‬הפרש התשואות לפני ואחרי הקורס אינו שונה מ‪2-‬‬
‫כאשר ‪ - H1 :  D  2‬המבחן הוא מבחן חד כיווני כלפי מעלה ( ‪  0.01 ) H 0 :  D  2‬‬
‫‪‬‬
‫‪ d C‬‬
‫‪ 5.47‬‬
‫‪2.53‬‬
‫‪6‬‬
‫‪ 2  3.36 ‬‬
‫‪S‬‬
‫‪n‬‬
‫‪C   0  t n1,1 ‬‬
‫‪ - 3  5.47‬הפרש הממוצעים נמצא בתחום קבלת ‪H 0‬‬
‫לכן נקבל את ‪ - H 0‬הפרש התשואות לפני ואחרי הקורס אינו גדול מ‪2-‬‬
‫‪285‬‬
‫ג‪.‬‬
‫ע"פ הפלט ניתן לבנות את משוואת הרגרסיה (עיינו בפרק על הסקה באמצעות אקסל)‬
‫‪‬‬
‫קו הרגרסיה הוא ‪y  2.6 xi  2.35‬‬
‫‪‬‬
‫תחזית ליועץ בעל ‪ 3‬שנות ותק – נציב ‪xi  3‬‬
‫‪y  2.6  3  2.35  5.45‬‬
‫יועץ בעל ‪ 3‬שנות ותק ישיג תשואה של ‪.5.45%‬‬
‫שמקדם המתאם גבוהה יותר כך הסטיות מקו האמצע קטנות – החיזוי טוב יותר ‪ ,‬כאשר המתאם הוא ‪ r  1‬החיזוי‬
‫מדויק‪.‬‬
‫ד‪.‬‬
‫מתמטית ניתן לבצע חיזוי מאחר ויצרנו קו רגרסיה לכן ניתן להציב ‪ xi  20‬ונקבל‬
‫‪‬‬
‫‪ . y  2.6  20  2.35  49.65‬בפועל חיזוי זה בעייתי – ברמה מציאותית קשה להניח שהתשואה גדלה באופן‬
‫ליניארי בכל שנת ותק ‪ -‬אדם עם ‪ 30‬שנות ותק יצור תשואות של ‪ ? 75%‬הסיבה לכך נובעת מכך שהערך ‪20‬‬
‫גבוה באופן חריג מכל ערכי חמשת ערכי המדגם ‪ ,‬סביר להניח כי אם היינו משלבים במדגם גם אנשים ברמות וותק‬
‫כאלו היינו מקבלים מתאם אחר וקו רגרסיה אחר‪.‬‬
‫ה‪.‬‬
‫ע"פ משוואת הרגרסיה כל שנת ותק מעלה את התשואה פי ‪, 2.6‬שיפוע קו הרגרסיה‪.‬‬
‫הקשר בין התשואה לשנות ותק הוא קשר חיובי חזק ‪ , r  0.911 -‬אולם הקשר אינו מושלם ‪ ,‬מקדם המתאם עדיין‬
‫רחוק מ‪ 1-‬ולכן החיזוי אינו מדויק‪.‬‬
‫‪.2‬א‪.‬‬
‫מבחן להשוואת ממוצעים ‪ ,‬סטיות תקן באוכלוסיה אינן ידועות – מבחן ‪ , t‬מבחן חד כיווני כלפי מטה‪.‬‬
‫‪‬‬
‫‪S1  3‬‬
‫‪‬‬
‫‪S 2  3.4‬‬
‫‪X 1  6.5‬‬
‫‪n1  122‬‬
‫‪X2 7‬‬
‫‪n2  65‬‬
‫‪X 1  X 2  0.5‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬זמן השירות של עובדים ותיקים אינו מהיר יותר מזמן השירות של עובדים חדשים‪.‬‬
‫‪1   2  0‬‬
‫‪ H1 :‬זמן השירות של עובדים ותיקים מהיר יותר מזמן השירות של עובדים חדשים‪.‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫)‪S 12 (n1  1)  S 2 2 (n2  1) 32 (122  1  1)  3.4 2 (65  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 9.88‬‬
‫‪n1  n2  2‬‬
‫‪185‬‬
‫‪2‬‬
‫‪9.88 9.88‬‬
‫‪‬‬
‫‪ 1.122‬‬
‫‪65‬‬
‫‪122‬‬
‫‪C  0  2.326 ‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪C  0  t n1 n 22,1 ‬‬
‫‪286‬‬
‫‪H0‬‬
‫‪0‬‬
‫‪ 1.122  0.5‬‬
‫הפרש הממוצעים נמצא בתחום קבלת השערת האפס – מקבלים את השערת האפס זמן השירות של עובדים ותיקים‬
‫אינו מהיר יותר מזמן השירות של עובדים חדשים‪.‬‬
‫ב‪.‬‬
‫מבחן חד כיווני כלפי מטה להשוואת ממוצעים בין הממוצע הקיים לממוצע המדגם‪.‬‬
‫‪  7.5‬‬
‫‪  7.5‬‬
‫‪H0 :‬‬
‫‪  0.05‬‬
‫‪H1 :‬‬
‫‪‬‬
‫‪3.4‬‬
‫‪ 6.79‬‬
‫‪65‬‬
‫‪S‬‬
‫‪‬‬
‫‪n‬‬
‫‪C  7.5  1.671‬‬
‫‪C  0  tn1,1‬‬
‫‪H0‬‬
‫‪7.5‬‬
‫‪6.79‬‬
‫‪7‬‬
‫הממוצע החדש גדול מהתחום הקריטי – נמצא בתחום קבלת השערת האפס ‪ ,‬לכן נקבל את השערת האפס – לא חל‬
‫שיפור בזמן השירות של העובדים החדשים‪.‬‬
‫ג‪.‬‬
‫סטית התקן באוכלוסיה ידועה ‪ ,‬נחשב רווח בר סמך באמצעות התפלגות ‪.Z‬‬
‫מחצית הרווח היא ‪.1.28‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪‬‬
‫‪X Z‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪X Z‬‬
‫‪5.72    8.28‬‬
‫‪‬‬
‫‪4‬‬
‫‪ 1.28‬‬
‫‪64‬‬
‫‪ 2.56‬‬
‫‪‬‬
‫)‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪(1‬‬
‫‪Z‬‬
‫‪Z‬‬
‫‪  0.0104‬‬
‫‪S‬‬
‫‪ 1.28‬‬
‫‪n‬‬
‫‪1.28  64‬‬
‫‪4‬‬
‫‪‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪(1‬‬
‫‪ ‬‬
‫) ‪(1‬‬
‫‪ 0.9948‬‬
‫‪Z‬‬
‫‪Z‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪287‬‬
‫ד‪.‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪  X Z‬‬
‫‪4‬‬
‫‪ 0.25‬‬
‫‪n‬‬
‫‪1.96 ‬‬
‫‪‬‬
‫‪n‬‬
‫‪ 0.25‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪X Z‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪2‬‬
‫‪ 1.96  4 ‬‬
‫‪‬‬
‫‪ n‬‬
‫‪ 0.25 ‬‬
‫‪984  n‬‬
‫ה‪.‬‬
‫‪2‬‬
‫מבחן‬
‫‪‬‬
‫לאי תלות ‪ ,‬נתונה טבלת ‪ , Observed‬נשווה אותה לטבלה תיאורטית מקבילה הטבלה לה‬
‫נצפה במצב של אי תלות ‪Expected -‬‬
‫‪32‬‬
‫‪25‬‬
‫‪57‬‬
‫סה"כ‬
‫‪90‬‬
‫‪40‬‬
‫‪130‬‬
‫‪122‬‬
‫‪65‬‬
‫‪187‬‬
‫נבנה את הטבלה הצפויה למצב של אי תלות – ‪. E‬‬
‫‪37.19‬‬
‫‪19.81‬‬
‫‪57‬‬
‫סה"כ‬
‫‪84.81‬‬
‫‪45.19‬‬
‫‪130‬‬
‫‪122‬‬
‫‪65‬‬
‫‪187‬‬
‫‪.1‬‬
‫‪H0‬‬
‫‪:‬‬
‫אין תלות בין ותק לטיב השירות‬
‫‪H1‬‬
‫‪:‬‬
‫יש תלות בין ותק לטיב השירות‬
‫‪.2‬‬
‫‪.3‬‬
‫‪2‬‬
‫‪‬‬
‫‪C 2 R 1C 1,1‬‬
‫‪ C 2 2121,0.95   C 2 1,0.95  3.84‬‬
‫‪(32  37.19) 2 (25  19.81) 2 (90  84.81) 2 (40  45.19) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ 2.99‬‬
‫‪37.19‬‬
‫‪19.81‬‬
‫‪84.81‬‬
‫‪45.19‬‬
‫‪2‬‬
‫‪‬‬
‫) ‪(o  e‬‬
‫‪   ie i‬‬
‫‪2‬‬
‫‪i‬‬
‫‪288‬‬
‫‪3.84‬‬
‫‪.4‬‬
‫החלטה ‪ -‬ערך‬
‫‪2‬‬
‫‪‬‬
‫‪2.99‬‬
‫הנבדק ‪ 2.99‬קטן מהגבול הקריטי ‪ , 3.84‬לכן נקבל את השערת האפס אין תלות בין‬
‫ותק למקצועיות השירות‪.‬‬
‫‪.5‬‬
‫שגיאה ‪ -‬מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני ‪.‬‬
‫‪289‬‬
‫פרק שני‬
‫‪.1‬‬
‫התפלגות נורמאלית ‪ ,‬משפט הגבול המרכזי‪ :‬אם ‪ 16‬חיילים שוקלים ‪ 1128‬ק"ג –‬
‫כל חייל שוקל בממוצע ‪ 70.5‬ק"ג‪ .‬מה ההסתברות שמשקלו של חייל יהיה מעל ‪ 70.5‬ק"ג‬
‫התשובה הנכונה היא ג‪.‬‬
‫‪70.5  75‬‬
‫‪ 1.5‬‬
‫‪12‬‬
‫(‬
‫)‬
‫‪16‬‬
‫‪P( Z  1.5)  0.0668‬‬
‫‪Z‬‬
‫‪1  0.0668  0.9332‬‬
‫‪.2‬‬
‫‪n4‬‬
‫‪‬‬
‫‪S  4.082‬‬
‫‪  X  85‬‬
‫‪0  90‬‬
‫‪85  90‬‬
‫‪ 3.489‬‬
‫‪4.082‬‬
‫(‬
‫)‬
‫‪4‬‬
‫‪0.95  1    0.975‬‬
‫מאחר וסטית התקן אינה ידועה נשתמש בהתפלגות ‪t n1,1  t3,1 t‬‬
‫‪t3,1 ‬‬
‫‪0.025    0.05‬‬
‫התשובה הנכונה היא ב‬
‫‪.3‬‬
‫כאשר מגדילים את גודל המדגם פי ‪ , K‬אורך הרווח קטן פי ‪K‬‬
‫לכן אם הרווח צר פי ‪ 3‬אזי המדגם גדל פי ‪32  9‬‬
‫התשובה הנכונה היא ג‬
‫‪.4‬‬
‫החוקר בדק מדגם של ‪ 5‬אנשים בהשערה דו כיוונית ‪ ,‬נחשב את ' ‪ ‬עבור ‪t  2.611‬‬
‫‪0.05   '  0.1‬‬
‫‪ 0.975‬‬
‫'‪‬‬
‫‪  '  ‬דוחים את השערת האפס‬
‫כלומר כאשר‬
‫‪2‬‬
‫‪0.95  1 ‬‬
‫‪ 2.611‬‬
‫‪‬‬
‫‪2‬‬
‫‪4,1‬‬
‫‪t‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1,1‬‬
‫‪t‬‬
‫‪  '  ‬מקבלים את השערת האפס‬
‫‪   0.5‬נדחה בוודאות את השערת האפס וכאשר ‪   0.05‬מקבלים את השערת האפס‪.‬‬
‫‪.5‬‬
‫נבדוק את הטענות ‪ :‬טענה ראשונה – אילו נבדוק את אותה טענה במבחן דו צדדי ברמת מובהקות של‬
‫‪ 2.5%‬כלומר הגבול הקריטי יהיה בשני הצדדים – בכל צד ‪ 1.25%‬מאחר ודחינו את השערת האפס עבור ‪5%‬‬
‫ואיננו יודעים את הערך הנבדק אין לנו נתונים כדי לאמת את הטענה‪.‬‬
‫טענה שנייה – במבחן דו צדדי ברמת מובהקות של ‪ 10%‬נקבל את אותו גבול קריטי כלומר אותה מסקנה – נדחה‬
‫את השערת האפס ‪ ,‬אולם מאחר והערך הנבדק אינו ידוע לא ניתן לקבוע אם זו רמת המובהקות המינימאלית –‬
‫יתכן כי ברמת מובהקות קטנה יותר עדיין נדחה את השערת האפס‪.‬‬
‫התשובה הנכונה היא ב‪.‬‬
‫‪290‬‬
‫‪.6‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬אין הבדל בתוחלות ההכנסה בין שתי הערים‬
‫‪1   2  0‬‬
‫‪ H1 :‬קיים הבדל בתוחלות ההכנסה בין שתי הערים‬
‫נבדוק גבולות קריטיים עבור ‪  0.05,   0.01‬‬
‫‪4.84 2 3.612‬‬
‫‪‬‬
‫‪ 3.62‬‬
‫‪10‬‬
‫‪12‬‬
‫‪C  1.96 ‬‬
‫‪4.84 2 3.612‬‬
‫‪‬‬
‫‪ 4.74‬‬
‫‪10‬‬
‫‪12‬‬
‫‪C  2.57 ‬‬
‫‪ 22‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪‬‬
‫‪n2‬‬
‫‪n2‬‬
‫‪ 12‬‬
‫‪C  0  Z 0.975 ‬‬
‫‪n1‬‬
‫‪ 12‬‬
‫‪C  0  Z 0.995 ‬‬
‫‪n1‬‬
‫‪.7‬‬
‫רווח בר סמך לתוחלת ברמת ביטחון של ‪ , 99%‬ע"פ משפט הגבול המרכזי ‪ 99%‬ממוצעי כל המדגמים‬
‫בגודל ‪ n‬נמצאים בתחום המתקבל –ו‪ 1%-‬מחוץ לתחום ‪ ,‬לכן הסיכוי שממוצע האוכלוסייה נמצא בתחום זה הוא ‪. 99%‬‬
‫התשובה הנכונה היא ד‪.‬‬
‫‪.8‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪.9‬‬
‫השערה דו כיוונית ‪ ,‬סטית התקן באוכלוסיה ידועה – התפלגות ‪: Z‬‬
‫‪  0.06‬‬
‫‪0  2‬‬
‫‪  X  1.99‬‬
‫‪n  50‬‬
‫נחשב את הסיכוי האמיתי לשגיאה – רמת המובהקות המינימאלית ' ‪‬‬
‫‪ 1.18‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪2  1.99‬‬
‫‪ 1.1785‬‬
‫‪ 0.06 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 50 ‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪ '  0.119 ‬‬
‫‪11.9%‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0  ‬‬
‫‪  ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪ 0.8810‬‬
‫'‪‬‬
‫‪2‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪291‬‬
‫‪.10‬‬
‫‪8‬‬
‫‪ Yi 2  4.83‬‬
‫‪8‬‬
‫‪ X i 2  14.25‬‬
‫‪Y  0.7125‬‬
‫‪i 1‬‬
‫) ‪COV ( XY‬‬
‫‪ x  y‬‬
‫‪X  1.25‬‬
‫‪i 1‬‬
‫‪r‬‬
‫‪ Xi2  X 2‬‬
‫‪n‬‬
‫‪‬‬
‫) ‪COV ( XY‬‬
‫‪2‬‬
‫‪x‬‬
‫‪my ‬‬
‫‪x‬‬
‫‪14.24‬‬
‫‪4.83‬‬
‫‪ 1.25 2  0.2175‬‬
‫‪y ‬‬
‫‪ 0.7125 2  0.096‬‬
‫‪8‬‬
‫‪8‬‬
‫) ‪COV ( XY‬‬
‫‪0.4569 ‬‬
‫) ‪0.09937575  COV ( XY‬‬
‫‪0.2175‬‬
‫‪0.09937575‬‬
‫‪r‬‬
‫‪ 0.6877‬‬
‫‪0.2175  0.096‬‬
‫‪x ‬‬
‫‪.11‬‬
‫כאשר הסטטיסטיקאי עובד ברמת מובהקות של ‪ 1%‬המשמעות היא רמת בטחון של ‪ , 99%‬כלומר כאשר‬
‫הוא עורך מבחן לבדיקת השערות ברמת בטחון של ‪ 99%‬הסיכוי לשגיאה הוא ‪ 1%‬כלומר הוא החליט נכון בערך‬
‫ב‪ 99%-‬מבדיקות ההשערות שביצע‪.‬‬
‫‪292‬‬
‫פתרון מבחן מס ‪2‬‬
‫‪.1‬‬
‫שני מדגמים מזווגים ‪ ,‬מבחן חד כיווני כלפי מעלה (האם תרד משפר את הכושר הפיסי) ‪,‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬תרד אינו משפר את הכושר הפיסי‬
‫‪1   2  0‬‬
‫‪H1 :‬‬
‫א‪.‬‬
‫ע"פ ‪ - ‬רמת מובהקות המחקר ‪  0.05‬‬
‫כלומר עבור כל ‪ ‬הקטנה מרמת מובהקות זו נדחה את ‪ H 0‬וההיפך‪.‬‬
‫ע"פ הפלט ניתן לראות כי הסיכוי ה"אמיתי" לשגיאה – ה ‪ ‬האמיתית היא ‪0.1726‬‬
‫)‪ ( '  0.1726)  (  0.05‬לכן נקבל את השערת האפס‪.‬‬
‫‪ t stat  t n1,1‬נדחה את ‪H 0‬‬
‫ב‪.‬‬
‫ע"פ ‪t‬‬
‫ב‪.‬‬
‫מבחן על תוחלת ‪ /‬ממוצע של אוכלוסיה אחת ‪ ,‬סטית תקן אינה ידועה ‪ -‬מבחן ‪t‬‬
‫‪ t stat  t n1,1‬נקבל את ‪H 0‬‬
‫)‪ (t stat  1.069)  (t n1,1  2.131‬לכן נקבל את ‪H 0‬‬
‫נתונים‪ 0  146 :‬‬
‫‪‬‬
‫‪S  114.7  10.7‬‬
‫‪  152.8‬‬
‫‪  146‬‬
‫‪H0 :‬‬
‫תרד אינו משפר את הכושר הפיסי‬
‫‪  146‬‬
‫‪H1 :‬‬
‫‪n5‬‬
‫‪  0.01‬‬
‫‪‬‬
‫‪ 163.93‬‬
‫‪ C‬‬
‫‪10.7‬‬
‫‪5‬‬
‫‪ 146  3.747 ‬‬
‫‪S‬‬
‫‪n‬‬
‫‪C   0  t n1,1 ‬‬
‫‪ - 152.8  163.93‬הממוצע החדש נמצא בתחום קבלת ‪H 0‬‬
‫לכן נקבל את ‪ - H 0‬אכילת תרד אינה משפרת את הכושר הפיסי‪.‬‬
‫ע"פ הפלט ניתן לבנות את משוואת הרגרסיה (עיינו בפרק על הסקה באמצעות אקסל)‬
‫‪‬‬
‫קו הרגרסיה הוא ‪y  7.2 xi  114.8‬‬
‫‪293‬‬
‫ג‪.‬‬
‫תחזית למשקולן שמתאמן ‪ 7‬שעות – נציב ‪xi  7‬‬
‫‪‬‬
‫‪y  7.2  7  114.8  165.2‬‬
‫משקולן שמתאמן ‪ 7‬שעות ירים ‪ 165.2‬ק"ג‪.‬‬
‫שמקדם המתאם גבוהה יותר כך הסטיות מקו האמצע קטנות – החיזוי טוב יותר ‪ ,‬כאשר המתאם הוא ‪ 1‬החיזוי מדויק‪.‬‬
‫ד‪.‬‬
‫אם כל מתאמן יוריד חצי שעת אימון – מאחר ושיפוע הקו הוא ‪ 7.2‬הורדת חצי שעה תוריד ‪ 3.6‬ק"ג במשקל ‪,‬‬
‫ניתן לבדוק זאת גם ע"י הצבת זמן הקטן בחצי שעה בכל אחד מהזמנים ומציאת המשקל המתאים‬
‫‪Y‬‬
‫‪147.2‬‬
‫‪161.6‬‬
‫‪150.8‬‬
‫‪140‬‬
‫‪136.4‬‬
‫‪X‬‬
‫‪4.5‬‬
‫‪6.5‬‬
‫‪5‬‬
‫‪3.5‬‬
‫‪3‬‬
‫אם נחשב את המשקל הממוצע אחרי השינוי – ‪ 147.2‬ק"ג ‪ ,‬המשקל הממוצע לפני השינוי ‪ 150.8‬ק"ג‬
‫אכן ירידה של ‪ 3.6‬ק"ג‪.‬‬
‫ה‪.‬‬
‫עוצמת הקשר – ‪ , 0.897‬קשר חיובי חזק אבל לא מושלם ‪ ,‬ככל שמקדם המתאם שואף ל‪ 1-‬הקשר חזק‬
‫יותר ומכאן חיזוי מדויק יותר‪.‬‬
‫‪.2‬‬
‫מבחן‬
‫‪2‬‬
‫‪‬‬
‫מבוגר‬
‫‪30‬‬
‫‪10‬‬
‫‪40‬‬
‫לא הצליח לגייס‬
‫הצליח לגייס‬
‫צעיר‬
‫‪14‬‬
‫‪46‬‬
‫‪60‬‬
‫‪44‬‬
‫‪56‬‬
‫‪100‬‬
‫מבוגר‬
‫‪17.6‬‬
‫‪22.4‬‬
‫‪40‬‬
‫לא הצליח לגייס‬
‫הצליח לגייס‬
‫צעיר‬
‫‪26.4‬‬
‫‪33.6‬‬
‫‪60‬‬
‫‪44‬‬
‫‪56‬‬
‫‪100‬‬
‫‪.1‬‬
‫‪.2‬‬
‫‪H0‬‬
‫‪:‬‬
‫אין תלות בין גיל המתנדב להצלחתו בגיוס תרומות‬
‫‪H1‬‬
‫‪:‬‬
‫יש תלות בין גיל המתנדב להצלחתו בגיוס תרומות‬
‫‪294‬‬
‫‪.3‬‬
‫מציאת תחומי דחייה‪/‬קבלה ל‪H 0 -‬‬
‫‪2‬‬
‫‪C 2 R 1C 1,1‬‬
‫‪‬‬
‫‪ C 2 21 21,0.99   C 21,0.99  6.63‬‬
‫‪(30  17.6) 2 (14  26.4) 2 (10  22.4) 2 (46  33.6) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ 26‬‬
‫‪17.6‬‬
‫‪26.4‬‬
‫‪22.4‬‬
‫‪33.6‬‬
‫תחום דחית‬
‫‪H0‬‬
‫‪‬‬
‫‪i‬‬
‫‪26‬‬
‫‪.4‬‬
‫‪2‬‬
‫) ‪(o  e‬‬
‫‪   ie i‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪H0‬‬
‫‪6.63‬‬
‫הנבדק ‪ 26‬גדול מהגבול הקריטי ‪ , 6.63‬לכן נדחה את השערת האפס יש תלות בין‬
‫הגיל לבין ההצלחה בגיוס תרומות‪.‬‬
‫‪.5‬‬
‫שגיאה ‪ -‬מאחר ודחינו את השערת האפס‪ ,‬השגיאה האפשרית היא שגיאה מסוג ראשון ‪. ‬‬
‫ב‪.‬‬
‫מבחן חד כיווני כלפי מטה (אברהם משכנע יותר מהר – זמן קצר יותר) שני מדגמים בלתי תלויים ‪,‬‬
‫להשוואה בין הממוצעים ‪ ,‬שונויות באוכלוסיה לא ידועות – מבחן ‪.t‬‬
‫‪‬‬
‫‪S1  4‬‬
‫‪‬‬
‫נתונים‪S 1  4 :‬‬
‫‪X 1  33‬‬
‫‪n1  11‬‬
‫‪X 2  35‬‬
‫‪n2  13‬‬
‫‪X 1  X 2  2‬‬
‫‪.1‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬זמן השכנוע של אברהם אינו מהיר מזמן השכנוע של יעקב‬
‫‪1   2  0‬‬
‫‪ H1 :‬זמן השכנוע של אברהם מהר יותר מיעקב‬
‫‪.2‬‬
‫‪.3‬‬
‫‪295‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫)‪S 12 (n1  1)  S 2 2 (n2  1) 4 2 (13  1)  4 2 (11  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 16‬‬
‫‪n1  n2  2‬‬
‫‪22‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪t n1 n 22,1   t 22,0.95  1.717‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪C  1   2  t ( n1  n2 2), 1 ‬‬
‫‪16 16‬‬
‫‪‬‬
‫‪ 1.638‬‬
‫‪11 13‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪ 12‬‬
‫‪‬‬
‫‪1   2  0‬‬
‫‪n1‬‬
‫‪C  0  1.717  1.638  2.81‬‬
‫‪H0‬‬
‫‪0‬‬
‫‪.4‬‬
‫‪ 2.81‬‬
‫‪2‬‬
‫החלטה‬
‫נקבל את השערת האפס ההפרש בין הממוצעים נמצא בתחום קבלת השערת האפס אברהם אינו משכנע מהר יותר‪.‬‬
‫‪.5‬‬
‫מאחר וקיבלנו את השערת האפס ‪ ,‬השגיאה האפשרית היא שגיאה מסוג שני ‪. ‬‬
‫‪ 0.48‬‬
‫‪ 2.798  2‬‬
‫‪16 16‬‬
‫‪‬‬
‫‪11 13‬‬
‫‪1    0.75 ‬‬
‫‪   0.25‬‬
‫‪t 22,1   ‬‬
‫‪1    0.6 ‬‬
‫‪   0.4‬‬
‫‪0.25    0.4‬‬
‫‪‬‬
‫ג‪.‬‬
‫אורך הרווח הוא‬
‫‪‬‬
‫‪S‬‬
‫‪S‬‬
‫‪   X t‬‬
‫‪ ‬‬
‫) ‪( n 1)(1‬‬
‫‪n‬‬
‫‪n‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫) ‪( n 1)(1‬‬
‫‪2‬‬
‫‪X t‬‬
‫‪ 43.25 - 38.25 = 5‬כלומר מחצית רווח היא ‪2.5‬‬
‫‪296‬‬
‫מאחר ואנו מתייחסים לרווח בלבד אין השפעה לממוצע ‪.‬‬
‫‪‬‬
‫‪S‬‬
‫‪t‬‬
‫‪ 2.5‬‬
‫‪ ‬‬
‫) ‪( n 1)(1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪4.5‬‬
‫‪ 2.5‬‬
‫‪16‬‬
‫‪ 0.99‬‬
‫‪‬‬
‫‪2‬‬
‫‪0.975  1 ‬‬
‫‪‬‬
‫‪‬‬
‫‪t‬‬
‫‪ 2.22‬‬
‫‪‬‬
‫‪t‬‬
‫) ‪15(1‬‬
‫‪2‬‬
‫) ‪15(1‬‬
‫‪2‬‬
‫‪0.02    0.05‬‬
‫ד‪.‬‬
‫שני מדגמים מזווגים ‪ ,‬שונויות לא ידועות ‪ ,‬מבחן ‪ , t‬מבחן חד כיווני כלפי מעלה‪.‬‬
‫‪d  0‬‬
‫‪.1‬‬
‫‪n4‬‬
‫‪‬‬
‫‪S  3.109‬‬
‫‪d  1.5‬‬
‫‪D  0‬‬
‫‪ H 0 :‬הפרסים לא יעלו את מספר התורמים‬
‫‪D  0‬‬
‫‪ H1 :‬הפרסים יעלו את מספר התורמים‬
‫‪  0.05‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪ 3.657‬‬
‫‪H0‬‬
‫‪C  0  t ( n1),(1 ) ‬‬
‫‪3.109‬‬
‫‪4‬‬
‫‪3.657‬‬
‫‪C  0  2.353 ‬‬
‫‪1.5‬‬
‫‪0‬‬
‫‪.4‬‬
‫מקבלים את השערת האפס ‪ ,‬מספר התורמים לא עלה כתוצאה מהפרסים‪.‬‬
‫‪.5‬‬
‫השגיאה האפשרית שגיאה מסוג שני‬
‫‪3.109‬‬
‫‪4‬‬
‫‪3.657  1.5  t 3,(1  ) ‬‬
‫) ‪1.3875  t 3,(1 ‬‬
‫‪1    0.75‬‬
‫‪  0.25‬‬
‫‪1    0.9‬‬
‫‪  0.1‬‬
‫‪0.1    0.25‬‬
‫‪297‬‬
‫פרק שני‬
‫‪.1‬‬
‫מתאם שלילי משמעותו – כאשר משתנה אחד עולה השני יורד‪ .‬מתאם חיובי – שני המשתנים "נעים"‬
‫באותו כיוון יכול להיות בתחום השלילי ויכול להיות בתחום החיובי‪.‬‬
‫התשובה היא ד‪.‬‬
‫‪.2‬‬
‫התפלגות נורמאלית ‪ ,‬משפט הגבול המרכזי‪ :‬אם משטח של ‪ 36‬ארגזים שוקל ‪ 340‬ק"ג אז כל ארגז שוקל‬
‫בממוצע ‪ 9.44‬ק"ג‪ .‬מה ההסתברות שמשקלו של ארגז יהיה מעל ‪ 9.44‬ק"ג‬
‫‪9.44  10‬‬
‫‪ 1.68‬‬
‫‪2‬‬
‫(‬
‫)‬
‫‪36‬‬
‫‪P( Z  1.68)  0.0465‬‬
‫‪Z‬‬
‫‪1  0.0465  0.9535‬‬
‫‪.3‬‬
‫המרחק בין ממוצע המשקל האמיתי לממוצע המשקל במדגם לא יעלה על ‪ 50‬ג' המשמעות היא שאורך‬
‫רווח הסמך הוא בין הערך הגבוה לממוצע לערך הנמוך הוא ‪ 100‬ג'‬
‫‪‬‬
‫התשובה הנכונה היא ד‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪‬‬
‫‪ X Z‬‬
‫‪200‬‬
‫‪ 50‬‬
‫‪n‬‬
‫‪‬‬
‫‪n‬‬
‫‪ 50‬‬
‫‪1.96 ‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪X Z‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪2‬‬
‫‪ 1.96  200 ‬‬
‫‪‬‬
‫‪ n‬‬
‫‪50‬‬
‫‪‬‬
‫‪‬‬
‫‪n  61.46‬‬
‫‪.4‬‬
‫השערה חד כיוונית כלפי מטה – הסמים מורידים את ערך הבדיקה‪.‬‬
‫מבחן ‪ – t‬סטית התקן באוכלוסיה לא ידועה‪ .‬ה‪  -‬המינימאלית היא המרחק בין ‪  0  200‬ל‪  188.6 -‬‬
‫‪200  188.6‬‬
‫‪ 1.9‬‬
‫‪30‬‬
‫(‬
‫)‬
‫‪25‬‬
‫‪t 24,1 ‬‬
‫תשובה ד נכונה‬
‫‪.5‬‬
‫‪0  ‬‬
‫‪‬‬
‫‪tn1,1 ‬‬
‫‪S‬‬
‫) (‬
‫‪n‬‬
‫‪0.95  1    0.975‬‬
‫‪0.025    0.05‬‬
‫כאשר מגדילים את המדגם ‪ -‬מקטינים את אורך הרווח ‪.‬‬
‫כאשר מקטינים את רמת המובהקות מגדילים את אורך הרווח – כאשר מקטינים את רמת המובהקות מגדילים את‬
‫הביטחון וההיפך‪ .‬רמת ביטחון קטנה – רווח קטן‪.‬‬
‫משפט ראשון – אינו נכון ‪ ,‬הפוך‪.‬‬
‫משפט שני – אינו נכון ‪ ,‬הפוך‪.‬‬
‫תשובה נכונה ב‪.‬‬
‫‪298‬‬
‫‪.6‬‬
‫מבחן השערות דו כיווני (אין הבדל בהוצאות השימוש בין חיילים וחיילות) ‪ ,‬שני מדגמים בלתי תלויים ‪,‬‬
‫‪‬‬
‫סטיות תקן באוכלוסיות לא ידועות – מבחן ‪.t‬‬
‫‪S 1  31.5‬‬
‫‪X 1  192‬‬
‫‪n1  17‬‬
‫‪S 1  26‬‬
‫‪X 2  180‬‬
‫‪n2  15‬‬
‫‪‬‬
‫ג‪.‬‬
‫‪X 1  X 2  12‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬אין הבדל בהוצאות החודשיות לטלפון בין חיילים וחיילות‬
‫‪1   2  0‬‬
‫‪ H1 :‬יש הבדל בהוצאות החודשיות לטלפון בין חיילים וחיילות‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫תחום י קבלה ודחית ‪H 0‬‬
‫‪‬‬
‫‪S  29.06‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫)‪S 12 (n1  1)  S 2 2 (n2  1) 26 2 (15  1)  31.5 2 (17  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 844.66‬‬
‫‪n1  n2  2‬‬
‫‪30‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪ t30,0.975  2.042‬‬
‫‪ t30,0.95  1.697‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪C  1   2  Z ‬‬
‫‪‬‬
‫‪1 ‬‬
‫‪ 2‬‬
‫‪ ‬‬
‫‪n1 n 22,1 ‬‬
‫‪ 2‬‬
‫‪t‬‬
‫‪ ‬‬
‫‪n1 n 22, 1 ‬‬
‫‪ 2‬‬
‫‪844.66 844.66‬‬
‫‪‬‬
‫‪ 10.29‬‬
‫‪15‬‬
‫‪17‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪1   2  0‬‬
‫‪n1‬‬
‫‪t‬‬
‫‪C0.05  0  2.042  10.29  21.01‬‬
‫‪C0.1  0  1.697  10.29  17.46‬‬
‫חישבנו את הגבולות הקריטיים עבור רמות מובהקות של ‪ 0.1‬ו‪ 0.05-‬בשני הגבולות הפרש הממוצעים ‪ 12‬נמצא‬
‫בתחום קבלת השערת האפס‪.‬‬
‫תשובה ג נכונה‪.‬‬
‫) ‪COV ( XY‬‬
‫חישוב מקדם המתאם ‪:‬‬
‫‪ x  y‬‬
‫‪.7‬‬
‫‪r‬‬
‫‪ xi yi  n  x  y   xi yi  x  y‬‬
‫‪n‬‬
‫‪n‬‬
‫‪COV ( XY ) ‬‬
‫‪ xi 2  X 2‬‬
‫‪17800  20 10 100  110‬‬
‫‪20‬‬
‫‪232000‬‬
‫‪ 100 2  40‬‬
‫‪20‬‬
‫‪y ‬‬
‫‪ 110‬‬
‫‪ 0.6875‬‬
‫‪4  40‬‬
‫‪n‬‬
‫‪‬‬
‫‪COV ( XY ) ‬‬
‫‪2320‬‬
‫‪ 10 2  4‬‬
‫‪20‬‬
‫‪x ‬‬
‫‪r‬‬
‫‪299‬‬
‫‪.8‬‬
‫‪H0‬‬
‫‪200‬‬
‫‪218‬‬
‫התפלגות נורמאלית ‪ ,‬סטית תקן באוכלוסיה ידועה נחשב את ההסתברות לקבלת ערך גדול מ‪ 218‬כלומר‬
‫ההסתברות לדחות את השערת האפס‪.) C =218( .‬‬
‫‪218  200‬‬
‫‪ 1.8‬‬
‫‪ 40 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 16 ‬‬
‫‪C  0‬‬
‫‪‬‬
‫‪  ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪1    0.9641‬‬
‫‪Z 1 ‬‬
‫‪  0.0359‬‬
‫‪.9‬‬
‫רמת המובהקות המינימאלית לדחיית ‪ ' -- , H 0‬‬
‫' ‪   ‬דוחים את ‪H 0‬‬
‫' ‪   ‬מקבלים את ‪H 0‬‬
‫כלומר אם הסיכוי האמיתי לשגיאה קטן מהסיכוי שהוגדר במחקר – דוחים את השערת האפס‪.‬‬
‫תשובה ג נכונה‪.‬‬
‫‪.10‬‬
‫טענה ראשונה – הטענה אינה נכונה ‪ ,‬רמת מובהקות קטנה יותר תרחיק את ‪ C‬למעלה ולכן יתכן מצב‬
‫שנקבל את השערת האפס‬
‫טענה שנייה – טענה נכונה ‪ ,‬אם קיבלנו את השערת האפס עבר רמת מובהקות מסוימת המשמעות היא‬
‫שהערך הנבדק קטן מ‪ , C-‬רמת מובהקות קטנה יותר תגדיל את ‪ C‬ולכן ברור כי נשאר עם אותה מסקנה‪.‬‬
‫תשובה ד נכונה‬
‫‪300‬‬
‫פתרון מבחן מס ‪3‬‬
‫‪.1‬א‪.‬‬
‫מבחן להשוואת ממוצעים ‪ ,‬סטיות תקן באוכלוסיה אינן ידועות – מבחן ‪ , t‬מבחן דו כיווני‬
‫‪‬‬
‫‪S 1  40‬‬
‫‪X 1  200‬‬
‫‪n1  8‬‬
‫‪20  35‬‬
‫‪S 2  43‬‬
‫‪X 2  190‬‬
‫‪n2  7‬‬
‫‪30  40‬‬
‫‪‬‬
‫‪X 1  X 2  10‬‬
‫‪1   2  0‬‬
‫‪1   2  0‬‬
‫‪‬‬
‫‪‬‬
‫)‪S 1 (n1  1)  S 2 (n2  1) 432 (7  1)  402 (8  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 1714.92‬‬
‫‪n1  n2  2‬‬
‫‪13‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪1714.92 1714.92‬‬
‫‪‬‬
‫‪ 46.29‬‬
‫‪8‬‬
‫‪7‬‬
‫‪2‬‬
‫‪‬‬
‫‪S12 S 2 2‬‬
‫‪C  1  2  t‬‬
‫‪‬‬
‫‪ ‬‬
‫‪n1‬‬
‫‪n2‬‬
‫‪n1 n 2  2,1 ‬‬
‫‪C  0  2.16 ‬‬
‫‪2‬‬
‫‪‬‬
‫‪H0‬‬
‫‪46.29‬‬
‫‪10‬‬
‫‪0‬‬
‫‪ 46.29‬‬
‫הפרש הממוצעים נמצא בתחום קבלת השערת האפס – מקבלים את ‪ H 0‬אין הבדל בין ממוצעי גובה החשבון‪.‬‬
‫ב‪.‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪( n 1)(1‬‬
‫‪‬‬
‫‪   X t‬‬
‫‪S‬‬
‫‪n‬‬
‫‪‬‬
‫)‬
‫‪‬‬
‫‪2‬‬
‫‪( n 1)(1‬‬
‫‪X t‬‬
‫‪40‬‬
‫‪40‬‬
‫‪   200  1.895 ‬‬
‫‪8‬‬
‫‪8‬‬
‫‪173.2    226.79‬‬
‫‪200  1.895 ‬‬
‫ערך ‪ t‬בטבלה עבור ‪ 98%‬הוא ‪ , 2.998‬ערך ‪ t‬בטבלה עבור ‪ 90%‬הוא ‪ 1.895‬מאחר והערך עבור ‪ 98%‬גדול פי‬
‫‪ 1.58‬המשמעות היא שהרווח יגדל פי ‪. 1.58‬‬
‫‪301‬‬
‫ד‪.‬‬
‫‪  40‬‬
‫‪0  210‬‬
‫‪  X 3  186.66‬‬
‫‪n3  9‬‬
‫‪40  50‬‬
‫סטית התקן ידועה לכן משתמשים בהתפלגות ‪Z‬‬
‫‪210  186.66‬‬
‫‪2‬‬
‫‪35‬‬
‫) (‬
‫‪9‬‬
‫‪Z1 ‬‬
‫‪  0‬‬
‫‪‬‬
‫‪Z1 ‬‬
‫(‬
‫)‬
‫‪n‬‬
‫‪1    0.9772‬‬
‫‪  0.0228‬‬
‫ה‪.‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪ 7.5‬‬
‫‪  X Z‬‬
‫‪‬‬
‫‪n‬‬
‫‪35‬‬
‫‪1.96 ‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪‬‬
‫‪ 7.5‬‬
‫‪n‬‬
‫‪‬‬
‫‪n‬‬
‫‪X Z‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪2‬‬
‫‪84  n‬‬
‫‪.2‬א‪.‬‬
‫‪ 1.96  35 ‬‬
‫‪‬‬
‫‪ n‬‬
‫‪ 7.5 ‬‬
‫שני מדגמים מזווגים ‪ ,‬התפלגות ‪ ,t‬מבחן חד כיווני כלפי מעלה‪.‬‬
‫‪1  2  20‬‬
‫‪ H 0 :‬ממוצע זמן האוויר של הצעירים אינו גבוה מזמן האוויר הבכורים‬
‫‪1  2  20‬‬
‫זמן האוויר של הצעירים גבוה מזמן האוויר של הבכורים‬
‫‪H1 :‬‬
‫‪  0.1‬‬
‫שימו לב – הפלט מתייחס להשערת האפס ‪ -‬פער של ‪ 20‬ד' בזמן האוויר‬
‫הסיכוי האמיתי לשגיאה ע"פ הפלט הוא ‪  ' 0.0925‬סיכוי זה קטן מ‪ 0.1 - 10%-‬לכן נדחה ת השערת האפס‬
‫ברמת מובהקות של ‪.10%‬‬
‫ב‪.‬‬
‫ע"פ הפלט ההסתברות האמיתית לשגיאה גם במבחן דו כיווני וגם במבחן חד כיווני גדולה מ‪ 0.05-‬לכן נקבל‬
‫את השערת האפס ברמת מובהקות של ‪. 0.05‬‬
‫ג‪.‬‬
‫ע"פ הפלט ניתן לבנות את משוואת הרגרסיה ‪:‬‬
‫‪‬‬
‫‪y  1.103xi  44.23‬‬
‫‪‬‬
‫‪y  1.103 180  44.23  154.31‬‬
‫ד‪.‬‬
‫‪xi  180‬‬
‫מקדם המתאם ‪ , r  0.9869‬מעיד על קשר חיובי חזק מאוד – מקדם המתאם שואף ל‪1-‬‬
‫לכן יכולת הניבוי ע"י קו הרגרסיה גבוהה מאוד (שונות מוסברת – לא נלמדה בקורס – אין צורך)‬
‫‪302‬‬
‫פרק שני‬
‫‪.1‬‬
‫השערת האפס נדחית ברמת מובהקות של ‪ 0.05‬המשמעות היא שעבור כל רמת מובהקות גבוהה יותר‬
‫נדחה את השערת האפס ‪ ,‬לגבי רמת מובהקות נמוכה יותר ‪ ,‬לא ניתן לדעת בלי בדיקה‪.‬‬
‫כאשר ההשערה דו כיוונית רמת המובהקות מתחלקת ל‪.2-‬‬
‫תשובה ג' נכונה מאחר ו‪ 10%-‬מתחלקים ל‪ 2-‬בדו כיווני ולכן התוצאה שווה ‪.5% -‬‬
‫‪.2‬‬
‫סטית התקן באוכלוסיה נתונה – התפלגות ‪. Z‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪ 5.47‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪12.481‬‬
‫‪20‬‬
‫‪ 1.96‬‬
‫רמת הסמך ‪ /‬רמת הביטחון = ‪95% / 0.95‬‬
‫‪‬‬
‫מחצית הרווח היא ‪5.47‬‬
‫‪  X Z‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪Z‬‬
‫‪  0.05‬‬
‫‪ 5.47‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪5.47  20‬‬
‫‪12.481‬‬
‫‪X Z‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪ 0.975‬‬
‫‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪Z‬‬
‫‪1‬‬
‫תשובה א נכונה‬
‫‪.3‬‬
‫מבחן‬
‫‪2‬‬
‫‪‬‬
‫לאי תלות ‪ -‬נתונה טבלת ‪ , Observed‬נשווה אותה לטבלה תיאורטית מקבילה הטבלה לה‬
‫‪200‬‬
‫‪200‬‬
‫‪400‬‬
‫‪200‬‬
‫‪200‬‬
‫‪400‬‬
‫גברים‬
‫‪160‬‬
‫‪130‬‬
‫‪290‬‬
‫נשים‬
‫‪40‬‬
‫‪70‬‬
‫‪110‬‬
‫מרוצה‬
‫לא מרומה‬
‫סה"כ‬
‫גברים‬
‫‪145‬‬
‫‪145‬‬
‫‪290‬‬
‫נשים‬
‫‪55‬‬
‫‪55‬‬
‫‪110‬‬
‫מרוצה‬
‫לא מרומה‬
‫סה"כ‬
‫א‪.‬‬
‫‪H0‬‬
‫‪:‬‬
‫אין תלות בין מין לשביעות הרצון‬
‫‪H1‬‬
‫‪:‬‬
‫יש תלות בין מין לשביעות הרצון‬
‫‪303‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪C 2 R 1C 1,1‬‬
‫‪C 22121,0.95  C 21,0.95  3.84‬‬
‫‪C 21,0.975  5.02‬‬
‫‪(160  145)2 (130  145)2 (40  55)2 (70  55)2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ 11.28‬‬
‫‪145‬‬
‫‪145‬‬
‫‪55‬‬
‫‪55‬‬
‫‪2‬‬
‫‪‬‬
‫) ‪(o  e‬‬
‫‪   ie i‬‬
‫‪2‬‬
‫‪i‬‬
‫שני אזורי דחית‬
‫‪H0‬‬
‫‪11.28‬‬
‫ד‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪5.02‬‬
‫‪3.84‬‬
‫הנבדק ‪ 11.28‬גדול משני הגבולות הקריטיים ‪ ,‬לכן נדחה את השערת ברמת‬
‫מובהקות של ‪ 2.5%‬ושל ‪ - 5%‬יש קשר בין שביעות רצון למין בשתי הרמות‪.‬‬
‫תשובה א נכונה‬
‫‪.4‬‬
‫הגדל המדגם פי ‪ K‬תקטין את אורך הרווח פי ‪K‬‬
‫‪ ,‬לכן הגדלת המדגם פי ‪( 5‬מ‪ 100-‬ל‪ )500-‬תקצר את‬
‫הרווח פי ‪ , 2.236‬כלומר במדגם של ‪ 100‬הרווח ארוך פי ‪.2.236‬‬
‫תשובה ג' נכונה‬
‫‪.5‬‬
‫‪.6‬‬
‫‪512‬‬
‫‪ 8.53‬‬
‫‪n  60‬‬
‫‪ 2‬‬
‫‪ 8‬‬
‫‪60‬‬
‫‪8.53  8‬‬
‫‪Z1 ‬‬
‫‪ 2.065‬‬
‫‪1    0.9803‬‬
‫‪  0.0197‬‬
‫‪2‬‬
‫(‬
‫)‬
‫‪60‬‬
‫‪X ‬‬
‫‪  1  r  1‬בתשובה בשאלה ‪ r=-1.55‬נתון זה בלתי אפשרי ‪.‬‬
‫תשובה ד' נכונה‬
‫‪304‬‬
‫‪.7‬‬
‫רווח בר סמך לפרופורציה ‪:‬‬
‫נערך מדגם של ‪ 100‬מצביעים ונמצא כי ‪ 21‬השתכנעו ‪.21% -‬‬
‫נבנה רווח בר סמך לפרופורציית המשתכנעים באוכלוסיה ברמת בטחון של ‪.98%‬‬
‫‪‬‬
‫)‪0.21(1  0.21‬‬
‫‪ 0.0407 Z   Z 0.99  2.33‬‬
‫‪1‬‬
‫‪100‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P (1  P‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P (1  P‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪P (1  P‬‬
‫‪ P  P Z  ‬‬
‫‪1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪‬‬
‫‪P  0.21‬‬
‫‪‬‬
‫‪P Z  ‬‬
‫‪1‬‬
‫‪2‬‬
‫‪0.21  2.33  0.0407  P  0.21  2.33  0.0407‬‬
‫‪0.21  0.095  P  0.21  0.095‬‬
‫התשובה הנכונה ג'‬
‫‪.8‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬אין הבדל בין זמן שיחות הטלפון בין שתי הערים‬
‫‪1   2  0‬‬
‫‪ H1 :‬קיים הבדל בין זמן שיחות הטלפון בין שתי הערים‬
‫נבדוק גבולות קריטיים עבור ‪  0.05,   0.01‬‬
‫‪4.842 3.612‬‬
‫‪C  1.96 ‬‬
‫‪‬‬
‫‪ 3.62‬‬
‫‪10‬‬
‫‪12‬‬
‫‪4.842 3.612‬‬
‫‪C  2.57 ‬‬
‫‪‬‬
‫‪ 4.74‬‬
‫‪10‬‬
‫‪12‬‬
‫‪ 22‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪‬‬
‫‪n2‬‬
‫‪n2‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪12‬‬
‫‪n1‬‬
‫‪C  0  Z 0.975 ‬‬
‫‪C  0  Z 0.995 ‬‬
‫‪.9‬‬
‫ע"פ המשוואה הפועל מקבל תוספת של ‪ ₪ 0.5‬עבור ‪ X1‬ומורידים לו ‪ ₪ 0.8‬עבור ‪X2‬‬
‫מקבל תוספת עבור מספר הפריטים ומנקים לו עבור מס' התלונות‪.‬‬
‫‪305‬‬
‫פתרון מבחן לדוגמה מס ‪4‬‬
‫‪.1‬‬
‫שני מדגמים בלתי תלויים ‪ ,‬מבחן חד כיווני כלפי מעלה (תוחלת זמן הגברים גבוהה מתוחלת זמן הנשים) ‪,‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬תוחלת זמן גלישה אצל גברים אינה גבוהה מתוחלת הזמן אצל הנשים‬
‫‪1   2  0‬‬
‫‪H1 :‬‬
‫תוחלת זמן גלישה אצל גברים גבוהה מתוחלת הזמן אצל הנשים‬
‫א‪ .‬רמת מובהקות המחקר ‪  0.1‬‬
‫כלומר עבור כל ‪ ‬הקטנה מרמת מובהקות זו נדחה את ‪ H 0‬ולהיפך‪.‬‬
‫ע"פ הפלט ניתן לראות כי הסיכוי ה"אמיתי" לשגיאה – רמת המובהקות המינימאלית – ‪.  ' 0.282‬‬
‫)‪ ( '  0.282)  (  0.1‬נקבל את השערת האפס‪.‬‬
‫הסיכוי האמיתי לשגיאה הוא ‪ 28.28%‬לעומת הסיכוי לשגיאה המוגדר שהוא ‪.10%‬‬
‫‪ t stat  t n1,1‬נדחה את ‪H 0‬‬
‫דרך נוספת ע"פ ערכי ‪t‬‬
‫‪ t stat  t n1,1‬נקבל את ‪H 0‬‬
‫)‪ (tstat  0.579)  (t38,0.90  1.685‬לכן נקבל את ‪H 0‬‬
‫ב‪.‬‬
‫‪1  2  2‬‬
‫‪1  2  2‬‬
‫‪ H 0 :‬תוחלת זמן גלישה אצל גברים אינה גבוהה בשעתיים מתוחלת זמן הנשים‬
‫‪H1 :‬‬
‫תוחלת זמן גלישה אצל גברים גבוהה בשעתיים מתוחלת הזמן אצל הנשים‬
‫‪  0.1‬‬
‫‪1  2  2.35‬‬
‫‪2‬‬
‫‪S  164.48‬‬
‫‪‬‬
‫‪164.48 164.48‬‬
‫‪‬‬
‫‪ 8.83‬‬
‫‪20‬‬
‫‪20‬‬
‫‪C  2  1.685 ‬‬
‫‪t38,0.9  1.685‬‬
‫‪‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪C  1  2  t‬‬
‫הפרש הממוצעים נמצא בתחום קבלת ‪H 0‬‬
‫לכן נקבל את ‪ - H 0‬זמן הגלישה אצל גברים אינו גבוה בשעתיים מזמן הגלישה אצל הנשים‪.‬‬
‫‪306‬‬
‫ג‪.‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪ 1   2  X 1  X 2  t‬‬
‫‪‬‬
‫‪ ‬‬
‫‪n1 n 22,1‬‬
‫‪n1 n2‬‬
‫‪n1 n2‬‬
‫‪2‬‬
‫‪X 1  X 2  tn1n22,1 ‬‬
‫‪2‬‬
‫‪2.35  1.684  4.055  1   2  2.35  1.684  4.055‬‬
‫‪ 4.478  1   2  9.179‬‬
‫ד‪.‬‬
‫מקדם המתאם בין גיל הגולשים לזמן הגלישה הוא ‪ , 0.84‬מקדם זה מעיד על קשר חיובי – ככל שהגיל עולה‬
‫כך עולה זמן הגלישה ‪ ,‬הקשר די חזק ‪.‬‬
‫ה‪.‬‬
‫‪‬‬
‫קו הרגרסיה הוא ‪y  0.341xi  38.37‬‬
‫תחזית זמן גלישה לגולש שגילו ‪25‬‬
‫‪.2‬א‪.‬‬
‫‪‬‬
‫‪y  0.341  25  38.37  46.89‬‬
‫מבחן להשוואת ממוצעים ‪ ,‬סטית התקן באוכלוסיה ידועה – מבחן ‪ , Z‬מבחן חד כיווני כלפי מטה‪.‬‬
‫‪0  500‬‬
‫‪  500‬‬
‫‪  500‬‬
‫‪ 6‬‬
‫‪  494.6‬‬
‫‪n 9‬‬
‫‪ H 0 :‬משקל הקופסא אינו נמוך מ‪ 500-‬גר'‪.‬‬
‫‪ H1 :‬משקל הקופסא נמוך מ‪ 500-‬גר'‪.‬‬
‫בדיקה ע"י גבול קריטי‬
‫‪6‬‬
‫‪ 496.08‬‬
‫‪9‬‬
‫‪C  500  1.96 ‬‬
‫‪‬‬
‫‪n‬‬
‫‪C  0  Z1 ‬‬
‫‪H0‬‬
‫‪494.6 496.08 500‬‬
‫משקל הממוצע של קופסא נמצא בתחום דחיית השערת האפס כלומר משקל הקופסא נמוך מ‪ 500 -‬גר'‪.‬‬
‫‪307‬‬
‫בדיקה ע"י רמת מובהקות‬
‫‪ '  0.0038‬‬
‫‪500  494.66‬‬
‫‪ 2.67‬‬
‫‪6‬‬
‫) (‬
‫‪9‬‬
‫‪1   '  0.9962‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪Z1 ' ‬‬
‫)‪  ' (0.0035)   (0.025‬דוחים את השערת האפס‪.‬‬
‫מאחר ורמת המובהקות המינימאלית היא ‪ , 0.38% -- 0.0038‬נדחה את השערת האפס ברמות מובהקות של‬
‫‪ 10%‬ושל ‪.1%‬‬
‫ב‪.‬‬
‫רמת המובהקות המינימאלית חושבה בסעיף הקודם ‪. 0.0038‬‬
‫ג‪.‬‬
‫סטית התקן אינה ידועה – התפלגות ‪ , t‬נחשב רווח בר סמך‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪   X t‬‬
‫‪ ‬‬
‫‪n 1,1‬‬
‫‪n‬‬
‫‪n‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪n 1,1‬‬
‫‪X t‬‬
‫‪8.485‬‬
‫‪8.485‬‬
‫‪   494.66  2.306 ‬‬
‫‪9‬‬
‫‪9‬‬
‫‪488.13    501.18‬‬
‫‪494.66  2.306 ‬‬
‫ד‪.‬‬
‫מבחן‬
‫‪2‬‬
‫‪‬‬
‫‪35‬‬
‫‪25‬‬
‫‪60‬‬
‫‪75‬‬
‫‪25‬‬
‫‪100‬‬
‫סה"כ‬
‫‪110‬‬
‫‪50‬‬
‫‪160‬‬
‫‪41.25‬‬
‫‪18.75‬‬
‫‪60‬‬
‫‪68.75‬‬
‫‪31.25‬‬
‫‪100‬‬
‫סה"כ‬
‫‪110‬‬
‫‪50‬‬
‫‪160‬‬
‫‪308‬‬
‫‪.1‬‬
‫‪H0‬‬
‫‪:‬‬
‫אין תלות בין המשמרת לגובה התפוקה‪.‬‬
‫‪H1‬‬
‫‪:‬‬
‫יש תלות בין המשמרת לגובה התפוקה‪.‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪2‬‬
‫‪C 2 R 1C 1,1‬‬
‫‪‬‬
‫‪ C 2 2121,0.95   C 2 1,0.95  3.84‬‬
‫‪(35  41.25)2 (75  68.75)2 (25  18.75)2 (25  31.25)2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ 4.84‬‬
‫‪41.25‬‬
‫‪68.75‬‬
‫‪18.75‬‬
‫‪31.25‬‬
‫‪2‬‬
‫) ‪(o  e‬‬
‫‪   ie i‬‬
‫‪2‬‬
‫‪i‬‬
‫תחום דחית‬
‫‪H0‬‬
‫‪4.84‬‬
‫‪.4‬‬
‫‪2‬‬
‫‪‬‬
‫‪H0‬‬
‫‪3.84‬‬
‫הנבדק ‪ 4.84‬גבוה מהגבול הקריטי ‪ , 3.84‬לכן נדחה את השערת האפס יש תלות‬
‫בין המשמרת לתפוקה‪.‬‬
‫‪.5‬‬
‫שגיאה ‪ -‬מאחר וקיבלנו את השערת האפס השגיאה האפשרית היא שגיאה מסוג שני ‪.‬‬
‫‪309‬‬
‫ה‪.‬‬
‫מדגם מזווג – מבחן חד כיווני כלפי מעלה (ניתן לבצע גם מבחן כלפי מטה)‪.‬‬
‫משקל לפני השימוש בערכה‬
‫‪87‬‬
‫‪85‬‬
‫‪73‬‬
‫‪68‬‬
‫‪78‬‬
‫משקל אחרי השימוש בערכה‬
‫‪82‬‬
‫‪82‬‬
‫‪74‬‬
‫‪64‬‬
‫‪74‬‬
‫‪5‬‬
‫‪3‬‬
‫‪1-‬‬
‫‪4‬‬
‫‪4‬‬
‫‪d‬‬
‫‪‬‬
‫‪S d  2.34‬‬
‫‪1   2  0‬‬
‫‪1   2  0‬‬
‫‪d 3‬‬
‫‪ H 0 :‬השימוש בערכה אינו משפר את הירידה במשקל‪.‬‬
‫‪H1 :‬‬
‫השימוש בערכה משפר את הירידה במשקל‪.‬‬
‫רמת מובהקות ‪  0.05 -‬‬
‫‪‬‬
‫‪S‬‬
‫‪C  0  t( n 1),(1 )  d‬‬
‫‪n‬‬
‫‪2.34‬‬
‫‪C  0  2.132 ‬‬
‫‪ 2.23‬‬
‫‪5‬‬
‫‪H0‬‬
‫‪3‬‬
‫‪2.23‬‬
‫‪0‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪t( n 1),(1 ') ‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0.01   '  0.025‬‬
‫‪df  4 ‬‬
‫‪ 0.975  1   '  0.99‬‬
‫)‪ 0.025)   (0.05‬‬
‫‪30‬‬
‫‪ 2.8‬‬
‫‪2.34‬‬
‫(‬
‫)‬
‫‪5‬‬
‫‪t4,1 ' ‬‬
‫‪310‬‬
‫השוואת ערכי ‪t‬‬
‫‪t4,0.95  2.132‬‬
‫‪30‬‬
‫‪ 2.795‬‬
‫‪2.34‬‬
‫(‬
‫)‬
‫‪5‬‬
‫)‪tSTAT (2.795)  t (2.132‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪‬‬
‫‪‬‬
‫‪tSTAT  t( n 1)(1 ') ‬‬
‫החלטה‬
‫דוחים את השערת האפס ‪ -‬הערכה משפרת את ההרזיה תוחלת המשקל לאחר השימוש בערכה קטנה מהתוחלת‬
‫ללא השימוש בערכה‪.‬‬
‫‪311‬‬
‫פרק שני‬
‫‪.1‬‬
‫התפלגות נורמאלית ‪ ,‬משפט הגבול המרכזי‪ , :‬נחשב את ההסתברות למשקל נמוך מ‪ 175-‬ג' ‪ ,‬את‬
‫ההסתברות למשקל נמוך מ‪ 215 -‬ג' ‪ ,‬נחסיר בין ההסתברויות ונקבל את ההסתברות למשקל בין שני ערכים אלו‪.‬‬
‫‪175  200‬‬
‫‪ 2‬‬
‫‪50‬‬
‫(‬
‫)‬
‫‪16‬‬
‫‪P( Z  2)  0.0228‬‬
‫‪Z‬‬
‫‪215  200‬‬
‫‪ 1.2‬‬
‫‪50‬‬
‫(‬
‫)‬
‫‪16‬‬
‫‪P( Z  1.5)  0.8849‬‬
‫‪Z‬‬
‫‪0.8849  0.0228  0.8621‬‬
‫‪.2‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪.3‬‬
‫‪200‬‬
‫‪n‬‬
‫‪2‬‬
‫‪n  61.46‬‬
‫‪50  1.96 ‬‬
‫‪ 1.96  200 ‬‬
‫‪n‬‬
‫‪‬‬
‫‪50‬‬
‫‪‬‬
‫‪‬‬
‫התשובה הנכונה היא ד‬
‫‪.4‬‬
‫כאשר המדגם גדל פי ‪ K‬רווח הסמך מתקצר פי ‪K‬‬
‫‪ ,‬לכן אם הרווח הראשון נבנה על מדגם בגודל ‪100‬‬
‫לעומת הרווח השני שנבנה על סמך מדגם של ‪ 500‬אזי הרווח השני קצר פי ‪5‬‬
‫לכן הרווח הראשון ארוך פי ‪5‬‬
‫‪.‬‬
‫‪.5‬‬
‫ככל שהמדגם גדול יותר – רווח הסמך קצר יותר – טענה ‪ 1‬לא נכונה‪.‬‬
‫ככל שרמת המובהקות ‪ ‬קטנה יותר הרווח גדל – ככל שרמת המובהקות קטנה ‪ ,‬רמת הסמך ‪1  ‬‬
‫גדלה לכן ככל שרמת הסמך גדלה הרווח ארוך יותר ‪ -‬טענה ‪ 2‬נכונה‪.‬‬
‫‪312‬‬
‫‪  38.5‬‬
‫‪.6‬‬
‫‪ '  0.2266‬‬
‫‪n  36‬‬
‫‪40  38.5‬‬
‫‪ 0.75‬‬
‫‪ 12 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 36 ‬‬
‫‪1   '  0.7734‬‬
‫‪.7‬‬
‫‪  12‬‬
‫‪0  40‬‬
‫‪Z1 ' ‬‬
‫השערה דו כיוונית‬
‫‪  1.99‬‬
‫‪ '  0.238‬‬
‫‪  0.06‬‬
‫‪n  50‬‬
‫‪ 0.8810‬‬
‫'‪‬‬
‫‪2‬‬
‫‪2  1.99‬‬
‫‪ 1.178‬‬
‫‪ 0.06 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 50 ‬‬
‫‪1‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪0  2‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪1‬‬
‫‪ 0.238  ‬דוחים את השערת האפס‪.‬‬
‫‪ 0.238  ‬מקבלים את השערת האפס‪.‬‬
‫‪.8‬‬
‫עבור ‪   0.05‬קיבלנו את השערת האפס ‪.‬‬
‫המשמעות היא שרמת המובהקות המינימאלית ‪ ,  ' 0.05‬ברמת מובהקות קטנה מ‪ 0.05-‬נקבל בוודאות את‬
‫אותן מסקנות ‪ ,‬ברמות מובהקות גבוהות מ‪ 0.05-‬לא ניתן לדעת‪.‬‬
‫‪.9‬‬
‫סטית התקן אינה ידועה ‪ ,‬נחשב רווח בר סמך ע"י התפלגות ‪. t‬‬
‫‪n6‬‬
‫‪‬‬
‫‪S  17.82‬‬
‫‪X  72‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪   X t‬‬
‫‪ ‬‬
‫‪n 1,1‬‬
‫‪n‬‬
‫‪n‬‬
‫‪2‬‬
‫‪X t‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪17.82‬‬
‫‪17.82‬‬
‫‪   72  2.571 ‬‬
‫‪6‬‬
‫‪6‬‬
‫‪n 1,1‬‬
‫‪72  2.571 ‬‬
‫‪72  18.71‬‬
‫‪313‬‬
‫‪.10‬‬
‫‪8‬‬
‫‪ Yi 2  4.83‬‬
‫‪8‬‬
‫‪ X i 2  14.25‬‬
‫‪Y  0.7125‬‬
‫‪i 1‬‬
‫) ‪COV ( XY‬‬
‫‪ x  y‬‬
‫‪X  1.25‬‬
‫‪i 1‬‬
‫‪r‬‬
‫‪ Xi2  X 2‬‬
‫‪n‬‬
‫‪‬‬
‫) ‪COV ( XY‬‬
‫‪2‬‬
‫‪x‬‬
‫‪my ‬‬
‫‪x‬‬
‫‪14.24‬‬
‫‪4.83‬‬
‫‪ 1.252  0.2175‬‬
‫‪y ‬‬
‫‪ 0.71252  0.096‬‬
‫‪8‬‬
‫‪8‬‬
‫) ‪COV ( XY‬‬
‫‪0.4569 ‬‬
‫) ‪0.09937575  COV ( XY‬‬
‫‪0.2175‬‬
‫‪0.09937575‬‬
‫‪r‬‬
‫‪ 0.6877‬‬
‫‪0.2175  0.096‬‬
‫‪x ‬‬
‫‪.11‬‬
‫כאשר הסטטיסטיקאי עובד ברמת מובהקות של ‪ 2.5%‬המשמעות היא רמת בטחון של ‪ , 97.5%‬כלומר‬
‫כאשר הוא עורך מבחן לבדיקת השערות ברמת בטחון של ‪ 97.5%‬הסיכוי לשגיאה הוא ‪ 2.5%‬כלומר הוא החליט‬
‫נכון בערך ב‪ 97.5%-‬מבדיקות ההשערות שביצע‪.‬‬
‫‪314‬‬
‫פתרון מבחן ‪5‬‬
‫‪ .1‬א‪ .‬מבחן דו כווני‪ ,‬שני מדגמים בלתי תלויים‪ ,‬סטית תקן באוכלוסייה אינה ידועה‬
‫‪1   2  0‬‬
‫‪H0 :‬‬
‫לא קיים פער במחזורי העסקאות בין שני המדדים‬
‫‪1   2  0‬‬
‫‪H1 :‬‬
‫קיים פער במחזורי העסקאות בין שני המדדים‪.‬‬
‫חישוב גבול‬
‫קריטי‬
‫‪‬‬
‫‪S 2  1.16‬‬
‫‪ t16, 0.975  2.12‬‬
‫‪0.05‬‬
‫‪2‬‬
‫‪9  9  2 ,1‬‬
‫‪t‬‬
‫‪‬‬
‫‪X 2  2.71‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1 n 2  2 ,1‬‬
‫‪S 1  1.23‬‬
‫‪X 1  2.73‬‬
‫‪X 1  X 2  2.73  2.71  0.02‬‬
‫‪t‬‬
‫‪‬‬
‫‪‬‬
‫)‪S 1 (n1  1)  S 2 (n 2  1) 1.23 2 (9  1)  1.16(9  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 1.42‬‬
‫‪n1  n 2  2‬‬
‫‪16‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪1.42 1.42‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ 0.5617‬‬
‫‪n1 n 2‬‬
‫‪9‬‬
‫‪9‬‬
‫‪C  0  2.12  0.5617  1.19‬‬
‫‪H0‬‬
‫‪0.02‬‬
‫‪1.19‬‬
‫‪ 1.19‬‬
‫‪0‬‬
‫נקבל את השערת האפס ונדחה את השערת המחקר – ההפרש בין הממוצעים ‪ ,0.02‬נמצא בתחום קבלת השערת‬
‫האפס ‪ -‬אין פער במחזורי העסקאות בין שני המדדים‪ ,‬ברמת מובהקות של ‪.0.05‬‬
‫מאחר וקיבלנו את השערת האפס ‪ ,‬השגיאה האפשרית‪ -‬שגיאה מסוג שני ‪ -  -‬קיבלנו את השערת האפס בזמן‬
‫שהשערת המחקר נכונה ‪ .‬חישוב השגיאה‪:‬‬
‫‪1.19  0.02‬‬
‫‪ 2.082‬‬
‫‪0.5617‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪88 2 ,1‬‬
‫‪  t‬‬
‫‪‬‬
‫‪ 0.5    0.1 ‬‬
‫‪ 5%    10%‬‬
‫‪‬‬
‫‪C  X1  X 2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪ 0.975‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1 n 2  2 ,1‬‬
‫‪t‬‬
‫‪0.95  1 ‬‬
‫‪315‬‬
‫ד‪ .‬מבחן חד כווני כלפי מעלה‪ ,‬סטית התקן באוכלוסיה ידועה‪ ,‬מבחן ‪Z‬‬
‫‪ H 0 :   2.1‬אין הבדל במחזורי המסחר במדד המעוף בין השנה לשנה שעברה‬
‫‪ H1 : 1  2.1‬מחזורי המסחר במדד המעוף השנה‪ ,‬גבוהים ממחזורי המסחר בשנה שעברה‬
‫חישוב גבול‬
‫‪ 0  2.1‬‬
‫‪Z 1  Z 10.05  Z 0.95  1.65‬‬
‫‪  0.3‬‬
‫‪  2.73‬‬
‫קריטי‬
‫‪ 2.265‬‬
‫‪0.3‬‬
‫‪9‬‬
‫‪C  2.1  1.65 ‬‬
‫‪H0‬‬
‫‪2.265‬‬
‫‪2.73‬‬
‫‪0‬‬
‫נדחה את השערת האפס ונקבל את השערת המחקר – מחזורי המסחר השנה במדד המעוף‪ ,‬גבוהים‬
‫ממחזורי המסחר בשנה שעברה‪ ,‬ברמת מובהקות של ‪.0.05‬‬
‫מאחר ודחינו את השערת האפס ‪ ,‬השגיאה האפשרית‪ -‬שגיאה מסוג ראשון ‪ -  -‬דחינו את השערת‬
‫האפס בזמן שהשערת האפס נכונה ‪ .‬חישוב השגיאה‪:‬‬
‫‪  0‬‬
‫‪2.73  2.1‬‬
‫‪‬‬
‫‪ Z 1 ‬‬
‫‪ 6.3‬‬
‫‪‬‬
‫‪0.3‬‬
‫‪Z 1 ‬‬
‫‪n‬‬
‫‪9‬‬
‫‪ 6.3 ‬‬
‫‪1    0.9990 ‬‬
‫‪   0.001‬‬
‫‪Z 1‬‬
‫‪  0.1%‬‬
‫ה‪ .‬להשוואה בין ‪ 4‬מדגמים נשתמש בניתוח שונות חד כווני – ‪ANOVA‬‬
‫‪ - H 0 : 1   2   3   4‬אין הבדל בין מדדי הבורסה במחזורי המסחר‬
‫‪ - H1 : 1  2  3  4‬יש הבדל בין מדדי הבורסה במחזורי המסחר‪.‬‬
‫רמת מובהקות ‪  0.05 :‬‬
‫‪316‬‬
‫ב‬
‫א‬
‫‪X 1  2.73‬‬
‫^‬
‫ד‬
‫ג‬
‫‪X 2  2.71‬‬
‫‪X 3  1.81‬‬
‫‪X 4  1.81‬‬
‫^‬
‫^‬
‫^‬
‫‪S 1  1.51‬‬
‫‪S 2  1.345‬‬
‫‪S 3  0.27‬‬
‫‪S 4  0.27‬‬
‫‪n1  9‬‬
‫‪n2  9‬‬
‫‪n3  9‬‬
‫‪n4  9‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2.73  9  2.71  9  1.81  9  1.81  9‬‬
‫‪ 2.265‬‬
‫‪9999‬‬
‫‪2‬‬
‫‪‬‬
‫‪SSB   ni  ( xi  x) 2 7.47‬‬
‫‪SSW   (ni  1) S i 27.07‬‬
‫‪2‬‬
‫‪i‬‬
‫‪i‬‬
‫מקור‬
‫השונות‬
‫בין‬
‫‪SSB=7.47‬‬
‫קבוצות‬
‫בתוך‬
‫‪SSW=27.07‬‬
‫‪n-k=36-4=32‬‬
‫קבוצות‬
‫סה"כ‬
‫‪SST=34.54‬‬
‫‪n-1=35‬‬
‫‪k-1=4-1=3‬‬
‫‪SSB‬‬
‫‪=2.49‬‬
‫‪MSB ‬‬
‫‪k 1‬‬
‫‪SSW‬‬
‫‪=0.845‬‬
‫‪MSW ‬‬
‫‪nk‬‬
‫‪MSB‬‬
‫‪=2.94‬‬
‫‪MSW‬‬
‫‪F‬‬
‫‪FC  FK 1,n K ,  F3,32,0.05  2.92‬‬
‫)‪ - F (2.94)  FC (2.92‬ברמת מובהקות של ‪ , 0.05‬דוחים את השערת האפס‬
‫יש הבדל בין מחזורי המסחר במדדי הבורסה השונים‪..‬‬
‫‪‬‬
‫‪2.92 2.94‬‬
‫‪317‬‬
‫‪.2‬‬
‫רמת המוטיבציה‬
‫גבוהה‬
‫נמוכה‬
‫סה"כ‬
‫‪42‬‬
‫‪35‬‬
‫‪77‬‬
‫‪35‬‬
‫‪28‬‬
‫‪63‬‬
‫סה"כ‬
‫‪128‬‬
‫‪107‬‬
‫‪235‬‬
‫‪51‬‬
‫‪44‬‬
‫‪95‬‬
‫רמת המוטיבציה‬
‫גבוהה‬
‫נמוכה‬
‫סה"כ‬
‫‪41.94‬‬
‫‪35.06‬‬
‫‪77‬‬
‫‪34.31‬‬
‫‪28.69‬‬
‫‪63‬‬
‫‪51.75‬‬
‫‪43.25‬‬
‫‪95‬‬
‫סה"כ‬
‫‪128‬‬
‫‪107‬‬
‫‪235‬‬
‫א‪.‬‬
‫‪: H0‬‬
‫‪: H1‬‬
‫אין תלות בין גיל לבין מוטיבציה להיות בתנועה‪.‬‬
‫יש תלות בין גיל לבין מוטיבציה להיות בתנועה‪.‬‬
‫ב‪.‬‬
‫ד‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪ C 2 3121,0.99   C 2 2,0.99  9.21‬‬
‫‪(35  34.31) 2 (28  28.69) 2 (42  41.94) 2 (35  35.06) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪34.31‬‬
‫‪28.69‬‬
‫‪41.94‬‬
‫‪35.06‬‬
‫‪eij‬‬
‫‪ ‬‬
‫‪9.21‬‬
‫ערך‬
‫‪2‬‬
‫‪ij‬‬
‫‪(51  51.75) 2 (44  43.25) 2‬‬
‫‪‬‬
‫‪ 0.054‬‬
‫‪51.75‬‬
‫‪.43.25‬‬
‫ד‪.‬‬
‫‪ eij ‬‬
‫‪o‬‬
‫‪2‬‬
‫‪0.054‬‬
‫החלטה‬
‫‪2‬‬
‫‪‬‬
‫הנבדק ‪ , 0.054‬קטן מהגבול הקריטי ‪ , 9.21‬לכן נקבל את השערת האפס אין תלות בין גיל לבין‬
‫מוטיבציה להיות בתנועת נוער‪.‬‬
‫ה‪.‬‬
‫‪318‬‬
‫פתרון חלק ב‬
‫‪.1‬‬
‫‪‬‬
‫‪‬‬
‫)‪P(1  P‬‬
‫‪0.51  0.49‬‬
‫‪‬‬
‫‪ 0.02235‬‬
‫‪n‬‬
‫‪500‬‬
‫‪‬‬
‫‪‬‬
‫‪255‬‬
‫‪P‬‬
‫‪ 0.51.‬‬
‫‪500‬‬
‫‪n  500‬‬
‫‪P  0.45‬‬
‫‪0.51  0.45‬‬
‫‪ 2.68 ‬‬
‫‪1    0.9963 ‬‬
‫‪   0.0037‬‬
‫‪0.02235‬‬
‫‪Z 1 ‬‬
‫סיכויי השגיאה הם ‪. 0.37%‬‬
‫התשובה הנכונה ד‬
‫‪ .2‬החוקר ניסח השערה דו כיוונית לכן עבד עם‬
‫‪ 0.9963 ‬‬
‫‪  0.0074‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫סיכויי השגיאה ‪0.74%‬‬
‫‪ 0.975 ‬‬
‫‪ 0.05   '  0.1 .3‬‬
‫'‪‬‬
‫‪2‬‬
‫‪ 1.88 ‬‬
‫‪ 0.95  1 ‬‬
‫'‪‬‬
‫‪2‬‬
‫‪t‬‬
‫‪14,1‬‬
‫תשובה נכונה א‬
‫‪.4‬‬
‫^‬
‫‪S  2.2891‬‬
‫‪  38.4.‬‬
‫‪n  10‬‬
‫‪ 0  40‬‬
‫‪40  38.4‬‬
‫‪ 2.21 ‬‬
‫‪ 0.95  1   '  0.975 ‬‬
‫‪ 0.025    0.05‬‬
‫‪ 2.2891 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 10 ‬‬
‫תשובה נכונה ב‬
‫‪.5‬‬
‫ד‬
‫א‬
‫ב‬
‫ג‬
‫מאמן‬
‫‪76‬‬
‫‪85‬‬
‫‪70.5 76.5‬‬
‫‪74‬‬
‫מאמנת‬
‫‪72.5‬‬
‫‪85‬‬
‫‪75‬‬
‫‪72.5‬‬
‫‪72‬‬
‫‪D‬‬
‫‪-3.5‬‬
‫‪0‬‬
‫‪-1.5‬‬
‫‪2‬‬
‫‪-2‬‬
‫^‬
‫‪S d  1.8708‬‬
‫ה‬
‫‪n5‬‬
‫‪1‬‬
‫‪ 1.195 ‬‬
‫‪ 0.75  1   '  0.9 ‬‬
‫‪ 0.1   '  0.25‬‬
‫‪ 1.8708 ‬‬
‫‪‬‬
‫‪‬‬
‫‪5 ‬‬
‫‪‬‬
‫‪t 9,1 ' ‬‬
‫‪d  1‬‬
‫‪t 4,1 ' ‬‬
‫‪319‬‬
‫בדיקת רמת המובהקות המינימאלית מראה כי היא גבוהה מ‪( 0.05-‬רמת המובהקות במחקר) ולכן זוהי שגיאה מסוג‬
‫שני ‪ , ‬לכן ‪0.1    0.25‬‬
‫התשובה הנכונה ב‬
‫‪ .6‬טבלה של ‪ 2/2‬מהווה ‪ 1‬דרגת חופש ולכן הגבול הקריטי הוא ‪ ,3.84‬הערך הנבדק הוא ‪ 9‬ולכן דוחים את‬
‫השערת האפס‪.‬‬
‫בטבלת ‪ ,5/2‬יש ‪ 4‬דרגות חופש לכן הגבול הקריטי הוא ‪ , 9.49‬הערך הנבדק הוא ‪ 9‬כלומר מקבלים את השערת‬
‫האפס‪.‬‬
‫‪ .7‬רמת מובהקות של ‪ 2.5%‬במבחן חד צדדי‪ ,‬מייצרת את אותו גבול כמו רמת מובהקות של ‪ 5%‬במבחן דו צדדי‪,‬‬
‫לכן נקבל את אותה מסקנה‪.‬‬
‫אם דחינו את השערת האפס אין זה אומר כי זו רמת המובהקות המינימאלית‪ – .‬רמת המובהקות המינימאלית‬
‫נקבעת ע"פ התוצאות בפועל‪ ,‬ואילו רמת המובהקות ע"י הגדרות המחקר‪ .‬לכן רק הטענה הראשונה נכונה‬
‫תשובה נכונה ג‬
‫‪.8‬‬
‫‪ Z 0.975  1.96‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪n  206.59‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪  1100‬‬
‫‪L  300‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1.96  1100 ‬‬
‫‪‬‬
‫‪n‬‬
‫‪  300  ‬‬
‫‪ ‬‬
‫‪ ‬‬
‫‪  2  ‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ Z  ‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪n‬‬
‫‪ L‬‬
‫‪  ‬‬
‫‪ 2‬‬
‫תשובה נכונה ג‬
‫‪.9‬‬
‫ככל שהמדגם גדול יותר‪ ,‬אורך הרווח יהיה קטן יותר‪ .‬ככל שרמת הביטחון גדולה יותר‪ ,‬רמת המובהקות‬
‫קטנה יותר ולכן הרווח ארוך יותר‪ .‬לכן רק טענה ‪ 2‬נכונה‪.‬‬
‫תשובה נכונה ד‪.‬‬
‫‪.10‬‬
‫מבחן דו כיווני‪ ,‬שני מדגמים בלתי תלויים‪ ,‬סטית התקן באוכלוסיה לא ידועה‪.‬‬
‫נחשב את רמת המובהקות המינימאלית‪:‬‬
‫‪320‬‬
‫‪n 2  15‬‬
‫‪‬‬
‫‪S 2  10‬‬
‫‪X 2  90‬‬
‫‪‬‬
‫‪n1  17‬‬
‫‪‬‬
‫‪‬‬
‫‪S 1  16‬‬
‫)‪S 1 (n1  1)  S 2 (n 2  1) 16 2 (17  1)  10(15  1‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 183.2‬‬
‫‪n1  n 2  2‬‬
‫‪30‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪X 1  98‬‬
‫‪X1  X 2 8‬‬
‫‪2‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪183.2 183.2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ 4.794‬‬
‫‪n1 n 2‬‬
‫‪17‬‬
‫‪15‬‬
‫‪8‬‬
‫'‪‬‬
‫‪ 1.668 ‬‬
‫‪1   0.95 ‬‬
‫‪  '  0.1‬‬
‫‪4.794‬‬
‫‪2‬‬
‫‪' ‬‬
‫‪ ' ‬‬
‫‪‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1715 2 ,1‬‬
‫‪t‬‬
‫תשובה נכונה ד‬
‫‪.11‬‬
‫השערת האפס נדחית במבחן דו צדדי ברמת מובהקות של ‪ ,2%‬אזי במבחן חד צדדי בטוח נדחה ברמת‬
‫מובהקות של ‪ .1%‬בכל רמת מובהקות גדולה מ‪ 1%‬בטוח נדחה את השערת האפס ‪.‬‬
‫לכן יש יותר מתשובה אחת נכונה – א‪ ,‬ב‪ ,‬ג נכונות‪.‬‬
‫?‪‬‬
‫‪.12‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪n  26‬‬
‫‪L5‬‬
‫‪L‬‬
‫‪4‬‬
‫‪5‬‬
‫‪‬‬
‫‪ Z  ‬‬
‫‪‬‬
‫‪1‬‬
‫‪2‬‬
‫‪26 2‬‬
‫‪2‬‬
‫‪ 0.975 ‬‬
‫‪   0.05‬‬
‫‪‬‬
‫‪2‬‬
‫‪ 4‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪ 1.96 ‬‬
‫‪1 ‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪1‬‬
‫‪Z‬‬
‫‪Z‬‬
‫חישבנו את רמת המובהקות – ‪ 0.05‬כלומר רמת הביטחון היא ‪ ,95%‬לכן תשובות א‪,‬ב‪,‬ג נכונות‬
‫התשובה הנכונה היא ה – יש יותר מתשובה אחת נכונה‬
‫‪321‬‬
‫‪.1‬א‬
‫מבחן דו כווני‪ ,‬סטיית תקן לא ידועה‪ ,‬מבחן ‪ t‬לשני מדגמים בלתי תלויים‪.‬‬
‫‪‬‬
‫‪S 1  20.26‬‬
‫‪X 1  74.57‬‬
‫‪. n1  7‬ג‬
‫‪S 2  12.8‬‬
‫‪X 2  86.71‬‬
‫‪ . n2  7‬ד‬
‫‪‬‬
‫‪X 2  X 1  12.14‬‬
‫‪1    0‬‬
‫‪ H 0 :‬אין הבדל בין המלצרים‪.‬‬
‫‪1   2  0‬‬
‫‪ H1 :‬קיים הבדל בין המלצרים‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫)‪S 1 (n1  1)  S 2 (n2  1‬‬
‫‪ 287.26‬‬
‫‪n1  n2  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪S ‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪‬‬
‫‪ 0  2.179  9.0594  19.74‬‬
‫‪n1 n2‬‬
‫‪C  1   2  t n1 n 22,1‬‬
‫‪H0‬‬
‫‪ 19.74‬‬
‫‪0‬‬
‫‪12.14 19.74‬‬
‫הפרש הממוצעים נמצא בתחום קבלת השערת האפס – מקבלים את השערת האפס אין הבדל בין שכר המלצרים ג‪,‬‬
‫ו‪-‬ד‪.‬‬
‫ב‪ .‬מבחן על תוחלת של אוכלוסייה כאשר סטית התקן לא ידועה‬
‫‪  93‬‬
‫‪t ( 7 1)(10.01)  t 6,0.99  3.143‬‬
‫‪‬‬
‫‪S  12.8‬‬
‫‪ 0  86.71‬‬
‫‪ .1‬השערות ‪:‬‬
‫‪.2‬‬
‫‪  86.71‬‬
‫‪H0 :‬‬
‫שכר האח אינו שונה משכרו של מלצר ד‪.‬‬
‫‪  86.71‬‬
‫‪H1 :‬‬
‫שכר האח גבוה משכרו של מלצר ד‪.‬‬
‫‪  0.01‬‬
‫‪322‬‬
‫‪.3‬‬
‫‪‬‬
‫‪S‬‬
‫‪C  0  t( n1),(1 ) ‬‬
‫‪n‬‬
‫‪ 100.96‬‬
‫‪12.8‬‬
‫‪7‬‬
‫‪H0‬‬
‫‪C  86.71  3.143 ‬‬
‫‪.4‬‬
‫‪93 100.96‬‬
‫‪86.71‬‬
‫החלטה‬
‫השכר הממוצע של האח ‪ ₪ 93‬נמצא בתחום קבלת השערת האפס ‪ ,‬נקבל את השערת האפס‪.‬‬
‫שכר האח אינו גבוה משכרו של מלצר ד‪.‬‬
‫‪.5‬‬
‫קבלנו את ‪ H 0‬הטעות האפשרית – טעות מסוג שני ‪ - ‬קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה‪.‬‬
‫‪100.96  93‬‬
‫‪ 1.68‬‬
‫‪4.837‬‬
‫‪, 0. 05    0.1‬‬
‫‪0.9  1    0.95‬‬
‫‪‬‬
‫‪‬‬
‫)‬
‫הסיכוי לשגיאה במסקנה הוא בין ‪.10% - 5%‬‬
‫ג‪.‬‬
‫‪ C‬‬
‫‪S‬‬
‫‪n‬‬
‫‪t 6,(1  ) ‬‬
‫(‬
‫להשוואה בין ‪ 4‬מדגמים נשתמש בניתוח שונות חד כווני – ‪ANOVA‬‬
‫‪ - H 0 : 1   2   3   4‬אין הבדל בין השכר היומי הממוצע של ארבעת המלצרים‬
‫‪ - H1 : 1  2  3  4‬יש הבדל בין השכר היומי הממוצע של ארבעת המלצרים‪.‬‬
‫רמת מובהקות ‪  0.05 :‬‬
‫ב‬
‫א‬
‫ד‬
‫ג‬
‫‪n1  7‬‬
‫‪n1  7‬‬
‫‪n1  7‬‬
‫‪n1  7‬‬
‫‪x 1  77.57‬‬
‫‪x 1  77.43‬‬
‫‪x 1  74.57‬‬
‫‪x 1  86.71‬‬
‫‪‬‬
‫‪S 1  711.62‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  484.95‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  410.62‬‬
‫‪2‬‬
‫‪77.57  7  77.43  7  74.57  7  86.71  7‬‬
‫‪ 79.07‬‬
‫‪7777‬‬
‫‪‬‬
‫‪S 1  163.9‬‬
‫‪2‬‬
‫‪SSB   ni  ( xi  x) 2  7  77.57  79.07   7  77.43  79.07  ‬‬
‫‪2‬‬
‫‪2‬‬
‫‪i‬‬
‫‪7  74.57  79.07   7  86.71  79.07   584.91‬‬
‫‪2‬‬
‫‪2‬‬
‫‪323‬‬
‫‪‬‬
‫‪SSW   (ni  1) S i 6  711.62  6  484.95  6  410.62  6  163.9  10626.54‬‬
‫‪2‬‬
‫‪i‬‬
‫מקור‬
‫השונות‬
‫בין‬
‫‪k-1=4-1=3‬‬
‫‪SSB=584.91‬‬
‫‪SSB‬‬
‫‪=194.97‬‬
‫‪k 1‬‬
‫קבוצות‬
‫בתוך‬
‫‪SSW=10626.54‬‬
‫‪n-k=28-4=24‬‬
‫‪SSW‬‬
‫‪=442.77‬‬
‫‪nk‬‬
‫קבוצות‬
‫סה"כ‬
‫‪SST=11211.45‬‬
‫‪MSB ‬‬
‫‪MSW ‬‬
‫‪MSB‬‬
‫‪=0.44‬‬
‫‪MSW‬‬
‫‪F‬‬
‫‪n-1=27‬‬
‫‪FC  FK 1,n K ,  F3, 24,0.05  3.0088‬‬
‫)‪ - FC (3.0088)  F (0.44‬ברמת מובהקות של ‪ , 0.05‬מקבלים את השערת האפס‬
‫אין הבדל בין הכנסות המלצרים‪.‬‬
‫‪‬‬
‫)‪0.44 FC (3.0088‬‬
‫‪.2‬‬
‫מספר תאונות ‪ 23-30 17-22‬מעל ‪30‬‬
‫‪85‬‬
‫‪40‬‬
‫‪30‬‬
‫‪15‬‬
‫עד ‪1‬‬
‫‪85‬‬
‫‪35‬‬
‫‪25‬‬
‫‪25‬‬
‫מעל ‪1‬‬
‫‪170‬‬
‫‪75‬‬
‫‪55‬‬
‫‪40‬‬
‫סה"כ‬
‫מספר תאונות ‪ 23-30 17-22‬מעל ‪30‬‬
‫‪37.5 27.5‬‬
‫‪20‬‬
‫עד ‪1‬‬
‫‪37.5 27.5‬‬
‫‪20‬‬
‫מעל ‪1‬‬
‫‪75‬‬
‫‪55‬‬
‫‪40‬‬
‫סה"כ‬
‫‪85‬‬
‫‪85‬‬
‫‪170‬‬
‫‪324‬‬
‫א‪.‬‬
‫‪: H0‬‬
‫אין תלות בין גיל הנהג לבין מספר תאונות הדרכים‪.‬‬
‫‪: H1‬‬
‫יש תלות בין גיל הנהג למספר תאונות הדרכים‪.‬‬
‫ב‪.‬‬
‫ה‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪ C 2 3121,0.99   C 2 2,0.99  9.21‬‬
‫‪(15  20) 2 (30  27.5) 2 (40  37.5) 2 (25  20) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪20‬‬
‫‪27.5‬‬
‫‪37.5‬‬
‫‪20‬‬
‫‪eij‬‬
‫‪ ‬‬
‫‪9.21‬‬
‫ערך‬
‫‪2‬‬
‫‪(25  27.5) 2 (35  37.5) 2‬‬
‫‪‬‬
‫‪ 3.287‬‬
‫‪27.5‬‬
‫‪.37.5‬‬
‫ד‪.‬‬
‫‪ eij ‬‬
‫‪ij‬‬
‫‪o‬‬
‫‪2‬‬
‫‪3.287‬‬
‫החלטה‬
‫‪2‬‬
‫‪‬‬
‫הנבדק ‪ , 3.287‬קטן מהגבול הקריטי ‪ , 9.21‬לכן נקבל את השערת האפס אין תלות בין גיל הנהג לבין‬
‫מספר תאונות הדרכים‪.‬‬
‫ה‪.‬‬
‫פרק שני‬
‫‪ .1‬מחצית הרווח היא ‪,5.47‬‬
‫‪5.47‬‬
‫‪5.47‬‬
‫‪‬‬
‫‪ 1.96‬‬
‫‪    12.48 ‬‬
‫‪‬‬
‫‪ ‬‬
‫‪‬‬
‫‪ n   20 ‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪ 5.47  Z‬‬
‫‪ 0.975    0.05‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ 1.96  1 ‬‬
‫‪‬‬
‫‪n‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪Z‬‬
‫רמת הסמך = רמת ביטחון = ‪1    1  0.05  0.95‬‬
‫תשובה א‪ ,‬נכונה‪.‬‬
‫‪325‬‬
‫‪ .2‬הכלל אומר‪:‬‬
‫‪' ‬‬
‫‪' ‬‬
‫מאחר ורמת המובהקות המינימלית היא ‪ ,5%‬המשמעות היא שבכל רמת מובהקות גבוהה מ‪ 5%-‬נדחה את השערת‬
‫האפס‪ ,‬ובכל רמת מובהקות הקטנה או שווה ל‪ 5%-‬נקבל את השערת האפס‪.‬‬
‫מנתונים אלו עולה המסקנה כי תשובה ג נכונה‪.‬‬
‫‪ .3‬השערה חד כיוונית כלפי מעלה‪ ,‬מבחן ‪ ,t‬מאחר והשונות באוכלוסייה אינה ידועה‪ .‬נתון לנו כי‬
‫הערך המתקבל בטבלת ‪ ,t‬הוא ‪ .2.45‬על סמך ערך זה ו‪ 29-‬דרגות חופש נחפש את ההסתברות‬
‫בטבלה‪ .‬ערך זה נמצא בטבלה (‪ )2.46‬תחת עמודה ‪.0.99‬‬
‫כלומר רמת המובהקות המינימאלית היא ‪.1%‬‬
‫‪' ‬‬
‫‪' ‬‬
‫כלומר בכל רמת מובהקות הגבוהה מ‪ ,1%-‬דוחים את השערת האפס‪.‬‬
‫התשובה הנכונה ג‪.‬‬
‫‪ .4‬מבחן השערות דו כיווני (אין הבדל בתוחלת זמן השיחה בטלפון סלולארי בין שתי הערים)‪ ,‬שני מדגמים‬
‫בלתי תלויים ‪ ,‬סטיות תקן באוכלוסיות ידועות – מבחן ‪.Z‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬אין הבדל בתוחלת זמן השיחה בטלפון סלולארי בין שתי הערים‪.‬‬
‫‪1   2  0‬‬
‫‪ H1 :‬יש בתוחלת זמן השיחה בטלפון סלולארי בין שתי הערים‪.‬‬
‫ב‪ .‬רמת מובהקות ‪  0.05‬‬
‫ג‪.‬‬
‫מאחר והתשובות מתמקדות בשתי רמות מובהקות – ‪ ,0.05‬ו‪ ,0.1-‬נבדוק גבולות קריטיים עבור שתי רמות אלו‪.‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪Z 0.975  1.96‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪Z 0.95  1.65‬‬
‫‪‬‬
‫‪C  1   2  Z ‬‬
‫‪‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪4.84 3.61‬‬
‫‪‬‬
‫‪ 0.8859‬‬
‫‪10‬‬
‫‪12‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪1   2  0‬‬
‫‪C0.05  0  1.96  0.8859  1.736‬‬
‫‪C0.1  0  1.65  0.8859  1.461‬‬
‫הפרש הממוצעים הוא ‪ ,3.66‬ואותו אנו בודקים מול הגבולות הקריטיים‪.‬‬
‫‪326‬‬
‫חישבנו את הגבולות הקריטיים עבור רמות מובהקות של ‪ 0.1‬ו‪ 0.05-‬בשני הגבולות הפרש הממוצעים ‪ 3.66‬עובר‬
‫את הגבול הקריטי‪ ,‬ולכן בשתי רמות המובהקות‪ ,‬נדחה את השערת האפס‪.‬‬
‫תשובה ד נכונה‪.‬‬
‫יוסי‬
‫‪.5‬‬
‫שאול דני‬
‫משה‬
‫דוד‬
‫לפני‬
‫‪76‬‬
‫‪85‬‬
‫‪70.5 76.5‬‬
‫‪74‬‬
‫אחרי‬
‫‪72.5‬‬
‫‪85‬‬
‫‪75‬‬
‫‪72.5‬‬
‫‪72‬‬
‫‪D‬‬
‫‪3.5‬‬
‫‪0‬‬
‫‪1.5‬‬
‫‪-2‬‬
‫‪2‬‬
‫^‬
‫‪n5‬‬
‫‪S d  2.0916‬‬
‫‪d 1‬‬
‫מאחר ואין אנו יודעים אם מדובר על שגיאה מסוג ראשון או שני‪ ,‬נבדוק בשלב ראשון‪ ,‬אם מקבלים או דוחים את‬
‫השערת האפס‪.‬‬
‫‪ 1.994‬‬
‫‪2.0916‬‬
‫‪5‬‬
‫‪ 2.132 ‬‬
‫‪S‬‬
‫‪n‬‬
‫‪C  0  t n1,1 ‬‬
‫ע"פ הגבול הקריטי אשר קיבלנו‪ ,‬אנחנו מקבלים את השערת האפס‪ ,‬לכן השגיאה האפשרית במחקר‪ ,‬היא שגיאה‬
‫מסוג שני‬
‫‪1.994  1‬‬
‫‪ 1.062 ‬‬
‫‪ 0.75  1    0.9 ‬‬
‫‪ 0.1    0.25‬‬
‫‪ 2.0916 ‬‬
‫‪‬‬
‫‪‬‬
‫‪5 ‬‬
‫‪‬‬
‫‪t 4,1  ‬‬
‫שגיאה מסוג שני ‪ , ‬לכן ‪0.1    0.25‬‬
‫התשובה הנכונה ב‬
‫‪.6‬‬
‫כאשר מגדילים את המדגם פי ‪ ,K‬מקצרים את הרווח פי שורש של ‪ ,K‬לכן אם מדגם אחד גדול מהשני פי‬
‫‪ ,5‬הרווח יתקצר פי שורש של חמש – ‪.2.236‬‬
‫לכן התשובה הנכונה היא ג‪.‬‬
‫‪.7‬‬
‫החישוב אשר התקבל לאחר בדיקת המדגם‪ ,‬ה‪ t-‬הסטטיסטי‪ ,‬הוא למעשה הערך המתקבל בטבלה‪ ,‬לכן‬
‫נחפש בטבלה ב‪ 4-‬דרגות חופש‪ ,‬את הערך הנ"ל (בערכו המוחלט)‪.‬‬
‫הערך מתאים ל‪ ,0.975-‬כלומר רמת מובהקות של ‪ ,0.025‬מאחר והמבחן הוא דו כיווני‪  0.05 ,‬‬
‫‪' ‬‬
‫‪' ‬‬
‫תשובה נכונה א‪.‬‬
‫‪327‬‬
‫‪.8‬‬
‫טענה ראשונה‪ :‬כאשר בודקים טענה חד צדדית‪ ,‬ברמת מובהקות מסוימת וטענה דו צדדית ברמת מובהקות‬
‫כפולה‪ ,‬מקבלים את אותן גבולות קריטיים ולכן בהכרח מגיעים לאותן מסקנות‪ – .‬הטענה נכונה‪.‬‬
‫טענה שנייה‪ :‬קבלת השערת האפס עבור רמת מובהקות מסוימת‪ ,‬אין בא כדי לומר מאומה על רמת המובהקות‬
‫המינימלית‪ ,‬ולכן קבלה ברמת מובהקות של ‪ ,5%‬אינה מציגה כל נתון על רמת המובהקות המינימאלית‪ – .‬הטענה‬
‫אינה נכונה‪.‬‬
‫‪.9‬‬
‫תשובה נכונה ג‪.‬‬
‫טענה ראשונה‪ :‬ככל שלוקחים מדגם גדול יותר הרווח קצר יותר – כאשר מגדילים את הדגם פי ‪K‬מקצרים‬
‫את הרווח פי שורש של ‪ – .K‬הטענה נכונה‪.‬‬
‫טענה שנייה‪ :‬ככל שרמת הביטחון גדולה יותר (רמת המובהקות קטנה יותר) הרווח גדול יותר‪ .‬הטענה נכונה‪.‬‬
‫‪.10‬‬
‫‪  100‬‬
‫‪C  0‬‬
‫‪‬‬
‫‪  ‬‬
‫‪  20‬‬
‫‪n8‬‬
‫‪‬‬
‫‪‬‬
‫‪ Z 1‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪C  110‬‬
‫‪C   0  Z 1 ‬‬
‫‪110  100‬‬
‫‪ 1.41 ‬‬
‫‪1    0.9207 ‬‬
‫‪   0.0793‬‬
‫‪ 20 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 8‬‬
‫‪.11‬‬
‫‪ 1.96‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪  16.97‬‬
‫‪Z‬‬
‫‪ 11.76‬‬
‫‪16.97‬‬
‫‪8‬‬
‫‪Z 1 ‬‬
‫‪X  74.62‬‬
‫‪ 1.96 ‬‬
‫‪‬‬
‫‪n‬‬
‫‪‬‬
‫‪‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪Z‬‬
‫‪74.62  11.76‬‬
‫תשובה נכונה ג‪.‬‬
‫‪2‬‬
‫‪.12‬‬
‫‪L  0.5‬‬
‫‪ Z   ‬‬
‫) ‪ (1‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪n‬‬
‫‪L‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪  3.4‬‬
‫‪Z   1.96‬‬
‫) ‪(1‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪ 1.96  3.4 ‬‬
‫‪ ‬‬
‫‪n‬‬
‫‪ n  710.54‬‬
‫‪ 0 .5 ‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪‬‬
‫‪‬‬
‫‪328‬‬
‫לפתרון השאלה יש צורך בהשוואה בין ארבעה מדגמים‪,‬‬
‫‪.1‬א‪.‬‬
‫לכן נשתמש בניתוח שונות חד כווני – ‪ANOVA‬‬
‫‪ - H 0 : 1   2   3   4‬אין הבדל בהכנסות‪ ,‬בין הסניפים השונים של הרשת‪.‬‬
‫‪ - H1 : 1  2  3  4‬יש הבדל בהכנסות בין הסניפים השונים של הרשת‪.‬‬
‫רמת מובהקות ‪  0.05 :‬‬
‫ב‬
‫א‬
‫ד‬
‫ג‬
‫‪n1  5‬‬
‫‪n1  7‬‬
‫‪n1  7‬‬
‫‪n1  5‬‬
‫‪x 1  16.40‬‬
‫‪x 1  16.29‬‬
‫‪x 1  14.57‬‬
‫‪x 1  14.4‬‬
‫‪‬‬
‫‪S 1  4. 3‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  13.24‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  2.62‬‬
‫‪2‬‬
‫‪16.4  5  16.29  7  14.57  7  14.4  5‬‬
‫‪ 15.41‬‬
‫‪5775‬‬
‫‪‬‬
‫‪S 1  6 .3‬‬
‫‪2‬‬
‫‪SSB   ni  ( xi  x) 2  5  16.4  15.41  7  16.29  15.41 ‬‬
‫‪2‬‬
‫‪2‬‬
‫‪i‬‬
‫‪7  14.57  15.41  5  14.4  15.41  20.29048‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪SSW   (ni  1) S i 5  4.3  7 13.24  7  2.62  5  6.3  137.5429‬‬
‫‪2‬‬
‫‪i‬‬
‫מקור‬
‫השונות‬
‫בין‬
‫‪SSB=20.29048‬‬
‫‪k-1=4-1=3‬‬
‫קבוצות‬
‫בתוך‬
‫‪SSW=137.5426‬‬
‫‪n-k=24-4=20‬‬
‫קבוצות‬
‫סה"כ‬
‫‪SST=157.833‬‬
‫‪SSB‬‬
‫‪=6.763492‬‬
‫‪k 1‬‬
‫‪SSW‬‬
‫‪=6.87714‬‬
‫‪nk‬‬
‫‪MSB ‬‬
‫‪MSW ‬‬
‫‪MSB‬‬
‫‪=0.9834‬‬
‫‪MSW‬‬
‫‪F‬‬
‫‪n-1=23‬‬
‫‪329‬‬
‫‪FC  FK 1,n K ,  F3, 24,0.05  3.098‬‬
‫)‪ FC (3.098) -F (0.98347‬ברמת מובהקות של ‪ , 0.05‬מקבלים את השערת האפס‬
‫בהכנסות בין הסניפים השונים של הרשת‪..‬‬
‫‪‬‬
‫) ‪0.98 FC (3.098‬‬
‫‪.2‬‬
‫מבחן השערות דו כיווני (אין הבדל בתוחלת צריכת הפיצה)‪ ,‬שני מדגמים בלתי תלויים ‪ ,‬סטיות תקן‬
‫באוכלוסיות לא ידועות – מבחן ‪. t‬‬
‫ב‪ .‬השערות ‪:‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬אין הבדל בצריכת הפיצות בין תושבי רמת גן לתושבי נתניה‪.‬‬
‫‪1   2  0‬‬
‫‪ H1 :‬אין הבדל בצריכת הפיצות בין תושבי רמת גן לתושבי נתניה‪.‬‬
‫ג‪ .‬רמת מובהקות ‪  0.04‬‬
‫ג‪.‬‬
‫‪‬‬
‫‪‬‬
‫‪S 1 (n1  1)  S 2 (n2  1) 4.3  4  13.24  6‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 9.664‬‬
‫‪n1  n2  2‬‬
‫‪10‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪ 0  2.228  1.82  4.055‬‬
‫‪n1 n2‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1 n 2  2 ,1‬‬
‫‪C  1   2  t‬‬
‫‪H0‬‬
‫‪4.055‬‬
‫‪0.11‬‬
‫‪0‬‬
‫‪ 4.055‬‬
‫הפרש הממוצעים הוא ‪ ,0.11‬ואותו אנו בודקים מול הגבולות הקריטיים‪.‬‬
‫חישבנו את הגבולות הקריטיים ‪ – .  4.055‬מקבלים את השערת האפס – אין הבדל בצריכת הפיצה בין שתי הערים‪.‬‬
‫‪330‬‬
‫ד‪ .‬החלטת החוקר ‪ -‬מקבלים את השערת האפס – אין הבדל בצריכת הפיצה בין שתי הערים‪ ,‬ברמת מובהקות של ‪.5%‬‬
‫ה‪ .‬שגיאה אפשרית – השגיאה האפשרית היא שגיאה מסוג שני ‪ , ‬קיבלנו את השערת האפס בזמן שהשערת‬
‫חישוב סיכויי השגיאה –‬
‫‪4.055  0.11‬‬
‫‪ 2.16‬‬
‫‪1.82‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪7  5 2 ,1‬‬
‫‪  t‬‬
‫‪‬‬
‫‪C  X1  X 2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪‬‬
‫‪ 0.5    0.1 ‬‬
‫‪ 5%    10%‬‬
‫‪ 0.975‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1 n 2  2 ,1‬‬
‫‪t‬‬
‫‪0.95  1 ‬‬
‫ג‪ .‬מבחן השערות על תוחלת‪ ,‬סטית תקן באוכלוסייה ידועה‪ ,‬מבחן ‪ Z‬חד כווני כלפי‪:‬‬
‫‪.1‬‬
‫השערות ‪  15.1 :‬‬
‫‪ H 0 :‬סניף נתניה אינו סניף "חזק" ביחס לשאר סניפי הרשת‪.‬‬
‫‪  15.1‬‬
‫סניף נתניה הוא סניף "חזק" ביחס לשאר סניפי הרשת‪.‬‬
‫‪H1 :‬‬
‫‪  0.03‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪‬‬
‫‪n‬‬
‫‪ 1.118‬‬
‫‪Z 1   Z 10.03  Z 0.97  1.78‬‬
‫‪2.5‬‬
‫‪5‬‬
‫‪‬‬
‫‪C  0  Z 1  ‬‬
‫‪‬‬
‫‪ 0  15.1‬‬
‫‪n‬‬
‫‪C  15.1  1.78 1.118  17.09‬‬
‫השיטה הקלאסית – גבולות קריטיים‬
‫‪H0‬‬
‫‪17.09‬‬
‫‪.4‬‬
‫‪16.4‬‬
‫‪15.1‬‬
‫נקבל את ‪ H 0‬ונדחה את השערת המחקר – סניף נתניה אינו סניף "חזק" ביחס לשאר סניפי הרשת‪.‬‬
‫‪331‬‬
‫‪.5‬‬
‫קיבלנו את השערת האפס‪ ,‬השגיאה האפשרית – קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה‪.‬‬
‫שגיאה מסוג שני ‪. ‬‬
‫‪17.09  16.4‬‬
‫‪‬‬
‫‪ 0.617‬‬
‫‪ 2.5 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 5‬‬
‫‪  26.76%‬‬
‫‪  0.2676‬‬
‫‪Z1 B‬‬
‫‪ C‬‬
‫‪‬‬
‫‪  ‬‬
‫‪Z1 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪1    0.7324‬‬
‫‪Z1  0.62‬‬
‫ד‪ .‬יש לחשב רמת מובהקות מינימלית לדחיית השערת האפס‪:‬‬
‫‪17.09  15.1‬‬
‫‪ 1.78‬‬
‫‪ 2.5 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 5‬‬
‫‪ '  3.75%‬‬
‫‪ '  0.0375‬‬
‫‪Z1 ' ‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪Z1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪1   '  0.9625‬‬
‫‪Z1 '  1.78‬‬
‫‪.2‬‬
‫סה"כ מדעי הרוח מדעי הטבע מדעי החברה‬
‫‪56‬‬
‫‪47‬‬
‫‪50‬‬
‫‪153‬‬
‫‪8‬‬
‫‪14‬‬
‫‪5‬‬
‫‪27‬‬
‫‪64‬‬
‫‪61‬‬
‫‪55‬‬
‫‪180‬‬
‫סה"כ‬
‫סה"כ מדעי הרוח מדעי הטבע מדעי החברה‬
‫‪54.4‬‬
‫‪51.85‬‬
‫‪46.75‬‬
‫‪153‬‬
‫‪9.6‬‬
‫‪9.15‬‬
‫‪8.25‬‬
‫‪27‬‬
‫‪64‬‬
‫‪61‬‬
‫‪55‬‬
‫‪180‬‬
‫סה"כ‬
‫א‪.‬‬
‫ב‪.‬‬
‫‪: H0‬‬
‫אין תלות בין אישיות הסטודנט לבין תחום לימודיו‪.‬‬
‫‪: H1‬‬
‫יש תלות בין אישיות הסטודנט לבין תחום לימודיו‪.‬‬
‫‪332‬‬
‫ג‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪ C 2 3121,0.99   C 2 2,0.99  5.99‬‬
‫‪(50  46.75) 2 (47  51.85) 2 (56  54.4) 2 (5  5.25) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪46.75‬‬
‫‪51.85‬‬
‫‪54.4‬‬
‫‪8.25‬‬
‫‪ eij ‬‬
‫‪2‬‬
‫‪‬‬
‫‪ij‬‬
‫‪eij‬‬
‫‪o‬‬
‫‪2  ‬‬
‫‪(14  9.15) 2 (8  9.6) 2‬‬
‫‪‬‬
‫‪ 4.84‬‬
‫‪9.15‬‬
‫‪9.6‬‬
‫‪5.99‬‬
‫ד‪.‬‬
‫ערך‬
‫‪4.84‬‬
‫החלטה‬
‫‪2‬‬
‫‪‬‬
‫הנבדק ‪ , 4.84‬קטן מהגבול הקריטי ‪ , 5.99‬לכן נקבל את השערת האפס ‪ -‬אין תלות בין אישיות‬
‫הסטודנט‪ ,‬לבין תחום לימודיו‪.‬‬
‫ה‪.‬‬
‫פרק שני‬
‫‪.1‬‬
‫‪ 0  10‬‬
‫‪  14.5‬‬
‫‪ 6‬‬
‫‪C  15‬‬
‫‪n9‬‬
‫‪15  14.5‬‬
‫‪ 0.25 ‬‬
‫‪1    0.5987 ‬‬
‫‪   0.0.4013 ‬‬
‫‪ 40.13%‬‬
‫‪ 6 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 9‬‬
‫‪Z1  ‬‬
‫‪.2‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪333‬‬
‫‪ 2‬‬
‫‪n  20‬‬
‫‪ .3‬השערה דו כיוונית‪.‬‬
‫‪Z  2.33‬‬
‫'‪‬‬
‫'‪‬‬
‫‪ 2.33 ‬‬
‫‪1   0.99 ‬‬
‫‪  0.01 ‬‬
‫‪ '  0.02 ‬‬
‫‪ 2%‬‬
‫‪2‬‬
‫‪2‬‬
‫'‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Z‬‬
‫התשובות הנכונות א ‪ +‬ג‪ ,‬כלומר תשובה נכונה ה‪.‬‬
‫‪.4‬‬
‫‪336‬‬
‫‪ 0.84‬‬
‫‪400‬‬
‫‪‬‬
‫‪P‬‬
‫‪n  400‬‬
‫‪ 2.18 ‬‬
‫‪1   '  0.9854 ‬‬
‫‪  '  0.0146 ‬‬
‫‪1.46%‬‬
‫‪P0  0.8‬‬
‫‪0.84  0.8‬‬
‫‪0.84  0.16‬‬
‫‪400‬‬
‫‪Z 1 ' ‬‬
‫‪ .5‬נתון כי הטענה נבדקה ברמת מובהקות של ‪ ,1%‬ברמת מובהקות זו אנחנו מקבלים את השערת האפס‪ ,‬ולכן יש‬
‫טעות מסוג שני‪ ,‬לכן יש לחשב את ‪ , ‬כדי לחשב את ‪ , ‬יש לחשב את ‪.C‬‬
‫‪0.84  0.16‬‬
‫‪ 0.8427‬‬
‫‪400‬‬
‫‪0.8427  0.84‬‬
‫‪‬‬
‫‪ 0.1472  0.15 ‬‬
‫‪1    0.5596 ‬‬
‫‪   0.4404 ‬‬
‫‪ 44.04%‬‬
‫‪0.84  0.16‬‬
‫‪400‬‬
‫‪C  0.8  2.33 ‬‬
‫‪Z 1 ‬‬
‫‪ .6‬מבחן – שני מדגמים מזווגים‪ ,‬מבחן דו כווני‪.‬‬
‫‪D  0‬‬
‫‪H0 :‬‬
‫‪D  0‬‬
‫‪H1 :‬‬
‫‪‬‬
‫‪ .7‬רמת המובהקות המינימלית‪:‬‬
‫‪n5‬‬
‫‪S  3.78‬‬
‫‪2.4 ‬‬
‫'‪‬‬
‫‪‬‬
‫‪ 1.42 ‬‬
‫‪ 0.75  1   0.9 ‬‬
‫‪ 0.2   '  0.5‬‬
‫‪3.78‬‬
‫‪2‬‬
‫תשובה נכונה ב‬
‫‪X  2.4‬‬
‫' ‪t n 1,1 ‬‬
‫‪2‬‬
‫‪5‬‬
‫‪ .8‬ככל שמקטינים את אלפא – מגדילים את רמת הביטחון‪ ,‬כלומר מגדילים את הרווח‪.‬‬
‫ככל שמגדילים את גודל המדגם מקטינים את הרווח – הגדלת מדגם פי ‪ ,K‬תקטין את הרווח פי ‪K‬‬
‫אז מה קורה במקרה המתואר?‬
‫הרווח התקצר פי ‪ 2‬מאחר והמדגם גדל פי ‪ ,4‬אולם הקטינו את אלפא‪ ,‬לכן הרווח התרחב‪/‬התארך‪.‬‬
‫‪334‬‬
‫‪200‬‬
‫‪ 0.4‬‬
‫‪500‬‬
‫‪.9‬‬
‫‪‬‬
‫‪n  500‬‬
‫‪P‬‬
‫‪ 2.28 ‬‬
‫‪1   '  0.9887 ‬‬
‫‪  '  0.0113 ‬‬
‫‪1.13%‬‬
‫‪P0  0.35‬‬
‫‪0.4  0.35‬‬
‫‪0.4  0.6‬‬
‫‪500‬‬
‫‪Z 1 ' ‬‬
‫מצאנו את רמת המובהקות המינימאלית‪ ,‬כדי לפרסם שהתמיכה בו עלתה‪ ,‬צריך לדחות את השערת האפס‪,‬‬
‫בהתאם לכלל‪:‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪ .10‬נבדוק את שתי הטענות‪:‬‬
‫טענה ראשונה ‪ -‬ברמת מובהקות של ‪ 5%‬דו צדדי‪ ,‬נקבל ‪ 2.5%‬מכל צד‪ ,‬ולכן אם רמת המובהקות המינימאלית היא‬
‫‪ ,2%‬אזי נדחה את השערת האפס – טענה נכונה‪.‬‬
‫טענה שנייה – אם רמת המובהקות המינימלית במבחן חד צדדי היא ‪ ,4%‬אזי במבחן דו צדדי בו מחלקים את אלפא‬
‫לשניים‪ ,‬נגיע לאותה נקודה עם רמת מובהקות של ‪ - 4%‬הטענה נכונה‪.‬‬
‫‪ .11‬מבחן ‪ ,t‬סטית התקן לא ידועה‪ ,‬נמצא את רמת המובהקות‪:‬‬
‫‪110  100‬‬
‫‪ 1.414‬‬
‫‪ 20 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 8‬‬
‫‪Z 1 ‬‬
‫‪1    0.9 ‬‬
‫‪   0.1‬‬
‫‪12‬‬
‫‪‬‬
‫‪n8‬‬
‫‪‬‬
‫‪S  20‬‬
‫‪t ( n 1) (1  )  2.896‬‬
‫‪‬‬
‫‪S  0.431‬‬
‫‪X  4.68‬‬
‫‪2‬‬
‫‪‬‬
‫‪0.431‬‬
‫‪ 0.1765‬‬
‫‪ 20 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 8‬‬
‫תשובה‬
‫‪ 2.896 ‬‬
‫‪S‬‬
‫‪n‬‬
‫‪t‬‬
‫‪4.68  0.1765‬‬
‫‪335‬‬
‫‪ .1‬א‪ .‬שני מדגמים בלתי תלויים‪ ,‬מבחן דו כווני‪ ,‬סטית תקן לא ידועה – מבחן ‪. t‬‬
‫‪ .1‬השערות ‪:‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬אין הבדל במחיר סל קניות לחג‪ ,‬בין שתי הרשתות‪.‬‬
‫‪1   2  0‬‬
‫‪ H1 :‬יש הבדל במחיר סל קניות לחג‪ ,‬בין שתי הרשתות‪..‬‬
‫‪ .2‬רמת מובהקות ‪  0.1‬‬
‫ג‪.‬‬
‫‪n2  7‬‬
‫‪‬‬
‫_‬
‫‪X 2  982.86‬‬
‫‪S 2  106.1‬‬
‫‪‬‬
‫‪n1  9‬‬
‫_‬
‫‪X 1  1048.89‬‬
‫‪S 1  178.92‬‬
‫‪‬‬
‫‪‬‬
‫)‪S 1 (n1  1)  S 2 (n2  1‬‬
‫‪ 23116.55‬‬
‫‪n1  n2  2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪‬‬
‫‪ 0  1.761  76.62  134.93‬‬
‫‪n1 n2‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1 n 2  2 ,1‬‬
‫‪C  1   2  t‬‬
‫‪H0‬‬
‫‪134.93‬‬
‫‪0‬‬
‫‪66.03‬‬
‫‪ 134.93‬‬
‫הפרש הממוצעים הוא ‪ 66.03‬ואותו אנו בודקים מול הגבולות הקריטיים‪.‬‬
‫חישבנו את הגבולות הקריטיים ‪ – .  134.93‬מקבלים את השערת האפס – אין הבדל במחיר סל קניות לחג בין‬
‫שתי הרשתות‪.‬‬
‫ד‪ .‬החלטת החוקר ‪ -‬מקבלים את השערת האפס – ברמת מובהקות של ‪ ,5%‬אין הבדל במחיר סל קניות לחג בין‬
‫שתי הרשתות‪.‬‬
‫ה‪ .‬שגיאה אפשרית – השגיאה האפשרית היא שגיאה מסוג שני ‪ , ‬קיבלנו את השערת האפס בזמן שהשערת‬
‫חישוב סיכויי השגיאה –‬
‫‪134.93  66.03‬‬
‫‪ 0.8992‬‬
‫‪76.62‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪7  5 2 ,1‬‬
‫‪  t‬‬
‫‪‬‬
‫‪C  X1  X 2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪ 0.9‬‬
‫‪‬‬
‫‪2‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪‬‬
‫‪ 0.2    0.5 ‬‬
‫‪ 20%    50%‬‬
‫‪2‬‬
‫‪S ‬‬
‫‪‬‬
‫‪2‬‬
‫‪n1 n 2  2 ,1‬‬
‫‪t‬‬
‫‪0.75  1 ‬‬
‫‪336‬‬
‫ב‪ .‬בדיקת השערות חד כיוונית כלפי מטה‪ ,‬השוואה בין תוחלות‪ ,‬סטיית התקן לא ידוע – מבחן ‪. t‬‬
‫‪.1‬‬
‫השערות ‪  120 :‬‬
‫‪H0 :‬‬
‫עלות סל קניות לחג גדולה מ‪.₪ 1120 -‬‬
‫‪  1120‬‬
‫‪H1 :‬‬
‫עלות סל קניות לחג‪ ,‬נמוכה מ‪.₪ 1120-‬‬
‫‪  0.05‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪‬‬
‫‪S‬‬
‫השערה חד כיוונית כלפי מטה ‪-‬‬
‫‪n‬‬
‫‪C   0  t n 1,1 ‬‬
‫‪‬‬
‫‪t n 1,1  t 8,0.95  1.860‬‬
‫‪ 59.64‬‬
‫‪178.92‬‬
‫‪9‬‬
‫‪‬‬
‫‪S‬‬
‫‪n‬‬
‫‪ 0  1120‬‬
‫‪C  1120  1.860  56.94  1009.07‬‬
‫גבולות קריטיים‬
‫‪H0‬‬
‫נקבל את השערת האפס‪.‬‬
‫‪.4‬‬
‫‪1120‬‬
‫‪1009.07 1048.89‬‬
‫נקבל את ‪ H 0‬ונדחה את השערת המחקר – סל קניות השנה אינו זול יותר ביחס לשנה שעברה‪.‬‬
‫‪.5‬‬
‫קיבלנו את השערת האפס‪ ,‬השגיאה האפשרית – קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה‪.‬‬
‫‪25%    40%‬‬
‫ג‪.‬‬
‫‪1048.89  1009.07‬‬
‫‪‬‬
‫‪ 0.6677‬‬
‫‪ 178.91 ‬‬
‫‪‬‬
‫‪‬‬
‫‪9‬‬
‫‪‬‬
‫‪‬‬
‫‪0.25    0.4‬‬
‫‪t 8,1 ‬‬
‫‪0.6  1    0.75‬‬
‫‪ C‬‬
‫‪t 8,1  ‬‬
‫‪  ‬‬
‫‪ S ‬‬
‫‪ n ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 0.6677‬‬
‫‪t8,1‬‬
‫ניתוח שונות חד כווני – ‪ ,ANOVA‬להשוואה בין ארבעה מדגמים‪:‬‬
‫‪ - H 0 : 1   2   3   4‬אין הבדל בעלות סל קניות לחג‪ ,‬בין הרשתות השונות‪.‬‬
‫‪ - H1 : 1  2  3  4‬יש הבדל בעלות סל קניות לחג‪ ,‬בין הרשתות השונות‪.‬‬
‫רמת מובהקות ‪  0.05 :‬‬
‫‪337‬‬
‫תמוי‬
‫עגול‬
‫ב‬
‫א‬
‫‪n1  9‬‬
‫‪n1  7‬‬
‫‪n1  8‬‬
‫‪n1  9‬‬
‫‪x1  1048.89‬‬
‫‪x 1  982.86‬‬
‫‪x 1  922‬‬
‫‪x1  955.56‬‬
‫‪‬‬
‫‪S 1  178.92 2‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  106.12‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  84.23 2‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  108.18 2‬‬
‫‪2‬‬
‫‪ 1048.89  9  982.86  7  922  8  955.56  9‬ממוצע משוקלל‬
‫‪X ‬‬
‫‪ 978.66‬‬
‫‪9789‬‬
‫‪SSB   ni  ( xi  x) 2 74999.37‬‬
‫‪‬‬
‫‪SSW   (ni  1) S i 466918‬‬
‫‪2‬‬
‫‪i‬‬
‫‪i‬‬
‫מקור‬
‫השונות‬
‫בין‬
‫‪k-1=4-1=3‬‬
‫‪SSB=74999.37‬‬
‫‪SSB‬‬
‫‪=24999.79‬‬
‫‪k 1‬‬
‫קבוצות‬
‫בתוך‬
‫‪SSW=466918‬‬
‫‪n-k=33-4=29‬‬
‫‪MSB ‬‬
‫‪=16100.62‬‬
‫קבוצות‬
‫‪SSW‬‬
‫‪nk‬‬
‫‪MSB‬‬
‫‪=1.55‬‬
‫‪MSW‬‬
‫‪F‬‬
‫‪MSW ‬‬
‫‪FC  FK 1,n K ,  F3, 29,0.05  2.934‬‬
‫)‪FC (2.934)-  F (1.55‬‬
‫ברמת מובהקות של ‪ , 0.05‬מצאנו כי אין הבדל בעלות סל קניות לחג‬
‫בין הסניפים – מקבלים את הטענה כי קיים קרטל והשוואת מחירים בין הסניפים‬
‫‪‬‬
‫)‪1.55 FC ( 2.934‬‬
‫‪338‬‬
‫הטבלה הנתונה היא טבלת הצפייה –‪. o‬‬
‫‪.2‬‬
‫תפוקה‬
‫סה"כ‬
‫‪35‬‬
‫‪20‬‬
‫‪55‬‬
‫משמרת‬
‫צהרים‬
‫‪20‬‬
‫‪30‬‬
‫‪50‬‬
‫‪95‬‬
‫‪75‬‬
‫‪170‬‬
‫‪40‬‬
‫‪25‬‬
‫‪65‬‬
‫תפוקה‬
‫סה"כ‬
‫‪30.74‬‬
‫‪24.26‬‬
‫‪55‬‬
‫משמרת‬
‫צהרים‬
‫‪27.94‬‬
‫‪22.06‬‬
‫‪50‬‬
‫‪95‬‬
‫‪75‬‬
‫‪170‬‬
‫‪36.32‬‬
‫‪28.68‬‬
‫‪65‬‬
‫‪: H0‬‬
‫אין בין שעות המשמרת לבין תפוקת העובד‪.‬‬
‫א‪.‬‬
‫‪: H1‬‬
‫יש תלות בין שעות המשמרת לתפוקת העובד‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪ C 2 3121,0.99   C 2 2,0.99  5.99‬‬
‫‪(35  30.74) 2 (20  24.26) 2 (20  27.94) 2 (30  22.06) 2‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪30.74‬‬
‫‪24.26‬‬
‫‪27.94‬‬
‫‪22.06‬‬
‫‪ eij ‬‬
‫‪2‬‬
‫‪‬‬
‫‪ij‬‬
‫‪o‬‬
‫‪eij‬‬
‫‪ ‬‬
‫‪2‬‬
‫‪(40  36.32) 2 (25  28.68) 2‬‬
‫‪‬‬
‫‪ 7.3‬‬
‫‪36.32‬‬
‫‪28.68‬‬
‫‪7.3‬‬
‫ד‪.‬‬
‫ערך‬
‫‪5.99‬‬
‫החלטה‬
‫‪2‬‬
‫‪‬‬
‫הנבדק ‪ , 7.3‬גבוה מהגבול הקריטי ‪ , 5.99‬לכן נדחה את השערת האפס ונקבל את השערת המחקר ‪ -‬יש‬
‫תלות בין המשמרת לבין התפוקה‪.‬‬
‫ה‪.‬‬
‫מאחר ודחינו את השערת האפס השגיאה האפשרית היא שגיאה מסוג ראשון ‪ -‬אלפא‪.‬‬
‫‪339‬‬
‫פרק שני‬
‫‪.1‬‬
‫‪ 0  52.26‬‬
‫'‪‬‬
‫‪‬‬
‫‪S  8.62‬‬
‫‪X  46.1‬‬
‫‪n9‬‬
‫‪52.263  46.1‬‬
‫‪ 2.26 ‬‬
‫‪1   0.975 ‬‬
‫‪  '  0.05 ‬‬
‫‪ 5%‬‬
‫‪8.62‬‬
‫‪2‬‬
‫התשובה הנכונה ד‪.‬‬
‫‪10‬‬
‫‪t 91,1  ' ‬‬
‫‪2‬‬
‫‪ .2‬שני מדגמים מזווגים‪ ,‬מבחן דו כווני – כדי לדעת מהי השגיאה האפשרית‪ ,‬עלינו לדעת בשלב ראשון האם‬
‫מדובר על שגיאה מסוג ראשון או שגיאה מסוג שני – אלפא או ביתא‪.‬‬
‫לכן נחשב את רמת המובהקות המינימלית ונשווה ל‪ - 5%-‬רמת המובהקות במדגם‪.‬‬
‫‪‬‬
‫‪X  8.6‬‬
‫‪n5‬‬
‫‪S  8.93‬‬
‫‪ 8.6  0‬‬
‫'‪‬‬
‫‪‬‬
‫‪ 2.15 ‬‬
‫‪ 0.95  1   0.975 ‬‬
‫‪ 5%   '  10%‬‬
‫‪8.93‬‬
‫‪2‬‬
‫' ‪t 41,1 ‬‬
‫‪2‬‬
‫‪5‬‬
‫‪' ‬‬
‫‪' ‬‬
‫רמת המובהקות היא ‪ ,5%‬ורמת המובהקות המינימלית היא בין ‪ 5%‬ל‪ ,10%-‬לכן מקבלים את השערת האפס –‬
‫בכדי לחשב את סיכויי השגיאה במסקנות‪ ,‬עלינו לחשב את ביתא‪ - ,‬בכדי לחשב את ביתא‪ ,‬עלינו לחשב את הגבול‬
‫הקריטי – ‪.C‬‬
‫‪‬‬
‫‪ 11.086‬‬
‫‪8.93‬‬
‫‪5‬‬
‫‪‬‬
‫‪ C  0  2.776 ‬‬
‫‪S‬‬
‫‪n‬‬
‫‪‬‬
‫‪S  8.93‬‬
‫‪C  0  t n 1,1  ‬‬
‫‪X  8.6‬‬
‫‪n5‬‬
‫‪2‬‬
‫‪11.086  8.6‬‬
‫‪‬‬
‫‪ 0.6224 ‬‬
‫‪ 0.6  1   0.75 ‬‬
‫‪ 50%    80%‬‬
‫‪8.93‬‬
‫‪2‬‬
‫‪t 4,1  ‬‬
‫‪5‬‬
‫‪ .3‬בשלב ראשון נחשב את רמת המובהקות המינימלית‪:‬‬
‫‪ 0  7580‬‬
‫‪‬‬
‫‪S  637.883‬‬
‫‪n7‬‬
‫‪X  7074.29‬‬
‫‪7580  7074.29‬‬
‫‪ 2.097 ‬‬
‫‪ 0.95  1   '  0.975 ‬‬
‫‪ 2.5%   '  5%‬‬
‫‪637.883‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪t 7 1,1 ' ‬‬
‫‪7‬‬
‫מאחר ורמת המובהקות המינימלית קטנה מ‪ ,5%-‬כלומר קטנה מרמת המובהקות של המחקר‪ ,‬דוחים את השערת‬
‫האפס‪ ,‬ולכן הסיכויים האמיתיים לשגיאה שווים לרמת המובהקות המינימלית‪.‬‬
‫‪340‬‬
‫‪2‬‬
‫‪ .4‬אם נבצע את אותה בדיקה על מדגם כפול – נקצר את אורך הרווח‪ ,‬אך לא תהיה לכך כל השפעה על רמת‬
‫המובהקות – משפט לא נכון‪.‬‬
‫אם נשתמש ברמת מובהקות כפולה ובמבחן דו צדדי – מאחר ונחלק את אלפא לשניים‪ ,‬נגיע לאותו גבול קריטי‬
‫ולכן בהכרח לאותן מסקנות – משפט נכון‪.‬‬
‫‪ .5‬נחשב את רמת המובהקות המינימאלית‪:‬‬
‫‪‬‬
‫‪241‬‬
‫‪P‬‬
‫‪ 0.3089‬‬
‫‪780‬‬
‫‪ 1.74 ‬‬
‫‪1   '  0.9591 ‬‬
‫‪  '  0.409 ‬‬
‫‪ 4.09%‬‬
‫התשובה הנכונה ב‪.‬‬
‫‪n  780‬‬
‫‪P0  0.28‬‬
‫‪0.3089  0.28‬‬
‫‪Z 1 ' ‬‬
‫‪0.3089  0.6910‬‬
‫‪780‬‬
‫‪ .6‬מאחר ורמת המובהקות המינימלית היא ‪ ,4.09%‬ברור כי ניתוח ברמת מובהקות של ‪ ,2%‬משמעותו‪ ,‬קבלת השערת‬
‫האפס‪ ,‬מאחר וההפקה קיבלה את אותה מסקנה‪ ,‬יש כאן שגיאה – שגיאה מסוג שני‪.‬‬
‫נחשב את ‪ ,C‬במטרה לאפשר לנו לחשב את ביתא‪.‬‬
‫‪‬‬
‫‪‬‬
‫)‪P (1  P‬‬
‫‪‬‬
‫‪n‬‬
‫‪Z 0.98  2.05‬‬
‫‪C  P0  Z1‬‬
‫‪‬‬
‫‪241‬‬
‫‪P‬‬
‫‪ 0.3089‬‬
‫‪780‬‬
‫‪n  780‬‬
‫‪P0  0.28‬‬
‫‪0.3089  0.6910‬‬
‫‪ 0.3139‬‬
‫‪780‬‬
‫‪0.3139  0.3089‬‬
‫‪‬‬
‫‪ 0.3022 ‬‬
‫‪1    0.6179 ‬‬
‫‪   0.3821 ‬‬
‫‪ 38.21%‬‬
‫‪0.3089  0.6910‬‬
‫‪780‬‬
‫‪C  0.28  2.05 ‬‬
‫‪ .7‬מבחן דו כווני‪ ,‬סטית התקן באוכלוסייה ידועה – התפלגות ‪ ,Z‬ע"ס תוצאות המדגם קיבל בטבלה ‪1.96‬‬
‫‪Z  '  1.96 ‬‬
‫‪ '  0.05 ‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪.8‬‬
‫‪  12‬‬
‫‪L9‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ Z 0.99  2.33‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ Z  ‬‬
‫‪ 1‬‬
‫‪2‬‬
‫‪n‬‬
‫‪ L‬‬
‫‪‬‬
‫‪ 2‬‬
‫‪‬‬
‫‪‬‬
‫‪ 2.33 12 ‬‬
‫‪‬‬
‫‪n‬‬
‫‪ n  38‬‬
‫‪ 9 ‬‬
‫‪‬‬
‫‪‬‬
‫‪2 ‬‬
‫‪‬‬
‫‪341‬‬
‫‪Z1 ‬‬
‫‪ .9‬אין קשר בין גודל המדגם לבין בדיקה חד‪/‬דו כיוונית‪ ,‬הגבול יהיה זה בהתאם ליחסים בין רמות המובהקות ולא‬
‫המדגמים – אף תשובה אינה נכונה – תשובה נכונה ב‪.‬‬
‫‪ .10‬שני מדגמים בלתי תלויים‪ ,‬סטיות תקן לא ידועות – מבחן ‪ ,t‬נחשב את רמת המובהקות המינימאלית‪.‬‬
‫‪‬‬
‫‪S 2  36‬‬
‫__‬
‫‪X 2  197.8‬‬
‫‪‬‬
‫‪n2  17‬‬
‫__‬
‫‪S 1  20‬‬
‫‪X 1  180‬‬
‫‪‬‬
‫‪n1  15‬‬
‫‪‬‬
‫‪S 1 (n1  1)  S 2 (n2  1) 400  14  1296  16‬‬
‫‪S ‬‬
‫‪‬‬
‫‪ 877.86‬‬
‫‪n1  n2  2‬‬
‫‪30‬‬
‫‪2‬‬
‫‪ 1.696‬‬
‫‪(197.8  180)  0‬‬
‫‪‬‬
‫‪ t 30,1 ' ‬‬
‫‪877.86 877.86‬‬
‫‪‬‬
‫‪15‬‬
‫‪17‬‬
‫‪‬‬
‫‪ X 2  1   2 ‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫‪1‬‬
‫‪X‬‬
‫‪2‬‬
‫‪t n1 n 2 2,1 ' ‬‬
‫‪S‬‬
‫‪S‬‬
‫‪‬‬
‫‪n1 n2‬‬
‫‪‬‬
‫‪  '  0.05 ‬‬
‫‪  '  5%‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪1   '  0.95‬‬
‫‪‬‬
‫‪t15,1 '  2.13 ‬‬
‫‪ .11‬ע" הנתונים‪ '  0.25 :‬‬
‫‪n  16‬‬
‫‪S 6‬‬
‫‪' ‬‬
‫‪' ‬‬
‫התשובה הנכונה היא ה – תשובות ג‪+‬ד נכונות‪.‬‬
‫‪.12‬‬
‫‪ t 29, 0.995  2.756‬‬
‫‪0.01‬‬
‫)‬
‫‪2‬‬
‫‪‬‬
‫‪29,(1‬‬
‫‪t‬‬
‫‪‬‬
‫‪‬‬
‫) ‪( n 1), (1‬‬
‫‪2‬‬
‫‪S  11‬‬
‫‪t‬‬
‫‪X  134‬‬
‫‪‬‬
‫‪S‬‬
‫‪S‬‬
‫‪X t‬‬
‫‪   X t‬‬
‫‪ ‬‬
‫‪ ‬‬
‫) ‪( n 1)(1‬‬
‫(‬
‫‪n‬‬
‫‪‬‬
‫‪1‬‬
‫()‬
‫‪1‬‬
‫‪‬‬
‫)‬
‫‪n‬‬
‫‪n‬‬
‫‪2‬‬
‫‪2‬‬
‫‪11‬‬
‫‪11‬‬
‫‪   134  2.756 ‬‬
‫‪30‬‬
‫‪30‬‬
‫‪134  2.756 ‬‬
‫‪128.46    139.53‬‬
‫‪342‬‬
‫‪1‬א‪ .‬מבחן השערות על תוחלת‪ ,‬סטית תקן באוכלוסייה ידועה‪ ,‬מבחן ‪ Z‬חד כווני כלפי‪:‬‬
‫‪  52500‬‬
‫‪ H 0 :‬מכירת חביתות ירק‪ ,‬לא תשפר את ההכנסות‪.‬‬
‫‪  52500‬‬
‫‪ H1 :‬מכירת חביתות ירק‪ ,‬תשפר את ההכנסות‪.‬‬
‫ב‪.‬‬
‫‪  0.04‬‬
‫ג‪ .‬תחומי קבלה ודחית ‪H 0‬‬
‫‪‬‬
‫‪n‬‬
‫‪Z 1   Z 10.04  Z 0.96  1.75‬‬
‫‪8500‬‬
‫‪12‬‬
‫‪ 56794‬‬
‫‪‬‬
‫‪‬‬
‫‪12‬‬
‫‪ 0  52500‬‬
‫‪n‬‬
‫‪8500‬‬
‫‪C  0  Z 1  ‬‬
‫‪C  52500  1.75 ‬‬
‫‪H0‬‬
‫ד‪ .‬החלטת החוקר ‪-‬‬
‫‪57500‬‬
‫‪52500‬‬
‫‪56794‬‬
‫נדחה את ‪ H 0‬ונקבל את השערת המחקר – הוספת חביתות ירק‪ ,‬משפרת את הרווחיות‪.‬‬
‫ה‪.‬‬
‫דחינו את השערת האפס‪ ,‬השגיאה האפשרית – דחינו את השערת האפס בזמן שהשערת האפס נכונה‪.‬‬
‫שגיאה מסוג ראשון ‪. ‬‬
‫‪57500  52500‬‬
‫‪ 2.03‬‬
‫‪ 8500 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 12 ‬‬
‫‪ '  2.12%‬‬
‫‪ '  0.0212‬‬
‫‪Z1 ' ‬‬
‫‪1   '  0.9788‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪Z1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪Z1 '  2.03‬‬
‫‪343‬‬
‫על מדגם של ‪ 18( 45%‬סניפים)‪ ,‬בודקים כדאיות הכנסת נקניקיות לתפריט – מבחן על תוחלת‪ ,‬מבחן חד כווני‬
‫כלפי מעלה‪ ,‬סטית התקן ידועה – מבחן ‪.Z‬‬
‫‪  52500‬‬
‫‪ H 0 :‬מכירת נקניקיות‪ ,‬לא תשפר את ההכנסות‪.‬‬
‫‪  52500‬‬
‫‪ H1 :‬מכירת נקניקיות‪ ,‬תשפר את ההכנסות‪.‬‬
‫ב‪.‬‬
‫‪  0.05‬‬
‫ג‪ .‬תחומי קבלה ודחית ‪H 0‬‬
‫‪‬‬
‫‪n‬‬
‫‪Z 1   Z 10.05  Z 0.95  1.65‬‬
‫‪8500‬‬
‫‪18‬‬
‫‪ 55805‬‬
‫‪‬‬
‫‪‬‬
‫‪18‬‬
‫‪ 0  52500‬‬
‫‪n‬‬
‫‪8500‬‬
‫‪C  0  Z 1  ‬‬
‫‪C  52500  1.65 ‬‬
‫‪H0‬‬
‫‪58200‬‬
‫‪52500‬‬
‫‪55805‬‬
‫ד‪ .‬החלטת החוקר ‪-‬‬
‫נדחה את ‪ H 0‬ונקבל את השערת המחקר – הוספת נקניקיות‪ ,‬תשפר את הרווחיות‪.‬‬
‫ה‪ .‬השגיאה האפשרית ‪:‬‬
‫דחינו את השערת האפס‪ ,‬השגיאה האפשרית – דחינו את השערת האפס בזמן שהשערת האפס נכונה‪.‬‬
‫שגיאה מסוג ראשון ‪. ‬‬
‫‪58200  52500‬‬
‫‪ 2.85‬‬
‫‪ 8500 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 18 ‬‬
‫‪ '  0.22%‬‬
‫‪ '  0.0022‬‬
‫‪Z1 ' ‬‬
‫‪1   '  0.9978‬‬
‫‪  0‬‬
‫‪  ‬‬
‫‪Z1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ n‬‬
‫‪Z1 '  2.85‬‬
‫שני השינויים טובים לרשת בבדיקת שני השינויים חל שיפור ברווחיות‪.‬‬
‫‪344‬‬
‫‪1‬ב‪ .‬כוונת המנהל היא – שני השינויים‪ :‬חביתות ירק‪/‬נקניקיות‪ ,‬משפרים את הרווחיות באותה מידה‪ ,‬השאלה היא‬
‫אם הטענה שלו נכונה‪.‬‬
‫בכדי לבדוק זאת – נבחן שני מדגמים בלתי תלויים‪ ,‬מבחן דו כווני‪ ,‬סטיות התקן ידועות‪.‬‬
‫א‪.‬‬
‫‪1   2  0‬‬
‫‪H0 :‬‬
‫אין הבדל ברווחיות כתוצאה מהוספת נקניקיות‪/‬חביתות ירק‬
‫‪1   2  0‬‬
‫‪H1 :‬‬
‫אין הבדל ברווחיות כתוצאה מהוספת נקניקיות‪/‬חביתות ירק‬
‫ב‪.‬‬
‫ג‪.‬‬
‫השערה דו כיוונית – יש לחשב שני גבולות קריטיים‪:‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪C1  1   2  Z ‬‬
‫‪‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪ Z 0.975  1.96‬‬
‫‪Z‬‬
‫‪‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪8500 2 8500 2‬‬
‫‪‬‬
‫‪ 3470.11‬‬
‫‪12‬‬
‫‪18‬‬
‫‪C1  0  3470.11  1.96  6801.41‬‬
‫‪‬‬
‫‪C 2  1   2  Z ‬‬
‫‪‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪n1‬‬
‫‪1   2  0‬‬
‫‪C2  0  3470.11  1.96  6801.41‬‬
‫הגבול הקריטי הוא ‪ 6801.41‬‬
‫‪H0‬‬
‫‪6801‬‬
‫‪700‬‬
‫‪0‬‬
‫‪ 6801‬‬
‫‪X 1  X 2  58200  57500  700‬‬
‫ד‪.‬‬
‫ההפרש בין הממוצעים נמצא בתחום קבלת השערת האפס ‪ ,‬מקבלים את השערת האפס‪ ,‬ודוחים את השערת‬
‫המחקר ‪ -‬אין הבדל ברווחיות בין הוספת חביתות ירק או נקניקיות לתפריט‪.‬‬
‫‪345‬‬
‫ה‪.‬‬
‫קיבלנו את השערת האפס‪ ,‬השגיאה האפשרית ‪ -‬קיבלנו את השערת האפס בזמן שהשערת המחקר נכונה כלומר‬
‫‪(X 1  X 2 )  C‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪‬‬
‫‪(X 1  X 2 )  C‬‬
‫‪Z‬‬
‫‪‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪n1‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪‬‬
‫‪Z‬‬
‫‪‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪n1‬‬
‫‪6801  700‬‬
‫‪ 1.75‬‬
‫‪3470.11‬‬
‫‪  0.0802 ‬‬
‫‪ 8.02%‬‬
‫‪‬‬
‫‪‬‬
‫‪Z‬‬
‫‪ 1 ‬‬
‫‪ 2‬‬
‫‪ 0.9599‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪1‬ג‪ .‬לפתרון השאלה יש צורך בהשוואה בין ארבעה מדגמים‪,‬‬
‫לכן נשתמש בניתוח שונות חד כווני – ‪ANOVA‬‬
‫‪ - H 0 : 1   2   3   4‬אין הבדל בהכנסות‪ ,‬בין הסניפים השונים של הרשת‪.‬‬
‫‪ - H1 : 1  2  3  4‬יש הבדל בהכנסות בין הסניפים השונים של הרשת‪.‬‬
‫רמת מובהקות ‪  0.05 :‬‬
‫ב‬
‫א‬
‫ד‬
‫ג‬
‫‪n1  9‬‬
‫‪n1  6‬‬
‫‪n1  7‬‬
‫‪n1  8‬‬
‫‪x1  4.93‬‬
‫‪x 1  5.08‬‬
‫‪x 1  5.19‬‬
‫‪x 1  5.03‬‬
‫‪‬‬
‫‪S 1  0.55 2‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  0.412‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  0.57 2‬‬
‫‪2‬‬
‫‪‬‬
‫‪S 1  0.63 2‬‬
‫‪2‬‬
‫‪ X  5.046‬ממוצע משוקלל‬
‫‪SSB   ni  ( xi  x) 2 0.2627‬‬
‫‪i‬‬
‫‪‬‬
‫‪SSW   (ni  1) S i 8.0519‬‬
‫‪2‬‬
‫‪i‬‬
‫מקור‬
‫השונות‬
‫בין‬
‫‪SSB=0.2627‬‬
‫‪k-1=4-1=3‬‬
‫קבוצות‬
‫בתוך‬
‫‪SSW=8.0519‬‬
‫‪n-k=30-4=26‬‬
‫קבוצות‬
‫‪SSB‬‬
‫‪=0.08756‬‬
‫‪k 1‬‬
‫‪SSW‬‬
‫‪=0.3096‬‬
‫‪nk‬‬
‫‪MSB ‬‬
‫‪MSW ‬‬
‫‪MSB‬‬
‫‪=0.2828‬‬
‫‪MSW‬‬
‫‪F‬‬
‫‪346‬‬
‫‪FC  FK 1,n K ,  F3, 26,0.05  2.975‬‬
‫ברמת מובהקות של ‪ , 0.05‬מקבלים את השערת האפס‬
‫)‪FC (2.975)  F (0-.2828‬‬
‫אין הבדל בהכנסות בין הסניפים השונים של הרשת‪..‬‬
‫‪‬‬
‫)‪0.2828 FC ( 2.975‬‬
‫‪.2‬‬
‫סה"כ‬
‫‪312‬‬
‫‪188‬‬
‫‪500‬‬
‫השקעות‬
‫ללא סיכון‬
‫‪100‬‬
‫‪60‬‬
‫‪160‬‬
‫השקעות‬
‫בסיכון‬
‫נמוך‬
‫‪92‬‬
‫‪78‬‬
‫‪170‬‬
‫השקעות‬
‫בסיכון‬
‫‪120‬‬
‫‪50‬‬
‫‪170‬‬
‫רווקים‬
‫נשואים‬
‫סה"כ‬
‫סה"כ‬
‫השקעות‬
‫ללא סיכון‬
‫‪312‬‬
‫‪188‬‬
‫‪500‬‬
‫‪99.84‬‬
‫‪60.16‬‬
‫‪160‬‬
‫השקעות‬
‫בסיכון‬
‫נמוך‬
‫‪106.08‬‬
‫‪63.92‬‬
‫‪170‬‬
‫השקעות‬
‫בסיכון‬
‫‪106.08‬‬
‫‪63.92‬‬
‫‪170‬‬
‫רווקים‬
‫נשואים‬
‫סה"כ‬
‫א‪.‬‬
‫‪: H0‬‬
‫אין תלות בין מצב משפחתי ללקיחת סיכונים בהשקעות‪.‬‬
‫‪: H1‬‬
‫יש תלות בין מצב משפחתי ללקיחת סיכונים בהשקעות‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫‪2‬‬
‫‪‬‬
‫‪ C 2 3121,0.95   C 2 2,0.95  5.99‬‬
‫‪347‬‬
‫‪ eij ‬‬
‫‪2‬‬
‫‪ 9.82‬‬
‫‪ij‬‬
‫‪o‬‬
‫‪eij‬‬
‫‪9.82‬‬
‫ד‪.‬‬
‫ערך‬
‫‪ ‬‬
‫‪2‬‬
‫‪5.99‬‬
‫החלטה‬
‫‪2‬‬
‫‪‬‬
‫הנבדק ‪ , 9.82‬ערך זה גדול מהגבול הקריטי ‪ , 5.99‬לכן נדחה את השערת האפס ‪ -‬יש תלות בין המצב‬
‫המשפחתי לבין לקיחת סיכונים בהשקעות‪.‬‬
‫ה‪.‬‬
‫מאחר ודחינו את השערת האפס השגיאה האפשרית היא שגיאה מסוג ראשון‪.‬‬
‫פרק שני‬
‫‪ .1‬נחשב את רמת המובהקות המינימאלית‪.‬‬
‫‪230‬‬
‫‪ 0.46‬‬
‫‪500‬‬
‫‪‬‬
‫‪P‬‬
‫‪n  500‬‬
‫‪ 1.79 ‬‬
‫‪1   '  0.9633 ‬‬
‫‪  '  0.0367 ‬‬
‫‪ 3.67%‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪P0  0.42‬‬
‫‪0.46  0.42‬‬
‫‪0.46  0.54‬‬
‫‪500‬‬
‫‪Z 1 ' ‬‬
‫חל גידול באחוז התומכים ב‪.B-‬‬
‫‪ .2‬חישבנו בסעיף א – ‪.3.67%‬‬
‫‪ .3‬שני מדגמים מזווגים – נחשב את רמת המובהקות המינימאלית‪.‬‬
‫‪‬‬
‫‪S  8.37‬‬
‫__‬
‫‪X  8.83‬‬
‫‪n6‬‬
‫‪8.83  0‬‬
‫‪ 2.58 ‬‬
‫‪1   '  0.975 ‬‬
‫‪  '  0.025 ‬‬
‫‪ 2.5%‬‬
‫‪8.37‬‬
‫‪t 5'1 ' ‬‬
‫‪6‬‬
‫‪348‬‬
‫‪.4‬‬
‫‪  0.02 ‬‬
‫‪ 2%‬‬
‫‪ 0.99‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪ 2.412‬‬
‫‪‬‬
‫‪2‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪29,1‬‬
‫‪t‬‬
‫‪.5‬‬
‫‪ 0.876‬‬
‫‪0.24  0.2‬‬
‫‪0.24  0.76‬‬
‫‪350‬‬
‫‪84‬‬
‫‪ 0.24‬‬
‫‪350‬‬
‫‪Z1 ' ‬‬
‫‪‬‬
‫‪P‬‬
‫‪35‬‬
‫‪ 0.2‬‬
‫‪175‬‬
‫‪P0 ‬‬
‫‪1   '  0.8106 ‬‬
‫‪  '  18.94%‬‬
‫‪.6‬‬
‫‪‬‬
‫‪  79.73‬‬
‫‪S 7‬‬
‫‪1   '  0.975 ‬‬
‫‪  '  2.5%‬‬
‫‪79.73  76‬‬
‫‪ 2.13‬‬
‫‪ 7 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 10 ‬‬
‫‪ 0  76‬‬
‫‪n  16‬‬
‫‪  0‬‬
‫‪t15,1 ' ‬‬
‫‪‬‬
‫‪‬‬
‫‪ S ‬‬
‫‪ n ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫תשובה ב נכונה‪.‬‬
‫‪t15,1 ' ‬‬
‫‪ .7‬בדיקה ברמת מובהקות של ‪ ,1%‬משמעותה קבלת השערת האפס‪ ,‬לכן השגיאה היא שגיאה מסוג שני – ביתא‪ .‬בכדי‬
‫לחשב את ביתא‪ ,‬יש צורך לחשב את ‪.C‬‬
‫‪7‬‬
‫‪ 80.55‬‬
‫‪16‬‬
‫‪80.55  79.73‬‬
‫‪‬‬
‫‪t15,1   0.4705‬‬
‫‪ 7 ‬‬
‫‪‬‬
‫‪‬‬
‫‪ 16 ‬‬
‫‪0.6  1    0.75 ‬‬
‫‪ 0.5    0.8‬‬
‫‪.8‬‬
‫‪1   2  0‬‬
‫‪ H 0 :‬אין הבדל בדקות דיבור בין גברים לנשים‪.‬‬
‫‪1   2  0‬‬
‫‪ H1 :‬יש אין הבדל בדקות דיבור בין גברים לנשים‪.‬‬
‫‪n2  9‬‬
‫‪‬‬
‫‪S 2  22.32‬‬
‫_‬
‫‪n1  9‬‬
‫‪X 2  191.22‬‬
‫‪C  76  2.602 ‬‬
‫‪‬‬
‫‪S 1  13.88‬‬
‫‪‬‬
‫‪t15,1 ‬‬
‫_‬
‫‪X 1  168.55‬‬
‫‪‬‬
‫)‪S 1 (n1  1)  S 2 (n2  1‬‬
‫‪S ‬‬
‫‪ 345.48‬‬
‫‪n1  n2  2‬‬
‫‪2‬‬
‫'‪‬‬
‫‪ 0.99 ‬‬
‫‪ '  2%‬‬
‫‪2‬‬
‫‪1‬‬
‫‪2‬‬
‫‪191.22  168.55‬‬
‫‪ 2.587‬‬
‫‪ 345.48 345.48 ‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪9 ‬‬
‫‪ 9‬‬
‫‪‬‬
‫ברמת מובהקות של ‪ ,6%‬דוחים את השערת האפס‪.‬‬
‫‪349‬‬
‫‪2‬‬
‫‪t‬‬
‫'‪‬‬
‫‪16,1‬‬
‫‪2‬‬
‫‪ .9‬ברמת מובהקות של ‪ ,1%‬מקבלים את השערת האפס‪ ,‬לכן השגיאה היא מסוג שני – ביתא‪.‬‬
‫נחשב את ‪.C‬‬
‫‪ 0.75 ‬‬
‫‪ 0.5    0.8‬‬
‫‪‬‬
‫‪2‬‬
‫‪0.6  1 ‬‬
‫‪.10‬‬
‫‪' ‬‬
‫‪' ‬‬
‫‪C  0  2.921  8.76  25.58‬‬
‫‪25.58  22.66‬‬
‫‪t  ‬‬
‫‪ 0.3341‬‬
‫‪16,1‬‬
‫‪8‬‬
‫‪.‬‬
‫‪762‬‬
‫‪2‬‬
‫ע"פ האמור בטבלה – טענה א נכונה ואילו טענה ב לא נכונה‪.‬‬
‫‪ .11‬אם נגדיל את המדגם מ‪ 40-‬ל‪ ,100-‬נגדיל אותו פי ‪ ,2.5‬לכן הרווח יתקצר פי ‪2.5‬‬
‫‪ 4111 ‬‬
‫‪ 3035    4111‬‬
‫‪.12‬‬
‫__‬
‫‪X  78‬‬
‫‪‬‬
‫‪S 6‬‬
‫‪t19,0.975  2.093‬‬
‫‪6500‬‬
‫‪2.5‬‬
‫‪ 3035‬‬
‫‪4800‬‬
‫‪2.5‬‬
‫‪n  20‬‬
‫‪6‬‬
‫‪6‬‬
‫‪   78  2.093 ‬‬
‫‪20‬‬
‫‪20‬‬
‫‪75.19    80.80‬‬
‫‪78  2.093 ‬‬
‫‪350‬‬
‫השימוש במחשבון ‪ Casio fx‬לחישובים סטטיסטיים‬
‫עיינו באיור בעמוד הבא‬
‫‪.1‬‬
‫לשימושים סטטיסטיים יש לעבור ל‪ mode -‬סטטיסטי ‪ -‬לחצו על ‪ mode‬ואח"כ על המספר ‪2‬‬
‫‪.2‬‬
‫כדי לצאת חזרה כלומר לבטל את ה‪ mode -‬הסטטיסטי יש ללחוץ ‪ mode‬ואח"כ את המספר ‪1‬‬
‫*‬
‫חשוב לציין כי עד שלא יבוטל המצב הסטטיסטי הנתונים שהזנתם ישמרו במחשבון ‪,‬‬
‫גם לאחר שהמחשבון יכבה ‪.‬‬
‫כאשר עובדים עם נתונים בודדים – כלומר ללא שכיחות – כל נתון מופיע כערך בודד‬
‫לאחר שעברתם ל‪ mode-‬סטטיסטי נזין נתונים ‪:‬‬
‫‪ 4‬נלחץ על ‪( m+‬הכפתור הימני ביותר למטה בקבוצת הכפתורים השחורים באמצע)‬
‫‪ 6‬נלחץ על ‪m+‬‬
‫‪xi‬‬
‫‪ 7‬נלחץ על ‪m+‬‬
‫‪4‬‬
‫‪ 10‬נלחץ על ‪m+‬‬
‫‪6‬‬
‫‪ 7‬נלחץ על ‪m+‬‬
‫‪8‬‬
‫כל הנתונים הוזנו ניתן לקבל חישובים‪:‬‬
‫‪10‬‬
‫נלחץ על ‪ shift‬ואח"כ על ‪2‬‬
‫‪7‬‬
‫‪3‬‬
‫נקבל על המסך ‪:‬‬
‫‪xn  1‬‬
‫‪2‬‬
‫‪1‬‬
‫‪xn‬‬
‫‪x‬‬
‫כאשר נלחץ ‪ 1‬ואח"כ = נקבל את הממוצע‬
‫כאשר נלחץ ‪ 2‬ואח"כ = נקבל את סטית התקן‬
‫‪‬‬
‫כאשר נלחץ ‪ 3‬ואח"כ = נקבל אומדן לסטיית התקן באוכלוסיה ‪S‬‬
‫אם הזנתם את הנתונים הרשומים בטבלה הנ"ל תקבלו‪:‬‬
‫‪x7‬‬
‫‪xn  2‬‬
‫‪xn  1  2.236‬‬
‫כאשר עובדים עם נתונים עם שכיחות (מספר הפעמים שמופיע כל נתון)‪:‬‬
‫‪ .1‬נזין את הנתונים כפי שהזנו בדוגמא הקודמת‬
‫‪ .2‬נזין את השכיחות ‪ :‬נלחץ על החץ התחתון (בכפתור ה‪) Replay -‬‬
‫נקבל את ערך ‪ , x1‬נלחץ שוב על החץ התחתון נקבל ‪ Freq1 ‬כלומר נוכל להזין את השכיחות של‬
‫משתנה מס' ‪ 1‬נלחץ = את המספר ושוב =‬
‫וכך נרד ונזין את כל השכיחויות‬
‫‪351‬‬
‫‪ .3‬לאחר שהזנו את כל הנתונים ניתן לקבל את כל החישובים בהתאם לסעיף הקודם‬
‫אם עקבתם אחרי ההסבר והזנתם את נתוני הטבלה הנ"ל תקבלו‪:‬‬
‫‪xn  1  1.67‬‬
‫‪xn  1.63‬‬
‫‪x  7.238‬‬
‫שימוש במקש ‪ shift‬ואח"כ ‪ 1‬יפתח מסך‬
‫‪3‬‬
‫= נקבל את סה"כ הנבדקים ‪n‬‬
‫‪fi‬‬
‫‪2‬‬
‫‪5‬‬
‫‪7‬‬
‫‪3‬‬
‫‪4‬‬
‫‪xi‬‬
‫‪4‬‬
‫‪6‬‬
‫‪8‬‬
‫‪10‬‬
‫‪7‬‬
‫‪=2‬‬
‫‪n‬‬
‫‪Ex ‬‬
‫‪Ex 2 ‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫נקבל את סה"כ עמוד ‪xi  fi‬‬
‫‪ = 1‬נקבל את סה"כ עמודת ‪ ( xi  x)2 fi‬כלומר ‪E ( xi  x)2 fi‬‬
‫‪Replay‬‬
‫‪ - Mode 2‬כניסה‬
‫‪- Mode 1‬יציאה‬
‫‪Shift 2‬‬
‫‪M+‬‬
‫הזנת נתונים‬
‫‪Shift 1‬‬
‫‪352‬‬
‫לוח התפלגות נורמאלית – ‪Z‬‬
‫‪The Standardized Normal Distribution‬‬
‫‪0.09‬‬
‫‪0.0010‬‬
‫‪0.0014‬‬
‫‪0.0019‬‬
‫‪0.0026‬‬
‫‪0.0036‬‬
‫‪0.0048‬‬
‫‪0.0064‬‬
‫‪0.0084‬‬
‫‪0.0110‬‬
‫‪0.0143‬‬
‫‪0.0183‬‬
‫‪0.0233‬‬
‫‪0.0294‬‬
‫‪0.0367‬‬
‫‪0.0455‬‬
‫‪0.0560‬‬
‫‪0.0680‬‬
‫‪0.0820‬‬
‫‪0.0980‬‬
‫‪0.1170‬‬
‫‪0.1380‬‬
‫‪0.1610‬‬
‫‪0.1870‬‬
‫‪0.2150‬‬
‫‪0.2450‬‬
‫‪0.2780‬‬
‫‪0.3120‬‬
‫‪0.3480‬‬
‫‪0.3859‬‬
‫‪0.4247‬‬
‫‪0.5359‬‬
‫‪0.5753‬‬
‫‪0.6141‬‬
‫‪0.6517‬‬
‫‪0.6879‬‬
‫‪0.7224‬‬
‫‪0.7549‬‬
‫‪0.7852‬‬
‫‪0.8133‬‬
‫‪0.8389‬‬
‫‪0.8621‬‬
‫‪0.8830‬‬
‫‪0.9015‬‬
‫‪0.9177‬‬
‫‪0.9319‬‬
‫‪0.9441‬‬
‫‪0.9545‬‬
‫‪0.9633‬‬
‫‪0.9706‬‬
‫‪0.9767‬‬
‫‪0.9817‬‬
‫‪0.9857‬‬
‫‪0.9890‬‬
‫‪0.9916‬‬
‫‪0.9936‬‬
‫‪0.9952‬‬
‫‪0.9964‬‬
‫‪0.9974‬‬
‫‪0.9981‬‬
‫‪0.9986‬‬
‫‪0.9990‬‬
‫‪0.08‬‬
‫‪0.0010‬‬
‫‪0.0014‬‬
‫‪0.0020‬‬
‫‪0.0027‬‬
‫‪0.0037‬‬
‫‪0.0049‬‬
‫‪0.0066‬‬
‫‪0.0087‬‬
‫‪0.0113‬‬
‫‪0.0146‬‬
‫‪0.0188‬‬
‫‪0.0238‬‬
‫‪0.0301‬‬
‫‪0.0375‬‬
‫‪0.0465‬‬
‫‪0.0570‬‬
‫‪0.0690‬‬
‫‪0.0840‬‬
‫‪0.1000‬‬
‫‪0.1190‬‬
‫‪0.1400‬‬
‫‪0.1630‬‬
‫‪0.1890‬‬
‫‪0.2180‬‬
‫‪0.2480‬‬
‫‪0.2810‬‬
‫‪0.3160‬‬
‫‪0.3520‬‬
‫‪0.3897‬‬
‫‪0.4286‬‬
‫‪0.5319‬‬
‫‪0.5714‬‬
‫‪0.6103‬‬
‫‪0.6480‬‬
‫‪0.6844‬‬
‫‪0.7190‬‬
‫‪0.7517‬‬
‫‪0.7823‬‬
‫‪0.8106‬‬
‫‪0.8365‬‬
‫‪0.8599‬‬
‫‪0.8810‬‬
‫‪0.8997‬‬
‫‪0.9162‬‬
‫‪0.9306‬‬
‫‪0.9429‬‬
‫‪0.9535‬‬
‫‪0.9625‬‬
‫‪0.9699‬‬
‫‪0.9761‬‬
‫‪0.9812‬‬
‫‪0.9854‬‬
‫‪0.9887‬‬
‫‪0.9913‬‬
‫‪0.9934‬‬
‫‪0.9951‬‬
‫‪0.9963‬‬
‫‪0.9973‬‬
‫‪0.9980‬‬
‫‪0.9986‬‬
‫‪0.9990‬‬
‫‪0.07‬‬
‫‪0.0011‬‬
‫‪0.0015‬‬
‫‪0.0021‬‬
‫‪0.0028‬‬
‫‪0.0038‬‬
‫‪0.0051‬‬
‫‪0.0068‬‬
‫‪0.0089‬‬
‫‪0.0116‬‬
‫‪0.0150‬‬
‫‪0.0192‬‬
‫‪0.0244‬‬
‫‪0.0307‬‬
‫‪0.0384‬‬
‫‪0.0475‬‬
‫‪0.0580‬‬
‫‪0.0710‬‬
‫‪0.0850‬‬
‫‪0.1020‬‬
‫‪0.1210‬‬
‫‪0.1420‬‬
‫‪0.1660‬‬
‫‪0.1920‬‬
‫‪0.2210‬‬
‫‪0.2510‬‬
‫‪0.2840‬‬
‫‪0.3190‬‬
‫‪0.3560‬‬
‫‪0.3936‬‬
‫‪0.4325‬‬
‫‪0.5279‬‬
‫‪0.5675‬‬
‫‪0.6064‬‬
‫‪0.6443‬‬
‫‪0.6808‬‬
‫‪0.7157‬‬
‫‪0.7486‬‬
‫‪0.7794‬‬
‫‪0.8078‬‬
‫‪0.8340‬‬
‫‪0.8577‬‬
‫‪0.8790‬‬
‫‪0.8980‬‬
‫‪0.9147‬‬
‫‪0.9292‬‬
‫‪0.9418‬‬
‫‪0.9525‬‬
‫‪0.9616‬‬
‫‪0.9693‬‬
‫‪0.9756‬‬
‫‪0.9808‬‬
‫‪0.9850‬‬
‫‪0.9884‬‬
‫‪0.9911‬‬
‫‪0.9932‬‬
‫‪0.9949‬‬
‫‪0.9962‬‬
‫‪0.9972‬‬
‫‪0.9979‬‬
‫‪0.9985‬‬
‫‪0.9989‬‬
‫‪0.06‬‬
‫‪0.0011‬‬
‫‪0.0015‬‬
‫‪0.0021‬‬
‫‪0.0029‬‬
‫‪0.0039‬‬
‫‪0.0052‬‬
‫‪0.0069‬‬
‫‪0.0091‬‬
‫‪0.0119‬‬
‫‪0.0154‬‬
‫‪0.0197‬‬
‫‪0.0250‬‬
‫‪0.0314‬‬
‫‪0.0392‬‬
‫‪0.0485‬‬
‫‪0.0590‬‬
‫‪0.0720‬‬
‫‪0.0870‬‬
‫‪0.1040‬‬
‫‪0.1230‬‬
‫‪0.1450‬‬
‫‪0.1680‬‬
‫‪0.1950‬‬
‫‪0.2240‬‬
‫‪0.2550‬‬
‫‪0.2880‬‬
‫‪0.3230‬‬
‫‪0.3590‬‬
‫‪0.3974‬‬
‫‪0.4364‬‬
‫‪0.5239‬‬
‫‪0.5636‬‬
‫‪0.6026‬‬
‫‪0.6406‬‬
‫‪0.6772‬‬
‫‪0.7123‬‬
‫‪0.7454‬‬
‫‪0.7764‬‬
‫‪0.8051‬‬
‫‪0.8315‬‬
‫‪0.8554‬‬
‫‪0.8770‬‬
‫‪0.8962‬‬
‫‪0.9131‬‬
‫‪0.9279‬‬
‫‪0.9406‬‬
‫‪0.9515‬‬
‫‪0.9608‬‬
‫‪0.9686‬‬
‫‪0.9750‬‬
‫‪0.9803‬‬
‫‪0.9846‬‬
‫‪0.9881‬‬
‫‪0.9909‬‬
‫‪0.9931‬‬
‫‪0.9948‬‬
‫‪0.9961‬‬
‫‪0.9971‬‬
‫‪0.9979‬‬
‫‪0.9985‬‬
‫‪0.9989‬‬
‫‪0.05‬‬
‫‪0.0011‬‬
‫‪0.0016‬‬
‫‪0.0022‬‬
‫‪0.0030‬‬
‫‪0.0040‬‬
‫‪0.0054‬‬
‫‪0.0071‬‬
‫‪0.0094‬‬
‫‪0.0122‬‬
‫‪0.0158‬‬
‫‪0.0202‬‬
‫‪0.0256‬‬
‫‪0.0322‬‬
‫‪0.0401‬‬
‫‪0.0495‬‬
‫‪0.0610‬‬
‫‪0.0740‬‬
‫‪0.0890‬‬
‫‪0.1060‬‬
‫‪0.1250‬‬
‫‪0.1470‬‬
‫‪0.1710‬‬
‫‪0.1980‬‬
‫‪0.2270‬‬
‫‪0.2580‬‬
‫‪0.2910‬‬
‫‪0.3260‬‬
‫‪0.3630‬‬
‫‪0.4013‬‬
‫‪0.4404‬‬
‫‪0.5199‬‬
‫‪0.5596‬‬
‫‪0.5987‬‬
‫‪0.6368‬‬
‫‪0.6736‬‬
‫‪0.7088‬‬
‫‪0.7422‬‬
‫‪0.7734‬‬
‫‪0.8023‬‬
‫‪0.8289‬‬
‫‪0.8531‬‬
‫‪0.8749‬‬
‫‪0.8944‬‬
‫‪0.9115‬‬
‫‪0.9265‬‬
‫‪0.9394‬‬
‫‪0.9505‬‬
‫‪0.9599‬‬
‫‪0.9678‬‬
‫‪0.9744‬‬
‫‪0.9798‬‬
‫‪0.9842‬‬
‫‪0.9878‬‬
‫‪0.9906‬‬
‫‪0.9929‬‬
‫‪0.9946‬‬
‫‪0.9960‬‬
‫‪0.9970‬‬
‫‪0.9978‬‬
‫‪0.9984‬‬
‫‪0.9989‬‬
‫‪0.04‬‬
‫‪0.0012‬‬
‫‪0.0016‬‬
‫‪0.0023‬‬
‫‪0.0031‬‬
‫‪0.0041‬‬
‫‪0.0055‬‬
‫‪0.0073‬‬
‫‪0.0096‬‬
‫‪0.0125‬‬
‫‪0.0162‬‬
‫‪0.0207‬‬
‫‪0.0262‬‬
‫‪0.0329‬‬
‫‪0.0409‬‬
‫‪0.0505‬‬
‫‪0.0620‬‬
‫‪0.0750‬‬
‫‪0.0900‬‬
‫‪0.1070‬‬
‫‪0.1270‬‬
‫‪0.1490‬‬
‫‪0.1740‬‬
‫‪0.2000‬‬
‫‪0.2300‬‬
‫‪0.2610‬‬
‫‪0.2950‬‬
‫‪0.3300‬‬
‫‪0.3670‬‬
‫‪0.4052‬‬
‫‪0.4443‬‬
‫‪0.5160‬‬
‫‪0.5557‬‬
‫‪0.5948‬‬
‫‪0.6331‬‬
‫‪0.6700‬‬
‫‪0.7054‬‬
‫‪0.7389‬‬
‫‪0.7704‬‬
‫‪0.7995‬‬
‫‪0.8264‬‬
‫‪0.8508‬‬
‫‪0.8729‬‬
‫‪0.8925‬‬
‫‪0.9099‬‬
‫‪0.9251‬‬
‫‪0.9382‬‬
‫‪0.9495‬‬
‫‪0.9591‬‬
‫‪0.9671‬‬
‫‪0.9738‬‬
‫‪0.9793‬‬
‫‪0.9838‬‬
‫‪0.9875‬‬
‫‪0.9904‬‬
‫‪0.9927‬‬
‫‪0.9945‬‬
‫‪0.9959‬‬
‫‪0.9969‬‬
‫‪0.9977‬‬
‫‪0.9984‬‬
‫‪0.9988‬‬
‫‪0.03‬‬
‫‪0.0012‬‬
‫‪0.0017‬‬
‫‪0.0023‬‬
‫‪0.0032‬‬
‫‪0.0043‬‬
‫‪0.0057‬‬
‫‪0.0075‬‬
‫‪0.0099‬‬
‫‪0.0129‬‬
‫‪0.0166‬‬
‫‪0.0212‬‬
‫‪0.0268‬‬
‫‪0.0336‬‬
‫‪0.0418‬‬
‫‪0.0520‬‬
‫‪0.0630‬‬
‫‪0.0760‬‬
‫‪0.0920‬‬
‫‪0.1090‬‬
‫‪0.1290‬‬
‫‪0.1520‬‬
‫‪0.1760‬‬
‫‪0.2030‬‬
‫‪0.2330‬‬
‫‪0.2640‬‬
‫‪0.2980‬‬
‫‪0.3340‬‬
‫‪0.3710‬‬
‫‪0.4009‬‬
‫‪0.4483‬‬
‫‪0.5120‬‬
‫‪0.5517‬‬
‫‪0.5910‬‬
‫‪0.6293‬‬
‫‪0.6664‬‬
‫‪0.7019‬‬
‫‪0.7357‬‬
‫‪0.7673‬‬
‫‪0.7967‬‬
‫‪0.8238‬‬
‫‪0.8485‬‬
‫‪0.8708‬‬
‫‪0.8907‬‬
‫‪0.9082‬‬
‫‪0.9236‬‬
‫‪0.9370‬‬
‫‪0.9484‬‬
‫‪0.9582‬‬
‫‪0.9664‬‬
‫‪0.9732‬‬
‫‪0.9788‬‬
‫‪0.9834‬‬
‫‪0.9871‬‬
‫‪0.9901‬‬
‫‪0.9925‬‬
‫‪0.9943‬‬
‫‪0.9957‬‬
‫‪0.9968‬‬
‫‪0.9977‬‬
‫‪0.9983‬‬
‫‪0.9988‬‬
‫‪0.02‬‬
‫‪0.0013‬‬
‫‪0.0017‬‬
‫‪0.0024‬‬
‫‪0.0033‬‬
‫‪0.0044‬‬
‫‪0.0059‬‬
‫‪0.0078‬‬
‫‪0.0102‬‬
‫‪0.0132‬‬
‫‪0.0170‬‬
‫‪0.0217‬‬
‫‪0.0274‬‬
‫‪0.0344‬‬
‫‪0.0427‬‬
‫‪0.0530‬‬
‫‪0.0640‬‬
‫‪0.0780‬‬
‫‪0.0930‬‬
‫‪0.1110‬‬
‫‪0.1310‬‬
‫‪0.1540‬‬
‫‪0.1790‬‬
‫‪0.2060‬‬
‫‪0.2360‬‬
‫‪0.2680‬‬
‫‪0.3010‬‬
‫‪0.3370‬‬
‫‪0.3750‬‬
‫‪0.4129‬‬
‫‪0.4522‬‬
‫‪0.5080‬‬
‫‪0.5478‬‬
‫‪0.5871‬‬
‫‪0.6255‬‬
‫‪0.6628‬‬
‫‪0.6985‬‬
‫‪0.7324‬‬
‫‪0.7642‬‬
‫‪0.7939‬‬
‫‪0.8212‬‬
‫‪0.8461‬‬
‫‪0.8686‬‬
‫‪0.8888‬‬
‫‪0.9066‬‬
‫‪0.9222‬‬
‫‪0.9357‬‬
‫‪0.9474‬‬
‫‪0.9573‬‬
‫‪0.9656‬‬
‫‪0.9726‬‬
‫‪0.9783‬‬
‫‪0.9830‬‬
‫‪0.9868‬‬
‫‪0.9898‬‬
‫‪0.9922‬‬
‫‪0.9941‬‬
‫‪0.9956‬‬
‫‪0.9967‬‬
‫‪0.9976‬‬
‫‪0.9982‬‬
‫‪0.9987‬‬
‫‪0.01‬‬
‫‪0.0013‬‬
‫‪0.0018‬‬
‫‪0.0025‬‬
‫‪0.0034‬‬
‫‪0.0045‬‬
‫‪0.0060‬‬
‫‪0.0080‬‬
‫‪0.0104‬‬
‫‪0.0135‬‬
‫‪0.0174‬‬
‫‪0.0222‬‬
‫‪0.0281‬‬
‫‪0.0350‬‬
‫‪0.0436‬‬
‫‪0.0540‬‬
‫‪0.0650‬‬
‫‪0.0790‬‬
‫‪0.0950‬‬
‫‪0.1130‬‬
‫‪0.1340‬‬
‫‪0.1560‬‬
‫‪0.1810‬‬
‫‪0.2090‬‬
‫‪0.2390‬‬
‫‪0.2710‬‬
‫‪0.3050‬‬
‫‪0.3410‬‬
‫‪0.3780‬‬
‫‪0.4168‬‬
‫‪0.4562‬‬
‫‪0.5040‬‬
‫‪0.5438‬‬
‫‪0.5832‬‬
‫‪0.6217‬‬
‫‪0.6591‬‬
‫‪0.6950‬‬
‫‪0.7291‬‬
‫‪0.7611‬‬
‫‪0.7910‬‬
‫‪0.8186‬‬
‫‪0.8438‬‬
‫‪0.8665‬‬
‫‪0.8869‬‬
‫‪0.9049‬‬
‫‪0.9207‬‬
‫‪0.9345‬‬
‫‪0.9463‬‬
‫‪0.9564‬‬
‫‪0.9649‬‬
‫‪0.9719‬‬
‫‪0.9778‬‬
‫‪0.9826‬‬
‫‪0.9864‬‬
‫‪0.9896‬‬
‫‪0.9920‬‬
‫‪0.9940‬‬
‫‪0.9955‬‬
‫‪0.9966‬‬
‫‪0.9975‬‬
‫‪0.9982‬‬
‫‪0.9987‬‬
‫‪Z‬‬
‫‪-3.0‬‬
‫‪-2.9‬‬
‫‪-2.8‬‬
‫‪-2.7‬‬
‫‪-2.6‬‬
‫‪-2.5‬‬
‫‪-2.4‬‬
‫‪-2.3‬‬
‫‪-2.2‬‬
‫‪-2.1‬‬
‫‪-2.0‬‬
‫‪-1.9‬‬
‫‪-1.8‬‬
‫‪-1.7‬‬
‫‪-1.6‬‬
‫‪-1.5‬‬
‫‪-1.4‬‬
‫‪-1.3‬‬
‫‪-1.2‬‬
‫‪-1.1‬‬
‫‪-1.0‬‬
‫‪-0.9‬‬
‫‪-0.8‬‬
‫‪-0.7‬‬
‫‪-0.6‬‬
‫‪-0.5‬‬
‫‪-0.4‬‬
‫‪-0.3‬‬
‫‪-0.2‬‬
‫‪-0.1‬‬
‫‪0.0‬‬
‫‪0.1‬‬
‫‪0.2‬‬
‫‪0.3‬‬
‫‪0.4‬‬
‫‪0.5‬‬
‫‪0.6‬‬
‫‪0.7‬‬
‫‪0.8‬‬
‫‪0.9‬‬
‫‪1.0‬‬
‫‪1.1‬‬
‫‪1.2‬‬
‫‪1.3‬‬
‫‪1.4‬‬
‫‪1.5‬‬
‫‪1.6‬‬
‫‪1.7‬‬
‫‪1.8‬‬
‫‪1.9‬‬
‫‪2.0‬‬
‫‪2.1‬‬
‫‪2.2‬‬
‫‪2.3‬‬
‫‪2.4‬‬
‫‪2.5‬‬
‫‪2.6‬‬
‫‪2.7‬‬
‫‪2.8‬‬
‫‪2.9‬‬
‫‪3.0‬‬
‫‪0.00‬‬
‫‪0.0013‬‬
‫‪0.0019‬‬
‫‪0.0026‬‬
‫‪0.0035‬‬
‫‪0.0046‬‬
‫‪0.0062‬‬
‫‪0.0082‬‬
‫‪0.0107‬‬
‫‪0.0139‬‬
‫‪0.0179‬‬
‫‪0.0227‬‬
‫‪0.0287‬‬
‫‪0.0359‬‬
‫‪0.0446‬‬
‫‪0.0550‬‬
‫‪0.0670‬‬
‫‪0.0810‬‬
‫‪0.0970‬‬
‫‪0.1150‬‬
‫‪0.1360‬‬
‫‪0.1590‬‬
‫‪0.1840‬‬
‫‪0.2120‬‬
‫‪0.2420‬‬
‫‪0.2740‬‬
‫‪0.3080‬‬
‫‪0.3450‬‬
‫‪0.3820‬‬
‫‪0.4207‬‬
‫‪0.4602‬‬
‫‪0.5000‬‬
‫‪0.5398‬‬
‫‪0.5793‬‬
‫‪0.6179‬‬
‫‪0.6554‬‬
‫‪0.6915‬‬
‫‪0.7257‬‬
‫‪0.7580‬‬
‫‪0.7881‬‬
‫‪0.8159‬‬
‫‪0.8413‬‬
‫‪0.8643‬‬
‫‪0.8849‬‬
‫‪0.9032‬‬
‫‪0.9192‬‬
‫‪0.9332‬‬
‫‪0.9452‬‬
‫‪0.9554‬‬
‫‪0.9641‬‬
‫‪0.9713‬‬
‫‪0.9772‬‬
‫‪0.9821‬‬
‫‪0.9861‬‬
‫‪0.9893‬‬
‫‪0.9918‬‬
‫‪0.9938‬‬
‫‪0.9953‬‬
‫‪0.9965‬‬
‫‪0.9974‬‬
‫‪0.9981‬‬
‫‪0.9987‬‬
‫‪353‬‬
‫לוח התפלגות ‪ - t‬ערכי ‪ t‬קריטיים‬
‫‪Student t distribution – Critical Values of t‬‬
‫‪df / 1  ‬‬
‫‪0.9995‬‬
‫‪636.578‬‬
‫‪31.600‬‬
‫‪12.924‬‬
‫‪8.610‬‬
‫‪6.869‬‬
‫‪5.959‬‬
‫‪5.408‬‬
‫‪0.995‬‬
‫‪63.656‬‬
‫‪9.925‬‬
‫‪5.841‬‬
‫‪4.604‬‬
‫‪4.032‬‬
‫‪3.707‬‬
‫‪3.499‬‬
‫‪0.99‬‬
‫‪31.821‬‬
‫‪6.965‬‬
‫‪4.541‬‬
‫‪3.747‬‬
‫‪3.365‬‬
‫‪3.143‬‬
‫‪2.998‬‬
‫‪0.975‬‬
‫‪12.706‬‬
‫‪4.303‬‬
‫‪3.182‬‬
‫‪2.776‬‬
‫‪2.571‬‬
‫‪2.447‬‬
‫‪2.365‬‬
‫‪0.95‬‬
‫‪6.314‬‬
‫‪2.920‬‬
‫‪2.353‬‬
‫‪2.132‬‬
‫‪2.015‬‬
‫‪1.943‬‬
‫‪1.895‬‬
‫‪0.9‬‬
‫‪3.078‬‬
‫‪1.886‬‬
‫‪1.638‬‬
‫‪1.533‬‬
‫‪1.476‬‬
‫‪1.440‬‬
‫‪1.415‬‬
‫‪0.75‬‬
‫‪1.000‬‬
‫‪0.816‬‬
‫‪0.765‬‬
‫‪0.741‬‬
‫‪0.727‬‬
‫‪0.718‬‬
‫‪0.711‬‬
‫‪0.6‬‬
‫‪0.325‬‬
‫‪0.289‬‬
‫‪0.277‬‬
‫‪0.271‬‬
‫‪0.267‬‬
‫‪0.265‬‬
‫‪0.263‬‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫‪6‬‬
‫‪7‬‬
‫‪5.041‬‬
‫‪4.781‬‬
‫‪4.587‬‬
‫‪4.437‬‬
‫‪4.318‬‬
‫‪4.221‬‬
‫‪4.140‬‬
‫‪4.073‬‬
‫‪4.015‬‬
‫‪3.355‬‬
‫‪3.250‬‬
‫‪3.169‬‬
‫‪3.106‬‬
‫‪3.055‬‬
‫‪3.012‬‬
‫‪2.977‬‬
‫‪2.947‬‬
‫‪2.921‬‬
‫‪2.896‬‬
‫‪2.821‬‬
‫‪2.764‬‬
‫‪2.718‬‬
‫‪2.681‬‬
‫‪2.650‬‬
‫‪2.624‬‬
‫‪2.602‬‬
‫‪2.583‬‬
‫‪2.306‬‬
‫‪2.262‬‬
‫‪2.228‬‬
‫‪2.201‬‬
‫‪2.179‬‬
‫‪2.160‬‬
‫‪2.145‬‬
‫‪2.131‬‬
‫‪2.120‬‬
‫‪1.860‬‬
‫‪1.833‬‬
‫‪1.812‬‬
‫‪1.796‬‬
‫‪1.782‬‬
‫‪1.771‬‬
‫‪1.761‬‬
‫‪1.753‬‬
‫‪1.746‬‬
‫‪1.397‬‬
‫‪1.383‬‬
‫‪1.372‬‬
‫‪1.363‬‬
‫‪1.356‬‬
‫‪1.350‬‬
‫‪1.345‬‬
‫‪1.341‬‬
‫‪1.337‬‬
‫‪0.706‬‬
‫‪0.703‬‬
‫‪0.700‬‬
‫‪0.697‬‬
‫‪0.695‬‬
‫‪0.694‬‬
‫‪0.692‬‬
‫‪0.691‬‬
‫‪0.690‬‬
‫‪0.262‬‬
‫‪0.261‬‬
‫‪0.260‬‬
‫‪0.260‬‬
‫‪0.259‬‬
‫‪0.259‬‬
‫‪0.258‬‬
‫‪0.258‬‬
‫‪0.258‬‬
‫‪8‬‬
‫‪9‬‬
‫‪10‬‬
‫‪11‬‬
‫‪12‬‬
‫‪13‬‬
‫‪14‬‬
‫‪15‬‬
‫‪16‬‬
‫‪3.965‬‬
‫‪3.922‬‬
‫‪3.883‬‬
‫‪3.850‬‬
‫‪3.819‬‬
‫‪3.792‬‬
‫‪3.768‬‬
‫‪3.745‬‬
‫‪2.898‬‬
‫‪2.878‬‬
‫‪2.861‬‬
‫‪2.845‬‬
‫‪2.831‬‬
‫‪2.819‬‬
‫‪2.807‬‬
‫‪2.797‬‬
‫‪2.567‬‬
‫‪2.552‬‬
‫‪2.539‬‬
‫‪2.528‬‬
‫‪2.518‬‬
‫‪2.508‬‬
‫‪2.500‬‬
‫‪2.492‬‬
‫‪2.110‬‬
‫‪2.101‬‬
‫‪2.093‬‬
‫‪2.086‬‬
‫‪2.080‬‬
‫‪2.074‬‬
‫‪2.069‬‬
‫‪2.064‬‬
‫‪1.740‬‬
‫‪1.734‬‬
‫‪1.729‬‬
‫‪1.725‬‬
‫‪1.721‬‬
‫‪1.717‬‬
‫‪1.714‬‬
‫‪1.711‬‬
‫‪1.333‬‬
‫‪1.330‬‬
‫‪1.328‬‬
‫‪1.325‬‬
‫‪1.323‬‬
‫‪1.321‬‬
‫‪1.319‬‬
‫‪1.318‬‬
‫‪0.689‬‬
‫‪0.688‬‬
‫‪0.688‬‬
‫‪0.687‬‬
‫‪0.686‬‬
‫‪0.686‬‬
‫‪0.685‬‬
‫‪0.685‬‬
‫‪0.257‬‬
‫‪0.257‬‬
‫‪0.257‬‬
‫‪0.257‬‬
‫‪0.257‬‬
‫‪0.256‬‬
‫‪0.256‬‬
‫‪0.256‬‬
‫‪17‬‬
‫‪18‬‬
‫‪19‬‬
‫‪20‬‬
‫‪21‬‬
‫‪22‬‬
‫‪23‬‬
‫‪24‬‬
‫‪3.725‬‬
‫‪3.707‬‬
‫‪3.689‬‬
‫‪3.674‬‬
‫‪3.660‬‬
‫‪3.646‬‬
‫‪3.551‬‬
‫‪3.460‬‬
‫‪2.787‬‬
‫‪2.779‬‬
‫‪2.771‬‬
‫‪2.763‬‬
‫‪2.756‬‬
‫‪2.750‬‬
‫‪2.704‬‬
‫‪2.660‬‬
‫‪2.485‬‬
‫‪2.479‬‬
‫‪2.473‬‬
‫‪2.467‬‬
‫‪2.462‬‬
‫‪2.457‬‬
‫‪2.423‬‬
‫‪2.390‬‬
‫‪2.060‬‬
‫‪2.056‬‬
‫‪2.052‬‬
‫‪2.048‬‬
‫‪2.045‬‬
‫‪2.042‬‬
‫‪2.021‬‬
‫‪2.000‬‬
‫‪1.708‬‬
‫‪1.706‬‬
‫‪1.703‬‬
‫‪1.701‬‬
‫‪1.699‬‬
‫‪1.697‬‬
‫‪1.684‬‬
‫‪1.671‬‬
‫‪1.316‬‬
‫‪1.315‬‬
‫‪1.314‬‬
‫‪1.313‬‬
‫‪1.311‬‬
‫‪1.310‬‬
‫‪1.303‬‬
‫‪1.296‬‬
‫‪0.684‬‬
‫‪0.684‬‬
‫‪0.684‬‬
‫‪0.683‬‬
‫‪0.683‬‬
‫‪0.683‬‬
‫‪0.681‬‬
‫‪0.679‬‬
‫‪0.256‬‬
‫‪0.256‬‬
‫‪0.256‬‬
‫‪0.256‬‬
‫‪0.256‬‬
‫‪0.256‬‬
‫‪0.255‬‬
‫‪0.254‬‬
‫‪25‬‬
‫‪26‬‬
‫‪27‬‬
‫‪28‬‬
‫‪29‬‬
‫‪30‬‬
‫‪40‬‬
‫‪60‬‬
‫‪3.373‬‬
‫‪3.291‬‬
‫‪2.617‬‬
‫‪2.576‬‬
‫‪2.358‬‬
‫‪2.326‬‬
‫‪1.980‬‬
‫‪1.960‬‬
‫‪1.658‬‬
‫‪1.645‬‬
‫‪1.289‬‬
‫‪1.282‬‬
‫‪0.677‬‬
‫‪0.674‬‬
‫‪0.254‬‬
‫‪0.253‬‬
‫‪120‬‬
‫‪‬‬
‫‪354‬‬
‫‪2‬‬
‫‪0.995‬‬
‫‪7.8794‬‬
‫‪10.60‬‬
‫‪12.84‬‬
‫‪14.86‬‬
‫‪16.75‬‬
‫‪18.55‬‬
‫‪20.28‬‬
‫‪21.95‬‬
‫‪23.59‬‬
‫‪25.19‬‬
‫‪26.76‬‬
‫‪28.30‬‬
‫‪29.82‬‬
‫‪31.32‬‬
‫‪32.80‬‬
‫‪34.27‬‬
‫‪35.72‬‬
‫‪37.16‬‬
‫‪38.58‬‬
‫‪40.00‬‬
‫‪41.40‬‬
‫‪42.80‬‬
‫‪44.18‬‬
‫‪45.56‬‬
‫‪46.93‬‬
‫‪48.29‬‬
‫‪49.65‬‬
‫‪50.99‬‬
‫‪52.34‬‬
‫‪53.67‬‬
‫‪79.49‬‬
‫‪116.32‬‬
‫‪140.17‬‬
‫‪0.99‬‬
‫‪6.6349‬‬
‫‪9.21‬‬
‫‪11.34‬‬
‫‪13.28‬‬
‫‪15.09‬‬
‫‪16.81‬‬
‫‪18.48‬‬
‫‪20.09‬‬
‫‪21.67‬‬
‫‪23.21‬‬
‫‪24.73‬‬
‫‪26.22‬‬
‫‪27.69‬‬
‫‪29.14‬‬
‫‪30.58‬‬
‫‪32.00‬‬
‫‪33.41‬‬
‫‪34.81‬‬
‫‪36.19‬‬
‫‪37.57‬‬
‫‪38.93‬‬
‫‪40.29‬‬
‫‪41.64‬‬
‫‪42.98‬‬
‫‪44.31‬‬
‫‪45.64‬‬
‫‪46.96‬‬
‫‪48.28‬‬
‫‪49.59‬‬
‫‪50.89‬‬
‫‪76.15‬‬
‫‪112.33‬‬
‫‪135.81‬‬
‫‪0.975‬‬
‫‪5.0239‬‬
‫‪7.38‬‬
‫‪9.35‬‬
‫‪11.14‬‬
‫‪12.83‬‬
‫‪14.45‬‬
‫‪16.01‬‬
‫‪17.53‬‬
‫‪19.02‬‬
‫‪20.48‬‬
‫‪21.92‬‬
‫‪23.34‬‬
‫‪24.74‬‬
‫‪26.12‬‬
‫‪27.49‬‬
‫‪28.85‬‬
‫‪30.19‬‬
‫‪31.53‬‬
‫‪32.85‬‬
‫‪34.17‬‬
‫‪35.48‬‬
‫‪36.78‬‬
‫‪38.08‬‬
‫‪39.36‬‬
‫‪40.65‬‬
‫‪41.92‬‬
‫‪43.19‬‬
‫‪44.46‬‬
‫‪45.72‬‬
‫‪46.98‬‬
‫‪71.42‬‬
‫‪106.63‬‬
‫‪129.56‬‬
‫‪0.95‬‬
‫‪3.8415‬‬
‫‪5.99‬‬
‫‪7.81‬‬
‫‪9.49‬‬
‫‪11.07‬‬
‫‪12.59‬‬
‫‪14.07‬‬
‫‪15.51‬‬
‫‪16.92‬‬
‫‪18.31‬‬
‫‪19.68‬‬
‫‪21.03‬‬
‫‪22.36‬‬
‫‪23.68‬‬
‫‪25.00‬‬
‫‪26.30‬‬
‫‪27.59‬‬
‫‪28.87‬‬
‫‪30.14‬‬
‫‪31.41‬‬
‫‪32.67‬‬
‫‪33.92‬‬
‫‪35.17‬‬
‫‪36.42‬‬
‫‪37.65‬‬
‫‪38.89‬‬
‫‪40.11‬‬
‫‪41.34‬‬
‫‪42.56‬‬
‫‪43.77‬‬
‫‪67.50‬‬
‫‪101.88‬‬
‫‪124.34‬‬
‫‪‬‬
‫‪0.9‬‬
‫‪2.7055‬‬
‫‪4.61‬‬
‫‪6.25‬‬
‫‪7.78‬‬
‫‪9.24‬‬
‫‪10.64‬‬
‫‪12.02‬‬
‫‪13.36‬‬
‫‪14.68‬‬
‫‪15.99‬‬
‫‪17.28‬‬
‫‪18.55‬‬
‫‪19.81‬‬
‫‪21.06‬‬
‫‪22.31‬‬
‫‪23.54‬‬
‫‪24.77‬‬
‫‪25.99‬‬
‫‪27.20‬‬
‫‪28.41‬‬
‫‪29.62‬‬
‫‪30.81‬‬
‫‪32.01‬‬
‫‪33.20‬‬
‫‪34.38‬‬
‫‪35.56‬‬
‫‪36.74‬‬
‫‪37.92‬‬
‫‪39.09‬‬
‫‪40.26‬‬
‫‪63.17‬‬
‫‪96.58‬‬
‫‪118.50‬‬
‫‪2‬‬
‫‪‬‬
‫‪ -‬ערכים קריטיים‬
‫‪Critical Values of‬‬
‫‪0.1‬‬
‫‪0.0158‬‬
‫‪0.21‬‬
‫‪0.58‬‬
‫‪1.06‬‬
‫‪1.61‬‬
‫‪2.20‬‬
‫‪2.83‬‬
‫‪3.49‬‬
‫‪4.17‬‬
‫‪4.87‬‬
‫‪5.58‬‬
‫‪6.30‬‬
‫‪7.04‬‬
‫‪7.79‬‬
‫‪8.55‬‬
‫‪9.31‬‬
‫‪10.09‬‬
‫‪10.86‬‬
‫‪11.65‬‬
‫‪12.44‬‬
‫‪13.24‬‬
‫‪14.04‬‬
‫‪14.85‬‬
‫‪15.66‬‬
‫‪16.47‬‬
‫‪17.29‬‬
‫‪18.11‬‬
‫‪18.94‬‬
‫‪19.77‬‬
‫‪20.60‬‬
‫‪37.69‬‬
‫‪64.28‬‬
‫‪82.36‬‬
‫‪0.05‬‬
‫‪0.0039‬‬
‫‪0.103‬‬
‫‪0.352‬‬
‫‪0.711‬‬
‫‪1.15‬‬
‫‪1.64‬‬
‫‪2.17‬‬
‫‪2.73‬‬
‫‪3.33‬‬
‫‪3.94‬‬
‫‪4.57‬‬
‫‪5.23‬‬
‫‪5.89‬‬
‫‪6.57‬‬
‫‪7.26‬‬
‫‪7.96‬‬
‫‪8.67‬‬
‫‪9.39‬‬
‫‪10.12‬‬
‫‪10.85‬‬
‫‪11.59‬‬
‫‪12.34‬‬
‫‪13.09‬‬
‫‪13.85‬‬
‫‪14.61‬‬
‫‪15.38‬‬
‫‪16.15‬‬
‫‪16.93‬‬
‫‪17.71‬‬
‫‪18.49‬‬
‫‪34.76‬‬
‫‪60.39‬‬
‫‪77.93‬‬
‫‪0.025‬‬
‫‪0.0010‬‬
‫‪0.0506‬‬
‫‪0.216‬‬
‫‪0.484‬‬
‫‪0.831‬‬
‫‪1.24‬‬
‫‪1.69‬‬
‫‪2.18‬‬
‫‪2.70‬‬
‫‪3.25‬‬
‫‪3.82‬‬
‫‪4.40‬‬
‫‪5.01‬‬
‫‪5.63‬‬
‫‪6.26‬‬
‫‪6.91‬‬
‫‪7.56‬‬
‫‪8.23‬‬
‫‪8.91‬‬
‫‪9.59‬‬
‫‪10.28‬‬
‫‪10.98‬‬
‫‪11.69‬‬
‫‪12.40‬‬
‫‪13.12‬‬
‫‪13.84‬‬
‫‪14.57‬‬
‫‪15.31‬‬
‫‪16.05‬‬
‫‪16.79‬‬
‫‪32.36‬‬
‫‪57.15‬‬
‫‪74.22‬‬
‫‪0.01‬‬
‫‪0.0002‬‬
‫‪0.0201‬‬
‫‪0.115‬‬
‫‪0.297‬‬
‫‪0.554‬‬
‫‪0.872‬‬
‫‪1.24‬‬
‫‪1.65‬‬
‫‪2.09‬‬
‫‪2.56‬‬
‫‪3.05‬‬
‫‪3.57‬‬
‫‪4.11‬‬
‫‪4.66‬‬
‫‪5.23‬‬
‫‪5.81‬‬
‫‪6.41‬‬
‫‪7.01‬‬
‫‪7.63‬‬
‫‪8.26‬‬
‫‪8.90‬‬
‫‪9.54‬‬
‫‪10.20‬‬
‫‪10.86‬‬
‫‪11.52‬‬
‫‪12.20‬‬
‫‪12.88‬‬
‫‪13.56‬‬
‫‪14.26‬‬
‫‪14.95‬‬
‫‪29.71‬‬
‫‪53.54‬‬
‫‪70.06‬‬
‫‪0.005‬‬
‫‪0.0000‬‬
‫‪0.0100‬‬
‫‪0.072‬‬
‫‪0.207‬‬
‫‪0.412‬‬
‫‪0.676‬‬
‫‪0.989‬‬
‫‪1.34‬‬
‫‪1.73‬‬
‫‪2.16‬‬
‫‪2.60‬‬
‫‪3.07‬‬
‫‪3.57‬‬
‫‪4.07‬‬
‫‪4.60‬‬
‫‪5.14‬‬
‫‪5.70‬‬
‫‪6.26‬‬
‫‪6.84‬‬
‫‪7.43‬‬
‫‪8.03‬‬
‫‪8.64‬‬
‫‪9.26‬‬
‫‪9.89‬‬
‫‪10.52‬‬
‫‪11.16‬‬
‫‪11.81‬‬
‫‪12.46‬‬
‫‪13.12‬‬
‫‪13.79‬‬
‫‪27.99‬‬
‫‪51.17‬‬
‫‪67.33‬‬
‫‪1‬‬
‫‪2‬‬
‫‪3‬‬
‫‪4‬‬
‫‪5‬‬
‫‪6‬‬
‫‪7‬‬
‫‪8‬‬
‫‪9‬‬
‫‪10‬‬
‫‪11‬‬
‫‪12‬‬
‫‪13‬‬
‫‪14‬‬
‫‪15‬‬
‫‪16‬‬
‫‪17‬‬
‫‪18‬‬
‫‪19‬‬
‫‪20‬‬
‫‪21‬‬
‫‪22‬‬
‫‪23‬‬
‫‪24‬‬
‫‪25‬‬
‫‪26‬‬
‫‪27‬‬
‫‪28‬‬
‫‪29‬‬
‫‪30‬‬
‫‪50‬‬
‫‪80‬‬
‫‪100‬‬
‫‪355‬‬
‫טבלת התפלגות ‪ F‬עבור ‪  0.05‬‬
‫‪INF‬‬
‫‪120‬‬
‫‪60‬‬
‫‪40‬‬
‫‪30‬‬
‫‪24‬‬
‫‪20‬‬
‫‪15‬‬
‫‪12‬‬
‫‪10‬‬
‫‪9‬‬
‫‪8‬‬
‫‪7‬‬
‫‪6‬‬
‫‪5‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫‪df2/df1‬‬
‫‪161.448 199.5 215.707 224.583 230.162 233.99 236.768 238.883 240.543 241.882 243.91 245.95 248.013 249.052 250.095 251.143 252.196 253.253 254.314‬‬
‫‪1‬‬
‫‪18.5128 19 19.1643 19.2468 19.2964 19.33 19.3532 19.371 19.3848 19.3959 19.413 19.4291 19.4458 19.4541 19.4624 19.4707 19.4791 19.4874 19.4957‬‬
‫‪2‬‬
‫‪8.572‬‬
‫‪10.128 9.552 9.2766 9.1172 9.0135 8.9406 8.8867 8.8452 8.8123 8.7855 8.7446 8.7029 8.6602 8.6385 8.6166 8.5944‬‬
‫‪3‬‬
‫‪5.6877 5.6581 5.6281‬‬
‫‪7.7086 6.944 6.5914 6.3882 6.2561 6.1631 6.0942‬‬
‫‪4‬‬
‫‪6.6079 5.786 5.4095 5.1922 5.0503 4.9503 4.8759 4.8183 4.7725 4.7351 4.6777 4.6188 4.5581 4.5272 4.4957 4.4638 4.4314 4.3985‬‬
‫‪5‬‬
‫‪5.9874 5.143 4.7571 4.5337 4.3874 4.2839 4.2067 4.1468‬‬
‫‪6‬‬
‫‪5.5914 4.737 4.3468 4.1203 3.9715 3.866‬‬
‫‪7‬‬
‫‪5.3177 4.459 4.0662 3.8379 3.6875 3.5806 3.5005 3.4381 3.3881 3.3472 3.2839 3.2184 3.1503 3.1152 3.0794 3.0428 3.0053 2.9669 2.9276‬‬
‫‪8‬‬
‫‪5.1174 4.257 3.8625 3.6331 3.4817 3.3738 3.2927 3.2296 3.1789 3.1373 3.0729 3.0061 2.9365 2.9005 2.8637 2.8259 2.7872 2.7475 2.7067‬‬
‫‪9‬‬
‫‪4.9646 4.103 3.7083‬‬
‫‪10‬‬
‫‪2.4045‬‬
‫‪2.448‬‬
‫‪2.5705 2.5309 2.4901‬‬
‫‪4.8443 3.982 3.5874 3.3567 3.2039 3.0946 3.0123‬‬
‫‪11‬‬
‫‪2.2962‬‬
‫‪2.341‬‬
‫‪4.7472 3.885 3.4903 3.2592 3.1059 2.9961 2.9134 2.8486 2.7964 2.7534 2.6866 2.6169 2.5436 2.5055 2.4663 2.4259 2.3842‬‬
‫‪12‬‬
‫‪4.6672 3.806 3.4105 3.1791 3.0254 2.9153 2.8321 2.7669 2.7144‬‬
‫‪13‬‬
‫‪4.6001 3.739 3.3439 3.1122 2.9582 2.8477 2.7642 2.6987 2.6458 2.6022 2.5342 2.463‬‬
‫‪14‬‬
‫‪4.5431 3.682 3.2874 3.0556 2.9013 2.7905 2.7066 2.6408 2.5876 2.5437 2.4753 2.4034 2.3275 2.2878 2.2468 2.2043 2.1601 2.1141 2.0658‬‬
‫‪15‬‬
‫‪8.5494 8.5264‬‬
‫‪4.365‬‬
‫‪5.717‬‬
‫‪5.9988 5.9644 5.9117 5.8578 5.8025 5.7744 5.7459‬‬
‫‪3.9999 3.9381 3.8742 3.8415 3.8082 3.7743 3.7398 3.7047 3.6689‬‬
‫‪4.06‬‬
‫‪4.099‬‬
‫‪6.041‬‬
‫‪3.7257 3.6767 3.6365 3.5747 3.5107 3.4445 3.4105 3.3758 3.3404 3.3043 3.2674 3.2298‬‬
‫‪2.7372 2.6996 2.6609 2.6211 2.5801 2.5379‬‬
‫‪2.609‬‬
‫‪2.774‬‬
‫‪2.845‬‬
‫‪3.3258 3.2172 3.1355 3.0717 3.0204 2.9782 2.913‬‬
‫‪2.8962 2.8536 2.7876 2.7186 2.6464‬‬
‫‪2.671 2.6037 2.5331 2.4589 2.4202 2.3803 2.3392 2.2966 2.2524 2.2064‬‬
‫‪2.3879 2.3487 2.3082 2.2664 2.2229 2.1778 2.1307‬‬
‫‪3.787‬‬
‫‪2.948‬‬
‫‪3.478‬‬
‫‪4.494 3.634 3.2389 3.0069 2.8524 2.7413 2.6572 2.5911 2.5377 2.4935 2.4247 2.3522 2.2756 2.2354 2.1938 2.1507 2.1058 2.0589 2.0096‬‬
‫‪16‬‬
‫‪4.4513 3.592 3.1968 2.9647‬‬
‫‪17‬‬
‫‪4.4139 3.555 3.1599 2.9277 2.7729 2.6613 2.5767 2.5102 2.4563 2.4117 2.3421 2.2686 2.1906 2.1497 2.1071 2.0629 2.0166 1.9681 1.9168‬‬
‫‪18‬‬
‫‪4.3807 3.522 3.1274 2.8951 2.7401 2.6283 2.5435 2.4768 2.4227 2.3779 2.308 2.2341 2.1555 2.1141 2.0712 2.0264 1.9795 1.9302‬‬
‫‪19‬‬
‫‪4.3512 3.493 3.0984 2.8661 2.7109 2.599‬‬
‫‪20‬‬
‫‪4.3248 3.467 3.0725 2.8401 2.6848 2.5727 2.4876 2.4205‬‬
‫‪21‬‬
‫‪4.3009 3.443 3.0491 2.8167 2.6613 2.5491 2.4638 2.3965 2.3419 2.2967 2.2258 2.1508 2.0707 2.0283 1.9842‬‬
‫‪22‬‬
‫‪4.2793 3.422 3.028‬‬
‫‪23‬‬
‫‪4.2597 3.403 3.0088 2.7763 2.6207 2.5082 2.4226 2.3551 2.3002 2.2547 2.1834 2.1077 2.0267 1.9838‬‬
‫‪24‬‬
‫‪4.2417 3.385 2.9912 2.7587‬‬
‫‪25‬‬
‫‪4.2252 3.369 2.9752 2.7426 2.5868 2.4741 2.3883 2.3205 2.2655 2.2197 2.1479 2.0716 1.9898 1.9464‬‬
‫‪26‬‬
‫‪2.0584 2.0107 1.9604‬‬
‫‪1.878‬‬
‫‪2.104‬‬
‫‪2.4943 2.4499 2.3807 2.3077 2.2304 2.1898 2.1477‬‬
‫‪2.548‬‬
‫‪2.4471 2.3928 2.3479 2.2776 2.2033 2.1242 2.0825 2.0391 1.9938 1.9464 1.8963 1.8432‬‬
‫‪2.0102 1.9645 1.9165 1.8657 1.8117‬‬
‫‪1.8894‬‬
‫‪1.938‬‬
‫‪2.054‬‬
‫‪2.096‬‬
‫‪2.321 2.2504 2.1757‬‬
‫‪2.366‬‬
‫‪2.6987 2.6143‬‬
‫‪2.514‬‬
‫‪2.81‬‬
‫‪1.7831‬‬
‫‪1.838‬‬
‫‪1.757‬‬
‫‪1.9605 1.9139 1.8648 1.8128‬‬
‫‪1.733‬‬
‫‪1.8424 1.7896‬‬
‫‪1.939‬‬
‫‪1.711‬‬
‫‪2.603 2.4904 2.4047 2.3371 2.2821 2.2365 2.1649 2.0889 2.0075 1.9643 1.9192 1.8718 1.8217 1.7684‬‬
‫‪1.892‬‬
‫‪1.8533 1.8027 1.7488 1.6906‬‬
‫‪1.901‬‬
‫‪2.005‬‬
‫‪2.5277 2.4422 2.3748 2.3201 2.2747 2.2036 2.1282 2.0476‬‬
‫‪2.64‬‬
‫‪2.7955‬‬
‫‪3.354 2.9604 2.7278 2.5719 2.4591 2.3732 2.3053 2.2501 2.2043 2.1323 2.0558 1.9736 1.9299 1.8842 1.8361 1.7851 1.7306 1.6717‬‬
‫‪4.21‬‬
‫‪27‬‬
‫‪3.34 2.9467 2.7141 2.5581 2.4453 2.3593 2.2913‬‬
‫‪4.196‬‬
‫‪28‬‬
‫‪4.183 3.328 2.934‬‬
‫‪29‬‬
‫‪4.1709 3.316 2.9223 2.6896 2.5336 2.4205 2.3343 2.2662 2.2107 2.1646 2.0921 2.0148 1.9317 1.8874 1.8409 1.7918 1.7396 1.6835 1.6223‬‬
‫‪30‬‬
‫‪2.124‬‬
‫‪2.1802‬‬
‫‪2.4495 2.3359 2.249‬‬
‫‪4.0847 3.232 2.8387‬‬
‫‪40‬‬
‫‪2.0401 1.9926 1.9174 1.8364‬‬
‫‪2.097‬‬
‫‪4.0012 3.15 2.7581 2.5252 2.3683 2.2541 2.1665‬‬
‫‪60‬‬
‫‪1.3519 1.2539‬‬
‫‪1.429‬‬
‫‪3.9201 3.072 2.6802 2.4472 2.2899 2.175 2.0868 2.0164 1.9588 1.9105 1.8337 1.7505 1.6587 1.6084 1.5543 1.4952‬‬
‫‪120‬‬
‫‪1.2214‬‬
‫‪1.318‬‬
‫‪3.8415 2.996 2.6049 2.3719 2.2141 2.0986 2.0096 1.9384 1.8799 1.8307 1.7522 1.6664 1.5705 1.5173 1.4591‬‬
‫‪inf‬‬
‫‪2.1179 2.0411 1.9586 1.9147 1.8687 1.8203 1.7689 1.7138 1.6541‬‬
‫‪2.19‬‬
‫‪2.236‬‬
‫‪2.7014 2.5454 2.4324 2.3463 2.2783 2.2229 2.1768 2.1045 2.0275 1.9446 1.9005 1.8543 1.8055 1.7537 1.6981 1.6376‬‬
‫‪2.0772 2.0035 1.9245 1.8389 1.7929 1.7444 1.6928 1.6373 1.5766 1.5089‬‬
‫‪1.7001 1.6491 1.5943 1.5343 1.4673 1.3893‬‬
‫‪1‬‬
‫‪1.394‬‬
‫‪1.748‬‬
‫‪2.606‬‬
‫‪356‬‬
‫©‬
‫ברנע‬
‫כל הזכויות שמורות למחבר – ד"ר אופיר ברנע‬
‫אופיר ברנע‬
‫ד"ר אופיר‬
‫ד"ר‬
‫‪w‬‬
‫‪ww‬‬
‫‪ww‬‬
‫‪w..oopphhiirrbbaarrnneeaa..ccoo..iill‬‬
‫‪357‬‬

סטטיסטיקה ב - הסקה סטטיסטית - ד"ר אופיר ברנע

Transcription

Similar documents

לחץ כאן לבחינה לדוגמה

חוברת חדשה pdf | 826935.00 KB

סיכום מושגים למבחן

דוח אפס הצעה של פז כלכלה - קבוצת רכישה בחיפה

הסתברות מ - Anat Etzion

דוגמאות לשאלות במבחן

מבחן 2 pdf | 415370.00 KB

פיזיקה — שאלון חקר

הקשר בין סדר הלידה במשפחה לבין הערכה עצמית