חוברת המרתון בקורס סטטיסטיקה א` מפגש ראשון

Transcription

חוברת המרתון בקורס סטטיסטיקה א` מפגש ראשון
‫ברוכים הבאים למרתון בקורס מבוא לסטטיסטיקה לתלמידי מדעי החברה‬
‫של חברת ‪ OpenBook‬העובדת בשיתוף פעולה מלא עם אגודת הסטודנטים‬
‫של האוניברסיטה הפתוחה (סמסטר ‪2015‬א)‬
‫המבחן מורכב מ‪ 2-‬חלקים‪:‬‬
‫חלק א‪ :‬שאלה אחת חובה (‪ 25‬נקודות)‪ .‬חמש טענות‪.‬‬
‫צריך לציין כל טענה נכון‪/‬לא נכון ונמק תשובה‪( .‬תשובה ללא נימוק לא תתקבל!)‪ 5 .‬נקודות לכל טענה‪.‬‬
‫חלק ב‪ :‬עליכם לענות על שלוש מבין ארבע השאלות ‪.2-5‬‬
‫(‪ 75‬נקודות לחלק זה‪ 25 .‬נקודות לכל תשובה נכונה ומלאה)‪.‬‬
‫בד"כ השאלות בנושאים הבאים‪:‬‬
‫שאלה ‪ :2‬מיחידות ‪( 2-3‬מדדי מיקום מרכזי‪ ,‬מדדי פיזור ומדדי מיקום יחסי))‬
‫שאלה ‪ :3‬מיחידות ‪(6-7‬הסתברות והסתברות מותנית)‬
‫שאלה ‪ :4‬יתכן שיהיו ‪ 2‬שאלות מיח' ‪( 4-5‬התפלגות נורמלית ומדדי קשר)‬
‫שאלה ‪ :5‬יחידה ‪(8‬משתנה מקרי)‬
‫בסוף השאלון מצורפים דפי עזר וטבלת התפלגות נורמלית‬
‫חומר עזר‪ :‬מחשבון כיס מדעי‪.‬‬
‫סטטיסטיקה א‬
‫יחידה ‪ – 1‬מבוא לעולם הסטטיסטיקה‬
‫יחידה ‪ – 2‬סולמות מדידה ומדדי מיקום מרכזי‬
‫יחידה ‪ – 3‬מדדי פיזור ומדדי מיקום יחסי‬
‫יחידה ‪ – 4‬התפלגות נורמלית‬
‫יחידה ‪ – 5‬מדדי קשר‬
‫יחידה ‪ – 6‬הגדרת ההסתברות‬
‫יחידה ‪ – 7‬הסתברות מותנה‬
‫יחידה ‪ – 8‬משתנה מקרי‬
‫ברוכים הבאים למרתון טנגנס ! יש לנו ‪ 3‬מפגשים‪ ,‬כל מפגש ‪ 4‬שעות‪ .‬בתחילת כל מפגש נחזור בקצרה על החומר‬
‫(נדרש לעבור על החומר לפני השיעור !!) ולאחר מכן נתרגל תרגילים מבחינות‪.‬‬
‫תכנית מפגשים‪:‬‬
‫מפגש ראשון בתאריך‪ 26.1.2015 :‬בנושא(יחידות)‪4-5 ,2-3 :‬‬
‫מפגש שני בתאריך‪ 2.2.2015 :‬בנושא(יחידות)‪ :‬המשך ‪6-8 , 5‬‬
‫מפגש שלישי בתאריך‪ 5.2.2015 :‬בנושא(יחידות)‪ :‬המשך ‪ 6-8‬ומבחני חזרה‬
‫לאחר כל שיעור נפרסם פתרונות בדף הפייסבוק‬
‫‪https://www.facebook.com/OpenBook.co‬‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪1‬‬
‫יחידה ‪2‬‬
‫משתנה‬
‫מה זה משתנה?‬
‫זהו גודל היכול לקבל ערכים שונים‪ ,‬לפי שמו – הוא משתנה בין מדגם תצפית לתצפית‪.‬‬
‫אם אני רוצה לבדוק תכונה מסוימת‪ ,‬התכונה הזאת היא תשתנה בין הנבדקים‪/‬התצפיות ולכן כל תכונה אותה אנו‬
‫מודדים נקראת משתנה‪.‬‬
‫איך נסמן משתנה? באות לועזית גדולה כמו‪X, Y, Z… :‬‬
‫איזה סוגי משתנים יש?‬
‫יש משתנה כמותי ומשתנה איכותי‪ .‬מה ההבדל בין איכותי לכמותי? איכות וכמות!‬
‫משתנה כמותי ערכיו כמותיים‪ ,‬משתנה איכותי ערכיו הם קטגוריות (דעה פוליטית‪ ,‬מצב סוציו‪-‬אקונומי)‬
‫אנו נתעסק במשתנים כמותיים הבאים‪:‬‬
‫משתנה בדיד‬
‫משתנה שיכול לקבל מספר סופי של ערכים בין כל שני ערכים‪ .‬לערכים ולסדר יש משמעות‪.‬‬
‫הצגה גרפית – דיאגרמת מקלות‪.‬‬
‫משתנה רציף‬
‫בין כל שני ערכים של המשתנה קיים רצף של ערכים (אינסוף ערכים אפשריים)‪.‬‬
‫הצגה גרפית‪ -‬היסטוגרמה‬
‫קבוע – גודל שערכו יחיד‪( .‬כמו שטח של מעגל )‬
‫תצפית‪/‬ערך‬
‫מה צפיתי? מהי תוצאת המדידה של המשתנה‪ .‬הם הערכים שהמשתנה מקבל‪.‬‬
‫התצפית של משתנה ‪ X‬מסומנת ב‪ , X i :‬כאשר ‪ -i‬אינדקס זיהוי התצפית‪.‬‬
‫אם בדקתי ‪ n‬תצפיות‪ ,‬אני מציגה אותן כך‪, X n :‬‬
‫נסמן‪X i :‬‬
‫‪n‬‬
‫‪i 1‬‬
‫‪‬‬
‫‪ X 1 , X 2 , X 3 ,‬התצפיות לפי סדר הגעתן‪.‬‬
‫סכום התצפיות מאינדקס ‪ i=1‬עד אינדקס ‪.n‬‬
‫נסמן‪ ∑𝑛𝑖=1 𝑋𝑖 2 :‬סכום ריבועי התצפיות‪.‬‬
‫אוכלוסייה‬
‫לאיזה קהל אני פונה? את מי אני מעוניינת לחקור? אוסף של פריטים שמעוניינים לחקור‪/‬לבדוק‪.‬‬
‫למשל‪ :‬כל הסטודנטים הלומדים קורס ‪ 30111‬מבוא לסטטיסטיקה לתלמידי מדעי החברה –א‪.‬‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪2‬‬
‫מדגם‬
‫מכיוון שיש לאוניברסיטה הפתוחה הרבה סטודנטים‪ ,‬יהיה קשה (כלכלית ופיזית) לפנות לכל אוכלוסיית הסטודנטים‬
‫שלומדים לקורס סטטיסטיקה א' ולכן נקח מדגם המהווה תת קבוצה של האוכלוסייה שנבחרה‪ ,‬ועל‪-‬פי הנתונים שלה‬
‫יבוצע מחקר סטטיסטי במטרה להסיק מסקנות על האוכלוסייה‪.‬‬
‫אז מה זה סטטיסטיקה?‬
‫מדע העוסק באיסוף הנתונים‪ ,‬הצגתם (סיכום) והסקת מסקנות מהם‪.‬‬
‫איסוף הנתונים – זה דגימה‪( .‬לקחת מדגם מתוך אוכלוסייה)‬
‫הצגת‪/‬סיכום הנתונים – תיאור הנתונים‪" .‬סטטיסטיקה תיאורית"‪.‬‬
‫הסקת מסקנות – "הסקה סטטיסטית"‪.‬‬
‫הכלי המחבר בין הסטטיסטיקה התיאורית וההסקה הסטטיסטית נקרא הסתברות‪.‬‬
‫איך נארגן את הנתונים? איך נסדר אותם?‬
‫תיאור וארגון של נתונים זה רישומם בטבלה‪ ,‬חישוב ממוצעם‪ ,‬סידורם לפי סדר עולה‪ ,‬וכן הלאה‪.‬‬
‫דוגמא‪ :‬שאלתי אנשים האם הם בעד או נגד לוחמה באיראן‪ .‬בעד– ‪ ,1‬נגד– ‪.0‬‬
‫דוגמא‪ :‬שאלתי אנשים מה המצב הסוציו‪-‬אקונומי‪.‬‬
‫מצב סוציו‪-‬אקונומי‪:‬‬
‫נמוך מאוד – ‪1‬‬
‫נמוך – ‪2‬‬
‫בינוני – ‪3‬‬
‫גבוה – ‪4‬‬
‫גבוה מאוד – ‪5‬‬
‫דוגמא‪ :‬שאלתי אנשים מהי עמדתם הפוליטית‪ .‬דמוקרטי – ‪ ,0‬רפובליקני – ‪ ,1‬אחר – ‪2‬‬
‫האם הכלים לתיאור הנתונים זהים בכל הדוגמאות? לא‪.‬‬
‫ההבדל הוא בסוג מדידת הנתונים‪.‬‬
‫איך נסדר את הנתונים?‬
‫מנהלת חברת ‪ OpenBook‬מעוניינת לבדוק את התפלגות הציונים בקורס סטטיסטיקה א' באוניברסיטה הפתוחה‬
‫בקרב הסטודנטים שלא למדו סטטיסטיקה בחברת טנגנס‪ .‬היא קיבלה את הנתונים הבאים‪:‬‬
‫‪35,40,42,38,70,90,82,55,68,62,66,69,82,100,85,96,75,34,25,99,68,77,55,38,98,15,0,90,88,83‬‬
‫האם זוהי דרך נוחה לראות את הנתונים? לא‬
‫איזה דרך אפשר לסדר את הנתונים בצורה נוחה? טבלה = התפלגות שכיחות‬
‫התפלגות שכיחות‬
‫היא אמצעי לקיבוץ נתונים והצגה נוחה יותר‪.‬‬
‫שכיחות ‪frequency- f‬‬
‫מספר הפעמים שהופיע הערך של המשתנה ‪.X‬‬
‫מושגים הקשורים לטבלת שכיחויות‬
‫‪ )1‬גבולות המחלקה‪ :‬לכל מחלקה יש גבול עליון וגבול תחתון‪.‬‬
‫גבולות מדומים – הגבול העליון של המחלקה לא מתלכד עם הגבול התחתון של המחלקה שאחריה‪ .‬יש רווח‬
‫בין המחלקות – כמו בדוגמא שלנו‪.‬‬
‫גבולות אמיתיים – הגבול העליון של המחלקה מתלכד עם הגבול התחתון של המחלקה שאחריה‪.‬‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪3‬‬
‫מעבר מגבולות מדומים לאמיתיים נעשה ע"י חלוקת הרווח בין המחלקות לשניים; מחציתו האחת נוספת‬
‫למחלקה התחתונה ומחציתו האחרת – לעליונה‪.‬‬
‫‪ )2‬רוחב המחלקה‪ :‬מסומן ב‪ ,i -‬מוגדר כהפרש בין הגבול העליון האמיתי לגבול התחתון האמיתי‪.‬‬
‫אם ברצוננו לבנות טבלה של מחלקות שוות רוחב‪ :‬נחליט על מס' המחלקות הרצוי‪ ,‬נחשב את רוחב המחלקה לפי‬
‫המספר הרצוי של המחלקות‪:‬‬
‫)הנתון הנמוך ביותר( ‪) −‬הנתון הגבוה ביותר(‬
‫) מספר המחלקות הרצויות(‬
‫=𝑖‬
‫‪ )3‬אמצע מחלקה‪ :‬ממוצע הגבולות‪ ,‬העליון והתחתון‪ ,‬של מחלקה הוא נקודת האמצע שלה‪.‬‬
‫‪ )4‬התפלגות שכיחויות מצטברות‪ :‬מסומן ב)‪ ,F(x‬מספר המקרים עד הגבול העליון של אותה מחלקה‪ .‬או מספר‬
‫המקרים עד וכולל אותו ערך אם יש ערך יחיד‪.‬‬
‫‪ )5‬התפלגות שכיחויות יחסיות‪/‬פרופורציות‪:‬‬
‫)𝑥(𝑓‬
‫𝑛‬
‫השכיחות מחולקת בגודל המדגם‪.‬‬
‫)𝑥(𝑓‬
‫‪ )6‬צפיפות‪ :‬מסומנת ב‪ d(x) -‬מספר המקרים ברוחב של‬
‫שוות רוחב‪.‬‬
‫𝑖‬
‫= )𝑥(𝑑 הצפיפות משמשת להשוואה בין מחלקות שאינן‬
‫הצגה גרפית של התפלגות שכיחויות‬
‫דיאגרמה מקלות‬
‫משתנה בדיד‬
‫ציר ה‪ X -‬הוא ציר המשתנה‪ ,‬וציר ה‪ Y -‬הוא ציר השכיחות )‪ .f(x‬מעל ערכים שונים של ‪ X‬מעלים אנכים‪/‬מקלות בגובה‬
‫השכיחות של ערכים אלו‪ .‬הגובה מייצג את השכיחות‪.‬‬
‫השימוש בדיאגרמה נפוץ במקרים הבאים‪:‬‬
‫א‪ .‬כאשר נתונה התפלגות שכיחויות לא מקובצת‪ ,‬כלומר‪ ,‬כאשר כל מחלקה מורכבת מערך אחד בלבד‪.‬‬
‫ב‪ .‬כאשר נתונה התפלגות מקובצת‪ ,‬ומייצגים את המחלקה ע"י נקודת האמצע שלה‪.‬‬
‫היסטוגרמה‬
‫היא תיאור גרפי למשתנה רציף‪.‬‬
‫שבו מחלקה מיוצגת ע"י אורך של קטע‪ ,‬ושכיחותה מיוצגת ע"י שטח של מלבן‪.‬‬
‫השימוש בהיסטוגרמה נהוג במקרים שבהם התפלגות השכיחויות מקובצת במחלקות הנתונות בגבולות אמיתיים‪.‬‬
‫בציר ה ‪ X‬תמיד יהיה משתנה‪ .‬המחלקה מיוצגת ע"י קטע בציר ה‪ X‬שקצותיהם הם הגבולות האמיתיים של המחלקה‪.‬‬
‫בציר ה ‪ Y‬אם המחלקות לא שוות רוחב )‪ d(x‬ואם המחלקות שוות רוחב אז )‪f(x‬‬
‫השכיחות היא שטח המלבן מעל הקטע הנ"ל‪ .‬שטח כל המלבנים שווה ל ‪100%‬‬
‫נהוג לחבר את מרכזי הבסיסים העליונים של המלבנים בהיסטוגרמה‪ .‬הקו שבור המתקבל נקרא מצולע(פוליגון)‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪4‬‬
‫סוגי עקומות ‪ -‬צורות התפלגות‬
‫עקומה סימטרית פעמונית (חד שיאית)‬
‫רב התצפיות מרוכזות בסביבת המרכז של ערכי ‪ ,X‬ומעט מהן באזורי השוליים‪ .‬פיזור התצפיות סימטרי לחלוטין‬
‫משני עברי המרכז‪.‬‬
‫עקומות אסימטריות‬
‫בעקומות אסימטריות מרבית התצפיות מרוכזות בקטע מסוים; יש מעט תצפיות חריגת‪ ,‬רובן לכיוון אחד של‬
‫ההתפלגות‪.‬‬
‫כאשר החריגה רובן כלפי ערכים גבוהים של ‪ ,X‬זו עקומה אסימטרית חיובית(ימנית)‪M 0  Md  x  Mr .‬‬
‫כאשר החריגות נוטות כלפי ערכים נמוכים של ‪ ,X‬זו עקומה אסימטרית שלילית(שמאלית)‪.‬‬
‫‪M 0  Md  x  Mr‬‬
‫עקומה אחידה‬
‫הנתונים מתפלגים באופן שווה בין כל ערכי ‪ X‬האפשריים‪.‬‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪5‬‬
‫עקומה ‪U‬‬
‫מרבית התצפיות באזורי השוליים של ‪ -X‬גבוהים ונמוכים‪ ,‬ומעט תצפיות במרכז‪ .‬יש שני שכיחים ‪ X min‬ו‪. X max -‬‬
‫עקומה רב שכיחית‬
‫רב הנתונים מרוכזים סביב ערכים אחדים של ‪ .X‬בעקומה דו שכיחית מרוכזים הנתונים סביב שני ערכים בלבד‪ ,‬ויש‬
‫לה שתי דבשות‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪6‬‬
‫מדדי מיקום מרכזי‬
‫מדד ‪ -‬מספר מסכם כלשהו המחושב על סמך נתוני המדגם (התצפיות)‪.‬‬
‫מדד מיקום מרכזי ‪ -‬ערך שסביבו מרוכזות חלק ניכר מתצפיות המדגם‪.‬‬
‫שכיח‬
‫הערך המופיע בשכיחות הגבוהה ביותר‪.‬‬
‫ברשימת תצפיות‪ ,‬השכיח הוא הציון המופיע מספר רב ביותר של פעמים‪.‬‬
‫בטבלת שכיחות שהמחלקות שוות רוחב‪ ,‬נהוג לציין ת נק' האמצע של המחלקה השכיחה ביותר כשכיח‬
‫ובהיסטוגרמה יהיה זה מרכז המלבן הגבוה ביותר‪.‬‬
‫כשהמחלקות אינן שוות רוחב‪ ,‬השכיח אינו בהכרח במחלקה השכיחה ביותר‪ – .‬בצפופה ביותר‪.‬‬
‫אמצע טווח‬
‫זהו הממוצע בין התצפית הגדולה ביותר לקטנה ביותר‪:‬‬
‫𝑛𝑖𝑚𝑥‪𝑥𝑚𝑎𝑥 +‬‬
‫‪2‬‬
‫= 𝑅𝑀‬
‫במחלקה הערוכה לפי מחלקות זהו הממוצע בין הגבול העליון של המחלקה העליונה לגבול התחתון של המחלקה‬
‫התחתונה‪.‬‬
‫𝑛𝑖𝑚𝑙‪𝑙𝑚𝑎𝑥 +‬‬
‫‪2‬‬
‫= 𝑅𝑀‬
‫חציון‬
‫במשתנה בדיד או ברשימת תצפיות‪( ,‬ברשימת תצפיות עלינו לסדר את המשתנים בסדר עולה)‪.‬‬
‫‪‬‬
‫אם מספר התצפיות(‪ )n‬אי זוגי ‪𝑀𝑑 = 𝑋𝑛+1‬‬
‫‪2‬‬
‫‪‬‬
‫אם מספר התצפיות(‪ )n‬זוגי‬
‫‪+1‬‬
‫𝑛𝑋‪𝑋𝑛+‬‬
‫‪2‬‬
‫‪2‬‬
‫‪2‬‬
‫= 𝑑𝑀‬
‫𝑛‬
‫במשתנה רציף או בטבלת שכיחויות לפי מחלקות‪(𝐿1 − 𝐿0 ) + 𝐿0 :‬‬
‫) ‪−𝐹(𝑋𝑚−1‬‬
‫) 𝑚𝑋(𝑓‬
‫‪𝑀𝑑 = 2‬‬
‫‪ -n‬מספר המקרים הכולל;‬
‫‪-Xm‬המחלקה בה נמצא החציון;‬
‫‪ -L1‬גבולה האמיתי העליון של ‪;Xm‬‬
‫‪ -L0‬גבולה האמיתי התחתון של ‪;Xm‬‬
‫‪ -Xm-1‬המחלקה הקודמת ל‪.Xm-‬‬
‫)‪ F(Xm-1‬השכיחות המצטברת עד לגבול העליון של המחלקה ‪.Xm-1‬‬
‫)‪ f(Xm‬שכיחות המחלקה ‪Xm‬‬
‫הדרך לחישוב חציון‪:‬‬
‫‪ .1‬קבע גבולות אמיתיים למחלקה‬
‫‪ .2‬חשב את ‪n/2‬‬
‫‪ .3‬בנה טור של שכיחות מצטברת‬
‫‪ .4‬מצא את ‪ ,Xm‬כלומר אתר את המחלקה שבה יימצא החציון (מרקר אותה!)‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪7‬‬
‫𝑛‬
‫‪ .5‬חשב את ) ‪ .2 − 𝐹 (𝑋𝑚−1‬זה מספר המקרים ב‪ ,Xm-‬שאותם יש לצרף לכל המחלקות משמאל ל‪ ,Xm‬שבהן יש‬
‫)‪ F(Xm-1‬מקרים‪.‬‬
‫‪ .6‬חשב את היחס בין המקרים החסרים לכלל המקרים שב‪:Xm-‬‬
‫‪ .7‬כפול את המנה שקיבלת ברוחב של ‪(𝐿1 − 𝐿0 ) :Xm‬‬
‫𝑛‬
‫)‪−𝐹(𝑋𝑚−1‬‬
‫‪2‬‬
‫) 𝑚𝑋(𝑓‬
‫𝑛‬
‫)‪−𝐹(𝑋𝑚−1‬‬
‫‪2‬‬
‫) 𝑚𝑋(𝑓‬
‫‪ .8‬הוסף את התוצאה‪ ,‬שקיבלת‪ ,‬לגבול התחתון של ‪Xm‬‬
‫ממוצע‬
‫כשנתונה רשימת ציונים‪ ,‬מחושב הממוצע בדרך הבאה‪:‬‬
‫כאשר נתונה טבלת שכיחויות‪:‬‬
‫)𝑛𝑥(𝑓𝑛𝑥‪𝑥1𝑓(𝑥1)+⋯+‬‬
‫𝑛‬
‫=‬
‫𝑛∑‬
‫𝑖𝑋 ‪𝑖=1‬‬
‫𝑛‬
‫= ̅𝑥‬
‫𝑛∑‬
‫)𝑖𝑥(𝑓𝑖𝑋 ‪𝑖=1‬‬
‫𝑛‬
‫= ̅𝑥‬
‫תכונה מעניינת של הממוצע היא שסכום הסטיות מהממוצע הוא אפס‪∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅) = 0 :‬‬
‫הממוצע הוא אותו ערך‪ ,‬שסכום הסטיות ממנו שווה לאפס‪.‬‬
‫בבואנו לשאלה נבדוק‪:‬‬
‫‪ .1‬משתנה בדיד ‪ /‬רציף‪.‬‬
‫‪ .1.1‬משתנה רציף?‬
‫‪ .1.1.1‬האם גבולות מחלקה אמיתיים או מדומים? במידה ומדומים נשנה לגבולות אמיתיים‪.‬‬
‫)‪f ( x‬‬
‫‪ .1.1.2‬רוחב מחלקה זהה? במידה ולא יש להוסיף ‪ 2‬עמודות‪ :‬רוחב מחלקה ‪ i  L1  L0‬וצפיפות‬
‫‪i‬‬
‫‪.‬‬
‫‪L1  L0‬‬
‫‪X mid ‬‬
‫‪ .1.1.3‬הוספת עמודה אמצע מחלקה‬
‫‪2‬‬
‫‪ .1.2‬משתנה בדיד?‬
‫‪ .1.2.1‬הוספת שכיחות מצטברת )‪F(x‬‬
‫‪ .2‬מבקשים בשאלה למצוא ממוצע? נוסיף עמודה ‪x  f  x ‬‬
‫‪d‬‬
‫‪ .3‬מבקשים בשאלה למצוא סטיית תקן או שונות? נוסיף עמודה ‪x 2  f  x ‬‬
‫חוק המספרים הגדולים‬
‫תיאוריה מתמטית הבנויה על העובדה שתופעות כלכליות רבות מאוד הן בעלות התפלגות נורמלית ולכן ככל שאירוע‬
‫מסוים חוזר על עצמו מספר רב יותר של פעמים (דהיינו ככל שהמדגם גדול יותר)‪ ,‬כך הממוצע בפועל יהיה קרוב יותר‬
‫לערך המיוחל‪ .‬לשון אחר‪ :‬למרות אי‪ -‬הסדר הקיים במהלך האינדבידואלי של האירועים‪ ,‬הסדרה כולה מראה‬
‫סדירות מסוימת‪ .‬חוק זה הוא הבסיס לביטוח‪ .‬החוק מכונה גם "חוק ממוצעים" )‪(average law‬או "סדירות‬
‫סטטיסטית" ‪(statistical regularity).‬‬
‫משפט הגבול המרכזי‬
‫על פי משפט הגבול המרכזי (בניסוח רשלני) – ההתפלגות של ממוצע תצפיות מקריות ובלתי תלויות שואפת לגבול‬
‫מרכזי – וגבול זה הוא ההתפלגות הפעמונית המפורסמת‪.‬‬
‫משפט הגבול המרכזי הוא משפט יסודי בתורת ההסתברות‪ ,‬העוסק בהתפלגות הגבולית של הממוצע המצטבר של‬
‫סדרת משתנים מקריים‪ .‬המשפט קובע שבתנאים מסוימים‪ ,‬התפלגות הממוצע של סדרת משתנים מקריים מתקרבת‬
‫להתפלגות נורמלית‪ .‬מאחר שרבים מהערכים הנמדדים בטבע מורכבים למעשה מסכום מספר רב של אירועים‬
‫אקראיים‪ ,‬המשפט מסביר את הדומיננטיות של ההתפלגות הנורמלית‪ .‬את המשפט הוכיח אלכסנדר ליאפונוב‪.‬‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪8‬‬
‫השפעת טרנספורמציה על מדדים‬
‫טרנספורמציה – חישוב שמעביר ערכים מסדרה אחת לסדרה אחרת‪.‬‬
‫דוגמאות‪ :‬מעבר מש"ח לדולר‪ ,‬מעבר מציון לפני פקטור לציון אחרי פקטור‪ ,‬מעבר ממכירות למשכורות‪.‬‬
‫טרנספורמציה ליניארית‪ :‬טרנספורמציה שיש לה את הנוסחה הכללית‪X '  a  b  X :‬‬
‫‪ – X‬הערכים בסדרה הישנה‬
‫' ‪ - X‬הערכים בסדרה החדשה‬
‫‪ – a‬האיבר החופשי – הקבוע‬
‫‪ – b‬האיבר התלוי ב ‪.X‬‬
‫דוגמאות‪:‬‬
‫(‪ )1‬סוכני מכירות מקבלים שכר בסיסי של ‪ ,₪ 4,000‬ועוד עמלה של ‪ ₪ 125‬לכל יחידה שהם מוכרים‪ .‬מהי‬
‫משוואת השכר?‬
‫‪ – X‬מספר היחידות שהסוכן מכר‪.‬‬
‫'‪ – X‬השכר החודשי‬
‫‪X '  4,000  125  X‬‬
‫(‪ )2‬במבחן בסטטיסטיקה הוחלט לתת לכל הסטודנטים בונוס של ‪ 10‬נקודות‪ .‬מה משוואת הציון לאחר הבונוס?‬
‫‪ – X‬הציון לפני הבונוס‬
‫'‪ – X‬הציון לאחר הבונוס‬
‫‪X '  15  X‬‬
‫ממוצע ‪X '  a  b  X‬‬
‫חציון ‪Md X '  a  b  Md X‬‬
‫אחוזון (מאון) ‪X ' X %  a  b  X C %‬‬
‫טווח ‪RX '  b  RX‬‬
‫סטיית תקן ‪S X '  b  S X‬‬
‫שונות ‪S 2 X '  b2  S 2 X‬‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪9‬‬
‫שאלה ‪1‬‬
‫בהתחלת שנת הפעילות של מתנ"ס מסוים נערך סקר על מספר החוגים אליהם נרשמו ילדים בגילים ‪ . 5-7‬התפלגות‬
‫התוצאות מתוארת בדיאגרמת המקלות הבאה‪:‬‬
‫א‪.‬‬
‫ב‪.‬‬
‫ג‪.‬‬
‫מצא את השכיח‪ ,‬החציון ואת הממוצע של התפלגות מספר החוגים אליו נרשם ילד בגיל ‪.5-7‬‬
‫מצא את סטיית התקן ואת ממוצע הסטיות המוחלטות מהחציון של התפלגות מספר החוגים אליו נרשם ילד‬
‫בגיל ‪.5-7‬‬
‫כחודש לאחר תחילת הפעילות נבדקו שוב אותם ‪ 100‬ילדים‪ .‬התברר כי שישה מהם‪ ,‬שלא נרשמו לחוגים‬
‫בהתחלה‪ ,‬החליטו בסופו של דבר להירשם לחוג אחד‪.‬‬
‫מה יקרה לכל אחד מהמדדים שחשבת בסעיפים א' וב' (יגדל‪/‬יקטן‪/‬לא ישתנה)? נמק‪.‬‬
‫שאלה ‪2‬‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪10‬‬
3 ‫שאלה‬
4 ‫שאלה‬
11
www.OpenBook.co.il
|
[email protected]
5 ‫שאלה‬
6 ‫שאלה‬
12
www.OpenBook.co.il
|
[email protected]
‫יחידה ‪ - 4‬התפלגות נורמלית‬
‫התפלגות נורמלית היא התפלגות פעמונית וסימטרית שבקו האמצע נמצאים מדיי המרכז והם‪:‬‬
‫‪x  Md  Mo  MR‬‬
‫השטח מתחת לעקומה שווה ל ‪ ,)100%( 1‬השטח משמאל לממוצע הוא ‪ ,0.5‬והשטח מימין לממוצע הוא ‪0.5‬‬
‫‪aX‬‬
‫אנו נעבור תמיד מהצגת משתנה נורמלי כלשהו למשתנה נורמלי סטנדרטי ע"י תרגום ‪ a‬ל‪:Z‬‬
‫‪S‬‬
‫‪Z‬‬
‫ניתן להציג כל ערך של המשתנה ‪ X‬המתפלג נורמאלי במונחים של מספר סטיות התקן שהוא מרוחק מן הממוצע‪ .‬שם‬
‫אחר ציון סטנדרטי‪ .‬ולהתפלגותו נקראת התפלגות נורמאלית סטנדרטית עם ממוצע שווה ל‪ 0-‬וסטיית תקן שווה ל‪.1-‬‬
‫‪xx‬‬
‫‪Zx ‬‬
‫‪Sx‬‬
‫את השטח משמאל לערך ‪ Z‬מסוים נסמן כך‪  z  :‬‬
‫מה אנחנו צריכים לזכור?‬
‫‪P  Z  Number     Number ‬‬
‫‪P  Z  Number   1    Number ‬‬
‫‪   Number   1    Number ‬‬
‫‪  a  Z  b   b   a ‬‬
‫נתרגל קצת‪:‬‬
‫לפי לוח ההתפלגות הנורמאלי יש לחשב‪:‬‬
‫‪[email protected]‬‬
‫‪ 1.2 ‬‬
‫‪  ??   0.500‬‬
‫‪  0.3 ‬‬
‫‪  ??   0.9750‬‬
‫‪  2.8 ‬‬
‫‪  ??   0.1003‬‬
‫‪  0.8 ‬‬
‫‪  ??   0.9904‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪13‬‬
‫שאלה ‪1‬‬
‫גובה החיילים המתגייסים לצה"ל מפולג נורמלית עם ממוצע ‪ 175‬ס"מ וסטית תקן של ‪ 10‬ס"מ‪.‬‬
‫א‪ .‬חשב‪/‬י את אחוז החיילים שגובהם נמוך מ‪ 2-‬מטר ‪)0.9938( .‬‬
‫ב‪ .‬חשב‪/‬י את אחוז החיילים שגובהם גבוה מ‪ 2-‬מטר ‪)0.0062(.‬‬
‫ג‪ .‬חשב‪/‬י את אחוז החיילים שגובהם נמוך מ‪ 1.65-‬מטר ‪)0.1587(.‬‬
‫ד‪ .‬חשב‪/‬י את אחוז החיילים שגובהם בין ‪ 185‬ס"מ ל‪ 195-‬ס"מ‪)0.1359(.‬‬
‫ה‪ .‬חשב‪/‬י את אחוז החיילים שגובהם בין ‪ 165‬ס"מ ל‪ 185-‬ס"מ‪)0.6826(.‬‬
‫ו‪ .‬חשב‪/‬י את אחוז החיילים שגובהם נמוך ‪ 165‬ס"מ או גבוה מ‪ 185-‬ס"מ ‪)0.3174(.‬‬
‫ז‪ .‬במחזור גיוס מסוים התגייסו ‪ 10,000‬חיילים ‪ .‬חשב‪/‬י כמה מבין החיילים שהתגייסו במחזור גיוס זה ‪,‬‬
‫גובהם נמוך מ‪ 175-‬ס"מ ‪)5000( .‬‬
‫ח‪ .‬מצא‪/‬י את גובה החייל אשר ‪ 90%‬מהחיילים המתגייסים לצה"ל נמוכים ממנו ‪)187.82(.‬‬
‫ט‪ .‬מצא‪/‬י את גובה החייל אשר ‪ 10%‬מהחיילים המתגייסים לצה"ל נמוכים ממנו ‪)162.18(.‬‬
‫י‪ 3% .‬החיילים הגבוהים ביותר נשלחים לאימוני נבחרת כדורסל ‪ .‬מהו הגובה המינימלי של החיילים‬
‫המתאמנים בכדורסל ‪)193.81(.‬‬
‫יא‪ .‬חשב‪/‬י הטווח הבין רבעוני של גובה החיילים ‪)13.48(.‬‬
‫שאלה ‪2‬‬
‫ידוע כי התפלגות הציונים בבחינת גמר בקורס מסוים באוניברסיטה הפתוחה היא נורמלית‪.‬‬
‫א‪ .‬בסמסטר א בשנה מסוימת קיבלו ‪ 50%‬מהסטודנטים ציון הגבוה מ ‪ 72.5 -‬ו ‪ 6% -‬קיבלו ציון גבוה מ ‪ .91.16 -‬מה‬
‫היה הציון הממוצע ומה הייתה סטית התקן של הציונים בסמסטר זה ?‬
‫ב‪ .‬בסמסטר א ידוע כי התלמידים שציונם מעל ‪ 96‬קיבלו ציון "מעולה"‪ .‬כמו כן ידוע כי באותו סמסטר ‪ 18‬תלמידים‬
‫קיבלו ציון מעולה‪ .‬מצא מה היה מספר הנבחנים באותו סמסטר‪.‬‬
‫ג‪ .‬בסמסטר ב היה הציון הממוצע ‪ 70‬וסטית התקן ‪ .10‬סטודנטים שציונם בין ‪ 76-85‬קיבלו את הציון טוב‪ .‬מהו אחוז‬
‫הסטודנטים בסמסטר זה שקיבלו "טוב" בבחינת הגמר ?‬
‫ד‪ .‬מהו הציון בסמסטר ב השקול ( טוב באותה מידה ) לציון ‪ 67‬בסמסטר א ?‬
‫שאלה ‪3‬‬
‫חברת "האבוב" מתכוונת לשווק סוג חדש של צמיגים רדיאליים‪ .‬מבדיקות החברה התברר שממוצע אורך החיים של‬
‫צמיגים אלו הוא ‪ 38,000‬ק"מ עם סטיית תקן ‪ 3,000‬ק"מ‪.‬‬
‫בהנחה שאורך חיי הצמיג מתפלג נורמלית ובדיקות החברה נכונות מצא ‪:‬‬
‫א‪ .‬מהו אחוז הצמיגים שניתן לצפות שיחזיקו מעמד יותר מ ‪ 38,000 -‬ק"מ ?‬
‫ב‪ .‬מהו אחוז הצמיגים שניתן לצפות שיחזיקו מעמד לכל היותר ‪ 35,000‬ק"מ ?‬
‫ג‪ .‬חברת "האבוב" יצאה במסע פרסום והודיע שתפצה בצמיג חדש‪ ,‬כל בעל מכונית שהצמיג שקנה החזיק מעמד‬
‫פחות מ‪ K -‬ק"מ‪ .‬החברה קבעה את הערך ‪ K‬כך שלא תצטרך לפצות יותר מאשר ‪ 10%‬מרוכשי הצמיגים‪ .‬מהו הערך ‪K‬‬
‫שנקבע ?‬
‫ד‪ .‬הסבר‪ ,‬ללא חישוב מחדש‪ ,‬כיצד ולאיזה כוון ( אם בכלל ) היו משתנות תשובותיך לסעיפים א‪ ,‬ב‪ ,‬ו ‪ -‬ג לו סטיית‬
‫התקן היתה ‪ 5,000‬ק"מ ?‬
‫שאלה ‪4‬‬
‫מפעל לפיצוחים אורז את תוצרתו בשקיות שהמשקל הרשום עליהן ‪ 200‬גרם‪ .‬עם זאת‪ ,‬בגלל תהליך האריזה‬
‫האוטומטי המשקל המדויק בכל שקית מתפלג נורמלית עם ממוצע ‪ 200‬גרם וסטיית תקן ‪ 8‬גרם‪.‬‬
‫א‪ .‬מהו אחוז השקיות שמשקלן מתחת ל ‪ 190-‬גרם ?‬
‫ב‪ .‬מהו הרבעון התחתון של משקל השקיות ?‬
‫שאלה ‪5‬‬
‫התפלגות הציונים בקורסים בכלכלה היא בקירוב נורמלית‪.‬‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪14‬‬
‫לבחינה במבוא לכלכלה במועד א' ניגשו ‪ 500‬סטודנטים‪ ,‬הציון הממוצע בבחינה היה ‪ 70‬וסטיית התקן ‪.12‬‬
‫א‪ .‬אם ציון "מספיק" מוגדר כציון בתחום ‪ ,55-64‬מהו מספר הסטודנטים במועד זה‪ ,‬שקיבלו "מספיק"‬
‫בבחינה במבוא לכלכלה?‬
‫ב‪.‬‬
‫‪ 2%‬מהסטודנטים שציוניהם הטובים ביותר יקבלו ציון "מצוין" מהו הציון המינימלי לקבלת "מצוין"‬
‫בבחינה במבוא לכלכלה ?‬
‫ג‪.‬‬
‫לבחינה במקרו כלכלה במועד א' ניגשו ‪ 400‬סטודנטים‪.‬‬
‫‪ 50%‬מהסטודנטים שנבחנו בבחינה קיבלו ציון גבוה מ ‪ 74‬ו‪ 2.5% -‬מהסטודנטים קיבלו ציון גבוה מ ‪. 93.6‬‬
‫מה היה הציון הממוצע ומה הייתה סטיית התקן בבחינה במקרו כלכלה?‬
‫ד‪.‬‬
‫לבחינה בתורת המחירים במועד א' ניגשו ‪ 100‬סטודנטים‪ ,‬הציון הממוצע היה ‪ 68‬וסטית תקן ‪ .8‬חשב‪:‬‬
‫‪ .)1‬את הציון הממוצע של כל הנבחנים בבחינות בכלכלה‪.‬‬
‫‪ .)2‬את סטית התקן של הציונים בבחינות בכלכלה‪.‬‬
‫שאלה ‪6‬‬
‫משקלם של עכברי מעבדה לבנים מתפלג נורמלית‪.‬‬
‫ידוע כי מתחת למשקל ‪ 171.15‬גרם נמצאים ‪ 99.2%‬מהעכברים ומעל למשקל ‪ 152.55‬נמצאים ‪ 12.1%‬מהעכברים‪.‬‬
‫א‪.‬‬
‫מהם הממוצע והשונות של משקל עכברי המעבדה ?‬
‫ב‪.‬‬
‫מהו אחוז העכברים שמשקלם בין ‪ 105‬גרם לבין ‪ 150‬גרם ?‬
‫ג‪.‬‬
‫מהו משקל עכבר שרק ‪ 10%‬מעכברי המעבדה שוקלים יותר ממנו ?‬
‫ד‪.‬‬
‫מהו טווח הבינרבעוני של משקל עכברי המעבדה?‬
‫שאלה ‪7‬‬
‫מילוי קרטון חלב של ‪ 1‬ליטר נעשה בעזרת מכונה אוטומטית‪ .‬ניתן לכוון את המכונה כדי שתיתן כמות ממוצעת נתונה‬
‫של חלב‪ .‬כמות המילוי מתפלגת בקירוב נורמלית עם סטיית התקן של ‪ 0.01‬ליטר‪.‬‬
‫א‪.‬‬
‫מהי פרופרציית הקרטונים שבהם פחות מ‪ 0.97 -‬ליטר חלב‪ ,‬אם המכונה כוונה למילוי ממוצע של ‪ 1‬ליטר ?‬
‫ב‪.‬‬
‫מהי פרופרציית הקרטונים שבהם יותר מ‪ 1 -‬ליטר חלב‪ ,‬אם המכונה כוונה למילוי ממוצע של ‪ 1.02‬ליטר ?‬
‫ג‪.‬‬
‫לאיזה מילוי ממוצע חייב היצרן לכוון את המכונה‪ ,‬אם על פי התקן‪ ,‬אחוז הקרטונים שבהם פחות מ‪1 -‬‬
‫ליטר חלב אינו יכול לעלות על ‪. 1.5%‬‬
‫ד‪.‬‬
‫המכונה כוונה לממוצע התקני‪ ,‬שמצאת בסעיף ג'‪ ,‬מהו אחוז הקרטונים שכמות החלב בהם אינה סוטה‬
‫מהממוצע ביותר מסטיית תקן אחת ?‬
‫טענות נכון‪ /‬לא נכון‬
‫טענה ‪1‬‬
‫אם להתפלגות סימטרית נוסיף שני נתונים אחד כערך התצפית הגבוהה ביותר‪ -‬בהתפלגות ואחד כערך התצפית‬
‫הנמוכה ביותר ‪,‬אזי שונות הסדרה לא תשתנה‬
‫טענה ‪2‬‬
‫בשנה מסוימת היה השכר הממוצע במפעל כלשהו ‪ . ₪ 8,500‬שנה לאחר מכן קיבל כל עובד העלאה של ‪ .₪ 250‬כעבור‬
‫שנה נוספת כל המשכורות) כולל העלאה הקודמת (הועלו ב‪ .15% -‬לכן השכר הממוצע הנוכחי הוא ‪10,062.5₪‬‬
‫טענה ‪3‬‬
‫בסדרה המונה ‪ 6‬תצפיות‪ ,‬נרשמו לגבי ‪ 5‬מהן הסטיות מממוצע הסדרה‪ 2.5 , 1.4, -0.8, 1.6, -2.2 :‬לכן שונות הסדרה‬
‫היא ‪4.5‬‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪15‬‬
‫טענה ‪4‬‬
‫לסדרה סטטיסטית בת ‪ 100‬תצפיות ממוצע ‪ 80‬וחציון ‪ . 70‬לסדרה זו הוסיפו עוד שתי תצפיות‪ . 100 ,60 :‬כתוצאה‬
‫מכך‪ ,‬הממוצע וגם החציון של הסדרה בת ‪ 102‬התצפיות אינם משתנים‪.‬‬
‫טענה ‪5‬‬
‫דני הוא נהג "אגד" הנוסע בממוצע ‪ 200‬ק"מ ביום עם סטיית תקן ‪ 40‬ק"מ‪ .‬רותי אשתו היא פקידה המדפיסה‬
‫בממוצע ‪ 60‬עמודים ביום עם סטיית תקן של ‪ 6‬עמודים‪ .‬ביום מסוים נסע דני ‪ 300‬ק"מ ורותי הדפיסה ‪ 45‬עמודים‪ .‬לכן‬
‫באותו יום ההספק היחסי שלהם היה זהה‪.‬‬
‫טענה ‪6‬‬
‫סדרת נתונים סטטיסטיים מונה ‪ 50‬תצפיות‪ .‬נתון כי סדרת הנתונים סימטרית סביב הממוצע‪ .‬חציון הסדרה‪128 -‬‬
‫ושונות הסדרה – ‪ . 225‬בשלב מאוחר יותר נוספו שתי תצפיות נוספות לסדרה‪ 143 :‬ו‪ 113 -‬לכן החציון‪ ,‬הממוצע‬
‫והשונות של ‪ 52‬התצפיות לא ישתנו‪.‬‬
‫‪[email protected]‬‬
‫|‬
‫‪www.OpenBook.co.il‬‬
‫‪16‬‬