מיקום מרכזי ופיזור
Transcription
מיקום מרכזי ופיזור
היסטוגרמה התפלגות ימי העדרות בשנה חציון 12 11 10 9 6 6 4 2 2 20-24 15-19 שכיחות העובדים 8 2 0 10-14 0-4 5-9 ימי ההעדרות שיעור – 5ערכים מרכזיים )המשך( ופונקציות הפסד. כללי הסכימה עבור סידרה של ערכים x1,x2,x3,…xnנסמן – iאינדקס רץ שממספר את הפריטים. – xiסימון הערכים בסדרה . x1,x2,x3,…xn – nמספר הפריטים בסדרה. כדי לסמן סכום של סידרה משתמשים בסיגמה ) Σהאות היוונית הגדולה( n ) = ( x1 + x2 + x3 + .... + xn ∑x i i =1 הסימנים הם: סיגמה – Σהיא סימן של סכום עבור סדרת ערכים. – iאינדקס רץ שממספר את הפריטים. – nמספר הפריטים. 1 שיעור – 5ערכים מרכזיים )המשך( ופונקציות הפסד. _ ממוצע – מסומן (mean) Xהוא סכום הערכים חלקי מספר הערכים. את נוסחת הממוצע עבור הסדרה x1,x2,x3,…xnנסמן n ) ( x1 + x2 + x3 + .... + xn n ∑x i = i =1 n ___ = X את נוסחת הממוצע ריכוז של תוצאות או טבלת שכיחויות נסמן )∑ x • f ( x x n שכיחות מצטברת 2 12 16 17 18 24 24 24 28 33 F(x)*X 20 90 32 7 6 30 0 0 8 5 198 6 ˆ x חציון=7 ממוצע=6 =Σ ממוצע =X שכיחות שביעות המשיבים הרצון X )f(x 2 10 4 1 1 6 0 0 4 5 33 10 9 8 7 6 5 4 3 2 1 סכום 2 רמת המדידה שכיח חציון ממוצע משתנה שמי )נומינלי( + - - סולם סודר )אורדינלי( + + - + + + + + + סולם רווח )אינטרוולי( סולם מנה או יחס )אבסולוטי( דוגמאות • לאום :יהודים ,ערבים ,דרוזים • מין :זכר/נקבה • צורות ישוב :עירוני ,קהילתי ,חקלאי • סוג דםA, B, AB, O. : • מקצוע :נגר ,רופא ,חוקר... • מצב משפחתי :נשוי ,רווק ,גרוש ,אלמן • ארץ מוצא :אסיה ,אירופה ,אפריקה... • רמה מקצועית :טכנאי,הנדסאי ,מהנדס • דרגה :טוראי ,רב"ט ,סמל • סולם הטונים באוקטבה :דו ,רה ,מי )יש אמנם רבעי וחצאי טון אך רק סולם התדרים הוא רציף( • שביעות רצון בעבודה :מאוד ,מעט ,בכלל לא. • מידת הסכמה עם הגדים :מסכים בהחלט ,מסכים ,ניטרלי ,מתנגד,מתנגד בהחלט. • סידור היררכי של פריטים לפי חשיבות – למשל דרוג סדר החשיבות של קרירה ,משפחה, השכלה ,ופנאי )מתקבלים 4סולמות(. • מידות של בגדים48 , 44 , 42 : • דרגה בשרות הציבורי...44 ,43 ,41 : • סולמות שאינם ליניאריים* .למשל למבדה λבמבחן רורשך מחושב כמספר תגובות של "צורה טהורה" חלקי מספר התגובות שאינם צורה טהורה. • דרוג מ 1-עד 10לשביעות רצון ממקום העבודה-10 :מאוד שבע רצון-1 ,מאוד לא מרוצה. • ציון סולם ליקרט ) (Likert, 1932למידת הסכמה-1 :מתנגד בתוקף -5מסכים בהחלט. • טמפרטורה – צלזיוס או פרנהיט • ציון פסיכומטרי • לחץ דם • מספר ילדים למשפחה • שנות לימוד • מספר ימי מחלה • מספר איחורים לעבודה • גיל בשנים • שנות ותק • שכר חודשי • איחורים לעבודה בשעות • משקל • גובה * למשל סולמות לוגריתמים כגון סולם ריכטר לדרוג רעידות אדמה ,סולם בדציבלים לעוצמת קול ,וסולמות פסיכו-פיזיים אחרים ,אלו סולמות רציפים אך בהרבה מקרים צריך להתיחס אליהם כאל אינטרוולים. פונקציות הפסד אמרנו שהמדד המרכזי אמור לסכם את הערכים שקיבלנו כך שבאמצעות ערך בודד אנו יכולים לאפיין את האוכלוסיה ולהשוות בין אוכלוסיות שונות .כמו כן אנו מתיחסים אליו כבעל יכולת ניבוי .כלומר המדד המרכזי מסוגל לתאר כל אחת מהתצפיות שנמדדו )עם שגיאה מסוימת הנובעת מההתפלגות( .אנו רוצים לדעת מה תוקף הניבוי שהמדד מניב .כלומר אנו רוצים לראות איזה מדד מרכזי מנבא הכי טוב את התצפיות שלנו. המונח "הכי טוב" נגזר מהצרכים שלנו כלומר את סוג השגיאה אנו מגדירים בהתאם לצרכים .לשם כך אנו מחשבים פונקצית הפסד. ההפסד בניבוי הוא הפער בין התצפית לבין הערך המרכזי ,והניבוי הטוב ביותר הוא הניבוי שסכום ההפסדים שלו מעבר לתצפיות הוא הקטן ביותר. 3 3פונקציות הפסד .I מהו המדד המנבא הכי הרבה תצפיות. כל שגיאה בניבוי נספרת כהפסד. .II מהו הניבוי שהסטיות ממנו יהיו הקטנות ביותר. גודל ההפסד כגודל הסטיה מניבוי. .IIIמהו הניבוי שיצמצם בעיקר את הסטיות הגדולות. גודל ההפסד כריבוע הסטיה מהניבוי .Iניבוי הכי הרבה תצפיות למשל בתוצאות שביעות הרצון ,אם אני רוצה מדד שייצג הכי הרבה עובדים .אז פונקצית ההפסד שלי תקבל נקודה עבור כל עובד שהמדד המרכזי לא מיצג אותו ותקבל אפס עבור כל עובד שהמדד מיצג .ככל שסכום הנקודות יותר גדול כך ההפסד שלי יותר גבוה )בפונקציה כזאת אין משמעות לגודל הטעות(. n Lxˆ = ∑ li i =1 ˆ0 xi = x = li ˆ1 xi ≠ x 4 פונקצית הפסד ראשונה לפי מספר טעויות הניבוי שכיחות שביעות ˆ x המשיבים הרצון שכיח חציון ממוצע X )f(x Xi≠9 F(x)*L Xi≠7 F(x)*L Xi≠6 F(x)*L 10 2 1 2 1 2 1 2 9 10 0 0 1 10 1 10 8 4 1 4 1 4 1 4 7 1 1 1 0 0 1 1 6 1 1 1 1 1 0 0 5 6 1 6 1 6 1 6 4 0 1 0 1 0 1 0 3 0 1 0 1 0 1 0 2 4 1 4 1 4 1 4 1 5 1 5 1 5 1 5 סכום 33 L= 23 L= 32 L= 32 .IIניבוי שהסטיות ממנו הן הקטנות ביותר אם לא כל כך חשוב לי שהניבוי יפגע בול בערכים יותר חשוב לי סטיות כמה שיותר קטנות. למשל בשביעות הרצון ,חשוב שטעות הניבוי תהיה מינימאלית עבור כל העובדים .אז פונקצית ההפסד שלי תהיה הערך המוחלט של גודל הטעות .ככל שסכום הערכים המוחלטים יותר קטן כך יש לי פחות ההפסד. n ˆLxˆ = ∑ xi − x i =1 5 פונקצית הפסד שנייה לפי גודל הסטיה מהניבוי ˆ x חציון ממוצע שכיח ||9-Xi )f(x 8 4 6 3 2 1 2 10 30 3 20 2 0 0 10 9 8 2 4 1 4 1 4 8 1 1 0 0 2 2 1 7 0 0 1 1 3 3 1 6 6 1 12 2 24 4 6 5 0 2 0 3 0 5 0 4 0 3 0 4 0 6 0 3 16 4 20 5 28 7 4 2 25 5 30 6 40 8 5 F(x)*l ||Xi-6 שכיחות המשיבים L= 94 F(x)*l ||Xi-7 שביעות הרצון L= 93 F(x)*l L= 103 33 X 1 סכום .IIIניבוי שיצמצם את הסטיות הגדולות אם הסטיות הקטנות מהניבוי לא כל כך חשובות אבל חשוב לי לצמצם בעיקר את הסטיות הגדולות אני אשתמש בפונקציה שמעלה את הסטיות בריבוע. למשל בשביעות הרצון ,אם חשוב שהניבוי יתחשב בכל הערכים – שנתחשב גם בעובדה שיש עובדים שלא היו מרוצים .אז פונקצית ההפסד שלי תהיה ריבוע הסטיה מהניבוי .ככל שסכום ריבוע הסטיות יותר קטן כך יהיה פחות הפסד. n ) ˆLxˆ = ∑ ( xi − x 2 i =1 6 פונקצית הפסד שלישית לפי ריבוע הסטיה שכיחות המשיבים שביעות הרצון (9-Xi)2 )f(x X 32 16 18 9 2 1 2 10 90 9 40 4 0 0 10 9 16 4 4 1 4 1 4 8 1 1 0 0 4 4 1 7 0 0 1 1 9 9 1 6 6 1 24 4 96 16 6 5 0 4 0 9 0 25 0 4 0 9 0 16 0 36 0 3 64 16 100 25 196 49 4 2 25 180 36 320 64 5 1 ממוצע F(x)*l חציון (6-Xi)2 125 L= 334 F(x)*l שכיח (7-Xi)2 L= 367 F(x)*l L= 631 33 סכום 7