המכללה האקדמית תל חי

Transcription

המכללה האקדמית תל חי
‫המכללה האקדמית תל חי‬
‫החוג רב תחומי‬
‫מבוא לסטטיסטיקה למדעי החברה ב'‬
‫מבחן לדוגמא‬
‫משך מבחן‪ 3 :‬שעות‪.‬‬
‫חומר עזר‪ :‬כל חומר עזר מותר‬
‫חלק ‪ 02% -1‬מהציון הסופי‪ .‬פתרון ידני‪.‬‬
‫חוקר אמד את ממוצע לחץ הדם של אוכלוסיית הקשישים‪ .‬נבדק מדגם של ‪ 691‬קשישים ונמצא‬
‫ממוצע לחץ הדם ‪ .645‬ידוע שסטיית תקן באוכלוסיה שווה ל‪.54 -‬‬
‫א‪ 4( .‬נק') מהו רווח סמך ללחץ דם הממוצע של אוכלוסיית הקשישים ברמת סמך ‪?94%‬‬
‫חישוב רווח סמך בעזרת ערך ‪. Z=1.96‬‬
‫‪]  157.5‬‬
‫‪]  150.5‬‬
‫‪25‬‬
‫‪196‬‬
‫‪25‬‬
‫‪196‬‬
‫‪L 2  [ X  Z  x ]  [ 154  1.96 ‬‬
‫‪L1  [ X  Z  x ]  [ 154  1.96 ‬‬
‫‪p(150.5157.5)=0.95‬‬
‫ב‪ 4( .‬נק') האם‪ ,‬על פי נתוני המדגם‪ ,‬ניתן לקבוע שלחץ הדם של אוכלוסיית הקשישים שונה‬
‫מ‪ 611 -‬ברמת מובהקות של ‪?4%‬‬
‫השערות‪:‬‬
‫‪H 0 :   160‬‬
‫‪H 1 :   160‬‬
‫חישוב תחום קבלה של ‪H0‬‬
‫‪25‬‬
‫‪]  163.5‬‬
‫‪196‬‬
‫‪25‬‬
‫‪K1  [   Z  x ]  [ 160  1.96 ‬‬
‫‪]  156.5‬‬
‫‪196‬‬
‫‪K 2  [   Z  x ]  [ 160  1.96 ‬‬
‫חישוב ערך ‪:Z‬‬
‫‪154  160‬‬
‫‪ 3.36‬‬
‫‪25‬‬
‫‪‬‬
‫‪X ‬‬
‫‪196‬‬
‫מסקנה‪ :‬בהתייחס ערכים הקריטיים‪ ,‬ממוצע המדגם נמצא מחוץ לתחום הקבלה של ‪.H0‬‬
‫בהתייחס לערך ‪ Z‬המחושב עבור ממוצע המדגם‪Z x  Z  :‬‬
‫‪2‬‬
‫‪‬‬
‫‪n‬‬
‫‪ZX ‬‬
‫לכן המסקנה היא כי עבור ‪ =0.05‬נדחה את השערת האפס וניתן לומר כי ממוצע המדגם שונה‬
‫מ‪.611-‬‬
‫ג‪ 4( .‬נק') האם‪ ,‬על פי נתוני המדגם‪ ,‬ניתן לקבוע שלחץ הדם של אוכלוסיית הקשישים נמוך‬
‫מ‪ 611 -‬ברמת מובהקות של ‪?4%‬‬
‫השערות‪:‬‬
‫‪H 0 :   160‬‬
‫‪H 1 :   160‬‬
‫חישוב ערך קריטי שמאלי בעזרת ערך ‪( Z=1.645‬מבחן חד צדדי‪ 4% -‬נמצאים בצד שמאל‪ ,‬החלק‬
‫התחתון של ההתפלגות)‪.‬‬
‫‪25‬‬
‫‪]  157.1‬‬
‫‪196‬‬
‫‪K  [ X  Z  x ]  [ 160  1.645 ‬‬
‫מסקנה‪ 154<157.1 :‬לכן ממוצע המדגם נמצא מחוץ לאזור הקבלה של ‪ .H0‬ניתן לומר כי עבור‬
‫‪ =0.05‬ממוצע המדגם קטן מ‪.611-‬‬
‫למסקנה דומה ניתן להגיע גם ע"י השוואת ערך ‪ Z‬של המדגם חושב בסעיף קודם) מול ערך ‪Z‬‬
‫קריטי עבור ‪( =0.05‬בהתייחס למבחן חד צדדי)‬
‫ד‪ 4( .‬נק') לפי נתוני סעיף קודם‪ ,‬מהי רמת מובהקות הקטנה ביותר לדחיית השערת האפס?‬
‫חישוב ערך ‪ Z‬של המדגם ביחס ל‪ ,611 -‬ומתוך טבלת ‪ Z‬קביעת ערך ‪ P‬השווה לרמת‬
‫המובהקות הקטנה ביותר לדחיית השערת האפס‬
‫‪154  160‬‬
‫‪ 3.36   '  0.0004‬‬
‫‪25‬‬
‫‪196‬‬
‫‪‬‬
‫‪X ‬‬
‫‪x‬‬
‫‪Z‬‬
‫חלק ‪ 02% -0‬מהציון הסופי‪ .‬כל שאלה ‪ 4‬נקודות‪ ,‬יש לבחור ‪ 5‬מתוך ‪ 6‬שאלות‪.‬‬
‫‪ .1‬ממוצע התואר הראשון במדעי ההתנהגות בישראל ב‪ 5115-‬היה ‪ .01‬חוקר מאוניברסיטת תל‪-‬‬
‫אביב משער שב‪ 5114-‬הממוצע היה נמוך יותר‪ .‬לשם בדיקת ההשערה‪ ,‬נדגמו ‪ 64‬סטודנטים‪.‬‬
‫הציון הממוצע במדגם היה ‪ .80‬על מנת לבדוק את השערת החוקר‪ ,‬עליו‪:‬‬
‫א‪.‬‬
‫להשתמש במבחן ‪ t‬למדגמים תלויים‬
‫ב‪.‬‬
‫להשתמש במבחן ‪Z‬‬
‫ג‪.‬‬
‫להשתמש במבחן ‪ t‬למדגם יחיד‬
‫ד‪.‬‬
‫לבצע מבחן ‪Anova‬‬
‫‪ .2‬חוקר בדק השערה חד צדדית ברמת מובהקות של ‪ ,1.16‬ולא הצליח לדחות את ‪ .H0‬מה‬
‫הייתה מסקנת החוקר אילו ביצע בדיקת השערה חד צדדית ברמת מובהקות ‪:1.14‬‬
‫א‪.‬‬
‫החוקר היה דוחה את ‪H0‬‬
‫ב‪.‬‬
‫החוקר עדיין לא היה דוחה את ‪H0‬‬
‫ג‪.‬‬
‫לא ניתן לדעת על סמך הנתונים‬
‫ד‪.‬‬
‫הדבר תלוי בדרגות החופש‬
‫‪ .3‬במידה והערך המחושב של אחד ממבחני המובהקות נמצא במרכז התפלגות הדגימה‪ ,‬אנו‪:‬‬
‫א‪ .‬נדחה את ‪H0‬‬
‫ב‪ .‬נקבל את ‪H0‬‬
‫ג‪ .‬לא נדחה את ‪H0‬‬
‫ד‪ .‬תשובות ב' ו‪ -‬ג' נכונות‬
‫‪ .5‬שני נציגים מהמועצה להשכלה גבוהה התכוונו לבדוק את ההבדל בין חברות קורסי ההכנה‬
‫למבחן הפסיכומטרי (קידום‪ ,‬אנקורי‪ ,‬ולחמן) בציון הפסיכומטרי המתקבלים במבחן‪ .‬באיזה מבחן‬
‫צריכים הנציגים להשתמש?‬
‫א‪.‬‬
‫מבחן ‪ t‬למדגמים בלתי תלויים‬
‫ב‪.‬‬
‫‪( χ5‬חי בריבוע) לאי תלות‬
‫ג‪.‬‬
‫‪( χ5‬חי בריבוע) לטיב התאמה‬
‫ד‪.‬‬
‫מבחן ‪Anova‬‬
‫ה‪.‬‬
‫אף תשובה אינה נכונה‬
‫‪ .4‬חוקר מאוניברסיטת בן‪-‬גוריון רוצה לבדוק אם קיים קשר בין מצב משפחתי (רווק‪ ,‬נשוי‪ ,‬גרוש)‬
‫לבין הצבעה פוליטית (עבודה‪ ,‬ליכוד‪ ,‬קדימה)‪ .‬באיזה מדד קשר על חוקר להשתמש‪:‬‬
‫א‪.‬‬
‫‪( χ5‬חי בריבוע) לטיב התאמה‬
‫ב‪.‬‬
‫מקדם ‪Anova‬‬
‫ג‪.‬‬
‫מבחן ‪ t‬למדגם יחיד‬
‫ד‪.‬‬
‫מבחן ‪ t‬למדגמים תלויים‬
‫ה‪.‬‬
‫אף תשובה אינה נכונה‬
‫‪5‬‬
‫‪ χ‬לאי תלות‬
‫‪ .1‬מה מן הבאים הוא דוגמא לניסוח של השערת החוקר (‪?)HA‬‬
‫א‪.‬‬
‫אין קשר בין אזור מגורים לבין קבוצות דתיות‬
‫ב‪.‬‬
‫כתוצאה ממשבר עולמי‪ ,‬הכנסה ממוצעת ירדה‬
‫ג‪.‬‬
‫תוחלת החיים לא השתנתה‬
‫ד‪.‬‬
‫אין הבדל בין מדינות במידת הסבלנות כלפי אחר‬
‫חלק ‪ 62% -3‬מהציון הסופי‪ .‬פתרון בתוכנת ‪.SPSS‬‬
‫הנהלת המכללה החליטה לבדוק את כמות הצילומים המצולמים על ידי חוגים אקדמיים שונים‪.‬‬
‫להלן תוצאות שנרשמו במהלך שבוע במספר חוגים‪:‬‬
‫מספר צילומים ביום‬
‫חוג‬
‫‪6‬‬
‫‪354‬‬
‫‪545‬‬
‫‪341‬‬
‫‪153‬‬
‫‪335‬‬
‫‪5‬‬
‫‪411‬‬
‫‪154‬‬
‫‪408‬‬
‫‪145‬‬
‫‪415‬‬
‫‪3‬‬
‫‪814‬‬
‫‪180‬‬
‫‪904‬‬
‫‪180‬‬
‫‪051‬‬
‫א‪ 0( .‬נק') הנהלת המכללה טוענת שבחוג מספר ‪ 3‬מצלמים יותר מאשר בחוג מספר ‪ .6‬בדוק‬
‫טענה זו ברמת מובהקות של ‪.4%‬‬
‫ב‪ 5( .‬נק') האם מסקנתך בסעיף קודם תשתנה עבור רמת מובהקות של ‪?6%‬‬
‫ג‪ 0( .‬נק') האם מספר צילומים בחוגים ‪ 6‬ו‪ 5 -‬שונים עבור רמת מובהקות של ‪?4%‬‬
‫ד‪ 5( .‬נק') בנה רווח סמך להפרש בין מספר הצילומים בחוגים ‪ 6‬ו‪ 3 -‬ברמת אמינות של ‪.94%‬‬
‫ה‪ 4( .‬נק') מהו רווח סמך לתוחלת מספר הצילומים בכל חוג בנפרד ברמת אמינות של ‪?94%‬‬
‫ו‪ 0( .‬נק') האם יש הבדל בין כמות הצילומים בין חוגים שונים ברמת מובהקות של ‪?4%‬‬
‫ז‪ 5( .‬נק') דרג את כמות הצילומים בכל החוגים‪.‬‬
‫ח‪ 8( .‬נק') האם ניתן לקבוע שתוחלת מספר הצילומים בכל החוגים יחד גדולה מ‪111 -‬‬
‫צילומים ביום עבור רמת מובהקות של ‪?4%‬‬
‫ט‪ 5( .‬נק') בנה רווח סמך‪ ,‬ברמת סמך ‪ ,91%‬לתוחלת מספר הצילומים בכל החוגים יחד‪.‬‬
‫י‪ 0( .‬נק') בדוק האם יש תלות‪ ,‬ברמת מובהקות של ‪ ,4%‬בין החוג לבין כמות הצילומים‬
‫כאשר כמות יומית של ‪ 411‬צילומים נחשבת נמוכה‪ ,‬בין ‪ 411‬ל‪ 111 -‬צילומים ביום כמות‬
‫בינונית ומעל ‪ 111‬צילומים ביום כמות גדולה‪.‬‬
‫תשובות לחלק ‪:3‬‬
‫א‪ .‬מבחן ‪ t‬לשני מדגמים בילתי תלויים – השוואה בין קב' ‪ 6‬ו‪ .3-‬השערה חד צדדית‬
‫‪H 0 :  3  1‬‬
‫‪H 1 :  3  1‬‬
‫‪Group Statistics‬‬
‫‪Std. Error Mean‬‬
‫‪Std. Deviation‬‬
‫‪N‬‬
‫‪Mean‬‬
‫‪department‬‬
‫‪57.82439‬‬
‫‪129.29927‬‬
‫‪790.4000‬‬
‫‪5‬‬
‫‪3.00‬‬
‫‪58.38236‬‬
‫‪130.54693‬‬
‫‪426.0000‬‬
‫‪5‬‬
‫‪1.00‬‬
‫‪copies‬‬
‫‪ ,0.963>0.05‬שונויות שוות‪ ,‬לכן שני מדגמים הבלתי תלויים נבדקים לפי שורה ראשונה‪.‬‬
‫‪ Pval=0.002/2<0.05‬לכן דוחים את השערת האפס ומסיקים כי אכן בחוג ‪ 3‬מצלמים יותר‬
‫צילומים (ממוצע של ‪ 790‬בחוג ‪ 3‬בהשוואה ל‪ 406-‬בחוג ‪.1‬‬
‫ב‪ Pval=0.002/2<0.01 .‬מסקנה דומה לזו שבסעיף א'‬
‫ג‪ .‬מבחו ‪ t‬בילתי תלויים – השוואה בין קב' ‪ 6‬ו‪ .5-‬השערה דו צדדית‪.‬‬
‫‪H 0 :  2  1‬‬
‫‪H 1 :  2  1‬‬
‫‪Group Statistics‬‬
‫‪Std. Error Mean‬‬
‫‪Std. Deviation‬‬
‫‪N‬‬
‫‪Mean‬‬
‫‪department‬‬
‫‪19.58418‬‬
‫‪43.79155‬‬
‫‪602.8000‬‬
‫‪5‬‬
‫‪2.00‬‬
‫‪58.38236‬‬
‫‪130.54693‬‬
‫‪426.0000‬‬
‫‪5‬‬
‫‪1.00‬‬
‫‪copies‬‬
‫‪ ,0.097>0.05‬שונויות שוות‪ ,‬לכן שני מדגמים הבלתי תלויים נבדקים לפי שורה ראשונה‪.‬‬
‫‪ Pval=0.021<0.05‬לכן דוחים את השערת האפס ומסיקים כי קיים הבדל במספר הצילומים בין‬
‫חוגים ‪ 1‬ו‪.0-‬‬
‫ד‪ .‬מציאה לפי רווח הסמך המתקבל בניתוח מבחן ‪( t‬סעיף א')‬
‫ה‪ .‬ע"י שימוש ב‪( Explore -‬החוג מהווה את ה‪:)"Factor list"-‬‬
‫‪p(9.3621588.1)=0.95‬‬
‫‪p(458659.4769)=0.95‬‬
‫‪p(.9262324062)=0.95‬‬
‫ו‪ .‬אנובה‬
‫‪H 0 : 1   2   3‬‬
‫‪H 1 : otherwise‬‬
ANOVA
copies
Sum of Squares
df
Mean Square
F
Between Groups
332065.600
2
166032.800
Within Groups
142714.000
12
11892.833
Total
474779.600
14
13.961
Sig.
.001
‫ לכן דוחים את השערת האפס ומסיקים כי קיימים הבדלים במספר‬Pval=0.001<0.05
.‫הצילומים בין החוגים השונים‬
Tukey ‫ מבחן‬.‫ז‬
copies
Tukey HSDa
Subset for alpha = 0.05
departm
ent
N
1
2
1.00
5
426.0000
2.00
5
602.8000
3.00
5
Sig.
790.4000
.060
1.000
Means for groups in homogeneous subsets are
displayed.
a. Uses Harmonic Mean Sample Size = 5.000.
:‫דרוג מספר הצילומים בחוגים בהתאם לתוצאות המבחן‬
1 = 2 < 3
H 0 :   600
H 1 :   600
‫ חד צדדי‬,One Sample T test .‫ח‬
One-Sample Test
Test Value = 600
95% Confidence Interval of the
Difference
t
copies
df
.135
Sig. (2-tailed)
14
Mean Difference
.895
Lower
6.40000
Upper
-95.5813
108.3813
‫ לכן מקבלים את השערת האפס ומסיקים כי ממוצע הצילומים אינו גדול‬Pval=0.895/2>0.05
.622-‫מ‬
Explore -‫ ע"י שימוש ב‬.‫ט‬
p(455.8191.65)=0.91
:‫ יצירת משתנה חדש לפי תחומי מס' הצילומים – בעזרת פונקציית‬-‫ שלב ראשון‬.‫י‬
"Recode into different Variable"
.‫בשלב הבא ביצוע מבחן חי בריבוע לאי תלות‬
department * copies_grp Crosstabulation
copies_grp
<500
department
1.00
Count
Expected Count
2.00
Count
Expected Count
3.00
Count
Expected Count
Total
Count
Expected Count
500-600
>600
Total
4
0
1
5
1.3
1.0
2.7
5.0
0
3
2
5
1.3
1.0
2.7
5.0
0
0
5
5
1.3
1.0
2.7
5.0
4
3
8
15
4.0
3.0
8.0
15.0
Chi-Square Tests
Asymp. Sig. (2Value
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
df
sided)
17.250a
4
.002
18.554
4
.001
8.195
1
.004
15
a. 9 cells (100.0%) have expected count less than 5. The minimum
expected count is 1.00.
‫ לכן דוחים את השערת האפס ומסיקים כי קיים קשר בין החוג לבין מספר‬Pval=0.002<0.05
.‫הצילומים‬
!‫בהצלחה‬