IntroToProbability-FormulaSheet-v1.1

Transcription

IntroToProbability-FormulaSheet-v1.1
‫מבוא להסתברות‪ :‬סיכום ודף נוסחאות‬
‫ ‬
‫‪n‬‬
‫‪X‬‬
‫‪n‬‬
‫‪k‬‬
‫‪= 2n−1 n‬‬
‫‪k‬‬
‫‪k=0‬‬
‫‪n‬‬
‫‪X n‬‬
‫‪k2‬‬
‫)‪= 2n−2 n (n + 1‬‬
‫‪k‬‬
‫גרסה ‪ ,1.1‬נובמבר ‪2010‬‬
‫ברק שושני‬
‫‪[email protected] | http://baraksh.co.il/‬‬
‫‪k=0‬‬
‫‪1‬‬
‫‪1.1‬‬
‫סכום על האינדקס העליון‪:‬‬
‫‬
‫‬
‫‬
‫‬
‫‪n‬‬
‫‪X‬‬
‫‪k‬‬
‫‪n+1‬‬
‫=‬
‫‪m‬‬
‫‪m+1‬‬
‫קומבינטוריקה‬
‫עקרון הספירה‬
‫‪k=0‬‬
‫אם בשלב הראשון של ניסוי כלשהו יש ‪ n‬תוצאות אפשריות‪,‬‬
‫ולכל מספר זהויות שימושיות נוספות‪:‬‬
‫יש‬
‫אז‬
‫אחת מתוצאות אלה יש ‪ m‬תוצאות אפשריות בשלב השני‪,‬‬
‫ ‬
‫ ‬
‫‬
‫בסה"כ ‪ nm‬תוצאות אפשריות לניסוי‪.‬‬
‫‪n‬‬
‫‪n−1‬‬
‫‪n−1‬‬
‫=‬
‫‪+‬‬
‫‪k‬‬
‫‪k−1‬‬
‫‪k‬‬
‫‪ 1.2‬סידור ‪ n‬עצמים בשורה‪ :‬פרמוטציות‬
‫‬
‫‬
‫ ‬
‫‪n‬‬
‫‪n n−1‬‬
‫=‬
‫‪k k−1‬‬
‫‪k‬‬
‫‪n! = n · (n − 1) · · · 3 · 2 · 1‬‬
‫ ‬
‫‬
‫‪n‬‬
‫‪k‬‬
‫‪n‬‬
‫‪n−m‬‬
‫יש !‪ n‬דרכים שונות לסדר ‪ n‬עצמים בשורה‪ n :‬אפשרויות לעצם‬
‫=‬
‫הראשון‪ n − 1 ,‬אפשרויות לשני וכך הלאה עד שלעצם האחרון‬
‫‪k‬‬
‫‪m‬‬
‫‪m k−m‬‬
‫נשארת רק אפשרות אחת‪.‬‬
‫ ‬
‫‬
‫ ‪n‬‬
‫‪X‬‬
‫‪m+k‬‬
‫‪m+n+1‬‬
‫יש !)‪ (n − 1‬דרכים לסדר ‪ n‬עצמים במעגל‪ :‬אם נסדר קודם את‬
‫=‬
‫העצמים בשורה ואז נצמיד את הראשון והאחרון נקבל מעגל‪ .‬אך‬
‫‪k‬‬
‫‪n‬‬
‫‪k=0‬‬
‫לאותו מעגל ניתן להגיע ב־‪ n‬צורות שונות )למשל עבור ‪:n = 3‬‬
‫‪ 123, 231, 312‬כולם מייצגים את אותו המעגל( ולכן יש לחלק ב־‪ .n‬קיימים גם מקדמים מולטינומיים‪:‬‬
‫לעצרת )קירוב סטירלינג( כאשר ∞ → ‪n‬‬
‫ניתן לקבל קירוב טוב √ ‪n‬‬
‫‬
‫‬
‫‪.n! ∼ ne‬‬
‫באמצעות הנוסחה ‪2πn‬‬
‫‪n‬‬
‫!‪n‬‬
‫=‬
‫! ‪k1 ! · · · km‬‬
‫‪k1 , . . . , k m‬‬
‫‪ 1.3‬בחירת ‪ k‬עצמים מתוך ‪ n‬ללא החזרה ועם חשיבות‬
‫‬
‫‪n‬‬
‫לסדר‬
‫אם ‪ k1 + · · · + km = n‬אז יש ‪ k1 ,...,km‬חלוקות שונות של קבוצה‬
‫בעלת ‪ n‬עצמים ל־‪ m‬קבוצות זרות בעלות ‪ k1 , . . . , km‬עצמים‪.‬‬
‫!‪n‬‬
‫= )‪nk = n · (n − 1) · · · (n − k + 1‬‬
‫‪ 1.5‬בחירת ‪ k‬עצמים מתוך ‪ n‬עם החזרה ועם חשיבות‬
‫!)‪(n − k‬‬
‫לסדר‬
‫יש ‪ nk‬דרכים שונות לבחור ‪ k‬עצמים מתוך קבוצה של ‪ n‬ולסדר‬
‫אותם בשורה‪ n :‬אפשרויות לעצם הראשון‪ n − 1 ,‬אפשרויות לשני יש ‪ nk‬דרכים שונות לבחור ‪ k‬עצמים מתוך קבוצה בעלת ‪ n‬עצמים‬
‫וכך הלאה עד שלעצם האחרון נשארות ‪ n − k + 1‬אפשרויות‪ .‬נשים עם החזרה‪ n :‬אפשרויות לעצם הראשון‪ n ,‬אפשרויות לשני וכך‬
‫הלאה‪ .‬ניסוח אחר‪ :‬אם בכל שלב בניסוי יש ‪ n‬תוצאות אפשריות‪,‬‬
‫לב כי !‪.nn = n‬‬
‫אז לאחר ‪ k‬שלבים יש ‪ nk‬תוצאות אפשריות בסה"כ‪.‬‬
‫‪ 1.4‬בחירת ‪ k‬עצמים מתוך ‪ n‬ללא החזרה וללא חשיבות‬
‫לסדר‪ :‬מקדמים בינומיים‬
‫ ‬
‫‪n‬‬
‫!‪n‬‬
‫‪nk‬‬
‫=‬
‫=‬
‫‪k‬‬
‫!‪k‬‬
‫!‪(n − k)!k‬‬
‫‬
‫יש ‪ nk‬דרכים שונות לבחור ‪ k‬עצמים מתוך ‪ n‬עצמים כאשר אין‬
‫חשיבות לסדר‪ :‬ראשית נבחר את העצמים ב־ ‪ nk‬דרכים‪ .‬אך כל‬
‫)כמספר הפרמוטציות שלה(‪,‬‬
‫קבוצה של ‪ k‬עצמים מופיעה !‪ k‬פעמים‬
‫‬
‫לכן יש לחלק ב־!‪ .k‬כמו כן נשים לב כי יש ‪ nk‬תת־קבוצות שונות‬
‫בגודל ‪ k‬של קבוצה בגודל ‪.n‬‬
‫הבינום של ניוטון‪:‬‬
‫ ‪n‬‬
‫‪X‬‬
‫‪n k n−k‬‬
‫‪x y‬‬
‫‪k‬‬
‫‪n‬‬
‫= )‪(x + y‬‬
‫‪k=0‬‬
‫תכונות של האינדקס התחתון‪:‬‬
‫ ‬
‫‬
‫‪n‬‬
‫‪n‬‬
‫=‬
‫‪k‬‬
‫‪n−k‬‬
‫‪= 2n‬‬
‫‪k‬‬
‫‪k=0‬‬
‫‬
‫ ‬
‫ ‬
‫ ‬
‫‬
‫‪n‬‬
‫‪k+n−1‬‬
‫‪k+n−1‬‬
‫=‬
‫=‬
‫‪k‬‬
‫‪k‬‬
‫‪n−1‬‬
‫הוכחה )בקטן כי היא ארוכה(‪ :‬לכל אחד מ־‪ n‬העצמים בקבוצה נשייך מספר בין ‪0‬‬
‫ל־‪ k‬הקובע את מספר הפעמים שאותו עצם נבחר‪ ,‬כאשר סכום המספרים המשויכים‬
‫חייב להסתכם ל־‪ .k‬צורה נוחה למצוא את מספר האפשרויות לעשות זאת היא‬
‫לסדר ‪ k‬כוכבים בשורה ולהפריד ביניהם באמצעות ‪ n − 1‬חוצצים‪ ,‬כך שנוצרות‬
‫‪ n‬קבוצות )רצפים של כוכבים( אשר עשויות להיות בגודל ‪ 0‬עד ‪ .k‬לדוגמה‪ ,‬עבור‬
‫‪ k = 5‬ו־‪ ,n = 4‬מיקום אפשרי של חוצצים הוא‪:‬‬
‫?| ? ? ? ||?‬
‫משמעות הסידור‪ :‬ניקח את העצם הראשון בקבוצה פעם אחת‪ ,‬את העצם השני אפס‬
‫פעמים‪ ,‬את העצם השלישי שלוש פעמים ואת העצם הרביעי פעם אחת ‪ -‬בסה"כ ‪5‬‬
‫מיקום ל־‪ n − 1‬החוצצים מתוך‬
‫עצמים‪ ,‬כנדרש‪ .‬כעת‪ ,‬מספר האפשרויות לבחור ‬
‫‪. k+n−1‬‬
‫‪ k + n − 1‬מיקומים אפשריים )כולל הקצוות( הוא‬
‫‪n−1‬‬
‫‪ 1.7‬סידור ‪ k‬עצמים ב־‪ n‬תאים כך שבכל תא יש לפחות‬
‫עצם אחד‬
‫ ‬
‫‪n‬‬
‫‪n‬‬
‫=‬
‫‪= 1,‬‬
‫‪0‬‬
‫‪n‬‬
‫‬
‫‬
‫‪k−1‬‬
‫‪n−1‬‬
‫כמו בסעיף הקודם‪ ,‬נסדר ‪ k‬כוכבים בשורה ונפריד ביניהם באמצעות‬
‫‪ n−1‬חוצצים‪ ,‬כאשר הפעם בין כל שני כוכבים יכול להיות רק חוצץ‬
‫אחד וכל חוצץ חייב להיות בין שני כוכבים ‪ -‬בסה"כ ‪ k−1‬אפשרויות‬
‫למיקום החוצצים‪.‬‬
‫סכומים על האינדקס התחתון‪:‬‬
‫ ‪n‬‬
‫‪X‬‬
‫‪n‬‬
‫‪1.6‬‬
‫לסדר‬
‫בחירת ‪ k‬עצמים מתוך ‪ n‬עם החזרה וללא חשיבות‬
‫ ‬
‫‪n‬‬
‫‪= 0,‬‬
‫‪k‬‬
‫‪k‬‬
‫)‪(−1‬‬
‫‪n‬‬
‫‪X‬‬
‫‪k=0‬‬
‫‪1‬‬
‫הסתברות‬
‫‪2‬‬
‫‪2.1‬‬
‫‪2.4‬‬
‫המאורעות ‪ A, B‬הם בלתי־תלויים אם ורק אם‪:‬‬
‫אקסיומות ונוסחאות בסיסיות‬
‫)‪P (A ∩ B) = P (A) P (B‬‬
‫יהי ‪ S‬מרחב מדגם ויהי ‪ A ∈ S‬מאורע‪ ,‬אז‪:‬‬
‫‬
‫‪P (A) ∈ [0, 1] ,‬‬
‫)‪P A = 1 − P (A‬‬
‫‪P (S) = 1,‬‬
‫או באופן שקול‪:‬‬
‫כאשר ‪ A‬הוא המשלים של ‪ .A‬אם ‪ S‬מרחב סופי וסימטרי אז‪:‬‬
‫|‪|A‬‬
‫= )‪P (A‬‬
‫|‪|S‬‬
‫‪2.2‬‬
‫)‪P (B|A) = P (B‬‬
‫יהיו ‪ ,1 ≤ i ≤ m ,Ai ∈ S‬מאורעות זרים בזוגות‪ ,‬אז‪:‬‬
‫!‬
‫‪n‬‬
‫‪n‬‬
‫[‬
‫‪X‬‬
‫‪P‬‬
‫= ‪Ai‬‬
‫) ‪P (Ai‬‬
‫‪i=1‬‬
‫‪i=1‬‬
‫‪i=1‬‬
‫‪i=1‬‬
‫אם ‪ Ai‬אינם זרים בזוגות אז )עקרון ההכלה וההפרדה(‪:‬‬
‫!‬
‫‪n‬‬
‫‪X‬‬
‫‪X‬‬
‫‪Ai‬‬
‫=‬
‫‪P (Ai ) −‬‬
‫‪P (Ai ∩ Aj ) + . . .‬‬
‫‪i<j‬‬
‫!‬
‫‪P (A|B) = P (A) ,‬‬
‫כלומר הידע ש־‪ B‬קרה לא משנה את ההסתברות ש־‪ A‬יקרה ולהפך‪.‬‬
‫המאורעות ‪ ,1 ≤ i ≤ n ,Ai‬הם בלתי־תלויים אם ורק אם לכל תת־‬
‫קבוצה ‪ Ai1 , . . . , Air‬שלהם מתקיים‪:‬‬
‫!‬
‫‪r‬‬
‫‪r‬‬
‫\‬
‫‪Y‬‬
‫‪P‬‬
‫= ‪Ai‬‬
‫) ‪P (Ai‬‬
‫ההסתברות של איחוד מאורעות‬
‫‪n‬‬
‫\‬
‫מאורעות בלתי־תלויים‬
‫‪3‬‬
‫‪n‬‬
‫[‬
‫הגדרה‪ :‬משתנה מקרי ‪ X : Ω → R‬הוא פונקציה ממרחב המדגם‬
‫‪ Ω‬לשדה המספרים הממשיים ‪ .R‬מסמנים‪:‬‬
‫‪P‬‬
‫‪i=1‬‬
‫‪i=1‬‬
‫משתנה מקרי‬
‫)}‪P (X = k) = P ({ω ∈ Ω|X (ω) = k‬‬
‫‪n+1‬‬
‫)‪· · · + (−1‬‬
‫‪P‬‬
‫‪Ai‬‬
‫כלומר ההסתברות ש־‪ X‬מקבל ערך מסוים )או טווח של ערכים(‬
‫‪i=1‬‬
‫היא ההסתברות של קבוצת כל המאורעות ‪ ω‬במרחב המדגם כך‬
‫כאשר |‪ |A‬מציין את מספר האיברים בקבוצה ‪ .A‬אי־שוויון בול ש־)‪ X (ω‬מקבל את הערך או טווח הערכים הנדרש‪.‬‬
‫קובע כי‪:‬‬
‫!‬
‫‪n‬‬
‫‪n‬‬
‫‪X‬‬
‫[‬
‫‪ 3.1‬תוחלת‬
‫) ‪P (Ai‬‬
‫‪P‬‬
‫≤ ‪Ai‬‬
‫יהי ‪ X‬משתנה מקרי‪ .‬התוחלת של ‪ X‬היא‪:‬‬
‫‪i=1‬‬
‫‪i=1‬‬
‫‪X‬‬
‫= )‪E (X‬‬
‫)‪x · P (X = x‬‬
‫‪2.3‬‬
‫הסתברות מותנית‬
‫‪x‬‬
‫יהיו ‪ A, B‬מאורעות‪ .‬אם ‪ P (B) > 0‬אז ההסתברות המותנית של‬
‫‪ A‬בהינתן ‪ B‬היא‪:‬‬
‫)‪P (A ∩ B‬‬
‫)‪P (B‬‬
‫= )‪P (A|B‬‬
‫מכאן‪:‬‬
‫כאשר הסכום הוא על כל הערכים האפשריים של ‪ .X‬מכאן‪,‬‬
‫התוחלת היא למעשה ממוצע משוקלל של כל ערכי ‪ .X‬באופן‬
‫כללי הביטוי ) ‪ E (X n‬נקרא "המומנט ה־‪ n‬של ‪ ;"X‬התוחלת היא‬
‫המומנט הראשון‪ .‬לכל פונקציה ‪ f : R → R‬מתקיים‪:‬‬
‫‪X‬‬
‫= ))‪E (f (X‬‬
‫)‪f (x) P (X = x‬‬
‫)‪P (A ∩ B) = P (A|B) P (B‬‬
‫‪x‬‬
‫ובאופן כללי יותר‪:‬‬
‫!‬
‫· · · ) ‪P (A1 ) P (A2 |A1 ) P (A3 |A2 ∩ A1‬‬
‫=‬
‫‪Ai‬‬
‫‪n‬‬
‫\‬
‫כאשר הסכימה היא על כל הערכיים האפשריים של ‪) X‬ולא של‬
‫)‪ .(f (X‬התוחלת היא לינארית‪:‬‬
‫‪P‬‬
‫‪E (aX + b) = aE (X) + b‬‬
‫‪i=1‬‬
‫) ‪· · · P (An |An−1 ∩ · · · ∩ A1‬‬
‫‪U‬‬
‫נוסחת ההסתברות השלמה ‪ -‬אם ‪) B = i Bi‬איחוד זר( אז‪:‬‬
‫) ‪P (A|Bi ) P (Bi‬‬
‫‪n‬‬
‫‪X‬‬
‫אם מתקיים )‪ P (a ≤ X ≤ b‬אז בהכרח גם ‪.a ≤ E (X) ≤ b‬‬
‫יתרה מזאת‪ ,‬אם ‪ X ≥ Y‬אז בהכרח ) ‪.E (X) ≥ E (Y‬‬
‫= )‪P (A‬‬
‫‪3.2‬‬
‫‪i=1‬‬
‫יהי ‪ X‬משתנה מקרי‪ .‬השונות של ‪ X‬היא‪:‬‬
‫‬
‫‬
‫‬
‫‪2‬‬
‫‪2‬‬
‫])‪Var (X) = E [X − E (X)] = E X 2 − [E (X‬‬
‫נוסחת בייס‪:‬‬
‫)‪P (B|A) P (A‬‬
‫)‪P (B‬‬
‫שונות‬
‫= )‪P (A|B‬‬
‫נוסחת בייס ‪ +‬נוסחת ההסתברות השלמה‪:‬‬
‫)‪P (B|A) P (A‬‬
‫ ‬
‫‬
‫= )‪P (A|B‬‬
‫‪P (B|A) P (A) + P B A P A‬‬
‫‪U‬‬
‫או במקרה הכללי‪ ,‬אם ‪:A = i Ai‬‬
‫השונות מעלה קבועים בריבוע‪ ,‬ואינה מושפעת מהזזות‪:‬‬
‫)‪Var (aX + b) = a2 Var (X‬‬
‫סטיית התקן מוגדרת להיות השורש של השונות‪:‬‬
‫‪p‬‬
‫)‪σX = Var (X‬‬
‫) ‪P (B|Ai ) P (Ai‬‬
‫‪P (Ai |B) = Pn‬‬
‫) ‪j=1 P (B|Aj ) P (Aj‬‬
‫‪2‬‬
‫‪3.3‬‬
‫פונקציה יוצרת מומנטים‬
‫קל לראות כי‪:‬‬
‫יהי ‪ X‬משתנה מקרי‪ .‬הפונקציה יוצרת המומנטים היא‪:‬‬
‫‪ X tx‬‬
‫= ‪MX (t) = E etX‬‬
‫)‪e P (X = x‬‬
‫)‪Cov (X, X) = Var (X‬‬
‫‪Cov (X, a) = 0‬‬
‫)‪Cov (X, Y ) = Cov (Y, X‬‬
‫) ‪Cov (aX, bY ) = abCov (X, Y‬‬
‫)‪Cov (X + Y, Z) = Cov (X, Z) + Cov (Y, Z‬‬
‫‪‬‬
‫‪‬‬
‫‪n‬‬
‫‪n‬‬
‫‪n X‬‬
‫‪n‬‬
‫‪X‬‬
‫‪X‬‬
‫‪X‬‬
‫‪Cov ‬‬
‫‪Xi ,‬‬
‫= ‪Yj ‬‬
‫) ‪Cov (Xi , Yj‬‬
‫‪x‬‬
‫מתקיים‪:‬‬
‫‬
‫‪00‬‬
‫‪MX‬‬
‫‪(0) = E X 2‬‬
‫‪0‬‬
‫‪MX‬‬
‫‪(0) = E (X) ,‬‬
‫‪MX (0) = 1,‬‬
‫וכך הלאה‪ ,‬כאשר הגזירה היא לפי ‪ .t‬לכן השונות היא‪:‬‬
‫‪2‬‬
‫‪i=1‬‬
‫‪j=1‬‬
‫‪i=1 j=1‬‬
‫אם המשתנים ‪ X, Y‬הם בלתי־תלויים‪ ,‬אז‪:‬‬
‫‪00‬‬
‫‪0‬‬
‫‪Var (X) = MX‬‬
‫‪(0) − [MX‬‬
‫])‪(0‬‬
‫‪Cov (X, Y ) = 0‬‬
‫אם ‪ X‬ו־ ‪ Y‬בלתי־תלויים אז‪:‬‬
‫אבל ההפך אינו בהכרח נכון‪ .‬כמו כן מתקיים הקשר‪:‬‬
‫)‪MX+Y (t) = MX (t) MY (t‬‬
‫) ‪Var (X + Y ) = Var (X) + Var (Y ) + 2 Cov (X, Y‬‬
‫הפונקציה יוצרת המומנטים קובעת את ההתפלגות באופן יחיד‪ ,‬לכן‬
‫ניתן להשתמש בנוסחה זה למציאת ההתפלגות של סכום משתנים ובאופן כללי‪:‬‬
‫מקריים‪ .‬דרך נוספת היא באמצעות נוסחת הקונבולוציה‪:‬‬
‫!‬
‫‪n‬‬
‫‪n‬‬
‫‪X‬‬
‫‪X‬‬
‫‪X‬‬
‫‪X‬‬
‫‪Var‬‬
‫= ‪Xi‬‬
‫‪Var (Xi ) + 2‬‬
‫) ‪Cov (Xi , Xj‬‬
‫= )‪P (X + Y = m‬‬
‫)‪P (X = k) P (Y = m − k|X = k‬‬
‫‪i<j‬‬
‫‪k‬‬
‫‪3.4‬‬
‫שכיח‬
‫‪i=1‬‬
‫מספר משתנים מקריים‬
‫) ‪E (Xi‬‬
‫‪n‬‬
‫‪X‬‬
‫!‬
‫=‬
‫‪Xi‬‬
‫‪i=1‬‬
‫תוחלת מותנית‬
‫יהיו ‪ X, Y‬משתנים מקריים‪ .‬התוחלת של ‪ X‬בהינתן ש־‪Y = y‬‬
‫היא‪:‬‬
‫‪X‬‬
‫= )‪E (X|Y = y‬‬
‫)‪x · P (X = x|Y = y‬‬
‫מתקיים‪:‬‬
‫‪n‬‬
‫‪X‬‬
‫= ‪ρX,Y‬‬
‫מתקיים תמיד ‪ ,−1 ≤ ρX,Y ≤ 1‬כאשר ‪ 1‬משמעותו שמתקיים‬
‫קשר לינארי חיובי בין המשתנים‪ −1 ,‬משמעותו שקיים קשר לינארי‬
‫שלילי ו־‪ 0‬משמעותו שאין קשר לינארי‪.‬‬
‫‪4.3‬‬
‫תוחלת‬
‫‪i=1‬‬
‫מקדם המתאם של ‪ X, Y‬הוא‪:‬‬
‫) ‪Cov (X, Y‬‬
‫‪σX σY‬‬
‫שני משתנים מקריים ‪ X‬ו־ ‪ Y‬הם בלתי־תלויים אם ורק אם לכל‬
‫‪ a, b ∈ R‬המאורעות }‪ {X ≤ a‬ו־}‪ {Y ≤ b‬הם בלתי־תלויים‪ .‬אי־‬
‫תלות של מספר משתנים מקריים מוגדרת בדומה לאי־תלות של‬
‫מספר מאורעות‪.‬‬
‫‪4.1‬‬
‫‪i=1‬‬
‫בפרט‪ ,‬אם המשתנים ‪ Xi‬בלתי־תלויים‪:‬‬
‫!‬
‫‪n‬‬
‫‪n‬‬
‫‪X‬‬
‫‪X‬‬
‫) ‪Var (Xi‬‬
‫‪Var‬‬
‫= ‪Xi‬‬
‫השכיח הוא הערך הנפוץ ביותר בהתפלגות‪ ,‬כלומר הערך של‬
‫המשתנה המקרי שמתקבל בהסתברות הגבוהה ביותר‪ .‬ערך זה‬
‫אינו בהכרח יחיד )לדוגמה‪ :‬התפלגות אחידה(‪.‬‬
‫‪4‬‬
‫‪i=1‬‬
‫‪E‬‬
‫‪x‬‬
‫‪i=1‬‬
‫כאשר הסכום הוא על כל הערכים האפשריים של ‪ .X‬חשוב לשים‬
‫לב כי )‪ E (X|Y = y‬הוא מספר‪ .‬ניתן גם להגדיר את הפונקציה‬
‫לכל סט של משתנים מקריים )המוגדרים על‬
‫אותו מרחב מדגם(‪ ,‬גם ) ‪ ,E (X|Y‬שהיא משתנה מקרי בפני עצמה‪ .‬זהות חשובה )נוסחת‬
‫אם אינם בלתי־תלויים‪ .‬מכאן‪ ,‬אם ניתן לרשום‪:‬‬
‫התוחלת השלמה( היא‪:‬‬
‫‪Xi‬‬
‫‪n‬‬
‫‪X‬‬
‫)) ‪E (X) = E (E (X|Y‬‬
‫=‪X‬‬
‫כלומר‪:‬‬
‫‪i=1‬‬
‫כאשר ‪ Xi‬הם אינדיקטורים שמקבלים את הערך ‪ 1‬בהסתברות ‪pi‬‬
‫ו־‪ 0‬אחרת‪ ,‬אז נקבל‪:‬‬
‫‪pi‬‬
‫‪n‬‬
‫‪X‬‬
‫)‪E (X|Y = y) P (Y = y‬‬
‫‪X‬‬
‫= )‪E (X‬‬
‫‪y‬‬
‫כמו כן מתקיים‪:‬‬
‫= )‪E (X‬‬
‫)‪E (g (X) Y |X) = g (X) E (Y |X‬‬
‫‪i=1‬‬
‫מכאן עם ‪ g (X) = X‬ושימוש בנוסחת התוחלת השלמה נקבל‪:‬‬
‫‪4.2‬‬
‫))‪E (XY ) = E (X · E (Y |X‬‬
‫שונות משותפת‬
‫לכן אם ‪ X, Y‬בלתי־תלויים‪:‬‬
‫יהיו ‪ X, Y‬משתנים מקריים‪ .‬אז השונות המשותפת שלהם היא‪:‬‬
‫)]) ‪E ([X − E (X)] [Y − E (Y‬‬
‫) ‪E (XY ) − E (X) E (Y‬‬
‫=‬
‫=‬
‫) ‪E (XY ) = E (X) E (Y‬‬
‫) ‪Cov (X, Y‬‬
‫‪3‬‬
‫‪4.4‬‬
‫‪5.3‬‬
‫שונות מותנית וסכום משתנים באורך מקרי‬
‫יהיו ‪ X, Y‬משתנים מקריים‪ .‬השונות של ‪ X‬בהינתן ‪ Y‬היא‪:‬‬
‫ ‬
‫‬
‫‪2‬‬
‫‪Var (X|Y ) = E [X − E (X|Y )] Y‬‬
‫ ‬
‫‪2‬‬
‫]) ‪= E X 2 Y − [E (X|Y‬‬
‫התפלגות בינומית שלילית וגאומטרית‬
‫התפלגות בינומית שלילית‪:‬‬
‫‪ X‬הוא מספר הניסויים עד להצלחה ה־‪) n‬כולל(‪ ,‬כשהניסויים בלתי־‬
‫תלויים והסיכוי להצלחה בכל אחד מהם הוא ‪.p‬‬
‫)‪X ∼ NB (n, p‬‬
‫נבחר ‪ n − 1‬מתוך ‪ k − 1‬הניסויים הראשונים‪ .‬ניסויים אלה הצליחו‪,‬‬
‫מכאן )נוסחת השונות השלמה(‪:‬‬
‫בהסתברות ‪ ,pn−1‬וה־‪ k − n‬הנותרים נכשלו‪ ,‬בהסתברות ‪.1 − p‬‬
‫]) ‪Var (X) = E [Var (X|Y )] + Var [E (X|Y‬‬
‫לאחר מכן עלינו להכפיל את התוצאה ב־‪ p‬משום שהניסוי האחרון‬
‫יהי ‪ N‬משתנה מקרי המקבל ערכים שלמים אי־שליליים ויהיו ‪ Xi‬הצליח‪ .‬לכן ההתפלגות היא‪:‬‬
‫‬
‫‬
‫משתנים מקריים בלתי־תלויים‪ ,‬שווי־התפלגות ובלתי־תלויים ב־ ‪,N‬‬
‫‪k−1 n‬‬
‫‪k−n‬‬
‫אז מתקיים‪:‬‬
‫= )‪P (X = k‬‬
‫)‪p (1 − p‬‬
‫!‬
‫‪n−1‬‬
‫‪N‬‬
‫‪X‬‬
‫‪E‬‬
‫) ‪Xi = E (N ) E (Xi‬‬
‫התוחלת והשונות הן‪:‬‬
‫‪i=1‬‬
‫!‬
‫‪2‬‬
‫) ‪= E (N ) Var (Xi ) + [E (Xi )] Var (N‬‬
‫‪Xi‬‬
‫‪N‬‬
‫‪X‬‬
‫‪1−p‬‬
‫‪Var (X) = n 2‬‬
‫‪p‬‬
‫‪Var‬‬
‫והפונקציה יוצרת המומנטים היא‪:‬‬
‫‪n‬‬
‫‪pet‬‬
‫‪1 − (1 − p) et‬‬
‫‪i=1‬‬
‫‪5‬‬
‫‪5.1‬‬
‫התפלגויות‬
‫‪n‬‬
‫‪E (X) = ,‬‬
‫‪p‬‬
‫‬
‫= )‪MX (t‬‬
‫אם )‪ X ∼ NB (n, p‬ו־)‪ Y ∼ NB (m, p‬הם בלתי־תלויים‪ ,‬אז‬
‫מתקיים‪:‬‬
‫התפלגות אחידה‬
‫‪ X‬הוא מספר שלם בין ‪ a‬ל־‪ b‬הנבחר באקראי‪.‬‬
‫)‪X + Y ∼ NB (n + m, p‬‬
‫)‪X ∼ Uni (a, . . . , b‬‬
‫יש בסה"כ ‪ n = b−a+1‬אפשרויות וכל אחת בעלת הסתברות שווה‪ ,‬התפלגות גאומטרית‪:‬‬
‫לכן ההתפלגות‪ ,‬התוחלת‪ ,‬השונות והפונקציה יוצרת המומנטים הן‪ :‬זהו מקרה פרטי של התפלגות בינומית שלילית כאשר ‪.n = 1‬‬
‫)‪X ∼ Geo (p) ≡ NB (1, p‬‬
‫‪1‬‬
‫‪1‬‬
‫=‬
‫= )‪P (X = k‬‬
‫‪b−a+1‬‬
‫‪n‬‬
‫ההתפלגות היא‪:‬‬
‫‪a+b‬‬
‫‪2‬‬
‫‪k−1‬‬
‫)‪P (X = k) = p (1 − p‬‬
‫= )‪E (X‬‬
‫‪2‬‬
‫‪(b − a + 1) − 1‬‬
‫‪n2 − 1‬‬
‫=‬
‫‪12‬‬
‫‪12‬‬
‫‪eat − e(b+1)t‬‬
‫) ‪n (1 − et‬‬
‫‪5.2‬‬
‫‪k‬‬
‫)‪P (X ≤ k) = 1 − (1 − p‬‬
‫התוחלת והשונות הן‪:‬‬
‫= )‪Var (X‬‬
‫‪1−p‬‬
‫= )‪Var (X‬‬
‫‪p2‬‬
‫= )‪MX (t‬‬
‫‪1‬‬
‫‪E (X) = ,‬‬
‫‪p‬‬
‫והשכיח הוא ‪ ,1‬כי ההסתברות יורדת ככל ש־‪ k‬עולה‪ .‬הפונקציה‬
‫יוצרת המומנטים היא‪:‬‬
‫התפלגות בינומית‬
‫‪ X‬הוא מספר ההצלחות ב־‪ n‬ניסויים בלתי־תלויים אשר סיכוי‬
‫ההצלחה בכל אחד מהם הוא ‪.p‬‬
‫‪pet‬‬
‫‪1 − (1 − p) et‬‬
‫= )‪MX (t‬‬
‫)‪X ∼ Bin (n, p‬‬
‫נבחר ‪ k‬מתוך ‪ n‬הניסויים‪ .‬ניסויים אלה הצליחו‪ ,‬בהסתברות ‪ ,p‬ו־ אם )‪ Xi ∼ Geo (p‬עבור ‪ 1 ≤ i ≤ n‬הם בלתי־תלויים‪ ,‬אז מתקיים‪:‬‬
‫‪ n − k‬הניסויים הנותרים נכשלו‪ ,‬בהסתברות ‪ .1 − p‬לכן ההתפלגות‬
‫‪n‬‬
‫‪X‬‬
‫היא‪:‬‬
‫)‪Xi ∼ NB (n, p‬‬
‫ ‬
‫‪n‬‬
‫‪n−k‬‬
‫‪i=1‬‬
‫= )‪P (X = k‬‬
‫)‪pk (1 − p‬‬
‫‪k‬‬
‫ההתפלגות הגאומטרית היא ההתפלגות הבדידה היחידה שהיא‬
‫"חסרת זיכרון"‪ ,‬כלומר‪ ,‬בכל שלב בניסוי יש אותו סיכוי להצלחה‬
‫התוחלת והשונות הן‪:‬‬
‫ללא תלות בכמות או בתוצאות הניסויים הקודמים )למשל‪ ,‬למטבע‬
‫‪E (X) = np,‬‬
‫)‪Var (X) = np (1 − p‬‬
‫שמוטל אין "זיכרון" של ההטלות הקודמות(‪ .‬ניתן לתאר תכונה זו‬
‫באמצעות הנוסחה‪:‬‬
‫השכיח הוא‪:‬‬
‫‪Mode (X) = b(n + 1) pc or b(n + 1) pc − 1‬‬
‫)‪P (X > m + n|X > m) = P (X > n‬‬
‫והפונקציה יוצרת המומנטים היא‪:‬‬
‫כלומר‪ ,‬לכל ‪ ,n, m ∈ N‬אם ידוע לנו שכבר נערכו ‪ m‬ניסויים‬
‫‪n‬‬
‫כושלים‪ ,‬ההסתברות ש־‪ n‬ניסויים נוספים ייכשלו שווה להסתברות‬
‫‪MX (t) = 1 − p + pet‬‬
‫ש־‪ n‬ניסויים ייכשלו אם נתחיל את התהליך מהתחלה‪ .‬מכאן‪ ,‬אם‬
‫אם )‪ X ∼ Bin (n, p‬ו־)‪ Y ∼ Bin (m, p‬הם בלתי־תלויים‪ ,‬אז מצאנו התפלגות המקיימת‪:‬‬
‫מתקיים‪:‬‬
‫)‪P (X = k + 1) = cP (X = k‬‬
‫)‪X + Y ∼ Bin (n + m, p‬‬
‫כאשר ‪ c‬קבוע כלשהו‪ ,‬התפלגות זו בהכרח תהיה גאומטרית )הקבוע‬
‫‪ c‬הוא פשוט ההסתברות לכישלון בניסוי(‪.‬‬
‫‪4‬‬
‫‪5.4‬‬
‫התפלגות היפרגאומטרית‬
‫או באופן שקול‪:‬‬
‫‪1‬‬
‫‪ X‬הוא מספר הפריטים "המיוחדים" שנמצאו בדגימה )ללא החזרה(‬
‫בגודל ‪ n‬מתוך אוכלוסייה בגודל ‪ N‬הכוללת ‪ D‬פרטים מיוחדים‪.‬‬
‫‪k2‬‬
‫קיימת גם גרסה חד־צדדית של שוויון זה‪:‬‬
‫)‪X ∼ HG (N, D, n‬‬
‫≤ )‪P (|X − E (X)| ≥ kσ‬‬
‫נבחר ‪ k‬פריטים מיוחדים מתוך ‪ D‬המיוחדים שבאוכלוסייה‪ ,‬ונבחר‬
‫את ‪ n − k‬הפריטים הלא־מיוחדים שנשארו מתוך ‪ N − D‬הלא־‬
‫מיוחדים באוכלוסייה‪ .‬נחלק את מספר האפשרויות בגודל מרחב‬
‫המדגם‪ ,‬שהוא ‪ n‬פריטים כלשהם שנדגמו מאוכלוסייה בגודל ‪.N‬‬
‫לכן ההתפלגות היא‪:‬‬
‫‬
‫‬
‫‪D N −D‬‬
‫‪k‬‬
‫‪n−k‬‬
‫‬
‫‪N‬‬
‫‪n‬‬
‫= )‪P (X = k‬‬
‫‪σ2‬‬
‫‪σ2 + k2‬‬
‫≤ )‪P (X − E (X) ≥ k‬‬
‫או באופן שקול‪:‬‬
‫‪1‬‬
‫‪1 + k2‬‬
‫≤ )‪P (X − E (X) ≥ kσ‬‬
‫אבחנה חשובה ‪ -‬אם המשתנה המקרי הוא סימטרי סביב התוחלת‪,‬‬
‫כלומר )‪ ,P (X − E (X)) = P (E (X) − X‬אז ניתן לרשום‪:‬‬
‫‪1‬‬
‫)‪P (|X − E (X)| ≥ k‬‬
‫‪2‬‬
‫התוחלת והשונות הן‪:‬‬
‫‬
‫‪D‬‬
‫‪D N −n‬‬
‫‪Var (X) = n‬‬
‫‪1−‬‬
‫‪N‬‬
‫‪N N −1‬‬
‫‪k‬‬
‫‪j‬‬
‫והשכיח הוא‬
‫)‪. (n+1)(D+1‬‬
‫‪N +2‬‬
‫‬
‫‪D‬‬
‫‪,‬‬
‫‪N‬‬
‫‪E (X) = n‬‬
‫‪6.3‬‬
‫אי־שוויון צ'רנוף‬
‫יהי ‪ X‬משתנה מקרי ותהי‪:‬‬
‫‬
‫‪tX‬‬
‫‪5.5‬‬
‫= )‪P (X − E (X) ≥ k‬‬
‫התפלגות פואסונית‬
‫‪ X‬הוא מספר ההצלחות בתהליך בינומי כאשר ‪,n → ∞ ,p → 0‬‬
‫אך המכפלה ‪ λ = np‬קבועה‪ .‬לכן ההתפלגות משמשת לקירוב של‬
‫תהליכים בהם יש הסתברות נמוכה להצלחה ומספר רב של ניסיונות‪,‬‬
‫לדוגמה מספר טעויות ההדפסה בספר או מספר האנשים שמגיעים‬
‫לגיל ‪ 100‬באוכלוסייה‪.‬‬
‫)‪X ∼ Pois (λ‬‬
‫‪MX (t) = E e‬‬
‫הפונקציה יוצרת המומנטים שלו‪ .‬אז מתקיים‪:‬‬
‫‪P (X ≥ a) ≤ e−ta MX (t) ,‬‬
‫‪t>0‬‬
‫‪P (X ≤ a) ≤ e−ta MX (t) ,‬‬
‫‪t<0‬‬
‫באמצעות מציאת ה־‪) t‬החיובי או השלילי לפי המקרה( שנותן את‬
‫הערך הנמוך ביותר לפונקציה )‪ ,e−ta MX (t‬נוכל למצוא את החסם‬
‫הטוב ביותר‪.‬‬
‫ההתפלגות‪ ,‬התוחלת והשונות הן‪:‬‬
‫‪E (X) = Var (X) = λ‬‬
‫‪e−λ λk‬‬
‫‪,‬‬
‫!‪k‬‬
‫‪6.4‬‬
‫= )‪P (X = k‬‬
‫‪00‬‬
‫הגדרה‪ :‬פונקציה )‪ f (x‬נקראת קמורה אם ‪ f (x) ≥ 0‬לכל ‪,x‬‬
‫וקעורה אם ‪ .f 00 (x) ≤ 0‬אם )‪ f (x‬קמורה אז מתקיים‪:‬‬
‫והשכיח הוא ‪ ,bλc‬או ‪ λ−1‬אם ‪ .λ ∈ Z‬הפונקציה יוצרת המומנטים‬
‫היא‪:‬‬
‫)‪−1‬‬
‫‪t‬‬
‫אי־שוויון ינסן‬
‫])‪E [f (X)] ≥ f [E (X‬‬
‫‪MX (t) = eλ(e‬‬
‫אם )‪ X ∼ Pois (λ‬ו־)‪ Y ∼ Pois (µ‬הם בלתי־תלויים‪ ,‬אז מתקיים‪:‬‬
‫‪6.5‬‬
‫קירוב לינארי‬
‫יהיו ‪ X, Y‬משתנים מקריים‪ .‬התחזית הלינארית האופטימלית‪,Yˆ ,‬‬
‫של ‪ Y‬לפי ‪ X‬ניתנת באמצעות הנוסחה‪:‬‬
‫)‪X + Y ∼ Pois (λ + µ‬‬
‫)‪X − E (X‬‬
‫) ‪Yˆ − E (Y‬‬
‫‪= ρX,Y‬‬
‫‪σY‬‬
‫‪σX‬‬
‫‪6‬‬
‫‪6.1‬‬
‫אי־שוויונים‪ ,‬קירובים ומשפטי גבול‬
‫כאשר‪:‬‬
‫) ‪Cov (X, Y‬‬
‫‪σX σY‬‬
‫אי־שוויון מרקוב‬
‫יהי ‪ X‬משתנה מקרי אי־שלילי‪ ,‬אז לכל ‪ a > 0‬מתקיים‪:‬‬
‫)‪E (X‬‬
‫‪a‬‬
‫הוא מקדם המתאם )ע"ע(‪ .‬ביטוי מפורש ל־ ˆ‪ Y‬הוא‪:‬‬
‫‪Yˆ = aX + b‬‬
‫≤ )‪P (X ≥ a‬‬
‫ניתן לבצע הזזה של המשתנה‪ ,‬כלומר )‪ ,P (X − b ≥ a − b‬כדי‬
‫לשפר את החסם ‪ -‬כל עוד ‪ X − b‬אי־שלילי‪ .‬כמו כן‪ ,‬במקרה של‬
‫מספרים שלמים )‪.P (X > a) = P (X ≥ a + 1‬‬
‫‪6.2‬‬
‫אי־שוויון צ'בישב‬
‫‪2‬‬
‫יהי ‪ X‬משתנה מקרי בעל שונות )‪ ,σ = Var (X‬אז לכל ‪k > 0‬‬
‫מתקיים‪:‬‬
‫‪σ2‬‬
‫‪k2‬‬
‫= ‪ρX,Y‬‬
‫כאשר‪:‬‬
‫) ‪Cov (X, Y‬‬
‫)‪E (X‬‬
‫)‪Var (X‬‬
‫‪b = E (Y ) −‬‬
‫) ‪Cov (X, Y‬‬
‫‪,‬‬
‫)‪Var (X‬‬
‫=‪a‬‬
‫השגיאה הריבועית הממוצעת )‪ (MSE‬של התחזית ˆ‪ Y‬היא‪:‬‬
‫‬
‫ ‬
‫ ‪2‬‬
‫‪MSE Yˆ = E Yˆ − Y‬‬
‫מספקת מדד למידת הדיוק של הקירוב הלינארי‪.‬‬
‫והיא ‬
‫‪ MSE Yˆ = 0‬הקירוב הוא מדויק‪.‬‬
‫≤ )‪P (|X − E (X)| ≥ k‬‬
‫‪5‬‬
‫אם‬
‫עבור קירוב של משתנה מקרי בינומי שלילי‪ ,‬נציג אותו כסכום של‬
‫‪ 6.6‬חוק המספרים הגדולים‬
‫משתנים גאומטריים; עבור קירוב של משתנה מקרי פואסוני‪ ,‬נציג‬
‫יהיו ‪X1 , X2 , . . .‬‬
‫משתנים מקריים בלתי־תלויים ושווי־התפלגות אותו כסכום של משתנים פואסוניים עם ‪ ;λ = 1‬עבור קירוב של‬
‫בעלי תוחלת ‪ µ‬ושונות ‪ .σ 2‬אז מתקיים‪:‬‬
‫משתנה מקרי בינומי‪ ,‬נציג אותו כסכום של אינדיקטורים )משתנים‬
‫בינומיים עם ‪ .(n = 1‬במקרה האחרון הקירוב נחשב טוב אם‬
‫!‬
‫‪n‬‬
‫‪n‬‬
‫‪ np (1 − p) ≥ 10‬בערך‪.‬‬
‫‪1X‬‬
‫‪1‬‬
‫‪1X‬‬
‫‪E‬‬
‫= ‪Xi‬‬
‫‪E (Xi ) = · nµ = µ‬‬
‫כמו כן‪ ,‬אם המשתנה המקרי שלנו מקבל ערכים שלמים בלבד‬
‫‪n‬‬
‫‪n‬‬
‫‪n‬‬
‫)זה בדר"כ המצב(‪ ,‬ואנו רוצים לבדוק למשל מתי )‪ ,P (X > b‬אז‬
‫‪i=1‬‬
‫‪i=1‬‬
‫ניתן להפוך את הקירוב לקצת יותר טוב אם משנים את ‪ b‬למספר‬
‫!‬
‫‪n‬‬
‫‪n‬‬
‫בתחום‪ ,‬למשל עבור‬
‫הקרוב ביותר ל־‪ b‬כך ש־‪ b‬נכלל ‪P‬‬
‫החצי־שלם ‪P‬‬
‫‪1X‬‬
‫‪1X‬‬
‫‪1‬‬
‫‪σ2‬‬
‫)‪ P ( Xi ≥ 100‬אפשר לחשב )‪.P ( Xi ≥ 99.5‬‬
‫‪Var‬‬
‫= ‪Xi‬‬
‫= ‪Var (Xi ) = 2 · nσ 2‬‬
‫‪n i=1‬‬
‫‪n i=1‬‬
‫‪n‬‬
‫‪n‬‬
‫‪7‬‬
‫לכן לכל ‪ ε > 0‬מתקיים‪ ,‬לפי אי־שוויון צ'בישב‪:‬‬
‫‬
‫‬
‫!‬
‫‪n‬‬
‫‪1 X‬‬
‫‬
‫‪σ2‬‬
‫‬
‫‬
‫‪Xi − µ ≥ ε ≤ 2‬‬
‫‬
‫‪n‬‬
‫‬
‫‪nε‬‬
‫‪i=1‬‬
‫ובגבול ∞ → ‪ n‬נקבל‪:‬‬
‫‬
‫‬
‫!‬
‫‪n‬‬
‫‪1 X‬‬
‫‬
‫‬
‫‬
‫‪Xi − µ ≥ ε = 0‬‬
‫‬
‫‪n‬‬
‫‬
‫‪i=1‬‬
‫‪7.1‬‬
‫‪P‬‬
‫סכומים נפוצים‬
‫)‪n (n + 1‬‬
‫‪2‬‬
‫‪lim P‬‬
‫‪Pn‬‬
‫‪i=1‬‬
‫‪1‬‬
‫‪n‬‬
‫של‬
‫=‪k‬‬
‫‪q m − q n+1‬‬
‫‪1−q‬‬
‫או‪:‬‬
‫‪3‬‬
‫‪lim P‬‬
‫)‪(1 − q‬‬
‫= ‪qk‬‬
‫= ‪k2 qk‬‬
‫‪n‬‬
‫‪X‬‬
‫‪k=m‬‬
‫∞‬
‫‪X‬‬
‫‪k=0‬‬
‫‪1 − q n+1‬‬
‫‪,‬‬
‫‪1−q‬‬
‫‪2,‬‬
‫‪q‬‬
‫)‪(1 − q‬‬
‫∞→‪n‬‬
‫‪k · k! = (n + 1)! − 1‬‬
‫כאשר‪:‬‬
‫‪2‬‬
‫‪1‬‬
‫‪e− 2 x dx‬‬
‫∞‪−‬‬
‫‪k=0‬‬
‫‬
‫‪(n + 1 − m) 2n2 + 2m2 + 2nm + n − m‬‬
‫= ‪k‬‬
‫‪6‬‬
‫‪ 1 Pn‬‬
‫‪a‬‬
‫‪n‬‬
‫‪X‬‬
‫‪2‬‬
‫)‪q (1 + q‬‬
‫ˆ‬
‫‪n‬‬
‫‪X‬‬
‫‪k=m‬‬
‫)‪n (n + 1) (2n + 1‬‬
‫= ‪k‬‬
‫‪6‬‬
‫יהיו ‪ X1 , X2 , . . .‬משתנים מקריים בלתי־תלויים ושווי־התפלגות‬
‫בעלי תוחלת ‪ µ‬ושונות ‪ .σ 2‬אז לכל ‪ a ∈ R‬מתקיים‪:‬‬
‫‪ Pn‬‬
‫‬
‫‪i=1 Xi − nµ‬‬
‫√‬
‫‪lim P‬‬
‫)‪≤ a = Φ (a‬‬
‫∞→‪n‬‬
‫‪σ n‬‬
‫‪n‬‬
‫‪k=0‬‬
‫‪2‬‬
‫משפט הגבול המרכזי‬
‫‬
‫‪i=1 Xi − µ‬‬
‫√‬
‫)‪≤ a = Φ (a‬‬
‫‪σ/ n‬‬
‫=‪k‬‬
‫‪n‬‬
‫‪X‬‬
‫)‪(n + m) (n + 1 − m‬‬
‫‪2‬‬
‫∞→‪n‬‬
‫מכאן‪ ,‬ככל שנגדיל את מספר הניסויים ‪ ,n‬הממוצע ‪Xi‬‬
‫תוצאות הניסויים יתקרב לתוחלת ‪.µ‬‬
‫‪6.7‬‬
‫שונות‬
‫= ‪qk‬‬
‫= ‪kq k‬‬
‫‪n‬‬
‫‪X‬‬
‫‪k=m‬‬
‫‪n‬‬
‫‪X‬‬
‫‪k=0‬‬
‫∞‬
‫‪X‬‬
‫‪k=0‬‬
‫‪n‬‬
‫‪X‬‬
‫‪k=1‬‬
‫‪1‬‬
‫√ = )‪Φ (a‬‬
‫‪2π‬‬
‫‪7.2‬‬
‫‪ P‬שהיא התפלגות רציפה‬
‫היא ההתפלגות הנורמלית הסטנדרטית‪,‬‬
‫‪n‬‬
‫המקיימת ‪ .Φ (∞) = 1‬יהי ‪ An = n1 i=1 Xi‬הממוצע של‬
‫תוצאות ‪ n‬הניסויים הראשונים‪ .‬קל לראות כי למשתנה המקרי‪:‬‬
‫‪An − µ‬‬
‫√‬
‫‪σ/ n‬‬
‫טיפים לפתרון בעיות‬
‫• אם מצאנו הסתברויות של מאורעות שהאיחוד הזר שלהם הוא‬
‫כל מרחב המדגם‪ ,‬כדאי לבדוק שסכום ההסתברויות הוא אכן‬
‫‪.1‬‬
‫• אם צריך למצוא את ההסתברות ש"לפחות איבר אחד מתוך‬
‫קבוצה כלשהי מקיים תנאי כלשהו" אז לרוב עדיף למצוא את‬
‫אחד מינוס ההסתברות המשלימה‪ ,‬כלומר ההסתברות "לא‬
‫קיים אף איבר בקבוצה המקיים את התנאי"‪ .‬אחרת יש סכנה‬
‫לספירות כפולות‪.‬‬
‫= ‪Yn‬‬
‫יש תוחלת ‪ 0‬ושונות ‪ ,1‬ומתקיים‪:‬‬
‫)‪lim P (Yn ≤ a) = Φ (a‬‬
‫∞→‪n‬‬
‫• לפונקציה )‪ p (1 − p‬יש נקודת מקסימום ב־ ‪ ,p = 21‬וערכה שם‬
‫הוא ‪. 41‬‬
‫מכאן‪ ,‬ככל שנגדיל את מספר הניסויים ‪ ,n‬התפלגות הממוצע‬
‫"המתוקנן" ‪ Yn‬תתקרב להתפלגות הנורמלית הסטנדרטית‪.‬‬
‫אם ברשותנו טבלת התפלגות נורמלית בעלת ערכים חיוביים בלבד‪,‬‬
‫נוכל להשתמש בנוסחה‪:‬‬
‫• למציאת התוחלת של מכפלת משתנים מקריים ) ‪ E (XY‬ניתן‬
‫להתנות באחד מהם ולהשתמש בנוסחת התוחלת השלמה‪.‬‬
‫)‪Φ (−a) = 1 − Φ (a‬‬
‫• אם קיבלנו התפלגות שהיא סימטרית סביב ערך ‪) c‬כלומר‬
‫)‪ P (X = c + k) = P (X = c − k‬אז ‪.E (X) = c‬‬
‫כמו כן נשים לב כי קיים קירוב גם לאי־שוויון בכיוון ההפוך‬
‫)ההסתברות המשלימה(‪:‬‬
‫• כדי להראות ששני משתנים מקריים ‪ X, Y‬הם תלויים מספיק‬
‫למצוא ‪ k‬מסוים שעבורו )‪.P (X|Y = k) 6= P (X‬‬
‫• אם צריך למצוא את היחס בין שני ערכים )למשל הסתברויות(‪,‬‬
‫לפעמים חלק מהביטויים מצטמצמים ואין צורך לחשב אותם‪.‬‬
‫לדוגמה‪ :‬בחישוב יחס בין הסתברויות מותנות המכנה עשוי‬
‫להצטמצם‪.‬‬
‫)‪lim P (Yn ≥ a) = 1 − Φ (a‬‬
‫∞→‪n‬‬
‫ולאי שוויון דו־צדדי )‪:(|Yn | ≤ a‬‬
‫‪lim P (−a ≤ Yn ≤ a) = Φ (a) − Φ (−a) = 2Φ (a) − 1‬‬
‫∞→‪n‬‬
‫‪6‬‬