הסתברות מ - Anat Etzion
Transcription
הסתברות מ - Anat Etzion
) – חורף תשע"א440032( מבוא לסטטיסטיקה :פונקצית התפלגות מצטברת . :שונות וסטיית תקן :הגדרה Fx ( x ) P ( X x ) .לא יורדת . lim . :רציף f x ( x ) dx Fx ( x ) )2 Fx ( x ) d fx ( x ) )5 Fx ( x ) dx lim Fx ( x ) 1 )1 Fx ( x ) 0 )3 x .רציפה מימין .לכל פונקציה F וגם . V ar ( c ) f קבוע אמ"מ 0 SD ( X ) x , y : PX Y x , y PX x PY y אם הסתברות משותפת היא מכפלת שתי ,y והשנייה שלx האחת של,פונקציות תלות- אזי ניתן להסיק שקיימת איf ( x ) g ( y ) .בין המשתנים קבוצות זרות של מ"מ- פונקציות ותת:הערה .בלתי תלויים הן בלתי תלויות Var ( X ) Y E Y | X 2 | X :שונות מותנית )6 U ni [ 0 , 1 ] :תלות מ"מ בדידים-אי מ"מ הם ב"ת אם"ם אם X ,Y V ar (Y V ar Y E X) V ar E Y X x z Z 2 z 1 2 e 2 Z נורמלי N ( 0 , 1) :ואריאנס-קו C ov ( X , X ) Var ( X ) X C ov ( X , Y ) E Y Y x E XY E X E X E Y ) P Z a X a P a Z b C ov X ,Y b a N ( , Y 2 -ו ) 2 . N ( , X 1 N ( X Y 2 , 1 :סכום נורמלים ) 1 2 2 1 2 גאמא: - נורמלי ב. מתפלגת קושי:מנת נורמלים , ש"ה,ב"ת X n N , 2 n n lim X , E X 2 :נגדיר Xi Var i i 1 X :משפט הגבול המרכזי n n 1 n X 1 , X 2 , ..., X n S n n P X i / x P( X x) x X 1 , X 2 , ..., X nx x f m in ) d c S n S n 1 e S dS n 1 ! n 1 x X a , b P a X b a a U ni [ 0, x ] b f x ( x ) dx 1 (X | Y y) x P(X x | Y y) x (Y ) (Y | X x ) P ( X x ) x פונקצית צפיפות של . :סטנדרטיזציה V ar X 1 ותמיד fx ( x ) 0 אם fx ( x ) f x ( x ) dx 1 E X xf X x y dx Y :תוחלת של רציף x f x ( x ) dx E g X .N מn ובוחריםn1 P (n E Y x f x ( x ) dx התוחלת קיימת רק כאשר f x ( x ) y fY ב"ת , X i exp( ) S E X Y | X Y y x dy dx EX 0 exp p :אז P (T t s T t ) P (T s ) 2 V ar X x f X x dx x f X x dx .Y Gamma n , X 1 , X 2 , ..., X ,Y n :Gamma התפלגות n Xi נגדיר, X i 1 ˆ X 2 1 2 n n 1 n 1 n , . X Gamma r , X Y Gamma r s , כנ"ל יתקיים X,Y n exp Y X Y XiX (X Y Y ) (X Y ) Y ˆ 1 X Beta r , s (X 2 2 ) ( ( X אז נקבל | Y y ) V ar ( X | Y y ) ( ( X Y y )) מ"מ ב"תN . exp 1/ תצפיות Xi 2 Xi :wald משפט XN , Xi -בכל ה … f :ס"מ לשונות כשהתוחלת ידועה :ס"מ לתוחלת כשהשונות ידועה - B er p , exp , P o is X :QQ-PLOT n pa ... N n Nk nk B in M n, N M e k .האירוע האחרון k! :מירוץ פואסון משני מאורעות בהסתברויות pb 1 1 e 1 X X 1 xi 1 n n xi 1 e e : - ס"מ ל. S X i : -ס"מ ל , - ס"מ ל. S i / n 1 X I{X 1 1 } .) h x 1 ( S X 1 , X i F x X p x F X P X p p f p X 1 xi S 1 n 2 p p 2 Xi X 2 1 n n xi x i or XiX 2 X i 2 X i X X 2 1 ln xi p . הנחת ההתפלגות נכונה-קו ישר בגרף :2-דוגמא - שברונית תיאורטיים:x ציר i / n 1 . תצפיות ממוינות לפי הסדר:y ציר :דוגמא מוצאים כיצד לבטא p i / n 1 ע"י p מוסיפים n :סטטיסטי מספיק X 1 exp - ס"מ ל , ב"ת 2 E S N EX EN EN U 0 , B er p Xi EX i S N X1 i i/n+1 p X 2 j k) N2 n 2 . P o is ( p a ), P o is ( p b ) מ"מים ב"ת שמתפלגים מתקיים פיצול לכל שתי אפשרויות של:!ב"ת ! אלו שני פואסון ב"ת."האנשים" שמגיעים כל ערך מתוך טווח:Uni(k,n) התפלגות אחידה . מתקבל באותה הסתברות,ערכים מסוים : דוגמא-סטטיסטי מספיק ( X Y ) ( ( X Y | Y y )) | Y y )) P o is B in n , p X i2 , X i 2 2 pˆ X כאשר Gamma s , (X N1 n 1 | Y y ) y ( X | Y y ) ( XY | Y ) Y ( X | Y ) התפלגות N , 2 2X ˆ X עבור:Gamma חילוק X n n x0 אם:Gamma חיבור ב"ת אז . המנה והסכום בשני הנ"ל ב"ת. ©ענת עציון G am m a 1 , n 1 ! : שלם ˆ X e x x n 1 e x x n 1 f X x n n 1 ! otherw ise 0 1 ˆ X E xp i מומנטים.ש 2 כאשר:מרובה סוגים n k קטן אזp- גדול וn כאשר:קירוב פואסוני לבינומי . np ניתן לקרב את הבינומי לפואסוני עם !מג"מ-הערה! ניתן לעשות קירוב נורמלי לבינומי Y P ois ( ) , X P ois ( ) :סכום פואסונים ב"ת . ( X Y ) P ois ( ) ואז מתרחש אחדZ P ois ( ) אם:פיצול פואסון f x ( x ) E ( Y X x ) dx (X Y | Y y) (X | Y y) y ˆ .. n X 1| X 1 X 2 n Bin n , 1 1 2 :נוסחאות נוספות P ( X x ) dx נוסחת הזנב 0 אנ"מ of type 1 אם X אם. G ( t ) P ( T t ) נגדיר, T נתון מ"מ:משפט . T ~ E xp ( ) כך ש קיים, G ( t s ) G ( t ) G ( s ) ,מ"מ ב"ת . 1 אז, F x 0 באזורים בהם:לב-לשים : שונות של רציף ( X Y j n N, D N N n p k 1 Fx ( x ) dx :סכום עם גיאומטרי N X i i 1 N P(X Y ) לא היהt אם נתון כי עד רגע:תכונת חוסר זיכרון אז הזמן עד למופע הבא מתחיל מהתחלה,מופיע . :תחרות בין אקספוננציאלים X ,Y X ~ E xp ( ), Y ~ E xp ( ) N Geo ( p ) E X N D nk מספר האירועים:Pois( )התפלגות פואסון בדידה אם ידוע כי הם מתרחשים בקצב,ביחידת זמן נתונה ובאופן ב"ת בפרק הזמן מאז 0 ממוצע קבוע X ~ Exp ( ), Y ~ Exp ( ) M in ( X , Y ) ~ Exp ( ) D k X ~ HG (n, N , M ) X X km11 p m q k m גדול מאודN כאשר:קירוב בינומי להיפר גיאומטרי אזי תוצאת החישוב עם ההחזרה, n -ביחס ל (הבינומית) קרובה לתוצאת החישוב בלי החזרה . p D / N , n n .)(ההיפר גיאומטרית אז במקרה הרציף g x f x ( x ) dx p k בכד:HG(N,D,n) גיאומטרית-התפלגות היפר . כדורים לבניםM - כדורים שחורים וN נמצאים ההסתברות. כדורים באקראי ללא החזרהn מוציאים . כדורים שחוריםk שבין הכדורים שהוצאו נמצאים ( X ) ( ( X |Y )) ( g ( Y )) . :במקרה הרציף ( X | Y ) g (Y ) B (n, p) k 1 אם :נוסחת ההחלקה :הסת' שלמה :מינימום של אקספוננט הוא אקספוננט k X B (m n, p) ( X ) ( X | Y y ) P (Y y ) y X ,Y (X | Y y) k . ב"ת אז ( X | Y ) ( X ) f X x f X |Y x |Y k P Y k 2 x x0 f X x e otherw ise 0 e :תוחלת מותנית , הסתברות הצלחה p p . p הסתברות ההצלחה בכל ניסוי היא אם ידוע שלא הייתה הצלחה עד לניסוי:חוסר זיכרון הינהm+k אז ההסתברות כי היא תקרה בניסויm-ה .עדיין כמו בנוסחה :NB(m,p) התפלגות בינומית שלילית ית בדיוק- m -ההסתברות לקבל את ההצלחה ה . p כאשר לכל ניסוי הסת' הצלחהk -בניסיון ה :נוסחת הזנב X :מעבר לאקספוננט X E f x ( x ) dx P a X b P X b P X a n 1 exp 0 ( X ) P( X k ) k 1 ( X a FX ( x ) P ( X a ) . P lim | X n | 0 1 x ) dx 0 U [ 0 , 1] ba bin / n אם:סכום בינומים : בשניהם) אזp (אותו :Geo(p) התפלגות גיאומטרית -ההסתברות להצלחה ראשונה בנסיון ה X Y P(k ) : אזEX i P |X n | 0 :החזק 2 2 b X a , ln 1U x וגם B (m, p) כאשר nk p k q n k כמו סכום של גיאומטרי 1 n n i 1 X i a otherw ise m in|m ax x b a xb אם:סטטיסטי הסדר n 1 x e y) Var X pq EX p עבור:חוק המספרים הגדולים לכל:החלש :פונקצית הצפיפות 2 1 f ( x ) ba x 0 U 0 ,1 n U [a, b] e :תקנון Xi :התפלגויות רציפות P P(X a) e a X b x, Y x y -ב"ת ו :אינטגרלים d x 1 0 זמן בין מאורעות:התפלגות אקספוננציאלית .פואסון P x aE X b ( XY ) ( X ) ( Y ) ב"ת אזX , Y אם:כלל הכפל . בלתי מתואמים:זוג מ"מ שמקיים את הנוסחה E XY xyP X x ,Y y :לכל שני מ"מ ) לכל6 a X a b ( X ) E ( X m in ) , e Y x) 0 Xi i 1 b a 2 n 1 U [ 0 ,1 ] ( g ( X )) g ( x ) P ( X x 2 e z dz E aX b ( g ( X , Y )) g ( x , y ) P ( X x y n n X קבוע X X X * : כאשר, מ"מ רציף אז ( X m ax ) )5 X *Y * 2 N (n , n 12 n 1 E :)התפלגות אחידה (יוניפורמית (b a ) Z ) C ov ( Y , X ) C ov ( X , Z ) 0 EX EY ) אם1 X )4 . C ov ( X , a ) כלומר (a) -ו b , cY d ) acC ov ( X , Y ) 0 0 ,1 FX P ( c X d ) :ב"ת i 1 n :אז C orr X ,Y a n U [ 0 ,1] f X x 1 V ar ( X ) n . C ov ( aX . C ov ( X , Y N 0 ,1 n 1 N n X n כלומר Y .) (ההפך לא בהכרח נכון. בלתי מתואמים ב"ת . סימטריות- C ov ( X , Y ) C ov ( Y , X ) )3 i X Y E ב"ת אז 0 . ב"תX , Y Cov ( X , Y ) 0 בד"כ ההיפך לא נכון . בלתי מתואמיםX , Y אזC ov ( X , Y ) 0 ) אם2 ב"ת אז ) 2 . C ov ( X , Y ) 2 f m ax V ar X Y V ar X V ar Y 1 2 2 P k p k q x F . ההסתברות לקבל:Bim(n,p) התפלגות בינומית ניסויים שלכל אחדn הצלחות בסדרה שלk בדיוק :תוחלת xP X x x R X :פונקצית הסתברות של מ"מ 1 ניסוי בעל שתי תוצאות:Ber(p) ניסוי ברנולי : F -' ו'כישלוןS -' 'הצלחה:האפשריות :התפלגות שולית PX x PXY x , y y :ניסויים ב"ת והתפלגויות בדידות P X x ,Y y PX Y x , y . Var X |Y Var X c SD ( aX b ) | a | SD ( X ) )4 Fx ( x ) :ב"ת 0 p X x חיתוך המאורעות:התפלגות משותפת 2 (( X ( X )) ) Var ( X Y ) Var ( X ) Var ( Y ) x 1 F ( x ) 0 . lim אזE X אם שימוש בטבלה עבור מ"מ:התפלגות נורמלית x 2 Var ( X ) V a r (Y X ) E x X ) ( ( X )) V ar ( X Y ) V ar ( X ) V ar ( Y ) 2 C ov ( X ,Y ) .0 Fx ( x ) 1 x :בדיד P ( X t ) t x 2 Var ( aX b ) a x Fx ( x ) 2 V ar ( X ) ( X :התפלגות משותפת ושולית 2 מבוא לסטטיסטיקה ( – )440032חורף תשע"א רווח סמך: ר"ס להפרש תוחלות בשני מדגמים מזווגים: בונים מדגם של הפרשים ר"ס לתוחלת במדגם מהתפלגות נורמאלית: כאשר לא ידוע: כאשר ידוע: X N 0 ,1 Q / n t n 1 S X z1 / 2 n X Di Q SD S/ n n X t n 1 ,1 / 2 n גודל המדגם הדרוש כדי שבביטחון של 1 הסטייה בין ממוצע המדגם ל לא תעלה על : d 2 2 2d n n n X 1/ n , n X X B in n , p X Xi n X pˆ 1 pˆ n 1 / 2 F m 1 , n 1 n 2 z1 / 2 2 0 .2 5 , n 1 pˆ p Q 2 n , / 2 2 2 z1 / 2 pˆ 1 pˆ n d 2 XiX n 1 2 2 S n 1 n 1 S 2 , 2 n 1 , / 2 2 n 1 S 2 Q Yi G am m a n , 2 ˆ 2 2 2 n , / 2 2 n ,1 / 2 Yi 2 ר"ס להפרש תוחלות בשני מדגמים ב"ת: כאשר ידוע: N 0 ,1 1 m 1 X Y X Y 1 m 1 2 2 nm2 X Y X Y 2 S X Y t df ,1 / 2 4 2 SY 2 m n 1 n 1 n 1 4 14% זוגי: 2 m 2 0 ,1 2n 2 n 2 Zi Wn n D 1 2 P X n 1 4 X 1 4 Q 2 n 1 1 2 n 2 X 1 2 n 1 2 M X 1 X 2 M 2 תחום בין רבעונים: 1 2 התפלגות שונות המדגם: תוחלת ידועה: X i לא ידועה X i X : 2 1 XiX 2 n 1 2 Xi X 3 Q 3 n 2 n 2 2 1 n 1 2 2 2 ˆ 2 P 2 2 Xi 1 n Q 2 2 S t k X Y k k 2 0 , V ar T S2 S2 df X Y n m E T X n 1 S/ n 1 n * X * n M SE אבל עדיין ˆ M SE עקיבות :אומד שה MSE-שלו שואף ל.0- M SE 0 n ˆ n אם לכל 0האמד lim P |ˆ | 1 n הערה :בד"כ כשה MSE-לא שואף ל ,0-לא עקיב. משפט :אם ˆ עקיב ל -אז לפונקציה רציפה ˆ עקיב ל( . -ליניארית שומרת אח"ה). סטטיסטי מספיק: פונקציה שבה כל המידע במדגם ביחס לפרמטר. 2 1 1 X 1 x | X x 1 x d x 0 2 1 1 M 1 2 ˆ 1 .1אם ˆ אנ"מ ל אז ˆ הוא פו' של ס"מ . S משפט הפירוק :סטטיסטי Sמספיק ביחס ל אם g S x1 .. x n | 1 V a r ˆ V a r X 1 n n ˆ E n 1 2 2 f בתצפיות ו g -שתלויה ב , -כאשר Sהיא המידע מהתצפיות בתוך . g משפט :אנ"מ תלוי במדגם מקרי דרך ס"מ. דוגמא: xi n n 1 e I { X } S X e 1 1 ˆ M 1 X :) 1 ˆ S X i X 2 n שיטת הנראות המירבית: בחירת הערך pעבורו ההסתברות של תוצאות המדגם היא הגדולה ביותר. פונקצית נראות :פו' צפיפות משותפת- f xi x1 .. x n f h x1 .. x n x1 .. x n | f כלומר :מפרקים את fל h -שתלויה רק אמידת התוחלת (הפרמטר הוא:) - E ˆ * S ס"מ וגם f S ס"מ כאשר fחח"ע. 1 E 1 1 P X 1 x1 .. X n x n | S s לא תלויה ב . s , תכונות: .2ס"מ אינו יחיד ,אם , S g S * גם: .Mk n 1 x אמידת השונות (הפרמטר הוא תכונות: .1סימטרית סביב 0. .2זנבות עבים משל הנורמאלית. t n ,0 .1 t n ,0 .9 1 2 t k k E X X ik ,0 x 1 2 ˆ Wk / k אמד מוטה .אח"ה: n 1 שואף לפרמטר בהסת' :1 השיטה :מבטאים את הפרמטר ע"י המומנטים של האוכלוסייה ואז מציבים במקומם את המומנטים של המדגם T V ar ˆ E ˆ אמידה נקודתית: דוגמא: התפלגות :t Z M SE ˆ אם"ם הצפיפות f X 1 .. X n | S s או התפלגות E n 1 n 1 2 נעדיף את האמד שבו הMSE- הקטן ביותר. :LWהתצפית המינימאלית שגדולה מ.LF- :UWהתצפית המקסימאלית שקטנה מ.UF- ˆ Xi n 1 I{X e הגדרה S S X 1 ,,, X n :סטטיסטי מספיק המומנט ה k-באוכלוסיה: ˆ V a r n 1 לפי ה:MSE- מומנטים הם עקיבים וח"ה ,וגם אמד שהוא פו' רציפה שלהם. step המומנט ה k-המדגמי: 2 e n } e E ˆ IQ R Q סטטיסטי :פונקציה של התצפיות במדגם. פרמטר :גודל שהוא מאפיין מסכם של האוכלוסייה. אמד :סטטיסטי שאיתו אומדים את הפרמטר. אומדן :הערך של האמד ,המחושב מהמדגם. שיטת המומנטים: n xi בהתפלגות אחידה :האנ"מ עדיף ל n 3אבל הוא L F Q1 step U F Q 3 step Wn n V ar W n e n השגיאה הריבועית הממוצעת-תוחלת הסטייה: 4 Q3 Q1 E Wn xi 1 I{X L אמד חסר הטייה אם. E ˆ : W n 2 } ˆ X 1 :BOX-PLOT W n 1 2n } I { xi xi 3 שונות המדגם: n בקירוב לערך הפרמטר אותו רוצים לאמודˆ . רבעון שלישי:Q3- 1 L כאשר xמוגבל ע"י הפרמטר ,מכניסים אינדיקטור דוגמא: 1 3 Q X X 3 4 3 n 1 4 3 n 1 1 4 4 34% l ln L n ln x i 0 ˆ חציון:M- P | X | d כאשר השונות לא ידועה: 4 N P W n n 1 P W n n 1 כאשר לא ידוע והשונויות שונות: SX X ההסתברות שאנ"מ לשונות במדגם נורמאלי יסטה ממנה בסטייה יחסית שינה עולה על : X Y X Y t n m 2 ,1 / 2 2 , 2 / n Xi N 1 ln x i r 1 אי-זוגי: nm 2 n n 1 S X2 m 1 S Y2 m 1 / n 2 p 1 xi 1 n ln 1 ln x i n L חוסר הטייה :ממוצע האומדנים יהיה שווה 1 r x k rx k 1 2 כאשר לא ידוע והשונויות זהות: S2 S2 X Y n m 1 Xn n Q P xi n P X P רבעון ראשון:Q1- n 1 G am m a , 2 2 2 n 1 2 1 SP n m , X n F k ,m שגיאת דגימה :שגיאה כתוצאה מכך שנאספו נתונים על מדגם שהינו חלק מכלל האוכלוסייה. גודלה תלוי בשיטת הדגימה ובגודל המדגם. ממוצע קטום :ממוצע ללא הנמוך והגבוה. n 1 p n 1 p n Z 1 / 2 d 1 2 1 SP n m k ,m הערך ש p% -מהאוכלוסייה מתחתיו. חישוב השברון המדגמי: X , d 2 / n n 1 2 nm 2 N 2 X Y X Y z1 / 2 t n pˆ X F בראש הטבלה: הסתברות .p-בפנים: P X a p a F0.05 דוגמא: 1 D n Y ln X , Y m ,k ˆ. יהיה: סטטיסטיקה תיאורית ושיטות גרפיות: קשר ל Gamma-ולנורמאלי: ln X i 1 2 1 Q 2 Yi G am m a n , 2 n , f X x 2 Yi pˆ X 1 pˆ X pˆ Y z1 / 2 n .4אדטיביות: 2 n 1 ,1 / 2 2 m pˆ X 1 pˆ X pˆ X Q התפלגות חי-בריבוע: תכונות: .1צפיפות לא סימטרית עם זנב ימני. .2התפלגות חיובית. .3עבור ,n>50קרוב לנורמאלי. X pˆ Y 1 pˆ Y 2% n 1 S , 1 m ,k חוק התקנון , 2 ,2 3 : תכונות: .1אינו רווח סמך אופטימאלי עבור רמת סמך נתונה. .2רווח סמך עבור סטיית תקן :שורש על שני הקצוות. ר"ס ל -במדגם מהתפלגות )Gamma( F x x exp , N 1 2 כאשר לא ידוע: 1 pˆ Y p X p Y V ar F k m 2 2 F0.95 גודל המדגם כדי ש- P | X | d 1 : Q 2 הסתברות שהסטייה המוחלטת לכל היותר : d n ,1 / 2 2 /2 F m 1 , n 1 , 2 2 .2 התפלגות הממוצע: 0 ,1 X i n 2 2 X i , X i 2 2 2 X 2 SX 2 SY Q 2 X 2 Y 2m .3 t k F 1, k X 0.95 Z 0.95 Z 0.15 Z 0.85 Xi ר"ס לשונות במדגם מהתפלגות נורמאלית: כאשר ידוע: 2 2 SY pˆ Y 1 pˆ Y , 2 pˆ 1 pˆ 4d k m 2 2 F k ,m .3אם ˆ אנ"מ ל -אז לכל פו , אנ"מ ל- תכונות: .1התפלגות לא סימטרית עם ד"ח במונה ובמכנה. 2 SY Wm / m m 4 התפלגות נורמאלית: גודל המדגם כדי שבביטחון של 1 הסטייה בין הפרופורציה במדגם ל pלא תעלה על : d , p 1 p E F 2 SD התפלגויות דגימה: n 2 SX 2 SY m 2 n 1 Wk / k שברון pבאוכלוסייה, p : B er p , pˆ X N 0 ,1 p pˆ z1 / 2 SX Y 2 SX 1 F n 1 , m 1 2z ר"ס לפרופורציה במדגם מהתפלגות נורמאלית: 1 Di D 1 m2 ר"ס להפרש פרופורציות בשני מדגמים ב"ת: Q X , n 2 2 ר"ס ל -במדגם מהתפלגות אחידה: n n px p y 1 / 2 D D t n 1,1 / 2 d 1 k ר"ס ליחס שונויות בשני מדגמים ב"ת: תכונות: .1זהו רווח סמך הקצר ביותר ברמת סמך נתונה. .2אורכו קבוע מראש רק כאשר השונות ידועה. .3אורך הרווח עולה עם הגדלת רמת הסמך והשונות. .4אורך הרווח קטן עם עליה בגודל המדגם z 1 / 2 התפלגות :F X Y D D i N D , D D 2 תכונות: .1אנ"מ אינו בהכרח יחיד. .2לפעמים קל יותר למקסם את l ln L g X 1 | משפט ˆ :Rao-Blackwellאמד ו S -ס"מ: * E ˆ | S .1הוא אמד. E * E ˆ .2 . ( M S E * M S E ˆ .3שוויון ˆ -כבר מבוסס על הס"מ). דוגמא, B er p , exp :אומד . X 1 :שיפורו: X xi n P X 1 1| x i s s 1 L | x1 .. x n מוצאים אמד שימקסם את L ע"י גזירה והשוואה ל.0- h x : Pois n n 1 n n B in s , 1 s s 1 X 1 | xi X 1 |S 1 n 1 n s E E ©ענת עציון