פונקציית הצטברות

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בתורת ההסתברות, פונקציית הצטברות (Cumulative distribution function, בראשי תיבות CDF) של משתנה מקרי היא פונקציה של משתנה מקרי X, שערכיה קובעים את ההסתברות למאורעות מהצורה \ X \leq a, לכל a ממשי. פונקציה זו מהווה הכללה של פונקציית הסתברות שעוסקת במשתנה מקרי בדיד, גם למשתנה מקרי רציף.

תכונות מופשטות והקשר למשתנים מקריים[עריכת קוד מקור | עריכה]

אם X משתנה מקרי, הפונקציה \ F_X(a) = \operatorname{Pr}(X \leq a) מקיימת בהכרח ארבע תכונות:

  1. הגבול \ \lim_{a \rightarrow -\infty} F_X(a) שווה ל-0.
  2. הגבול \ \lim_{a \rightarrow \infty} F_X(a) שווה ל-1.
  3. הפונקציה מונוטונית עולה (במובן החלש), כלומר \ F_X(a) \leq F_X(b) לכל \ a \leq b.
  4. הפונקציה רציפה מימין.

ולהיפך: אם F היא פונקציה המקיימת את ארבע התכונות האלה, אפשר להגדיר ממנה משתנה מקרי. פורמלית, כדי להגדיר משתנה מקרי יש לתאר את ההסתברות לכך שהוא ישתייך לכל קבוצה A השייכת לאלגברת בורל על הממשיים. עם זאת, מכיוון שהקטעים יוצרים את האלגברה, מספיק להגדיר את ההסתברויות למאורעות \ a < X < b. ואכן, אם דורשים ש- \ \operatorname{Pr}(X \leq a) = F(a), נובע שהגבול משמאל \ \lim_{x \rightarrow b^{-}} F(b) שווה להסתברות \ \operatorname{Pr}(X<b). מכאן אפשר לקבל את ההסתברויות לכל המאורעות מהצורה \ a < X < b, \ a < X \leq b, \ a \leq X < b ו- \ a < X < b.

בפרט נובע ש-\ P(X=b) = F_X(b) - \lim_{x\rightarrow b^{-}}F_X(x), כך שהסיכוי למאורעות \ X=b הוא אפס אם ורק אם הפונקציה F רציפה. אם הפונקציה גזירה, אפשר לתאר אותה כאינטגרל של פונקציית צפיפות f:

F(x) = \int_{-\infty}^x f(t)\,dt.