תוחלת

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
Erwartungswert.png

בתורת ההסתברות ובסטטיסטיקה, התוחלתאנגלית: Expected value, ערך נצפה או Mean, מסומנת: E או μ, בהתאמה), או התוחלת המתמטית, של משתנה מקרי, היא סכום כל המכפלות של כל אחד מן הערכים השונים אותם יכול לקבל המשתנה בהסתברויות המתאימות לקבלת אותם ערכים. הגדרה זו מתייחסת למשתנה מקרי בדיד. במילים אחרות, (במקרה של מרחב הסתברות בדיד), ניתן להתייחס לתוחלת של משתנה מקרי כאל סכום כל המכפלות של ערכי המשתנה בהסתברות המתאימה, כאשר הסכימה מתבצעת על פני כל נקודות מרחב המדגם. במדעים אמפיריים, התוחלת מייצגת את הערך אליו שואפת התוצאה הממוצעת של ניסוי, אם חוזרים עליו אינסוף פעמים. באופן עממי, התוחלת היא ממוצע (משוקלל בהסתברויות) של כל הערכים האפשריים בניסוי. לתוחלת יש שימוש נרחב בפיזיקה סטטיסטית, בפיזיקה קוונטית ובהנדסה.

רקע[עריכת קוד מקור | עריכה]

בניגוד לממוצע החשבוני הרגיל, המחושב על ידי סיכום סדרת ערכים וחלוקת הסכום למספר הערכים, התוחלת היא ממוצע משוקלל של כל הערכים האפשריים, כשכל ערך משוקלל בהסתברות שלו. בזכות חוק המספרים הגדולים, התוחלת מהווה קירוב לממוצע של סדרת תוצאות ארוכה, ויכולה לסייע בתחזיות של רווח והפסד וכדומה. בהתאם לכך, משחק מזל נחשב להוגן אם תוחלת הזכייה בו, בניכוי דמי ההשתתפות, היא אפס - דבר זה מצביע על כך שבטווח הארוך מחולקים כל דמי ההשתתפות אל השחקנים, ללא רווח או הפסד למארגנים. לדוגמה, בגלגל הרולטה יש 38 תוצאות אפשריות: כשהמהמר על מספר אחד זוכה, משלמים לו פי 36 מדמי ההשתתפות. לפיכך, תוחלת הרווח של המהמר היא פי \ \frac{1}{38}(36-1)- \frac{37}{38} \approx -0.0526 מגובה ההימור, היינו, הפסד של כ-53 שקלים בהימור על כל אלף שקלים.

התוחלת מייצגת תוצאה "צפויה" (Expected) של ניסוי זהה החוזר על עצמו פעמים רבות. מכאן מקורו של המונח בלועזית. אך אפשר שהערך של התוחלת עצמו לא יהיה תוצאה "צפויה" במובן המקובל, הוא עשוי להיות נדיר או אפילו בלתי אפשרי (ראו דוגמה להמחשה).

הגדרה[עריכת קוד מקור | עריכה]

התוחלת מסומלת על ידי \operatorname E X,\ \operatorname E(X),\ \operatorname E[X] ולעתים \ \langle X\rangle.

כאשר X הוא משתנה מקרי בדיד שמקבל את הערכים ...,x1, x2, התוחלת תחושב על ידי הטור \operatorname E(X) = \sum_i x_i P(X=x_i) (כמו בדוגמת הרולטה לעיל ובדוגמה להלן). במקום לסכום על פי ערכי המשתנה, אפשר לסכום על פי המאורעות במרחב המדגם Ω: \operatorname E(X) = \sum_{\omega \in \Omega} X(\omega) P(\omega). אם X הוא משתנה מקרי רציף בעל פונקציית צפיפות הסתברות f אזי \operatorname E(X) = \int\limits_{-\infty}^\infty x\; f(x)\; \mathrm dx.

בצורה הכללית, אם X הוא משתנה מקרי המוגדר על מרחב הסתברות (\Omega, \mathcal F, P), אזי התוחלת של X מוגדרת על ידי \operatorname E(X) = \int_\Omega X \;\mathrm dP כאשר האינטגרל הוא אינטגרל לבג. התוחלת קיימת רק כאשר האינטגרל מתכנס בהחלט.

מומנטים: המומנט מסדר n של משתנה מקרי X הוא התוחלת של החזקות ה-n-ית של X, כלומר \operatorname E\left(X^n\right). המומנט מסדר n סביב התוחלת של X מוגדר כ-\operatorname E\left((X-\operatorname E(X))^n\right), כאשר n=2 הוא שווה לשונות.

אמידה: כדי לאמוד את התוחלת של משתנה מקרי באופן אמפירי, מבצעים מדידות חוזרות של המשתנה ומחשבים את הממוצע החשבוני של התוצאות (חוק המספרים הגדולים מבטיח שאומדן זה מתכנס בהסתברות לתוחלת). לאומדן זה יש התכונה שהוא ממזער את סכום ריבועי השגיאות ביחס לתוחלת.

דוגמה 1[עריכת קוד מקור | עריכה]

הדגמת חישוב התוחלת של משתנה מקרי בדיד.
כאשר מטילים קובייה הוגנת (בעלת שש פאות) ההסתברות לקבלת כל מספר מ-1 עד 6 שווה ל-1/6. המשתנה המקרי הוא תוצאת ההטלה של הקוביה והתוחלת של משתנה מקרי זה תחושב באופן הבא:

\operatorname E(X) = 1 \times \frac{1}{6} + 2 \times \frac{1}{6} + 3 \times \frac{1}{6} + 4 \times \frac{1}{6} +
5 \times \frac{1}{6} + 6 \times \frac{1}{6} = 3.5

דוגמה זו ממחישה שתי תכונות של התוחלת:

  1. תוצאה צפויה: ערך התוחלת (3.5) לא חייב להיות אחד הערכים האפשריים של המשתנה המקרי (המספרים השלמים 1-6).
  2. כאשר ההסתברות בניסוי לקבלת כל תוצאה היא שווה אזי התוחלת היא הממוצע החשבוני.

ניתן לתת לתוחלת את הפירוש הבא: אם משלמים למהמר לפי תוצאות הטלת הקוביה, דהיינו במקרה שייצא 1 - יקבל 1 ש"ח, במקרה שייצא 6 - יקבל 6 ש"ח, הרי שהסכום הממוצע שהמהמר צפוי לקבל לאחר 10 הטלות של הקוביה הוא \ 35 = 10 \times 3.5 ש"ח.

דוגמה 2[עריכת קוד מקור | עריכה]

לצורך הדוגמה נעזר בטבלה הבאה: (בהנחה שאלו פרסים קבועים שאינם משתנים, מספר המשתתפים בהגרלה הוא 16,273,488 והמחיר להשתתפות בהגרלה הוא 2.9 ₪).

רמת הפרס סכום הפרס מספר הזוכים הסתברות הזכייה ≈אחוז תוחלת הזכייה (*אחוז ההחזר) ≈תוחלת הרווח הצפוי ≈תוחלת הזכייה
(=תוחלת הרווח)
תוחלת ההפסד הצפוי תוחלת ההפסד
1 4,000,000 1 1/16,273,488 8.4758% 0.2458 ₪ 2.6542- ₪
2 500,000 6 6/16,273,488 6.3569% 0.1843 ₪ 2.7157- ₪
3 2,500 186 186/16,273,488 0.9853% 0.0286 ₪ 2.8714- ₪
4 350 1,116 1,116/16,273,488 0.8277% 0.0240 ₪ 2.8760- ₪
5 125 6,975 6,975/16,273,488 1.8475%
6 40 41,850 41,850/16,273,488 3.5471%
7 35 89,900 89,900/16,273,488 6.6673%
8 10 539,400 539,400/16,273,488 11.4296%
סה״כ: 1.16 ₪ בממוצע 679,434 679,434/16,273,488 40.1371% 1.1640 1.7360-
שאינם זוכים
בשום פרס
0 15,594,054 15,594,054/16,273,488 0.0000%
סה״כ 1.16 ₪ בממוצע 16,273,488 1/1 40.1371%

ניתן לחשב את תוחלת הרווח הצפוי בצורה הבאה:

1.163977569= 539,400/16,273,488 * 10 + . . . 1,116/16,273,488 * 350 + 186/16,273,488 * 2,500 + 6/16,273,488* 500,000 + 1/16,273,488 * 4,000,000

כלומר, אם לדוגמה עלות השתתפות במשחק זה היא 2.9 ₪ אזי תוחלת אחוז הרווח הצפוי שווה ל- 40.1371575% (2.9 / 1.163977569) מההשקעה.

תוחלת ההפסד הצפוי מן ההשתתפות בהגרלה היא 1.736022431 = 2.9 (עלות ההשתתפות=תוחלת עלות ההשתתפות) פחות 1.163977569 (תוחלת הרווח הצפוי).

תוחלת ההפסד הצפוי מהווה 59.8628425% מעלות ההשתתפות בהגרלה (1.736022431 חלקי 2.9, או 100% פחות 40.1371575%).

דרך נוספת לחישוב תוחלת הרווח הצפוי: 1.163977569 ≈ 15,594,054/16,273,488 * (0-2.9) + 539,400/16,273,488 * (10-2.9) + . . . 6/16,273,488 * (500,000-2.9) + 1/16,273,488 * (4,000,000-2.9) + 2.9

דרך נוספת לחישוב אחוז תוחלת הרווח הצפוי (אחוז ההחזר) 40.1371575% ≈ 15,594,054/16,273,488 * 0/2.9 + 539,400/16,273,488 * 10/2.9 + . . . 6/16,273,488 * 500,000/2.9 + 1/16,273,488 * 4,000,000/2.9

יש להבדיל בין תוחלת הזכייה/תוחלת ההפסד (שבה הערך המתקבל מייצג את סכום הרווח/ההפסד) לבין תוחלת הרווח הצפוי/תוחלת ההפסד הצפוי (שבה הערך המתקבל מייצג את הסכום הממוצע שמוחזר בכל הגרלה) הנובעות מההשתתפות בהגרלה, בשני המקרים האחוז זהה אך התוחלת שונה.

  • בהגרלות בהן הפרסים מתחלקים בין הזוכים - תוחלת הצפי אינה בהכרח זהה לאחוז ההחזר המוקצה לפרסים.

תכונות התוחלת[עריכת קוד מקור | עריכה]

  • לשני משתנים מקריים בעלי אותה התפלגות תהיה אותה תוחלת.

אופרטור התוחלת E הוא לינארי, ולפיכך (כאשר X ,Y משתנים מקריים המוגדרים על אותו מרחב הסתברות, ו- a ,b מספרים ממשיים):

  • \ \operatorname E(a) = a
  • \ \operatorname E(aX+b) = a\operatorname E(X)+ b
  • \ \operatorname E(aX+bY) = a\operatorname E(X) + b\operatorname E(Y)
  • אם X,Y משתנים מקריים, מתקיים \ \operatorname E(X)=\operatorname E(\operatorname E(X|Y)). תוצאה זו קרויה לפעמים "משפט ההחלקה".

תוחלת של זמן המתנה[עריכת קוד מקור | עריכה]

אם X הוא משתנה מקרי המקבל רק ערכים טבעיים, אז התוחלת שלו מקיימת \ \operatorname E(X)=\sum_{n=1}^\infty P(X\geq n) (לנוסחה זו יש גם גרסאות כלליות יותר). ביטוי זה לחישוב התוחלת שימושי במקרה שהמשתנה מייצג את זמן ההמתנה עד להתרחשותו של מאורע (כגון הופעתה הראשונה של המלה "אנציקלופדיה" בסדרה של תווים אקראיים).

ראו גם[עריכת קוד מקור | עריכה]