תוחלת
בתורת ההסתברות ובסטטיסטיקה, התוחלת (באנגלית: Expected value או Mean, מסומנת: E או μ, בהתאמה), או התוחלת המתמטית, של משתנה מקרי, היא סכום כל המכפלות של כל אחד מן הערכים השונים אותם יכול לקבל המשתנה בהסתברויות המתאימות לקבלת אותם ערכים. הגדרה זו מתייחסת למשתנה מקרי בדיד. במילים אחרות, (במקרה של מרחב הסתברות בדיד), ניתן להתייחס לתוחלת של משתנה מקרי כאל סכום כל המכפלות של ערכי המשתנה בהסתברות המתאימה, כאשר הסכימה מתבצעת על פני כל נקודות מרחב המדגם. במדעים אמפיריים, התוחלת מייצגת את הערך אליו שואפת התוצאה הממוצעת של ניסוי, אם חוזרים עליו אינסוף פעמים. באופן עממי, התוחלת היא ממוצע (משוקלל בהסתברויות) של כל הערכים האפשריים בניסוי.
תוכן עניינים |
[עריכה] רקע
בניגוד לממוצע החשבוני הרגיל, המחושב על ידי סיכום סדרת ערכים וחלוקת הסכום למספר הערכים, התוחלת היא ממוצע משוקלל של כל הערכים האפשריים, כשכל ערך משוקלל בהסתברות שלו. בזכות חוק המספרים הגדולים, התוחלת מהווה קירוב לממוצע של סדרת תוצאות ארוכה, ויכולה לסייע בתחזיות של רווח והפסד וכדומה. בהתאם לכך, משחק מזל נחשב להוגן אם תוחלת הזכייה בו, בניכוי דמי ההשתתפות, היא אפס - דבר זה מצביע על כך שבטווח הארוך מחולקים כל דמי ההשתתפות אל השחקנים, ללא רווח או הפסד למארגנים. לדוגמה, בגלגל הרולטה יש 38 תוצאות אפשריות: כשהמהמר על מספר אחד זוכה, משלמים לו פי 36 מדמי ההשתתפות. לפיכך, תוחלת הרווח של המהמר היא פי
מגובה ההימור, היינו, הפסד של כ-53 שקלים בהימור על כל אלף שקלים.
התוחלת מייצגת תוצאה "צפויה" (Expected) של ניסוי זהה החוזר על עצמו פעמים רבות. מכאן מקורו של המונח בלועזית. אך אפשר שהערך של התוחלת עצמו לא יהיה תוצאה "צפויה" במובן המקובל, הוא עשוי להיות נדיר או אפילו בלתי אפשרי (ראו דוגמה להמחשה).
[עריכה] הגדרה
התוחלת מסומלת על ידי
ולעתים
.
כאשר X הוא משתנה מקרי בדיד שמקבל את הערכים ...,x1, x2, התוחלת תחושב על ידי הטור
(כמו בדוגמת הרולטה לעיל ובדוגמה להלן). במקום לסכום על פי ערכי המשתנה, אפשר לסכום על פי המאורעות במרחב המדגם Ω:
. אם X הוא משתנה מקרי רציף בעל פונקציית צפיפות הסתברות f אזי
.
בצורה הכללית, אם X הוא משתנה מקרי המוגדר על מרחב הסתברות
, אזי התוחלת של X מוגדרת על ידי
כאשר האינטגרל הוא אינטגרל לבג. התוחלת קיימת רק כאשר האינטגרל מתכנס בהחלט.
מומנטים: המומנט מסדר n של משתנה מקרי X הוא התוחלת של החזקות ה-n-ית של X, כלומר
. המומנט מסדר n סביב התוחלת של X מוגדר כ-
, כאשר
הוא שווה לשונות.
אמידה: כדי לאמוד את התוחלת של משתנה מקרי באופן אמפירי, מבצעים מדידות חוזרות של המשתנה ומחשבים את הממוצע החשבוני של התוצאות (חוק המספרים הגדולים מבטיח שאומדן זה מתכנס בהסתברות לתוחלת). לאומדן זה יש התכונה שהוא ממזער את סכום ריבועי השגיאות ביחס לתוחלת.
[עריכה] דוגמה1
נדגים את חישוב התוחלת של משתנה מקרי בדיד.
כאשר מטילים קובייה הוגנת (בעלת שש פאות) ההסתברות לקבלת כל מספר מ-1 עד 6 שווה ל-1/6. המשתנה המקרי הוא תוצאת ההטלה של הקוביה והתוחלת של משתנה מקרי זה תחושב באופן הבא:
דוגמה זו ממחישה שתי תכונות של התוחלת:
- תוצאה צפויה: ערך התוחלת (3.5) לא חייב להיות אחד הערכים האפשריים של המשתנה המקרי (המספרים השלמים 1-6).
- כאשר ההסתברות בניסוי לקבלת כל תוצאה היא שווה אזי התוחלת היא הממוצע החשבוני.
ניתן לתת לתוחלת את הפירוש הבא: אם משלמים למהמר לפי תוצאות הטלת הקוביה, דהיינו במקרה שייצא 1 - יקבל 1 ש"ח, במקרה שייצא 6 - יקבל 6 ש"ח, הרי שהסכום הממוצע שהמהמר צפוי לקבל לאחר 10 הטלות של הקוביה הוא
ש"ח.
[עריכה] דוגמה 2
לצורך הדוגמה נעזר בטבלה הבאה: (בהנחה שאלו פרסים קבועים שאינם משתנים , מספר המשתתפים בהגרלה הוא 16,273,488 והמחיר להשתתפות בהגרלה הוא 2.9 ₪).
| רמת הפרס | סכום הפרס | מספר הזוכים | הסתברות הזכייה | ≈אחוז תוחלת הזכייה (*אחוז ההחזר) | ≈תוחלת הרווח הצפוי | ≈תוחלת הזכייה (=תוחלת הרווח) |
תוחלת ההפסד הצפוי | תוחלת ההפסד |
|---|---|---|---|---|---|---|---|---|
| 1 | 4,000,000 | 1 | 1/16,273,488 | 8.4758% | 0.2458 ₪ | 2.6542- ₪ | ||
| 2 | 500,000 | 6 | 6/16,273,488 | 6.3569% | 0.1843 ₪ | 2.7157- ₪ | ||
| 3 | 2,500 | 186 | 186/16,273,488 | 0.9853% | 0.0286 ₪ | 2.8714- ₪ | ||
| 4 | 350 | 1,116 | 1,116/16,273,488 | 0.8277% | 0.0240 ₪ | 2.8760- ₪ | ||
| 5 | 125 | 6,975 | 6,975/16,273,488 | 1.8475% | ||||
| 6 | 40 | 41,850 | 41,850/16,273,488 | 3.5471% | ||||
| 7 | 35 | 89,900 | 89,900/16,273,488 | 6.6673% | ||||
| 8 | 10 | 539,400 | 539,400/16,273,488 | 11.4296% | ||||
| סה״כ: | 1.16 ₪ בממוצע | 679,434 | 679,434/16,273,488 | 40.1371% | 1.1640 | 1.7360- | ||
| שאינם זוכים בשום פרס |
0 | 15,594,054 | 15,594,054/16,273,488 | 0.0000% | ||||
| סה״כ | 1.16 ₪ בממוצע | 16,273,488 | 1/1 | 40.1371% |
ניתן לחשב את תוחלת הרווח הצפוי בצורה הבאה:
1.163977569= 539,400/16,273,488 * 10 + . . . 1,116/16,273,488 * 350 + 186/16,273,488 * 2,500 + 6/16,273,488* 500,000 + 1/16,273,488 * 4,000,000
כלומר, אם לדוגמה עלות השתתפות במשחק זה היא 2.9 ₪ אזי תוחלת אחוז הרווח הצפוי שווה ל- 40.1371575% (2.9 / 1.163977569) מההשקעה.
תוחלת ההפסד הצפוי מן ההשתתפות בהגרלה היא 1.736022431 = 2.9 (עלות ההשתתפות=תוחלת עלות ההשתתפות) פחות 1.163977569 (תוחלת הרווח הצפוי).
תוחלת ההפסד הצפוי מהווה 59.8628425% מעלות ההשתתפות בהגרלה (1.736022431 חלקי 2.9, או 100% פחות 40.1371575%).
דרך נוספת לחישוב תוחלת הרווח הצפוי: 1.163977569 ≈ 15,594,054/16,273,488 * (0-2.9) + 539,400/16,273,488 * (10-2.9) + . . . 6/16,273,488 * (500,000-2.9) + 1/16,273,488 * (4,000,000-2.9) + 2.9
דרך נוספת לחישוב אחוז תוחלת הרווח הצפוי (אחוז ההחזר) 40.1371575% ≈ 15,594,054/16,273,488 * 0/2.9 + 539,400/16,273,488 * 10/2.9 + . . . 6/16,273,488 * 500,000/2.9 + 1/16,273,488 * 4,000,000/2.9
יש להבדיל בין תוחלת הזכייה/תוחלת ההפסד (שבה הערך המתקבל מייצג את סכום הרווח/ההפסד) לבין תוחלת הרווח הצפוי/תוחלת ההפסד הצפוי (שבה הערך המתקבל מייצג את הסכום הממוצע שמוחזר בכל הגרלה) הנובעות מההשתתפות בהגרלה, בשני המקרים האחוז זהה אך התוחלת שונה.
- בהגרלות בהן הפרסים מתחלקים בין הזוכים - תוחלת הצפי אינה בהכרח זהה לאחוז ההחזר המוקצה לפרסים.
[עריכה] תכונות התוחלת
- לשני משתנים מקריים בעלי אותה התפלגות תהיה אותה תוחלת.
אופרטור התוחלת E הוא לינארי, ולפיכך (כאשר X ,Y משתנים מקריים המוגדרים על אותו מרחב הסתברות, ו- a ,b מספרים ממשיים):
- אופרטור התוחלת אינו כפלי, כלומר, השוויון
אינו מתקיים בדרך כלל. כאשר השוויון מתקיים, אומרים שהמשתנים X ו-Y בלתי מתואמים. כל שני משתנים בלתי תלויים הם גם בלתי מתואמים. ההפרש
הוא השונות המשותפת, שממנה אפשר לחשב את מקדם המתאם.
- אם X,Y משתנים מקריים, מתקיים
. תוצאה זו קרויה לפעמים "משפט ההחלקה".
[עריכה] תוחלת של זמן המתנה
אם X הוא משתנה מקרי המקבל רק ערכים טבעיים, אז התוחלת שלו מקיימת
(לנוסחה זו יש גם גרסאות כלליות יותר). ביטוי זה לחישוב התוחלת שימושי במקרה שהמשתנה מייצג את זמן ההמתנה עד להתרחשותו של מאורע (כגון הופעתה הראשונה של המלה "אנציקלופדיה" בסדרה של תווים אקראיים).




אינו מתקיים בדרך כלל. כאשר השוויון מתקיים, אומרים שהמשתנים X ו-Y
הוא ה
. תוצאה זו קרויה לפעמים "