ממוצע חשבוני

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

ממוצע חשבוני (או אריתמטי) הוא סוג הממוצע הנפוץ ביותר ואליו מתכוונים בדרך כלל במילה "ממוצע".

הממוצע החשבוני הוא מדד אמצע שימושי ביותר בסטטיסטיקה, לשם הצגת וניתוח נתונים.

הגדרה[עריכת קוד מקור | עריכה]

הממוצע החשבוני, המסומן ב- \bar{x}, של קבוצת מספרים  \{x_1 , x_2 ... x_n\} מוגדר כסכומם חלקי מספרם, כלומר:

 \bar{x} = {1 \over n} \sum_{i=1}^n{x_i} = \frac{x_1 + x_2 + \dotsb + x_n}{n}

כלומר, הממוצע החשבוני הוא מספר שאם יהיה אותו במקום כל המספרים, הסכום הכללי לא ישתנה. כך למשל, אם חשבון החשמל הממוצע של בניין הוא 1000 שקלים למשפחה, אז אם לכל המשפחות היה חשבון של 1000 שקל, החשבון הכללי של הבניין היה נותר זהה.

הממוצע הוא מעין "מרכז" של המספרים בזכות תכונתו שסכום ההפרשים בינו למספרים האחרים הוא אפס, כלומר (x_1-\bar{x}) + \dotsb + (x_n-\bar{x}) = 0. כמו כן סכום ריבועי ההפרשים הוא מינימלי, כלומר הגודל (x_1-\bar{x})^2 + \dotsb + (x_n-\bar{x})^2 קטן יותר מכל גודל שהיה יוצא לו היינו מחליפים את  \bar{x} במספר אחר.

ייצוג קבוצה באמצעות ממוצע[עריכת קוד מקור | עריכה]

השכיח (באדום), חציון (בירוק) וממוצע (בתכלת) של שתי התפלגויות לוג-נורמליות עם צידוד שונה

הממוצע החשבוני עלול שלא לשקף נאמנה את הנתונים, משום שהוא אינו נותן שום מידע על ההתפלגות של המספרים (כלומר אופן ה"פיזור" שלהם). הבעיה בולטת במיוחד אם מספר קטן של איברים רחוק מאוד מהאחרים. לדוגמה, במפעל בו 95 עובדים משתכרים 5,000 שקלים בחודש ו-5 מנהלים משתכרים 100,000 שקלים בחודש, השכר הממוצע לחודש הוא 9,750. במקרה זה, הממוצע רחוק מלייצג את גובהה של "משכורת אופיינית" במפעל שכן, אף עובד לא משתכר שכר קרוב לשכר הממוצע. 95% משתכרים כמחצית מסכום זה, ו-5% משתכרים יותר מפי עשר מהממוצע.

כדי לקבל מידע גם על פיזור המספרים, משתמשים בסטיית תקן. סטיית תקן היא שורש ממוצע ריבועי המרחקים, כלומר \sigma = \sqrt{\frac{1}{n} \sum_{i=1}^n (x_i - \overline{x})^2}. בדיקה גסה יותר אך מועילה לעתים היא בדיקת ההפרש בין הממוצע לחציון. אם איברי הקבוצה מפולגים באופן סימטרי סביב הממוצע, הממוצע יהיה קרוב לחציון, אולם, אם ההתפלגות אינה סימטרית כמו בדוגמה למעלה, המרחק בין החציון לבין הממוצע עשוי לגדול. כדי לקבל תמונה טובה על קבוצת משתנים משתמשים בנוסף לממוצע בסטיית התקן ובחציון ולעתים קרובות מוסיפים את השכיח.

הכללות[עריכת קוד מקור | עריכה]

ממוצע משוקלל[עריכת קוד מקור | עריכה]

Postscript-viewer-shaded.png ערך מורחב – ממוצע משוקלל

בממוצע חשבוני נותנים לכל מספר אותו משקל. אך לעתים יש צורך בנתינת משקל שונה לכל מספר, למשל לצורך חישוב מהירות ממוצעת של מספר מהיריות שהיו לאורך זמנים שונים. במקרה כזה משתמשים בממוצע משוקלל, המחושב בצורה הבאה:

\ \bar{x} = \frac{\sum_{i=1}^n w_i\cdot x_i}{\sum_{i=1}^n w_i} = \frac{w_1\cdot x_1 + w_2\cdot x_2 + \dotsb + w_n\cdot x_n}{w_1 + w_2 + \dotsb + w_n}

כאשר לכל מספר xi מותאם משקל wi. הממוצע המשוקלל מהווה הכללה של הממוצע החשבוני משום שאם כל המשקלים שווים ל-1, מתקבל ממוצע חשבוני רגיל. כמו כן, אם משקל wi הוא טבעי, ניתן להחליף בחישוב את המספר xi ב-wi מספרים השווים ל-xi מבלי לשנות את הממוצע.

ממוצע של פונקציה[עריכת קוד מקור | עריכה]

אם מרחב המספרים הוא רציף, ניתן לחשב את הממוצע לפי הנוסחה הבאה:

 \overline{f} = \frac{1}{b-a}\int_a^bf(x)\,dx

כאשר f היא פונקציית המשתנים ו [a,b] הוא הקטע שבו מחשבים את הממוצע.

זוהי הכללה של הממוצע החשבוני משום שהוא מתקבל כגבול של תהליך שבו מחשבים את ממוצע ערכי הפונקציה בקטע ומוסיפים עוד ועוד ערכים. באופן אינטואיטיבי, מחלקים את האינטגרל (שמהווה הכללה לסכום) באורך הקטע (שניתן להסתכל עליו כ"מספר הערכים שהפונקציה מקבלת").

משפט הערך הממוצע האינטגרלי קובע שפונקציה רציפה מקבלת את הערך הממוצע שלה בקטע.

אם הפונקציה מורכבת מקטעים מקבילים לציר ה-x בלבד, אז הממוצע שלה הוא ממוצע משוקלל של ערכי הקטעים כאשר משקלם הוא אורכם.

ראו גם[עריכת קוד מקור | עריכה]