חציון

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בסטטיסטיקה, החציון (קרוי גם המאון ה-50 ו-האחוזון ה-50) הוא מדד למיקום המרכז של קבוצת נתונים מספריים, שהתקבלו בדרך כל שהיא, כגון במדגם, או מדד למיקום המרכז של משתנה מקרי. לחציון כמה תכונות משותפות עם הממוצע, אבל הוא אינו רגיש כלל לערכי קצה, והדבר מהווה יתרון בהצגות מסוימות של כמה נתונים (כגון רמות שכר). את החציון אפשר לחשב גם כאשר הנתונים אינם מספריים, כמו למשל כאשר מדרגים צבעים לפי בהירותם[דרושה הבהרה] או שופטים לפי חומרת העונש שהם קוצבים[דרושה הבהרה]. בהשוואה למדדים אחרים, קשה לנתח את החציון ככלי סטטיסטי, ולפיכך חשיבותו התאורטית נמוכה.

תוכן עניינים

הסבר אינטואיטיבי[עריכה]

כאשר נתונה קבוצת מספרים סופית, ניתן לסדר את האיברים בקבוצה לפי גודלם וכך ליצור סדרת מספרים. אם מספר האיברים הוא אי זוגי, החציון יהיה האיבר הממוקם בדיוק באמצע הסדרה. אם מספר האיברים הוא זוגי, החציון יהיה הממוצע של שני האיברים האמצעיים.

למשל, אם נתונה סדרת המספרים \ 1,2,22,7,19,8 - סדרה בת 6 מספרים, כל שעלינו לעשות כדי למצוא את החציון הוא לסדר את המספרים שוב, על פי גודלם: \ 1,2,7,8,19,22 . בסדרה הזו יש שני חציונים: 7 ו-8, משום ששניהם ממוקמים באמצע הסדרה. המספר 7 הינו חציון, מפני שהוא גדול או שווה ל-\ 1,2,7, וקטן או שווה ל-\ 8,19,22. גם 8 הינו חציון, מפני שהוא גדול או שווה ל-\ 1,2,7 וקטן או שווה ל-\ 8,19,22.

חציון לא חייב להיות אבר בסדרה - בדוגמה שלנו, כל מספר בתחום \ [7,8] הוא חציון של הסדרה. למעשה, עבור כל סדרה באורך זוגי, שני המספרים האמצעיים המתקבלים כאשר רושמים את הסדרה בסדר ממוין הם חציונים, וכל מספר ביניהם הוא חציון. יש המגדירים את החציון כממוצע חשבוני של שני מספרים אלו.

בסדרה באורך אי זוגי יש חציון יחיד, הוא המספר האמצעי כאשר רושמים את הסדרה בסדר ממוין, למשל בדוגמה 1 למטה. ניתן להרחיב הגדרה זו גם עבור נתונים מקובצים.

הגדרות פורמליות[עריכה]

כמדד של קבוצת נתונים, יש לחציון כמה הגדרות מקובלות, שכולן מסכימות זו עם זו אם הקבוצה כוללת מספר אי-זוגי של נתונים. במקרה זה, החציון שווה לערך המופיע במקום האמצעי לאחר סידור הנתונים. אם בקבוצה מספר זוגי של נתונים מסודרים, \ a_1,\dots,a_n,a_{n+1},\dots,a_{2n}, כל מספר שבין \ a_n ו- \ a_{n+1} עשוי להחשב כחציון, ולעתים קרובות בוחרים את הממוצע שבין שני ערכים אלה.

כאשר מדובר בנתונים מקובצים (למשל: כמה תלמידים קיבלו ציון עד 60, מ- 61 ל- 70, וכן הלאה), החציון שייך לקבוצה שפחות ממחצית הנתונים מעליה, ופחות ממחצית הנתונים מתחתיה, אם יש כזו. במקרה כזה מקובל למקם את החציון כאילו הנתונים בקבוצה שאליה הוא שייך היו מתפלגים באופן אחיד, וכך מחלק החציון את ההיסטוגרמה לשתי מחציות שוות-שטח. אם לא קיימת קבוצה כנזכר למעלה, אז קיימת נקודת חיתוך בין שתי קבוצות, החוצה את הנתונים לשתי קבוצות שוות, ואז מקובל לקבוע אותה כחציון.

הגדרת החציון חלה, באופן כללי יותר, בכל מקרה שבו הנתונים סדורים באופן מלא. במקרה זה, חציון תמיד קיים (לפחות אחד) אם לכל חתך של הטווח של המשתנה המקרי (דהיינו, חלוקת הטווח לשתי קבוצות הממצות אותו ואשר כל איבר באחת גדול מכל אחד מאברי השנייה) יש לפחות קבוצה אחת המרכיבה אותו שיש לה איבר הקטן ביותר ואיבר הגדול ביותר.

חציון של משתנה מקרי[עריכה]

בדומה לתוחלת, החציון מוגדר גם עבור משתנה מקרי ממשי X, בתור ערך \ M(X), המקיים:
גם \ P[ X \le M(X)]\ge 0.5 וגם \ P[ X \ge M(X)]\ge 0.5 . האופרטור M הוא הומוגני ושומר על הזזות (כלומר, \ M(aX+b)=aM(X)+b); יתרה מזו, \ M(f(X))=f(M(X)) לכל פונקציה מונוטונית ממשית \ f. התוחלת של סכום משתנים מקריים שווה לסכום התוחלות, ובתנאים מסוימים טענה דומה נכונה גם עבור השונות. לעומת זאת, אין קשר ברור בין החציון של סכום משתנים לבין שני החציונים.

החציון של משתנה מקרי המקבל בהסתברות \ 1/n את הערך \ a_i (כאשר \ i=1,\dots,n והערכים \ a_i אינם בהכרח שונים), שווה לחציון של סדרת הערכים \ a_1,\dots,a_n. מכיוון שכך, ניתן לראות בהגדרה לחציון של קבוצת ערכים, מקרה פרטי של ההגדרה למשתנים מקריים.

דוגמאות. החציון של התפלגות אחידה רציפה, הוא מרכז הקטע. החציון של התפלגות סימטרית, כגון ההתפלגות הנורמלית, שווה לתוחלת.

הגדרה כערך קיצון[עריכה]

את הממוצע x של קבוצת מספרים \ a_1,\dots,a_n אפשר להגדיר כמספר (היחיד) שעבורו סכום הריבועים \ (x-a_1)^2+\dots+(x-a_n)^2 הוא הקטן ביותר. באופן דומה, מספר הממזער את סכום הערכים המוחלטים \ |x-a_1|+\dots+|x-a_n| נקרא חציון של הקבוצה. על-פי הגדרה זו, ישנם לקבוצה בגודל זוגי אינסוף ערכי חציון אפשריים (בדרך כלל); מקורות אחדים בוחרים אחד מן הערכים האלה להיות החציון, כפי שהוצע לעיל בבחירת הממוצע של שני הערכים המרכזיים.

דוגמאות[עריכה]

  1. במדגם 3,7,11,20,21, החציון הוא הערך האמצעי - 11.
  2. במדגם 3,7,11,20,21,21 החציון הוא הממוצע שבין שני הערכים האמצעיים - 15.5.
  3. בהיסטוגרמה המתארת 12 ערכים בטווח 70-80, 30 ערכים בטווח 80-90, ו- 18 ערכים בטווח 90-100, המדגם כולל 60 ערכים. בכזו היסטוגרמה ישנם שני ערכים אמצעיים ולכן גם החציון שייך לקבוצה האמצעית. כדי לאתר את החציון ביתר דיוק, מחלקים את קצות הטווח 80-90 באופן יחסי למספרי הערכים החסרים: מחד, 30-12=18, ומאידך 30-18=12. החציון הוא, אם כך, \ 80+\frac{18}{18+12}\cdot(90-80) = 86.