אמצע הטווח

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בסטטיסטיקה, אמצע הטווח (mid-range) או אמצע קיצוני (mid-extreme) של מערכת ערכי נתונים סטטיסטיים הוא ממוצע חשבוני של ערכי המקסימום והמינימום במערכת נתונים, והוא מוגדר כ:

אמצע הטווח משמש רק לעתים נדירות בניתוח סטטיסטי מעשי, מפני שהוא חסר תועלת עבור רוב השימושים. זאת משום שהוא מתעלם מכול נקודות הביניים, והוא חסר חוסן, משום שהערכים החריגים משנים אותו באופן משמעותי. ואכן, זהו אחד מהנתונים הסטטיסטיים הפחות יעילים. עם זאת משתמשים בו בכמה מקרים מיוחדים: הוא אומדן יעיל למרכז ההפצה האחיד, אמצע הטווח הגזוז הוא יותר חסין, והוא פשוט להבנה וחישוב.

חוסן[עריכת קוד מקור | עריכה]

אמצע הטווח משתמש רק בערכים הקיצוניים ומתעלם מכל הערכים הבינוניים. לכן אמצע הטווח הוא מאוד לא יציב, ונקודת השבירה שלו היא 0, כלומר שתצפית אחת יכולה לשנות אותו באופן משמעותי. יתר על כן, הוא מושפע מאוד מהחריגים: הגדלת הערך העליון או הקטנת הערך התחתון ב-x משנה את אמצע הטווח ב-x/2, בזמן שהוא משנה גם את המדגם, שגם לו נקודת השבירה הוא 0, רק ב-x/n. משום כך השימוש בו בסטטיסטיקה מעשית הוא קטן אלא אם כן מטפלים בחריגות.

אמצע טווח גזוז הידוע גם בתור סיכום אמצע (midsummary) - אמצע הטווח של n% הוא ממוצע חשבוני של הנתוני n% ו-%(n-100), והוא חסון יותר מכיוון שנקודת השבירה שלו היא n%. באמצע של כל האמצעים הגזוזים, כלומר אמצע גזוז בעל 25%, נמצא אמצע הסיכום (midsummary). את החציון ניתן להגדיר בתור אמצע טווח הגזוז לגמרי (50%), דבר זה תואם את תכונת החציון של קבוצת נתונים בעלת מספר נתונים זוגי שהוא ממוצע של שני הנתונים האמצעיים.

בטווחי אמצעים גזוזים ניתן להשתמש בסטטיסטיקות תיאורתיות כמו בצידוד. ההפרשים בין אמצעי סיכומים, כגון אמצע הסיכום פחות החציון נותנים כלים לצידוד בנקודות שונות בזנב.

יעילות[עריכת קוד מקור | עריכה]

למרות חסרונותיו, לפעמים לאמצע הטווח נמצא שימוש: אמצע הטווח הוא אומדן יעיל ל-μ, הוא נותן דגימה קטנה לגבנוניות שלילית, עם זאת הוא לא יעיל לגבנוניות חיוביות כגון נורמל.

לדוגמה, להתפלגות אחידה רציפה עם מקסימום ומינימום לא ידועים, אמצע הטווח הוא אומדן UMVU לממוצע. הדגימה המינימלית והדגימה המקסימלית, יחד עם גודל מדגם, הם נתון מספיק למקסימום האוכלוסייה ומינימום האוכלוסייה - הבאת דגימות אחרות, בהתניה במקסימום ומינימום נתונים, הם רק ההתפלגות אחידה בין המקסימום והמינימום ובהבאתם אין הוספת מידע. ראה בעיית הטנק הגרמני לדיון נוסף. כך אמצע הטווח, שהוא אומדן בלתי מוטה ומספק של ממוצע האוכלוסייה, הוא למעשה UMVU: שימוש בממוצע המדגם רק מוסיף רעש בהיתבסס על ההתפלגות אינפורמטיבית של הנקודות בטווח זה.

לעומת זאת, בהתפלגות הנורמלית, המדגם מתכוון הוא אומדן UMVU של הממוצע. כך התפלגויות קורטיזית לוּחָנִית, אשר לעתים קרובות יכולה להיחשב בין התפלגות אחידה והתפלגות נורמלית, האינפורמטיביות של נקודות דגימת אמצע לעומת ערכי קיצון משתנה מ-"שווה" לנורמל עד ל-"אינפורמטיבית" להתפלגות אחידה, ולהתפלגויות שונות, אחד או אחר (או כמה שילוב שלהם) עשוי להיות יעיל ביותר. אנלוג חזק הוא טרימין (trimean), שהוא הממוצע בין אמצע הצירים (אמצע טווח גזוז ב-25%) וחציון.

מאפייני דגימה[עריכת קוד מקור | עריכה]

למדגם בגודל n של התפלגות נורמלית, אמצע הטווח M הוא חסר הטיה, ויש לו שונות שניתנת על ידי:

למדגם בגודל n מהתפלגות לפלס הסטנדרטי, אמצע הטווח M הוא חסר הטיה, ויש לו שונות של:

השונות אינה קטנה כשהמדגם גדל.

למדגם בגודל n של התפלגות אחידה שמרכזה הוא סביב 0 (כלומר, התוחלת שווה ל-0), אמצע הטווח M הוא חסר הטיה, ו- Mn הוא בעל התפלגות אסימפטוטית שהיא התפלגות לפלס.

ראו גם[עריכת קוד מקור | עריכה]