סטטיסטי מספיק

מתוך ויקיפדיה, האנציקלופדיה החופשית

בסטטיסטיקה, סטטיסטי הוא מספיק ביחס למודל סטטיסטי ולפרמטר הבלתי ידוע, אם אין סטטיסטי אחר שיכול להיות מחושב מאותו מדגם, שיוסיף מידע ביחס לערך הפרמטר. במילים אחרות, סטטיסטי הוא מספיק עבור משפחה של התפלגויות, אם כל המידע לגבי ההתפלגות שממנה נלקח המדגם, נמצא בערך של הסטטיסטי.

הגדרה מתמטית[עריכת קוד מקור | עריכה]

סטטיסטי הוא מספיק לפרמטר , אם ההתפלגות המותנית של המדגם בהינתן הערך של אינה תלויה ב-. במילים אחרות, הפונקציה תלויה אולי ב-x ו-t, אבל לא ב-.

משפט הפירוק של פישר וניימן[עריכת קוד מקור | עריכה]

משפט הפירוק של פישר וניימן (באנגלית: Fisher–Neyman factorization theorem) מספק אפיון נוח לכך שסטטיסטי הוא מספיק: אם פונקציית הצפיפות היא , אזי לפי המשפט הוא מספיק עבור אם ורק אם קיימות פונקציות אי-שליליות g ו-h כך ש:

כלומר, ניתן לפרק את פונקציית הצפיפות למכפלה של שני גורמים, כך שגורם אחד, h, אינו תלוי ב- והגורם השני, g, אשר כן תלוי ב-, תלוי ב-x רק דרך .

קל לראות שאם היא פונקציה חד-חד-ערכית ו- הוא סטטיסטי מספיק, אזי הוא סטטיסטי מספיק גם כן. בפרט, ניתן לכפול סטטיסטי מספיק בקבוע שאינו אפס, ולקבל סטטיסטי מספיק.

משמעות לגבי הסקה סטטיסטית[עריכת קוד מקור | עריכה]

אחת ההשלכות של משפט הפירוק היא שכשמשתמשים בהסקה סטטיסטית על סמך נראות, שני מאגרי נתונים בגודל זהה אשר להם בדיוק אותו ערך עבור הסטטיסטי המספיק , תמיד יספקו את אותה מסקנה לגבי (למשל: רווח סמך ל-, דחיית/אי-דחיית השערה לגבי ). לפי קריטריון הפירוק התלות של הנראות ב- היא רק ביחד עם . מכיוון שזה נכון לגבי שני מאגרי הנתונים שלהם אותו ערך , התלות של הנראות ב- תהיה זהה גם כן, מה שיוביל להסקה סטטיסטית זהה.

ניסוח מדויק[עריכת קוד מקור | עריכה]

יהיו תצפיות של מדגם מקרי מהתפלגות עם פונקציית צפיפות עבור , ויהי סטטיסטי שפונקציית הצפיפות שלו היא . אז הוא סטטיסטי מספיק עבור אם ורק אם קיימת פונקציה כך ש:

הוכחה[עריכת קוד מקור | עריכה]

ההוכחה להלן ניתנה על ידי רוברט הוג ואלן קרייג.[1]

כיוון אחד[עריכת קוד מקור | עריכה]

נניח ש:

ונוכיח ש- הוא סטטיסטי מספיק.

יהיו , ‏ סטטיסטים כלשהם שפונקציות הצפיפות שלהם הן בהתאמה.

נבצע את הטרנספורמציה: לכל , כשהפונקציות ההפוכות הן: לכל , ויעקוביאן . אז:

הביטוי בצד שמאל של המשוואה הוא הצפיפות המשותפת: של המשתנים (הסטטיסטים): .

בצד ימין של המשוואה, הביטוי הוא פונקציית הצפיפות של , וכך יוצא שהביטוי: שווה ל- חלקי , כלומר, הוא שווה לפונקציית הצפיפות המותנה של בהינתן .

אבל לפי ההנחה, , וממילא גם אינו תלוי ב-. מכיוון ש- לא הוכנס בתוך הטרנספורמציה שביצענו, וכן לא בא לידי ביטוי ביעקוביאן , יוצא ש- אינו תלוי ב- (אלא רק ב-, וזאת לכל סטטיסטים אפשריים), ולכן הוא סטטיסטי מספיק עבור .

כיוון שני[עריכת קוד מקור | עריכה]

נניח ש- הוא סטטיסטי מספיק, ונוכיח ש:

כיוון ש-ש- הוא סטטיסטי מספיק, ניתן לרשום:

כש- אינו תלוי ב- כיוון ש- תלוי רק ב-, אשר הם בלתי תלויים ב- בהינתן שידוע שהוא סטטיסטי מספיק.

באמצעות חלוקת שני צידי המשוואה בערך המוחלט של היעקוביאן , והחלפת בפונקציות: , מתקבלת המשוואה:

כש- הוא היעקוביאן עם שהוחלפו על ידי: .

הצד הימני הוא בהכרח הצפיפות המשותפת של . נסמן: , ונקבל:

כיוון ש- (ולכן גם ) אינו תלוי ב- (לפי ההנחה), מתקבל ש:

היא פונקציה שאינה תלויה ב-, כלומר:

כנדרש.

סטטיסטי מספיק מינימלי[עריכת קוד מקור | עריכה]

סטטיסטי מספיק הוא מינימלי אם הוא יכול להיות מוצג כפונקציה של כל סטטיסטי מספיק אחר. במילים אחרות, הוא סטטיסטי מספיק מינימלי אם ורק אם:

  1. הוא סטטיסטי מספיק
  2. לכל סטטיסטי מספיק , קיימת פונקציה כך ש-

באופן אינטואיטיבי, סטטיסטי מספיק מינימלי תופס באופן היעיל ביותר את כל המידע בנוגע לפרמטר .

מאפיין שימושי של סטטיסטי מספיק מינימלי הוא שכאשר פונקציית הצפיפות קיימת, הוא סטטיסטי מספיק מינימלי אם ורק אם:

בלתי תלוי ב-

זה נובע באופן ישיר ממשפט הפירוק של פישר-נימן.

מצב בו לא קיים סטטיסטי מספיק מינימלי הוצג על ידי הסטטיסטיקאי ההודי Raghu Raj Bahadur, בשנת 1954. אולם, תחת תנאים מתונים למדי, סטטיסטי מספיק מינימלי תמיד קיים.

בפרט, במרחב אוקלידי, התנאים הללו תמיד מתקיימים אם המשתנים המקריים (הקשורים ל- ) הם כולם בדידים או כולם רציפים.

אם קיים סטטיסטי מספיק מינימלי, אזי סטטיסטי מספיק שלם (אנ') הוא בהכרח מינימלי. בעוד שקשה למצוא מקרים בהם סטטיסטי מספיק מינימלי אינו קיים, לא קשה למצוא מצבים בהם לא קיים סטטיסטי מספיק שלם.

אוסף היחסים של פונקציות נראות הוא סטטיסטי מספיק מינימלי אם הוא בדיד או בעל פונקציית צפיפות.

דוגמאות[עריכת קוד מקור | עריכה]

התפלגות ברנולי[עריכת קוד מקור | עריכה]

אם משתנים מקריים בלתי תלויים בעלי התפלגות ברנולי עם פרמטר , אזי הסכום הוא סטטיסטי מספיק עבור .

מאחר שהמשתנים המקריים הם בלתי תלויים, פונקציית הצפיפות המשותפת מקיימת:

ועל ידי קיבוץ חזקות של ושל , מתקבל:

הצגה זו מקיימת את תנאי משפט הפירוק כאשר:

הפרמטר הבלתי ידוע, , תלוי בנתונים () רק דרך הסטטיסטי שלהם

התפלגות אחידה[עריכת קוד מקור | עריכה]

אם משתנים מקריים בלתי תלויים המתפלגים באופן אחיד בטווח אזי הוא סטטיסטי מספיק ל-.

מאחר שהמשתנים המקריים הם בלתי תלויים, פונקציית הצפיפות המשותפת מקיימת:

כאשר היא פונקציית האינדיקטור. לכן, אם נסמן:

וכן ,

נקבל את תנאי משפט הפירוק, ושאכן הוא סטטיסטי מספיק.

התפלגות פואסון[עריכת קוד מקור | עריכה]

אם משתנים מקריים בלתי תלויים בעלי התפלגות פואסון עם פרמטר , אזי הסכום הוא סטטיסטי מספיק עבור .

על מנת להיווכח בכך, נתבונן בפונקציית ההסתברות המשותפת:

ומכיוון שהתצפיות בלתי תלויות:

לכן:

אם נסמן: , וכן: ,

נקבל את תנאי משפט הפירוק, ושאכן הוא סטטיסטי מספיק.

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ Hogg, Robert V.; Craig, Allen T. (1995). Introduction to Mathematical Statistics. Prentice Hall. ISBN 978-0-02-355722-4.