לדלג לתוכן

חסם קרמר–ראו

מתוך ויקיפדיה, האנציקלופדיה החופשית
(הופנה מהדף חסם קרמר-ראו)

בתורת האמידה ובסטטיסטיקה, חסם קרַמר–ראו (באנגלית: Cramér–Rao bound, בראשי תיבות: CRB; נקרא גם Cramér–Rao lower bound, בראשי תיבות: CRLB) הוא חסם תחתון על השונות של אומדים של פרמטרים דטרמיניסטיים. לעיתים הוא ידוע בשמות "אי-שוויון קרמר–ראו" או "אי-שוויון האינפורמציה". הוא נקרא על שם הראלד קרמר וק. ר. ראו, שהיו בין הראשונים לקבל אותו.

בצורתו הפשוטה ביותר, החסם קובע שהשונות של כל אומד חסר הטיה היא חסומה מלמטה על ידי ההופכי של האינפורמציה של פישר. אומד חסר הטיה שהשונות שלו שווה לחסם נקרא אומד יעיל (efficient). לאומד כזה השגיאה הריבועית הממוצעת הנמוכה ביותר מבין כל האומדים חסרי ההטיה, ולכן הוא נקרא גם אומד חסר הטיה בעל שונות מינימלית במידה שווה (uniformly minimum-variance unbiased estimator – UMVUE). עם זאת, לעיתים לא קיים אומד חסר-הטיה שמשיג את החסם, אף במקרה שיש אומד שהשונות שלו היא הקטנה ביותר מכל שאר האומדים.

גרסה מוכללת של חסם קרמר–ראו נותנת חסם גם עבור השונות של אומדים בעלי-הטיה ידועה. במקרים מסוימים, אומד מוטה עשוי להניב שגיאה ריבועית ממוצעת ושונות נמוכות יותר מאלו שמשיג חסם קרמר–ראו עבור אומר חסר-הטייה.

תנאים רגולריים

[עריכת קוד מקור | עריכה]

החסם תקף תחת שני תנאים רגולריים חלשים יחסית על פונקציית צפיפות ההסתברות :

  1. האינפורמציה של פישר מוגדרת היטב, כלומר לכל שבו , הנגזרת קיימת והיא סופית.
  2. ניתן להחליף את הסדר של גזירה לפי ואינטגרציה לפי . התנאי הזה מתקיים כאשר אחד מהבאים מתקיים:
    • הפונקציה היא בעלת תומך סופי ב-, שגבולותיו אינם תלויים ב-.
    • הפונקציה היא בעלת תומך אינסופי, גזירה ברציפות, והאינטגרל מתכנס במידה שווה לכל .

אומד סקלרי

[עריכת קוד מקור | עריכה]

אומד חסר-הטיה של פרמטר

[עריכת קוד מקור | עריכה]

יהי פרמטר דטרמיניסטי לא-ידוע הנאמד בעזרת וקטור של מדידות של . צפיפות ההסתברות של המדידות, שתלויה בפרמטר, היא . השונות של כל אומד חסר-הטיה של הפרמטר חסום על ידי ההופכי של האינפורמציה של פישר:

האינפורמציה של פישר במקרה הסקלרי , מוגדרת לפי:

כאשר היא הלוגריתם הטבעי של פונקציית הנראות של דגימה יחידה ו־ היא התוחלת לפי הצפיפות של . אם לא כתוב אחרת להלן, התוחלת היא תוחלת לפי .

אם גזירה פעמיים ותנאים רגולריים מסוימים מתקיימים, אזי ניתן להגדיר את האינפורמציה של פישר גם כך:[1]

היעילות (אנ') של אומד חסר הטיה מורה כמה קרובה שונות האומד לחסם התחתון; יעילות אומד מוגדרת כך:

כלומר היחס בין השונות המינימלית האפשרית עבור אומד חסר הטיה לבין השונות שלו בפועל. חסם קרמר–ראו קובע:

.

אומד חסר-הטיה של פונקציה של פרמטר

[עריכת קוד מקור | עריכה]

צורה כללית יותר של החסם מתקבלת עבור מקרה של אומד חסר הטיה, , שנועד לאמוד את , פונקציה ידועה של פרמטר סקלרי דטרמיניסטי לא-ידוע . משמעות חוסר ההטיה היא שמתקיים . במקרה זה, החסם הוא:

כאשר היא הנגזרת של לפי , ו־ היא האינפורמציה של פישר, כפי שהוגדרה לעיל.

אומד מוטה של פרמטר

[עריכת קוד מקור | עריכה]

ניתן להכליל את החסם עבור אומד של פרמטר בעל הטיה ידועה, . נסמן:

,

ולפיכך מתקיים:

.

השונות של כל אומד חסר הטיה שהתוחלת שלו היא חסומה על ידי הביטוי שלעיל; במילים אחרות, השונות של כל אומד שהטייתו ידועה, חסומה על ידי:

.

כאשר היא הנגזרת של לפי .

ניתן לראות כי תוצאה זו מתכנסת לנוסחה עבור אומד חסר-ההטיה עבור .

אם כן, השגיאה הריבועית הממוצעת של כל אומד מוטה חסומה על ידי:

.

הצורה הכללית ביותר של החסם עבור אומד סקלרי היא עבור אומד מוטה של פונקציה של פרמטר , שנועד לאמוד את , פונקציה ידועה של פרמטר סקלרי דטרמיניסטי לא-ידוע . משמעות ההטיה היא ש־ לא בהכרח שווה ל־0.

במקרה זה, החסם הוא:

אומד וקטורי כללי

[עריכת קוד מקור | עריכה]

ניתן להכליל את החסם עבור וקטור של פרמטרים לא-ידועים, המוגדר:

כאשר פונקציית הצפיפות מקיימת את התנאים הרגולריים לעיל.

במקרה זה, החסם דומה מאוד, אלא שכעת צורתו וקטורית: האינפורמציה של פישר היא מטריצה , ולא סקלר, ואת שונות האומד מחליפה מטריצת השונות המשותפות של אומד פונקציה כלשהי של וקטור הפרמטרים, המסומן .

האיבר ה־ במטריצת האינפורמציה של פישר מוגדר:

והמטריצה בכללה היא:

במילים אחרות, מטריצת האינפורמציה של פישר היא תוחלת המכפלה החיצונית של גרדיאנט פונקציית לוג-הנראות עם עצמו.

יהי אומד של פונקציה כלשהי של וקטור הפרמטרים :

נסמן את קטור התוחלות ב־.

חסם קרמר–ראו קובע כי מטריצת השונות המשותפות (Covariance Matrix) של מקיימת:

,

כאשר:

  • האי-שוויון הוא אי-שוויון מטריצי, כלומר ההפרש בין אגף שמאל לאגף ימין הוא מטריצה חיובית למחצה (Positive semi-definite).
  • היא מטריצת יעקובי שהאיבר ה־ שלה הוא .

במקרה הפרטי הפשוט שבו הוא אומד חסר-הטיה של (כלומר ), חסם קרמר–ראו מצטמצם לצורה:

צורה זו מזכירה מאוד את המקרה הסקלרי.

אם מסובך להפוך את מטריצת האינפורמציה של פישר, ניתן פשוט לקחת את ההופכי של האלמנט האלכסוני הרצוי כדי למצוא גבול תחתון, אם כי ייתכן שהוא יהיה מעט נמוך מהגבול התחתון האמיתי שיביא היפוך המטריצה:[2]

הוכחת החסם

[עריכת קוד מקור | עריכה]

ההוכחה הבאה היא זו של המקרה הסקלרי הכללי שהוצג לעיל.

נניח ש- הוא משתנה מקרי עם פונקציית צפיפות הסתברות , וש- הוא אומד של . יהי הניקוד (score) של הפילוג:

התוחלת של הניקוד:

כאשר החלפת סדר הגזירה והאינטגרציה אפשרית בהנחה שהתנאים הרגולריים מתקיימים.

השונות המשותפת של ושל :

מאחר ש- הוא אומד חסר הטיה, מתקבל:

לפי אי-שוויון קושי-שוורץ, מתקיים:

השונות של היא גם האינפורמציה של פישר (לפי הגדרה), ולכן יתקבל בהצבה לאי-שוויון:

שהוא החסם המבוקש.

דוגמה: חסם קרמר–ראו עבור משתני אינדיקטור

[עריכת קוד מקור | עריכה]

נחפש את חסם קרמר–ראו עבור מודל שבו . מכאן שפונקציית הנראות היא:

כדי לקבל את האינפורמציה של פישר, צריך לחשב את לוגריתם הנראות:

מגזירה מתקבל:

,

ולכן האינפורמציה של פישר היא:

ולפי חסם קרמר–ראו עבור כל אומד חסר הטיה , מתקיים:

לקריאה נוספת

[עריכת קוד מקור | עריכה]
  • Kay, Steven M. (1993). Fundamentals of Statistical Signal Processing, Volume I: Estimation Theory. Prentice Hall.
  • Shao, Jun (1998). Mathematical Statistics. New York: Springer.

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. Suba Rao. "Lectures on statistical inference" (PDF). אורכב מ-המקור (PDF) ב-2020-09-26.
  2. For the Bayesian case, see eqn. (11) of Bobrovsky; Mayer-Wolf; Zakai (1987). "Some classes of global Cramér–Rao bounds". Ann. Stat. 15 (4): 1421–38. doi:10.1214/aos/1176350602.