הנפה (סטטיסטיקה)

בסטטיסטיקה ובפרט בניתוח רגרסיה, הנפה או מינוף (באנגלית: Leverage) הוא מדד לחריגות של תצפיות. בפרט מדד זה בוחן כמה רחוקים ערכי המשתנים המסבירים בתצפית מסוימת, מערכים אלו בתצפיות האחרות.

נקודות מינוף גבוהות, אם קיימות, הן חריגות ביחס למשתנים הבלתי תלויים. חריגות זו יכולה להתבטא במרחק אוקלידי ממשתנים אחרים, אך גם בשוני הנוגע לדפוסי קורלציה. לדוגמה במדגם שבו יש קורלציה חיובית חזקה בין $X_{1}$ לבין $X_{2}$ , תצפית ספציפית שבה $X_{1}$ מקבל ערך גבוה ו $X_{2}$ נמוך בניגוד לדפוס הקורלציה תהיה בעלת הנפה גבוהה. שערוכים של פרמטרי המודל האופטימלי נוטים להימשך לתצפיות בעלות הנפה גבוהה^[1], ומכאן נגזרת המילה הנפה - תצפיות אלו נוטות למנף את המודל אליהן. נקודות אלו הן בעלות פוטנציאל רב להיות נקודות בעלות השפעה (influential points). אף על פי שנקודה משפיעה תהיה בדרך כלל בעלת מינוף גבוה, נקודת מינוף גבוהה היא לא בהכרח נקודה משפיעה. זאת משום שלמידת ההשפעה יש גם תלות בחריגות ב-y אשר אינה נכללת בחישוב של ההנפה. בהתאם לתכונה זו, למינוף יש חשיבות גדולה בחישוב מדדי השפעה של תצפיות כמו מרחק קוק (Cook's distance). מדדים אלו בוחנים כיצד תצפית ספציפית משפיעה על אמידת הפרמטרים של המודל.

הגדרה מתמטית[עריכת קוד מקור | עריכה]

הנפה מוגדרת באמצעות הרכיבים האלכסוניים של מטריצת הכובע (hat matrix) או מטריצת ההטלה. מטריצה זו מתארת את ההשפעה של כל תצפית, על הערכים המשוערכים של כלל התצפיות^[2]. האלכסון של מטריצה זו מתארת את ההשפעה של כל תצפית על ה-y המשוערך של אותה התצפית. מטריצה זו מוגדרת כמטריצה אשר הכפלתה בווקטור המשתנה התלוי במדגם תוביל לווקטור המשנה התלוי המשוערך על פי המודל.

בכתיב מטריצות: ${\hat {y}}={\hat {\beta }}X=X{\Bigl (}X^{T}X{\Bigr )}^{-1}X^{T}y=Hy$ , כאשר מסמנים $H=X{\Bigl (}X^{T}X{\Bigr )}^{-1}X^{T}$ .

ניתן לתאר את הבניה של ${\hat {y}}_{i}$ באמצעות ממוצע משוקלל של ערכי המשתנה התלוי $y$ בכל התצפיות מ-1 עד N, המוכפלים במשקלות השייכים ל- $H$ .

זאת משום ש- ${\hat {y}}_{i}=\sum _{j=1}^{N}H_{ij}\cdot y_{j}$ .

מכאן שהערך $H_{ii}$ מהווה את המשקל של התצפית על השערוך שלה ${\hat {y}}_{i}$ .

ערך זה חסום בין 0 ל-1.

הסבר אינטואיטיבי למטריצת ההטלה[עריכת קוד מקור | עריכה]

ניתן להסתכל על רגרסיה ליניארית כפתרון נדרש לסט משוואות ליניאריות כאשר כל תצפית מהווה משוואה, ונדרש למצוא פתרון בדמות בטאות ${\hat {\beta }}_{1},{\hat {\beta }}_{2},...,{\hat {\beta }}_{j}$ , שכאשר הן יוכפלו עבור כל תצפית $i$ בערכי המשתנים המסבירים שלה $X_{1},X_{2},...,X_{j}$ הן יובילו לערכי ה-y המתאימים לאותה תצפית. עם זאת, ניתן להראות כי לא ניתן לפתור את מערכת המשוואות ללא שגיאה כלשהי $\varepsilon$ , אשר אנו מנסים לצמצם עבור כל המשוואות יחדיו. שגיאה זו מוגדרת כהפרש בין ה- $y$ שהוא תוצאה של הכפלת הבטאות בערכי ה- $X$ לבין הערך $y$ של התצפית.

ניתן להסתכל על הערכים בכל i התצפיות של משתנה מסוים $X_{\bullet }j$ כווקטור עמודה.

בהתייחסות זו כל המשתנים יחדיו $X_{1}\bullet ,X_{2}\bullet ,...,X_{j}\bullet$ מהווים סט של ווקטורים הפורסים מרחב, או מישור רב ממדי.

מאחר שאין פתרון ללא שגיאה $\varepsilon$ , הווקטור אשר מכיל את כל ערכי המשתנה התלוי $y$ בתצפיות אינו מוכל במישור הנפרש על ידי $X$ , ${\text{SPAN}}(X)$ .

המטריצה $H$ מבצעת הטלה של וקטור ערכי המשתנה התלוי של כלל התצפיות $y$ אל עבר מישור נפרס זה. נהוג לסמן את הווקטור לאחר ההטלה כ- ${\hat {y}}$ , מילולית $y$ עם כובע.

הערות שוליים[עריכת קוד מקור | עריכה]

^ Everitt, B. S. (2002). Cambridge Dictionary of Statistics. Cambridge University Press. ISBN 0-521-81099-X.
^ Hoaglin, David C.; Welsch, Roy E. (February 1978). "The Hat Matrix in Regression and ANOVA" (PDF). The American Statistician. 32 (1): 17–22. doi:10.2307/2683469. hdl:1721.1/1920. JSTOR 2683469.

[1] Everitt, B. S. (2002). Cambridge Dictionary of Statistics. Cambridge University Press. ISBN 0-521-81099-X.

[2] Hoaglin, David C.; Welsch, Roy E. (February 1978). "The Hat Matrix in Regression and ANOVA" (PDF). The American Statistician. 32 (1): 17–22. doi:10.2307/2683469. hdl:1721.1/1920. JSTOR 2683469.

[1]

[2]