גבנוניות (סטטיסטיקה)

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בסטטיסטיקה, גבנוניות (kurtosis) היא מדד מקובל למידת הריכוז של פונקציית צפיפות או התפלגות של משתנה מקרי ממשי. גבנוניות גבוהה מתבטאת בחריגות גדולות ונדירות מן הממוצע, בעוד שגבנוניות נמוכה פירושה שהחריגות שכיחות אך קטנות יותר בעוצמתן. הגבנוניות מבוססת על המומנט הרביעי של ההתפלגות, והיא מנורמלת כך שלהתפלגות הנורמלית יש גבנוניות 0.

אחרי הפרמטרים החשובים ביותר של פונקציית התפלגות, התוחלת והשונות, המבוססים על המומנט הראשון והשני, ולצד הגבנוניות, נמצא בשימוש הצידוד, המבוסס על המומנט השלישי. במונח (האנגלי) השתמש לראשונה הסטטיסטיקאי קרל פירסון ב-1905.

הגדרה[עריכת קוד מקור | עריכה]

הגבנוניות של משתנה מקרי X מוגדרת לפי הנוסחה \ \gamma_2 = \frac{\mu_4}{\sigma^4}-3, כאשר \ \mu_4=E((X-\mu)^4) היא התוחלת של החזקה הרביעית של המרחק מן התוחלת \ \mu, ו- \ \sigma^2 היא השונות.

הגבנוניות אינה מושפעת מהזזה או כפל בקבוע: \ \gamma_2(aX+b)=\gamma_2(X). אם \ Y=X_1+\dots+X_n הוא סכום של משתנים מקריים בלתי תלויים בעלי אותה שונות, אז \ \gamma_2(Y)=\frac{1}{n^2}(\gamma_2(X_1)+\dots+\gamma_2(X_n)); בפרט, הגבנוניות של ממוצע משתנים בלתי תלויים (בעלי שונות קבועה וגבנוניות סופית) הולך וקטנה, ושואפת לאפס, כאשר המדגם גדל. על-פי משפט הגבול המרכזי, נובע מכאן שהגבנוניות של ההתפלגות הנורמלית היא אפס, עובדה שניתן לאמת בחישוב ישיר.

גבנוניות של מדגם[עריכת קוד מקור | עריכה]

גבנוניות מוגדרת לא רק עבור התפלגות תאורטית, אלא גם עבור מדגם סופי. הגבנוניות של מדגם \ x_1,\dots,x_n מחושב לפי הנוסחה  g_2 = \frac{n\,\sum_{i=1}^n (x_i - \overline{x})^4}{\left(\sum_{i=1}^n (x_i - \overline{x})^2\right)^2} - 3 , כאשר \ \bar{x} הוא ממוצע המדגם. אומד זה אינו חסר הטיה.

כאשר מבקשים לאמוד את הגבנוניות של ההתפלגות מתוך הגבנוניות של מדגם, מקובל לתקן אותה לפי הנוסחה \ G_2 = \frac{n-1}{(n-2) (n-3)} \left( (n+1)\,g_2 + 6 \right) \!, המהווה אומד חסר הטיה כאשר דוגמים מהתפלגות נורמלית. בדרך כלל, בדגימה מהתפלגויות אחרות, גם האומד המתוקן אינו חסר הטיה.

ראו גם[עריכת קוד מקור | עריכה]