צידוד (סטטיסטיקה)

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
התפלגות חיובית והתפלגות שלילית

בסטטיסטיקה, צידוד (Skewness) הוא מדד מקובל לחוסר הסימטריה של פונקציית צפיפות או התפלגות של משתנה מקרי ממשי. למשתנה בעל צידוד חיובי יש נטייה לקבל ערכים גבוהים ורחוקים מן הממוצע, יותר מאשר ערכים נמוכים הרחוקים ממנו, ובגרף של פונקציית הצפיפות ניכר שהזנב הימני ארוך ועבה יותר מן השמאלי. כאשר הצידוד שלילי, הצדדים מתהפכים. בפונקציה סימטרית ביחס לתוחלת, הצידוד הוא אפס.

הצידוד של משתנה X, המסומן ב-\ \gamma_1(X) מוגדר מתוך המומנט השלישי לפי הנוסחה \ \gamma_1(X) = \frac{\mu_3}{\sigma^3}, כאשר \ \mu_3 = E((X-\mu)^3) הוא המומנט השלישי הממורכז סביב התוחלת \ \mu=E(X), ו- \ \sigma היא סטיית התקן של X.

אחרי הפרמטרים החשובים ביותר של פונקציית התפלגות, התוחלת והשונות, המבוססים על המומנט הראשון והשני, ולצד הצידוד, נמצאת בשימוש הגבנוניות, המבוססת על המומנט הרביעי.

צידוד של מדגם[עריכת קוד מקור | עריכה]

צידוד מוגדר לא רק עבור התפלגות תאורטית, אלא גם עבור מדגם סופי. הצידוד של מדגם \ x_1,\dots,x_n מחושב לפי הנוסחה \ g_1 = \frac{m_3}{m_2^{3/2}} = \frac{\sqrt{n\,}\sum_{i=1}^n (x_i-\bar{x})^3}{\left(\sum_{i=1}^n (x_i-\bar{x})^2\right)^{3/2}}, \!, כאשר \bar{x} הוא הממוצע, \ m_3=\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^3 הוא המומנט השלישי הממורכז של המדגם, ו- \ m_2 = \frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^2 היא שונות המדגם.

כאשר מבקשים לאמוד את הצידוד של ההתפלגות מתוך הצידוד של מדגם, הוא מהווה אומד מוטה. מקובל לתקן אותו לפי הנוסחה \ G_1 = \frac{k_3}{k_2^{3/2}}= \frac{\sqrt{n\,(n-1)}}{n-2}\; g_1, \!, שבה k_3 הוא אומד חסר הטיה למומנט המרכזי השלישי ו- k_2 אומד חסר הטיה למומנט המרכזי השני, אלא שאפילו תיקון זה אינו מספק אומד חסר הטיה, ובמקרים מסוימים התוחלת שלו הפוכה בסימנה מן הצידוד האמיתי.

צידוד של משתנים קרובים[עריכת קוד מקור | עריכה]

הצידוד אינו מושפע מהזזה או כפל בקבוע: \ \gamma_1(aX+b)=\gamma_1(X). אם \ Y=X_1+\dots+X_n הוא סכום של משתנים מקריים בלתי תלויים, אז \ \gamma_1(Y)=\frac{1}{\sqrt{n}}\gamma_1(X_1); בפרט, הצידוד של ממוצע משתנים בלתי תלויים הולך וקטן כאשר המדגם גדל.

שימושים[עריכת קוד מקור | עריכה]

ביישומים סטטיסטיים מקובל להניח במקרים רבים שההתפלגות בה עוסקים היא התפלגות נורמלית, שהיא התפלגות סימטרית. המציאות אינה תמיד סימטרית, וזוהי סטייה שחשוב לכמת כדי להעריך עד כמה הנחת הנורמליות פגומה. הצידוד מאפשר להסיק לאיזה כיוון יהיו רוב הסטיות הגדולות מן הממוצע.

חלופות[עריכת קוד מקור | עריכה]

הסטטיסטיקאי הנודע קרל פירסון הציע שני מדדים אחרים למדידת חוסר הסימטריה של התפלגות או מדגם:

מדדים אלו שימושיים בעיקר במדגמים גדולים, ולא כאשר עוסקים בהתפלגויות תאורטיות. גם אין ערובה לכך שהם יהיו בעלי אותו סימן כמו הצידוד.

ראו גם[עריכת קוד מקור | עריכה]