התפלגות זנב עבה

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
גרף שמדגים את הזנב הארוך (מסומן בצהוב)

בתורת ההסתברות ובסטטיסטיקה, התפלגות זנב עבהאנגלית: Heavy-tailed distributions) היא תכונה המיוחסת להתפלגויות שזנבן אינו ניתן לחסימה מעריכית. אינטואיטיבית מדובר בהתפלגויות בהן ישנה אוכלוסייה מעטה עם הסתברות גבוהה ואוכלוסייה רבה עם הסתברות נמוכה, ש"מזדנבת". במקרים רבים, המשקל של ה"זנב" גדול מהמשקל של החלק הראשון. תופעה זו מכונה גם "זנבות כבדים" או "זנב פרטו". על פי רוב העניין מרוכז בזנב הימני, כלומר בערכים החיוביים הקיצוניים, אך באותה מידה התפלגות זנב עבה יכולה להיות בעלת זנב שמאלי ארוך או זנב ימני וגם שמאלי.

ההתפלגויות עבות זנב מתחלקות לשני תתי-סוגים: התפלגויות זנב ארוך והתפלגויות תת-מעריכיות, אך לכל צורך מעשי משתמשים בהתפלגויות תת-מעריכיות.

דוגמאות[עריכת קוד מקור | עריכה]

Postscript-viewer-shaded.png ערך מורחב – הזנב הארוך

יועץ שהתקשה להמחיש ללקוחותיו את העוצמה של הזנב הארוך תיאר אותו כך: תדמיינו ערימה של מאות מטבעות אחד על השני, ולידה ערימה כזו קטנה יותר, לידה ערימה קטנה עוד יותר וכן הלאה. לאחר ערימות שפרוסות לאורך כמטר הן מגיעות לגובה של מטבע אחד או שניים. הערימות הקטנות הללו, שלכאורה חסרות חשיבות ממשיכות לאורך קילומטרים רבים. בסך הכול הערימות הקטנות מכילות יותר מטבעות מהערימות הגדולות.

באופן מפתיע אוכלוסיות רבות בסביבה מתנהגות בהתפלגויות בעלות זנב ארוך. לדוגמה:

  • שכיחות המילים באנגלית: המילה the היא 7% מהמילים בטקסט טיפוסי, of מהווה 3.5% וכן הלאה. רוב המילים נדירות יחסית, ובכל זאת מרכיבות את חלק הארי של הטקסטים.
  • השכיחות שבה אנשים מחפשים מלים במנועי חיפוש.
  • מספר הצפיות של מאמרים בויקיפדיה: עמוד הבית נצפה הכי הרבה פעמים וכך גם מספר מאמרים פופולריים. שאר המאמרים נצפים מעט מאוד אולם הם מהווים רוב בין המאמרים הנצפים.

הגדרות[עריכת קוד מקור | עריכה]

התפלגות זנב עבה[עריכת קוד מקור | עריכה]

נאמר שההתפלגות של משתנה מקרי  \ X בעל פונקציית הצטברות \ F היא בעלת זנב ימני עבה אם:


\lim_{x \to \infty} e^{\lambda x}\Pr[X>x] = \infty \quad \mbox{for all } \lambda>0.\,

אם נגדיר את פונקציית התפלגות הזנב בתור: \overline{F}(x) \equiv \Pr(X>x) \, , אז נקבל כי:


\lim_{x \to \infty} e^{\lambda x}\overline{F}(x) = \infty \quad \mbox{for all } \lambda>0.\,

הגדרה שקולה ניתנת באמצעות פונקציה יוצרת מומנטים המתאימה ל-\ F , שנסמנה \ M_F( t ) . אם \ M_F( t ) היא סופית לכל t > 0 .

ההגדרות להתפלגויות זנב שמאלי עבה או התפלגויות בעלות שני זנבות עבים מתקבלות על ידי הגדרות דומות.

התפלגות זנב ארוך[עריכת קוד מקור | עריכה]

נאמר שההתפלגות של משתנה מקרי  \ X בעל פונקציית הצטברות \ F היא בעלת זנב ארוך אם לכל t > 0 :


\lim_{x \to \infty} \Pr[X>x+t|X>x] =1, \,

או באופן שקול:


\overline{F}(x+t) \sim \overline{F}(x) \quad \mbox{as } x \to \infty. \,

הסבר אינטואיטיבי להתפלגות זנב ארוך הוא שלא משנה כמה "רחוק" נלך ימינה על הזנב, תמיד ההסתברות שנקבל ערך שגבוה מהערך שבו אנו נמצאים שואף לאחד. או במילים אחרות, אם ככל שהולכים ימינה המצב פחות טוב עבורנו, גם כשאנחנו חושבים שהגענו הכי רחוק שאפשר, כנראה שהמציאות עוד יותר גרועה.

מן ההגדרה נובע שכל ההתפלגויות ארוכות הזנב הן גם עבות זנב, אך לא כל התפלגות זנב עבה היא גם זנב ארוך.

התפלגות תת-אקספוננציאלית[עריכת קוד מקור | עריכה]

התפלגויות זנב עבה נפוצות[עריכת קוד מקור | עריכה]

פונקציית הצפיפות של התפלגות לוי בעלת הזנב העבה.

כל התפלגויות הזנב העבה הנפוצות הן התפלגויות תת-אקספוננציאליות. בין התפלגויות הזנב הימני הנפוצות ניתן למנות את התפלגות פארטו, ההתפלגות הלוג-נורמלית, התפלגות לוי והתפלגות ווייבול. בין ההתפלגויות הסימטריות (בעלות שני זנבות) שהן גם זנב עבה הנפוצות הן התפלגות t והתפלגות קושי.

ראו גם[עריכת קוד מקור | עריכה]