לדלג לתוכן

התפלגות גאמבל

מתוך ויקיפדיה, האנציקלופדיה החופשית
התפלגות גאמבל
פונקציית צפיפות ההסתברות
px
px
פונקציית ההסתברות המצטברת
px
px
מאפיינים
פרמטרים , פרמטר מיקום (ממשי)
, פרמטר סקאלה (ממשי)
תומך
פונקציית צפיפות הסתברות
(pdf)

כאשר
פונקציית ההסתברות המצטברת
(cdf)
תוחלת
כאשר הוא קבוע אוילר-מסקרוני
חציון
ערך שכיח
שונות
אנטרופיה
פונקציה יוצרת מומנטים
(mgf)
פונקציה אופיינית
צידוד
גבנוניות

בתורת ההסתברות וסטטיסטיקה התפלגות גאמבל משמשת כמודל הסתברותי של ערכי קיצון (מקסימום או מינימום) של מספר דגימות של התפלגויות.

ניתן להשתמש בהתפלגות כמודל הסתברותי של הערך המקסימלי של הזרימה בנהר בשנה מסוימת בהינתן ערכי המקסימום בעשר השנים האחרונות או לאומדן הסיכון לרעידת אדמה קיצונית, שיטפון או אסון טבע אחר. היישום של התפלגות גאמבל לייצוג התפלגות ערכי מקסימום קשור לתאוריית ערכים קיצוניים(אנ').

התפלגות גאמבל היא מקרה פרטי של התפלגות הערכים הקיצונית המוכללת(אנ') (הידועה גם בשם התפלגות פישר-טיפט). היא ידועה גם בשם התפלגות לוג-ווייבול והתפלגות מעריכית כפולה (מונח שמשמש לפעמים במקום התפלגות לפלס).

התפלגות גאמבל נקראת על שמו של אמיל יוליוס גאמבל (1891 – 1966).[1][2]

פונקציית צפיפות ההסתברות של ההתפלגות גאמבל היא[3]

כאשר סימנו ,

ופונקציית ההתפלגות המצטברת שלה היא

התפלגות גאמבל סטנדרטית

[עריכת קוד מקור | עריכה]

התפלגות גאמבל סטנדרטית מוגדרת כהתפלגות גאמבל עם פרמטרים ו , כלומר פונקציית צפיפות הסתברות שלה היא

ופונקציית ההתפלגות המצטברת

.

במקרה זה השכיח הוא 0, החציון הוא , הממוצע הוא ( קבוע אוילר-מסקרוני), וסטיית התקן היא .

  • השכיח הוא μ, החציון הוא והתוחלת נתונה על ידי , כאשר הוא קבוע אוילר-מסקרוני.
  • סטיית התקן היא כלומר .[4]
  • בנקודת השכיח, , הערך של הוא , ללא קשר לערך של .
  • אִם הם משתנים מקריים בלתי-תלויים ושווי-התפלגות המתפלגים גאמבל עם פרמטרים אז הוא משתנה מקרי המתפלג גאמבל עם פרמטרים .
  • אִם הם משתנים מקריים בלתי-תלויים ושווי-התפלגות כך שלמשתנה יש אותה התפלגות כמו לכל המספרים הטבעיים , אז מתפלג גאמבל עם פרמטר קנה מידה .

התפלגויות קשורות

[עריכת קוד מקור | עריכה]
  • אִם מתפלג גאמבל, אזי ההתפלגות המותנית של Y = − X בהינתן ש- Y חיובי, או לחלופין בהינתן ש- X שלילי, יש התפלגות גומפרץ. פונקציית ההתפלגות המצטברת, G, של Y קשורה לפונקציית ההתפלגות המצטברת, F, של X, על ידי הנוסחה עבור y > 0. כתוצאה מכך, הצפיפויות קשורות זו לזו על ידי  : צפיפות גומפרץ פרופורציונלית לתמונת הראי של פונקציית צפיפות התפלגות של גומבל המוגבלת לחצי הישר הממשי החיובי.[5]
  • אם X הוא משתנה מקרי מתפלג מעריכית עם תוחלת 1, אז log( X ) מתפלג התפלגות גאמבל סטנדרטית.
  • אִם ו והם בלתי תלויים אז להפרש שלהם התפלגות לוגיסטית .
התאמת חלוקה עם רצועת ביטחון של חלוקת Gumbel מצטברת למקסימום גשמים של יום אחד באוקטובר. [6]

גאמבל הראה שהערך המקסימלי במדגם של משתנים מקריים המתפלגים התפלגות מעריכית בחיסור של הלוגריתם הטבעי של גודל המדגם[7] שואף להתפלגות גאמבל ככל שגודל המדגם גדל.[8]

באופן קונקרטי, תהי התפלגות ההסתברות של ו ההתפלגות המצטברת שלו. אז הערך המקסימלי מבין דגימות של קטן מ אם ורק אם כל הדגימות קטנות מ . אז ההתפלגות המצטברת של הערך המקסימלי מקיים

וכן, לערכי גדולים, צד הימני מתכנס ל .

בהידרולוגיה, לפיכך, התפלגות גאמבל משמשת לניתוח משתנים כמו ערכי מקסימום חודשיים ושנתיים של כמות גשם יומית וספיקה של זרימת מים בנהר, וכן לתיאור של בצורות.[9]

גמבל גם הראה שהאומד r(n+1) עבור ההסתברות לאירוע, כאשר r הוא הדירוג של הערך הנצפה בסדרת הנתונים ו- n הוא המספר הכולל של התצפיות, הוא אומד לא מוטה של ההסתברות המצטברת סביב השכיח של ההתפלגות.

התפלגות גאמבל מופיעה גם בבעיית אוסף הקופונים.

פרמטריזציות של התפלגות גאמבל

[עריכת קוד מקור | עריכה]

בלמידת מכונה, לעיתים משתמשים בהתפלגות גאמבל כדי ליצור דוגמאות מההתפלגות הקטגוריאלית.

ספציפית, יהיו ממשיים אי- שליליים, לא כולם אפס, ותהיינה דגימות בלתי-תלויות מהתפלגות גאמבל סטנדרטית. על ידי אינטגרציה מתקבל כלומר,

לחלופין בהינתן , נוכל לדגום מהתפלגות בולצמן על ידי משוואות קשורות כוללות:[10]

  • אִם , אז .
  • .
  • . כלומר, התפלגות גאמבל היא משפחת התפלגויות מקסימלית יציבה.

מחולל משתנים מקריים

[עריכת קוד מקור | עריכה]

כיוון שפונקציית השברונים (הפונקציה ההופכית לפונקציית התפלגות מצטברת), , של התפלגות גאמבל נתונה על ידי

הווריאט מתפלג גאמבל עם פרמטרים ו כאשר המשתנה המקרי נדגם מהתפלגות אחידה רציפה על האינטרוול .

קישורים חיצוניים

[עריכת קוד מקור | עריכה]
ויקישיתוף מדיה וקבצים בנושא התפלגות גאמבל בוויקישיתוף

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. ^ Gumbel, E.J. (1935), "Les valeurs extrêmes des distributions statistiques" (PDF), Annales de l'Institut Henri Poincaré, 5 (2): 115–158
  2. ^ Gumbel E.J. (1941). "The return period of flood flows". The Annals of Mathematical Statistics, 12, 163–190.
  3. ^ Weisstein, Eric W, Gumbel Distribution, MathWorld--A Wolfram Web Resource
  4. ^ Oosterbaan, R.J. (1994). "Chapter 6 Frequency and Regression Analysis" (PDF). In Ritzema, H.P. (ed.). Drainage Principles and Applications, Publication 16. Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175–224. ISBN 90-70754-33-9.
  5. ^ Willemse, W.J.; Kaas, R. (2007). "Rational reconstruction of frailty-based mortality models by a generalisation of Gompertz' law of mortality" (PDF). Insurance: Mathematics and Economics. 40 (3): 468. doi:10.1016/j.insmatheco.2006.07.003. אורכב מ-המקור (PDF) ב-2017-08-09. נבדק ב-2019-09-24.
  6. ^ "CumFreq, distribution fitting of probability, free calculator". www.waterlog.info.
  7. ^ "Gumbel distribution and exponential distribution". Mathematics Stack Exchange.
  8. ^ Gumbel, E.J. (1954). Statistical theory of extreme values and some practical applications. Applied Mathematics Series. Vol. 33 (1st ed.). U.S. Department of Commerce, National Bureau of Standards. ASIN B0007DSHG4.
  9. ^ Burke, Eleanor J.; Perry, Richard H.J.; Brown, Simon J. (2010). "An extreme value analysis of UK drought and projections of change in the future". Journal of Hydrology. 388 (1–2): 131–143. Bibcode:2010JHyd..388..131B. doi:10.1016/j.jhydrol.2010.04.035.
  10. ^ Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrian (2017-07-17). "Lost Relatives of the Gumbel Trick". International Conference on Machine Learning (באנגלית). PMLR: 371–379. arXiv:1706.04161.