התפלגות לוג-נורמלית

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
התפלגות לוג נורמלית
פונקציית צפיפות ההסתברות
Lognormal distribution PDF.png
פונקציית ההסתברות המצטברת
Lognormal distribution CDF.png
מאפיינים
פרמטרים \ \mu, \ \sigma.
תומך \ (0,\infty)
פונקציית הסתברות

(pmf)

פונקציית צפיפות הסתברות

(pdf)

\frac1{x\sigma\sqrt{2\pi}}\; \exp\left(-\frac{\left(\ln x-\mu\right)^2}{2\sigma^2} \right) \!
פונקציית ההסתברות המצטברת

(cdf)

\frac12 \left(1 + \mathrm{erf}\,\frac{\ln x-\mu}{\sigma\sqrt2}\right) \!
תוחלת \ e^{\mu+\sigma^2/2}
חציון \ e^{\mu}
ערך שכיח \ e^{\mu-\sigma^2}
שוֹנוּת \ (e^{\sigma ^2}-1)e^{2\mu+\sigma^2}
אנטרופיה \frac12 + \frac12 \ln(2\pi\sigma^2) + \mu
פונקציה יוצרת מומנטים

(mgf)

 
צידוד (e^{\sigma^2}\!\!+2) \sqrt{e^{\sigma^2}\!\!-1}
גבנוניות e^{4\sigma^2}\!\! + 2e^{3\sigma^2}\!\! + 3e^{2\sigma^2}\!\! - 6

התפלגות לוג-נורמלית היא התפלגות של משתנה אקראי, שפונקציית הצפיפות שלה היא \frac1{x\sigma\sqrt{2\pi}}\; \exp\left(-\frac{\left(\ln x-\mu\right)^2}{2\sigma^2} \right) \! בתחום \ x>0. אם \ X הוא משתנה אקראי שמתפלג נורמלית, אז \ e^X מתפלג לוג-נורמלית, וההפך- אם \ Y הוא משתנה אקראי שמתפלג לוג-נורמלית, אז \ \log(Y) מתפלג נורמלית. בסיס הלוגריתם לא משנה - שכן לוגריתמים בבסיסים שונים קשורים בקשר לינארי.

לפי משפט הגבול המרכזי, מכפלה של מספר רב של משתנים חיוביים בלתי תלויים ובעלי אותה התפלגות מתפלגת, בקירוב טוב, לוג-נורמלית. התפלגות כזו מופיעה כאשר הערך הנמדד נוצר על ידי הצטברות כפלית של גורמים רבים. לדוגמה, המשקל ולחץ הדם של בני אדם, מספר המילים במשפטים שכתב ג'ורג' ברנרד שו, זמן השרידה של חיידקים בחומר חיטוי, הנחתה בתקשורת אלחוטית ועוד.

מאפיינים[עריכת קוד מקור | עריכה]

אם \ X הוא משתנה אקראי שמתפלג לוג נורמלית, אז:

  • פונקציית הצפיפות של X היא \ f_X(x; \mu,\sigma)=\frac1{x\sigma\sqrt{2\pi}}\; \exp\left(-\frac{\left(\ln x-\mu\right)^2}{2\sigma^2} \right) \! והיא מוגדרת רק על החצי החיובי של הישר הממשי. הפרמטרים \ \mu,\sigma הם התוחלת וסטיית התקן של הלוגריתם הטבעי של המשתנה.
  • פונקציית ההצטברות היא F_X(x;\mu,\sigma) = \frac12 \operatorname{erfc}\!\left[-\frac{\ln x - \mu}{\sigma\sqrt{2}}\right] = \Phi\bigg(\frac{\ln x - \mu}{\sigma}\bigg), כאשר erfc היא פונקציית השגיאה המשלימה, ו-\ \Phi היא פונקציית ההתפלגות המצטברת של משתנה נורמלי סטנדרטי.
  • התוחלת והשונות הן:
     \mathrm{E}[X] = e^{\mu + \tfrac{1}{2}\sigma^2}
     \mathrm{Var}[X] = (e^{\sigma^2} - 1) e^{2\mu + \sigma^2}
  • השכיח והחציון הם:
    \ \mathrm{Mode}[X] = e^{\mu - \sigma^2}
    \ \mathrm{Med}[X] = e^{\mu}
  • המומנט ה-n-י נתון על ידי: : \operatorname{E}[X^n] = e^{n\mu + \tfrac{1}{2}n^2\sigma^2}, ולכן הפונקציה יוצרת המומנטים אינה מתכנסת פרט לנקודת הראשית. בהקשר זה, חשוב לציין כי התפלגות לוג-נורמלית אינה נקבעת באופן יחיד על ידי סדרת המומנטים שלה (\ {E[X^n]}_{n=1}^{\infty}).
  • התוחלת החלקית של משתנה אקראי X המתפלג לוג-נורמלית ביחס לחסם תחתון k היא:
    g(k) = \int_k^\infty \!xf(x)\, dx = e^{\mu+\tfrac{1}{2}\sigma^2}\, \Phi\!\left(\frac{\mu+\sigma^2-\ln k}{\sigma}\right)
    לנוסחה זו שימושים בענפי הכלכלה והביטוח. כך למשל, היא משמשת בהוכחת הנוסחה של מודל בלק ושולס.

דוגמה[עריכת קוד מקור | עריכה]

התפלגות אורכי הערכים בוויקיפדיה, אוקטובר 2009. הציר האופקי הוא בסקאלה לוגריתמית.

בגרף מימין - התפלגות הלוגריתם (לפי בסיס 2) של אורכי הערכים בויקיפדיה העברית, בבתים, לפי דגימת בסיס הנתונים שנעשתה בסוף אוקטובר 2009. מן הנתונים נוכו כ-3500 "ערכי שנים" משני סוגים - שנים עבריות ושנים לועזיות - שרובם המכריע נוצרים על ידי בוט והם ערכים שבלוניים בעלי מאפיינים אחידים (לוגריתם האורך \ 10.97\pm 0.43 בקבוצה אחת ו- \ 11.61\pm 0.41 בשנייה) שאינם מתאימים להתפלגות הערכים האחרים (\ 11.97 \pm 1.36).

לנתונים צידוד \ -0.105, המצביע על נטיית-מה בין הנתונים הרחוקים מן הממוצע להיות נמוכים ממנו, וגבנוניות \ 0.87, המצביעה על חריגות מן הממוצע, המתבטאות בזנבות עבים של ההתפלגות.

מלבד גורמים אלה, התפלגות הלוגריתם קרובה להתפלגות נורמלית: אורכם של ערכים בוויקיפדיה העברית מתפלג, בקירוב, לוג-נורמלית.

התפלגויות קשורות[עריכת קוד מקור | עריכה]

  • אם \ X מתפלג נורמלית עם \ (\mu,\sigma^2) אז \ e^{X} מתפלג לוג-נורמלית עם אותם פרמטרים.
  • אם \ X מתפלג לוג-נורמלית עם \ (\mu,\sigma^2), אז \ \ln(X) מתפלג נורמלית עם אותם פרמטרים.
  • אם X_i הם משתנים אקראיים בלתי-תלויים המתפלגים לוג-נורמלית עם (\mu_i, \sigma_i^2) אז מכפלתם מתפלגת לוג-נורמלית עם Y = \textstyle\prod_{j} X_j \sim \operatorname{Log-\mathcal{N}}\Big(\textstyle \sum_{j}\mu_j,\ \sum_{j} \sigma_j^2 \Big).
  • אם X מתפלג לוג-נורמלית עם \ (\mu,\sigma^2) אז \ Y=aX מתפלג לוג-נורמלית עם \ (\mu+ln(a),\sigma^2).
  • אם X מתפלג לוג-נורמלית עם \ (\mu,\sigma^2) אז \ X^r מתפלג לוג-נורמלית עם \ (r\mu,r^2\sigma^2). בפרט, \ 1/X מתפלג לוג-נורמלית עם \ (-\mu,\sigma^2).

קישורים חיצוניים[עריכת קוד מקור | עריכה]