אי-שוויון דבורצקי-קיפר-וולפוביץ

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בתורת ההסתברות, אי-שוויון דבורצקי-קיפר-וולפוביץ הוא אי-שוויון החוסם את המרחק בין התפלגות דגימה לבין ההתפלגות התאורטית שממנה נלקחת הדגימה. אי-השוויון קרוי על-שם המתמטיקאים אריה דבורצקי, ג'ק קיפר וג'קוב וולפוביץ שגילו אותו ב-1956‏‏[1]. בגרסה המקורית הופיע באגף ימין של אי-השוויון גורם קבוע C, שערכו לא הוגדר. ב-1990 מצא Pascal Massart ‏‏[2] את ערכו המדויק של הקבוע, והראה שלא ניתן לשפר את התוצאה מעבר אליו.

אי-השוויון[עריכת קוד מקור | עריכה]

עבור מספר טבעי n, יהיו \ X_1,\dots,X_n משתנים מקריים ממשיים, בלתי תלויים ושווי התפלגות, עם פונקציית התפלגות \ F. נסמן ב- \ F_n את פונקציית המדרגות המתקבלת מן הדגימה: F_n(x)=\frac1n \sum_{i=1}^n 1_{[X_i,\infty)}(x),\quad x\in{\mathbb R}.. אי-שוויון דבורצקי-קיפר-וולפוביץ חוסם את הסיכוי שהפונקציה המקרית \ F_n תהיה רחוקה מ-\ F ביותר מקבוע \ \varepsilon>0 במקום כלשהו על הישר הממשי. ליתר דיוק, 
\mathbb{P} \Bigl( \sup_{x\in\mathbb R} |F_n(x) - F(x)| > \varepsilon \Bigr) \le 2e^{-2n\varepsilon^2} לכל \ \varepsilon>0. תוצאה זו מחזקת את משפט גליבנקו-קנטלי, בכך שהיא קובעת את קצב ההתכנסות של המרחק כאשר n גדל לאינסוף. אי-השוויון מספק גם אומדן להסתברות הזנב של הסטטיסטי של קולמוגורוב-סמירנוב.

לדוגמה, אם דוגמים n=150 ערכים מהתפלגות לא ידועה \ F, ומגדירים \ F_n כמקודם, אז הסיכוי לכך שתהיה נקודה ממשית שבה \ |F(x)-F_n(x)|>0.1 קטן מ- \ 2e^{-2n\cdot 0.1^2} = 2e^{-1.5} \approx 0.1. כדי לדגום את הפונקציה בשגיאה קטנה פי \ K, ובאותה הסתברות, יש להגדיל את המדגם פי \ K^2.

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ ‏ , Dvoretzky, Kiefer and Wolfowitz, `Asymptotic minimax character of the sample distribution function and of the classical multinomial estimator', Annals of mathematical Statistics, Vol. 27(3), 1956, 642–-669. ראו גם גרסה אלקטרונית.‏
  2. ^ ‏ Massart, `The tight constant in the Dvoretzky-Kiefer-Wolfowitz inequality', The Annals of Probability, Vol. 18(3), 1990, 1269--1283. ראו גם גרסה אלקטרונית