לדלג לתוכן

שיטת הדלתה: הבדלי גרסאות

נוספו 445 בתים ,  לפני שנתיים
אין תקציר עריכה
[[סטטיסטיקה|בסטטיסטיקה]], שיטת הדלתה היא תוצאה המאפשרת את אמידת שגיאת התקן[[שונות|השונות]] של פונקציה של [[אמדן|אמד]] לפרמטר, כאשר התפלגותו האסימפטוטית של האמד היא [[התפלגות נורמלית|נורמלית]] [[סטיית ושגיאתתקן|וסטיית התקן]] של האמד ידועה.
 
== היסטוריה ==
== שיטת הדלתה ==
 
תהי <math>X_n</math> סדרה של [[משתנה מקרי|משתנים מקריים]] בעלת התפלגות אסימפטוטית נורמלית, ובאופן פורמלי <math>{\sqrt{n}[X_n-\theta]\,\xrightarrow{D}\,\mathcal{N}(0,\sigma^2)},</math>, כאשר <math>\theta</math> ו-<math>\sigma^2</math> קבועים ממשיים, ו-<math>\xrightarrow{D}</math> מציין [[התכנסות בהתפלגות]]. כן תהא <math>g</math> פונקציה [[נגזרת|הגזירה]] בנקודה <math>\theta</math> כך ש-<math>g'(\theta)</math> [[רציפות|רציפה]] ו-<math>g'(\theta) \ne 0</math> אזי: <math>{\sqrt{n}[g(X_n)-g(\theta)]\,\xrightarrow{D}\,\mathcal{N}(0,\sigma^2\cdot[g'(\theta)]^2)}</math>.
 
 
'''הוכחה:''' על פי [[משפט הערך הממוצע של לגראנז']] (משפט ערך הביניים) קיים <math>\tilde\theta</math> כך ש-<math>g(X_n)=g(\theta)+g'(\tilde{\theta})(X_n-\theta)</math>, כך ש-<math>\tilde\theta</math> נמצא בין <math>X_n</math> ובין <math>\theta</math>. (זהו למעשה [[פיתוח טיילור]] של <math>g</math> סביב <math>\theta</math>.)
 
נסדר מחדש את האיברים ונכפיל ב-<math>\sqrt{n}</math>, ונקבל כי <math>\sqrt{n}[g(X_n)-g(\theta)]=g' \left (\tilde{\theta} \right )\sqrt{n}[X_n-\theta]</math>.
 
מכיוון ש-<math>X_n\,\xrightarrow{P}\,\theta</math> (כאשר <math>\xrightarrow{P}</math> מציין שאיפה[[התכנסות בהסתברות]]) מקבלים כי <math>\tilde\theta\xrightarrow{P}\,\theta</math>, ומכיוון ש-<math>g'(\theta)</math> רציפה אנו מקבלים כי גם <math>g'(\tilde\theta)\xrightarrow{p}g'(\theta)</math>.
 
כזכור, על פי תנאי המשפט <math>{\sqrt{n}[X_n-\theta]\,\xrightarrow{D}\,\mathcal{N}(0,\sigma^2)},</math>, ולכן על פי [[משפט סלוצקי]] מקבלים כיבאופן מיידי כי <math>{\sqrt{n}[g(X_n)-g(\theta)]\,\xrightarrow{D}\,\mathcal{N}(0,\sigma^2\cdot[g'(\theta)]^2)}</math>.
 
הערה: ניתן להוכיח כי השגיאה בקירוב שואפת בהסתברות לאפס. כן קיימת גירסה רב מימדית.
==דוגמאות==
===ריבוע התוחלת===
על פי [[משפט הגבול המרכזי]], [[ממוצע|הממוצע]] של <math>n</math> משתנים מקריים [[אי תלות (סטטיסטיקה)|בלתי תלויים]] ושווי התפלגות בעלי [[תוחלת]] <math>\mu</math> ושונות סופית וחיובית <math>\sigma^2</math> מתפלג אסימפטוטית נורמלית, כלומר <math>\sqrt{n}[\bar{X}_n-\mu]\xrightarrow{D}N(0, \sigma^2)</math>. תהי <math>g(x)=x^2</math>, ןלכן <math>g'(x)=2x</math>. מכאן נקבל כי ל-<math>\bar{X}_n^2</math> יש התפלגות אסימפטוטית נורמלית עם תוחלת <math>\mu^2</math> ושונות <math>\frac {4\mu^2\sigma^2} {n}</math>.
 
===רגרסיה לוגיסטית===
נתבונן במודל [[רגרסיה לוגיסטית|הרגרסיה הלוגיסטית]] <math>\log \frac {\pi(x)}{1-\pi(x)}=\alpha + \beta \ x
</math>, ונסמן ב-<math>\hat\beta_n</math> את [[נראות מקסימלית|אמדן הנראות המקסימלית]] ל-<math>\beta</math>. מכיוון שזהו אמד נראות מקסימלית ידוע כי התפלגותו היא אסימפטוטית נורמלית עם תוחלת <math>\beta</math> ושגיאת תקן <math>s>0</math>, כאשר <math>s</math> נאמדת על ידי שימוש [[האינפורמציה של פישר|באינפורמציה של פישר]]. חוקרים מתעניינים בדרך כלל בערך <math>OR=e^\beta</math> שמפורש [[יחס הסיכויים|כיחס הסיכויים]] של <math>Y</math> בהינתן <math>X</math>. מכיוון ש-<math>g(x)=e^x</math> היא פונקציה רציפה שנגזרתה רציפה, נקבל כי לאמדן יחס הסיכויים <math>e^{\hat\beta}</math> יש התפלגות אסימפטוטית נורמלית עם תוחלת <math>e^\beta</math>, ולאמוד את שגיאת תקן שלו על ידי <math>se^{\hat\beta}</math>.
 
מכאן נוכל לקבל כי [[רווח סמך]] ברמת סמך <math>100(1-\alpha)%</math> ליחס הסיכויים הינו <math>e^{\hat\beta}\ \pm \ Z_{ \frac{\alpha}{2} }se^{\hat\beta}</math>. כן נוכל לבדוק את [[בדיקת השערות|ההשערה]] כי יחס הסיכויים שווה ל-1 על ידי [[סטטיסטי|הסטטיסטי]] <math>Z=\frac{e^{\hat\beta}-1}{se^{\hat\beta}}</math>.