מבחן t

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בסטטיסטיקה, מבחן t (מכונה גם מבחן סטודנט על פי שם העט של החוקר ויליאם גוסט שפיתח אותו) הוא שם כולל למבחני השערות לגבי התוחלת של נתונים המגיעים מהתפלגות נורמלית, כאשר השונות אינה ידועה. במבחנים אלו סטטיסטי המבחן מתפלג התפלגות t בהינתן שהשערת האפס H_0 נכונה. מבחן t שימושי לרוב במקרים בהם גודל המדגם קטן יחסית.

שימושים עיקריים למבחני t[עריכת קוד מקור | עריכה]

  • מבחן השערות בו נרצה לקבל או לדחות השערות המתארות את ערכה של התוחלת באוכלוסיה כלשהי, על סמך מדגם בודד.
  • מבחן השערות בו, על סמך שני מדגמים, נרצה לקבל או לדחות השערות בנוגע ליחס בין התוחלות של האוכלוסיות מהן לקוחים המדגמים (הוריאציה של מבחן זה עבור מקרים בהם לא נוכל להניח כי השונויות של האוכלוסיות השונות שוות בקירוב נקראת לעיתים מבחן וולצ').
  • מבחן השערות לתוחלת עבור דוגמאות מזווגות: מבחן השערות לגבי תוחלת של שתי אוכלוסיות שונות, אולם במקרים בהם נוכל ל"זווג" בין פרטים בין שני האוכלוסיות.
  • מבחני השערות בנוגע לקורולציה בין שני משתנים מקריים.

דוגמא: בדיקת השערות על תוחלת של אוכלוסיה[עריכת קוד מקור | עריכה]

מעוניינים לבדוק את השערת ה-0, לפיה אוכלוסיה המגיעה מההתפלגות הנורמאלית ומתפלגת עם תוחלת \mu = \mu_0, כאשר השונות \sigma^2 אינה ידועה. בהינתן מדגם מתוך האוכלוסיה, x_1,\dots,x_n (של תצפיות שהן בלתי תלויות ושוות התפלגות), נרצה לדחות או לקבל את ההשערה ש- \mu_0 = \mu עבור \mu_0 נתון כלשהו. נגדיר,

H_0: \mu = \mu_0

H_1:\mu \neq \mu_0

נמצע את המדגם \bar{X} = \frac{1}{n} \sum_{i=1}^{n}x_i. כעת, אם נניח ש-H_0 מתקיימת אז הרי הסטטיסטי \frac{\bar{X} - \mu_0}{\frac{\sigma}{\sqrt{n}}} מתפלג בצורה נורמלית סטנדרטית (ע"ע משפט הגבול המרכזי). אולם, משום שהשונות, \sigma^2, אינה ידועה לנו, לא נוכל להשתמש בסטטיסטי הנ"ל. במקום זאת נשתמש בסטטיסטי שעושה שימוש בשונות שנאמדה מתוך המדגם. נסמן את השונות שנאמדה מתוך המדגם כ- S_x ונסתכל על הסטטיסטי הבא:

\frac{\bar{X} - \mu_0}{\frac{S_x}{\sqrt{n}}}

סטטיסט זה אינו מתפלג נורמלית, אלא מתפלג ע"פ התפלגות t עם n-1 דרגות חופש. כעת, נמצא את ערך הסף, T, של הסטטיסטי לדחיית H_0 עבור שגיאת \alpha (לשגיאה מסדר ראשון), כלשהי:

\mathbb{P}\left( -T < \frac{\bar{X} - \mu_0}{S_x} < T  \right) = 1 - \alpha \Rightarrow T= t_{(n-1), 1-\frac{\alpha}{2}}

כלומר,


\begin{align}
\mathbb{P}\left( -t_{(n-1), 1-\frac{\alpha}{2}} < \frac{\bar{X} - \mu_0}{\frac{S_x}{\sqrt{n}}} < t_{(n-1),1-\frac{\alpha}{2}} \right) 

\end{align}

כעת, בהתקבל מדגם, נדחה את H_0 אם מתקיים אחד מהתנאים הבאים:


-t_{(n-1), 1-\frac{\alpha}{2}} > \frac{\bar{X} - \mu_0}{\frac{S_x}{\sqrt{n}}}

או,


\frac{\bar{X} - \mu_0}{\frac{S_x}{\sqrt{n}}} > t_{(n-1), 1-\frac{\alpha}{2}}


הערה: התפלגות t מתכנסת להתפלגות נורמלית ככל שמספר דרגות החופש גדל. לכן עבור מדגם גדול (במקומות מסוימים החל מ- n>30) הסטטיסטי המתואר מתפלג בקירוב על פי התפלגות נורמלית סטנדרטית.