בדיקת השערות

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בסטטיסטיקה, בדיקת השערות הוא הליך המשתמש בנתוני מדגם כדי להחליט אם לדחות או לקבל השערה נתונה.

הבדיקה מכריעה בין שתי השערות לגבי ההתפלגות ממנה נלקח המדגם: השערת האפס (H_0), שהיא לרוב ההשערה השמרנית אותה מנסים לדחות, והשערה אלטרנטיבית (H_1). לרוב, ההשערה האלטרנטיבית H_1 מגדירה את קיום התופעה אותה מנסים להוכיח ודחיית H_0 מוכיחה אותה ברמת מובהקות ידועה.

דוגמה[עריכת קוד מקור | עריכה]

נניח שרוצים לבדוק את ההשערה שפרות הניזונות ממזון מסוג X הן בעלות תנובת חלב רבה יותר מאשר פרות הניזונות ממזון מסוג Y. במקרה זה ננסח את שתי ההשערות הבאות:

  • H_0: לפרות הניזונות מסוג X אין תנובת חלב גבוהה מזו של פרות הניזונות ממזון מסוג Y.
  • H_1: לפרות הניזונות מסוג X יש תנובת חלב גבוהה מזו של פרות הניזונות ממזון מסוג Y.

על מנת להוכיח שהזנה במזון X מגבירה את תנובת החלב, כלומר לדחות את השערת האפס ולקבל את ההשערה האלטרנטיבית, יש לאסוף נתונים לגבי התפלגות תנובת החלב תחת שני סוגי המזונות. למשל, איסוף במשך תקופת זמן מסוימת של נתוני תנובת החלב של פרות משתי קבוצות (מדגמים) של פרות, כאשר כל אחת מהקבוצות ניזונה מסוג מזון אחר (X או Y) ומייצגת "אוכלוסייה", כלומר קבוצה אינסופית של פרות באותם תנאים. ניתן להשוות את ממוצעי תנובת החלב של הפרות בשתי הקבוצות, תוך התחשבות בשונות בכל קבוצה. זוהי בדיקת ההשערות בדבר תוחלת המתבססת על ההנחה שההתפלגויות של שתי האוכלוסיות שנבדקו הן מסוג זהה (למשל, התפלגות נורמלית) והבדיקה נעשית רק לגבי תוחלת ההתפלגות המיוצגת על ידי הממוצע.

נניח שעל פי הנתונים, ממוצע תנובת החלב של הפרות בקבוצה שאכלה ממזון X גבוה בליטר אחד מזה של הפרות שבקבוצה שאכלה ממזון Y. נתון זה אינו מספיק בהכרח כדי לדחות את השערת האפס ולהוכיח את הטענה שמזון X מגביר את תנובת החלב בהשוואה למזון Y כי הרי תמיד יהיו הבדלים כלשהם בין שתי דגימות, אפילו אם הן מאותה אוכלוסייה (למשל, ממוצע תנובת החלב בקבוצה X יהיה שונה אם ימדד בחודשים שונים). רק הבדל מובהק סטטיסטית מאפשר דחיה של השערת האפס.

בדיקת המובהקות הסטטיסטית נעשית בדרך דומה להוכחה בדרך השלילה: נניח שהשערת האפס נכונה, ונחשב מהי ההסתברות לקבל הבדל של 1 ליטר או יותר בין ממוצעי הקבוצות. אם תתקבל הסתברות נמוכה למשל, 0.01 (1%) נטען שהשערת האפס איננה סבירה דיה ולכן יש לדחות אותה. בכך נקבל את ההשערה האלטרנטיבית, שמזון X גורם לתנובת חלב גבוהה יותר ממזון Y. אם תתקבל הסתברות גבוהה יותר, למשל 0.3 (30%), לא נוכל לדחות את השערת האפס.

סוגי שגיאות[עריכת קוד מקור | עריכה]

הליך בדיקת ההשערות מספק שתי תוצאות אפשריות: דחיית השערת האפס או קבלתה. במציאות, ייתכן שהשערת האפס נכונה או איננה נכונה. לכן ייתכנו שני סוגים שונים של שגיאות:

ההסתברות לכל שגיאה תלויה בפרמטרים של המבחן הסטטיסטי שבו משתמשים לצורך בדיקת ההשערות, ובדרך כלל משתמשים בהם כדי לשלוט בהסתברות לטעות מסוג ראשון (α, הקרויה רמת המובהקות של המבחן), וכך קובע הערך הרצוי של α את ההסתברות לטעות מסוג שני (β).

השגיאות הן בעלות אופי שונה במהותן ובעלות השלכות שונות. מכיוון שההשערה האלטרנטיבית היא ההשערה שאותה החוקר מעוניין להוכיח, שגיאה מסוג I גורמת לו לחשוב בטעות שגילה תגלית. שגיאה כזו עשויה לגרום לפרסום מאמר מדעי שגוי, יציאתה לשוק של תרופה חסרת השפעה, וכיוצא באלה. בשגיאה מסוג II החוקר מחמיץ את ההזדמנות לגלות תגלית אמיתית. במקרה כזה עדיין עומדת לרשותו האפשרות לחזור על הבדיקה בצורה מקיפה יותר, למשל עם יותר נתונים. לחלופין הוא עשוי לנטוש את כיוון המחקר. בדרך כלל במקרה של שגיאה מסוג II דבר הניסוי וכשלונו איננו מתפרסם ברבים. המאורע המשלים ביחס לשגיאה מסוג I נקרא גם רמת הסמך של המבחן, ואילו המאורע המשלים ביחס לשגיאה מסוג II נקרא עוצמת המבחן.

מבחנים נפוצים[עריכת קוד מקור | עריכה]

מבחנים סטטיסטיים רבים עוסקים בבדיקת השערות אודות תכונות של ההתפלגות של משתנים אקראיים. הנה כמה דוגמאות.

  • מבחן z - בחינת השערות אודות התוחלת של משתנה אקראי נורמלי בעל שונות ידועה. למשל, אם נניח שגובה של בני אדם הוא משתנה אקראי נורמלי, ונניח שהשונות שלו ידועה לנו, אז בדיקה האם ממוצע הגובה במדינה אחת שונה מזה של מדינה אחרת תתבצע בעזרת מבחן z.
  • מבחן t - בחינת השערות אודות התוחלת של משתנה אקראי נורמלי בעל שונות לא ידועה.
  • מבחן F - בחינת השערות התלויות במספר פרמטרים.

בדיקת השערות מול אמידה ביסיאנית[עריכת קוד מקור | עריכה]

טעות נפוצה היא לנסות לגזור מהתוצאות של בדיקת השערות את ההסתברות לכך שההשערה שנבדקה נכונה. בבדיקת השערות קלאסית אין מניחים הסתברות כלשהי מראש על קיום ההשערה הנבדקת (הסתברות אפריורית), לכן אי אפשר גם לחשב את ההסתברות שהיא נכונה לאחר התבוננות בנתונים (הסתברות אפוסטריורית). במקום זה מסתפקים בחישוב ההסתברות של הנתונים בהינתן ההשערה (נראות), ולמעשה מחשבים את אזור הקבלה קרי ההסתברות לקבל את השערת האפס או לדחותה.

בשיטת האמידה הביסיאנית כן מניחים הסתברות אפריורית. לאחר איסוף הנתונים אפשר לחשב את ההסתברות לנכונותה של ההשערה הנבדקת.