מבחן כי בריבוע

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש

מבחן כי בריבוע (נהגה בכ' רפה, לעיתים נכתב חי בריבוע) הוא למעשה אוסף של מבחנים סטטיסטיים שמטרתם לבדוק את טיב ההתאמה של מודל התפלגותי לנתונים איכותיים או בדידים. המשותף לכל המבחנים האלה הוא שההתפלגות של סטטיסטי המבחן היא התפלגות כי בריבוע (במדויק או בקירוב). מבחנים אלה משמשים גם כבסיס למגוון מקדמי קשר (או מתאם), כגון מקדם הקשר של קראמר.

היסטוריה[עריכת קוד מקור | עריכה]

לאחר שקרל פירסון פיתח את המדד הידוע כ-"מתאם פירסון" למדידת עוצמת הקשר בין משתנים כמותיים, הוא פנה לפיתוח מקדם דומה למדידת הקשר בין שני משתנים איכותיים (קטגוריים), שנתוניהם מוצגים בלוח שכיחות דו ממדי. ב-1900 הוא הציג את סטטיסטי חי-בריבוע, שמבטא רעיון דומה לרעיון של מקדם המתאם[1]. בעוד שמקדם המתאם התבסס על ההפרשים בין התצפיות והממוצע שלהן. סטטיסטי חי בריבוע מבוסס על ההפרש בין מספר התצפיות בתא מסוים בלוח השכיחות הדו ממדי, והמספר הצפוי של התצפיות באותו תא בהנחה כי יש אי תלות בין משתנים. פירסון הראה כי ההתפלגות האסימפטוטית של המדד שפיתח היא אכן התפלגות חי בריבוע, ומכאן שמו של המדד.

תאוריה[עריכת קוד מקור | עריכה]

מבחן חי בריבוע לבדיקת השערת אי תלות[עריכת קוד מקור | עריכה]

יהיו ו- שני משתנים איכותיים (כלומר נמדדים בסולם מדידה שמי או סודר). נסמן את הערכים שהמשתנה יכול לקבל ב- ואת הערכים שהמשתנה יכול לקבל ב-.

בהינתן מדגם בגודל , נסמן ב- את מספר התצפיות במדגם עבורן ו-.

אם ו- הם משתנים בלתי תלויים הרי ש - לכל ולכל . תחת הנחה זו, ניתן לאמוד את הערך הצפוי של מספר התצפיות עבורן ו-, שנסמן ב- על ידי:

כאשר

  • הוא גודל המדגם
  • הוא מספר התצפיות עבורן
  • הוא מספר התצפיות עבורן

סטטיסטי חי בריבוע לבדיקת ההשערה כי ו- הם בלתי תלויים מוגדר כ-

והתפלגותו האסימפטוטית היא התפלגות חי בריבוע עם דרגות חופש.

השערת אי התלות תידחה אם הערך המחושב של גדול מערך קריטי הנקבע על פי רמת המובהקות α שנקבעה מראש, או אם ערך ה-p המחושב קטן מרמת המובהקות הזו.

מבחן חי בריבוע לבדיקת טיב ההתאמה של מודל מולטינומי[עריכת קוד מקור | עריכה]

יהי משתנה איכותי שיכול לקבל את הערכים . התפלגותו של היא התפלגות מולטינומית. נסמן .

בהינתן מדגם בגודל , נסמן ב- את מספר התצפיות במדגם עבורן .

מודל מולטינומי עבור הוא מפרט (ספציפיקציה) של על ידי פרמטר (שיכול להיות גם וקטור של פרמטרים, או וקטור ממימד 0, כלומר מפרט אי פרמטרי). בהינתן המודל , ניתן לאמוד את , ובעזרת אמדן זה אפשר לאמוד את הערך הצפוי של מספר התצפיות עבורן , שנסמן ב-, על ידי .

סטטיסטי חי בריבוע לבדיקת ההשערה כי המודל מתאים לנתונים מוגדר כ- , והתפלגותו האסימפטוטית היא התפלגות חי בריבוע עם דרגות חופש.

מבחן חי בריבוע לבדיקת השערת אי התלות בין שני משתנים הוא מקרה פרטי של מבחן חי בריבוע לבדיקת טיב ההתאמה של מודל מולטינומי.

מבחן יחס הנראות[עריכת קוד מקור | עריכה]

מבחן חי בריבוע לבדיקת השערת אי התלות פותח על ידי פירסון תוך שימוש בשיקולי מומנטים. עם זאת, ניתן לבדוק את השערת אי התלות בפרט, ואת טיב ההתאמה של מודל מולטינומי בכלל, על ידי שימוש במבחן יחס הנראות, על פי הלמה של ניימן ופירסון. סטטיסטי מבחן יחס הנראות שונה מסטטיסטי מבחן חי בריבוע, אך שני המבחנים שקולים אסימפטוטית.

מבחן יחס הנראות לבדיקת השערת אי התלות הוא

והתפלגותו האסימפטוטית היא התפלגות חי בריבוע עם דרגות חופש.

באופן דומה, מבחן יחס הנראות לבדיקת טיב ההתאמה של מודל מולטינומי הוא

, והתפלגותו האסימפטוטית היא התפלגות חי בריבוע עם דרגות חופש.

ניתן להראות כי סטטיסטי הוא קירוב של סטטיסטי על ידי פיתוח טור טיילור של פונקציית הלוגריתם הטבעי סביב 1 והשמטת האיברים מסדר 3 ומעלה.

דוגמאות לשימושים[עריכת קוד מקור | עריכה]

השערת אי תלות - קשר בין מין להעדפה פוליטית[עריכת קוד מקור | עריכה]

בסקר שנערך בארצות הברית בשנת 2000 נשאלו 2,757 איש לגבי העדפתם הפוליטית[2]. הנתונים המקובצים לפי מין מופיעים בטבלה הבאה:

העדפה פוליטית
מין רפובליקני עצמאי דמוקרט סך הכל
גבר 468

(533.7)

327

(319.6)

762

(703.07)

1557
אשה 477

(411.3)

239

(246.4)

484

(542.3)

1200
סך הכל 945 566 1246 2757

לדוגמה, 468 גברים הביעו תמיכה במפלגה הרפובליקנית ו-484 נשים הביעו תמיכה במפלגה הדמוקרטית.

נסמן ב- את משתנה המין, כאשר 1 מסמל גבר ו-2 מסמל אישה. מספר הערכים שמשתנה זה מקבל הוא כמובן . כמו כן נסמן ב- את משתנה ההעדפה הפוליטית כאשר 1, 2, ו-3 מסמלים העדפה של המפלגה הרפובליקנית, העדפה עצמאית או העדפה של המפלגה הדמוקרטית בהתאמה, וכאן . על פי סימול זה , ו-.

הערכים הצפויים מופיעים בטבלה בסוגריים. לדוגמה: מספר הנשים במדגם הוא , ומספר התומכים במפלגה הדמוקרטית הוא . לכן המספר הצפוי של נשים התומכות במפלגה הדמוקרטית תחת ההנחה כי אין קשר בין המין וההעדפה הפוליטית הוא

בחישוב הערך של נקבל כי

לאחר שנבצע חישובים דומים עבור כל ששת הצירופים האפשריים של ערכי ו-, החישוב הסופי יראה כי . בחישוב מבחן יחס הנראות נקבל כי . מספר דרגות החופש הוא . ערך ה-p עבור הוא ולכן אם קבענו מראש כי רמת המובהקות של המבחן תהיה נדחה את השערת האפס האומרת כי אין קשר בין המין וההעדפה הפוליטית.

קובייה הוגנת - טיב התאמה להתפלגות אחידה[עריכת קוד מקור | עריכה]

קוביית משחק הוגנת היא כזו שהסיכויים שלה ליפול על כל פאה הם שווים, כלומר ההסתברות כי תוצאת ההטלה תהיה 1 שווה להסתברות כי תוצאת ההטלה תהיה 2 וכן הלאה. כל אחת מההסתברויות האלה שווה ל-1/6.

השערת האפס היא כי הקוביה הוגנת. השערה זו מתורגמת לאמירה המתמטית כי המודל הוא מודל התפלגות אחידה על המספרים , כלומר זוהי התפלגות מולטינומית עם לכל . מודל זה אינו תלוי בפרמטר.

נניח כי הטלנו את הקוביה 100 פעמים והתקבלות התוצאות הבאות 13,17,25,12,10,23 (כלומר, התוצאה "1" התקבלה 13 פעמים, התוצאה "2" התקבלה 17 פעמים, וכן הלאה). תחת ההנחה כי הקוביה הוגנת השכיחויות הצפויות שוות כולן 100/6, כלומר כ-16.7 עבור כל אחת מהתוצאות. החישובים של מבחן חי בריבוע מוצגים בטבלה הבאה:

תוצאת ההטלה שכיחות Oi הסתברות Pi ערך צפוי Ei כי בריבוע

(Oi-Ei)2/Ei

1 18 0.1667 16.67 0.107
2 16 0.1667 16.67 0.027
3 16 0.1667 16.67 0.027
4 15 0.1667 16.67 0.167
5 22 0.1667 16.67 1.707
6 13 0.1667 16.67 0.807
סך הכל 100 1.0000 100.00 2.84

קיבלנו כי . מספר דרגות החופש כאן הוא מכיוון ש- ואילו מכיוון שההסתברויות לא היו תלויות בפרמטר. ניתן לחשב כי ערך ה-p הוא . בהנחה שקבענו מראש כי רמת המובהקות של המבחן היא לא נדחה את השערת האפס.

השוואת התפלגויות - הבדלי העדפה בין גברים ונשים[עריכת קוד מקור | עריכה]

לצורך סקר על העדפת מוצרים נערך מדגם שכלל 110 אנשים, שנתבקשו לדווח איזה מוצר הם מעדיפים מבין שלושה מוצרים. תוצאות הסקר (העדפה ומין הנשאל) נתונות בטבלה:

העדפת מוצר
מין מוצר 1 מוצר 2 מוצר 3 סך הכל
גבר 20 19 18 57
אשה 13 29 11 53
סך הכל 33 48 29 110

עורכי הסקר מעוניינים לדעת האם יש הבדלים בין ההעדפות של הגברים וההעדפות של הנשים, ולכן השערת האפס אומרת כי אין הבדל בין התפלגות ההעדפות של הגברים והתפלגות ההעדפות של הנשים.

בהנחה כי השערת האפס נכונה עלינו לאמוד כאן שני פרמטרים: את ההסתברות כי אדם (גבר או אשה) מעדיף את מוצר 1 ואת ההסתברות כי אדם (גבר או אשה) מעדיף את מוצר 2. האמדן להסתברות כי אדם מעדיף את מוצר 3 מתקבל על ידי השלמה ל-1. האמדנים האלה הם ו-. מכאן נקבל כי האמדן ל- הוא .

כמו כן נניח כי ההסתברות שאדם במדגם הוא גבר שווה להסתברות כי האדם הוא אשה, ולכן שתי הסתברויות אלה שוות ל-0.5. על סמך האמדנים האלה נוכל לחשב כי (כאשר מסמל גבר): , וכן הלאה לכל התאים בלוח השכיחות. החישוב הסופי מעלה כי .

מאחר שנאמדו כאן 2 פרמטרים, , ולכן נקבל כי . שימו לב כי מספר דרגות החופש כאן שונה ממספר דרגות החופש בבדיקת השערת אי תלות.

חישוב ערך ה-p מעלה כי . בהנחה שקבענו מראש כי רמת המובהקות של המבחן היא לא נדחה את השערת האפס ונסיק כי לא נצפו הבדלים בהעדפות בין גברים ונשים.

ראו גם[עריכת קוד מקור | עריכה]

קישורים חיצוניים[עריכת קוד מקור | עריכה]

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ Karl Pearson, On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling, Philosophical Magazine, 5 50, 1900, עמ' 157–175 doi: doi:10.1080/14786440009463897
  2. ^ Agresti, Alan, An Introduction to Categorical Data Analysis, Hoboken, New Jersey: JohnWiley & Sons, Inc., 2007, פרק 2, עמ' 37-38, ISBN 978-0-471-22618-5