תיקון בונפרוני

בסטטיסטיקה, תיקון בונפרוני הוא אחד ממספר שיטות המשמשות על מנת להתמודד עם בעיית ההשוואות המרובות. השיטה נקראת על שם המתמטיקאי האיטלקי קארלו אמיליו בונפרוני (אנ'), בשל השימוש שעשה ב"אי-שוויונות בונפרוני" (Bonferroni inequalities) בשנת 1936. עם זאת, השימוש המודרני בתיקון בונפרוני מיוחס דווקא למתמטיקאית האמריקנית אוליב ג'יין דאן, שתיארה בצורה מפורטת את הפרוצדורה של תיקון בונפרוני בצמד מאמרים שפרסמה ב-1959 וב-1961.

הסבר כללי

בדיקת השערות סטטיסטיות היא תהליך המבוסס על ניסוח השערה שאותה אנו רוצים להפריך, לה קוראים "השערת האפס", איסוף נתונים, ולבסוף ניתוח סטטיסטי של הנתונים על מנת לבדוק אם אכן ניתן לדחות את ההשערה ברמת ודאות מספקת. רמת המובהקות מייצגת את הסיכוי לכך שאנו נדחה את השערת האפס למרות היותה נכונה. לכן, אם אנו רוצים לדחות את ההשערה ברמת ודאות של $1-\alpha$ (למשל 95%), עלינו לקחת רמת מובהקות של $\alpha$ (למשל 5%). רמת המובהקות מייצגת את הסיכוי לטעות מסוג I, הנחשבת לטעות שהסיכויים להתרחשותה חייבים להישאר נמוכים מאוד (בדרך כלל 5% או 1%).

כשמבצעים בדיקת השערות מרובות במקביל (נניח למשל שישנן $n$ השערות שנבדקות), הסיכוי שלנו לבצע טעות מסוג I באחת מהן לפחות הופך להיות גדול בהרבה מרמת המובהקות שבה בחרנו עבור השערה בודדת. על מנת להתמודד עם בעיה זו, תיקון בונפרוני מציע להקטין את רמת המובהקות עבור כל בדיקה בודדת מ- $\alpha$ ל- $\alpha /n$ , ועל ידי כך לגרום לרמת המובהקות (הסיכוי לטעות מסוג I) של הבחירה המרובה, להיות שווה בקירוב ל- $\alpha$ המקורית שבה החוקרים חפצים.

לדוגמה: אם רמת המובהקות הנדרשת היא $\alpha =0.05$ ‏ (5%), ומתבצעת בדיקה של 50 השערות במקביל, אז לפי תיקון בונפרוני צריך לקחת רמת מובהקות של $\alpha =0.05/50=0.001$ ‏ (0.1%) עבור כל השערה, כדי שהסיכוי לטעות מסוג I של בדיקת כל ההשערות יחד תהיה בקירוב 5%.

הגדרה

נניח ש- $H_{1},...,H_{m}$ היא משפחה של השערות ו- $p_{1},...,p_{m}$ הם ערכי ה-p-value המתאימים לאותן השערות (השערה נדחית אם ורק אם ה-p-value שלה נמוך מ- $\alpha$ ). הסיכוי לטעות מסוג I בבדיקת כל משפחת ההשערות ביחד (Family-wise error rate, ‏FWER) היא ההסתברות לדחות לפחות השערה אחת $H_{i}$ למרות היותה נכונה, כלומר הסיכוי לעשות לפחות טעות אחת מסוג I.

תיקון בונפרוני קובע שאם נחליט לדחות את השערת האפס לכל השערה בודדת רק עבור $p_{i}\leq {\frac {\alpha }{m}}$ , ה-FWER יהיה בהכרח לא-גדול מ- $\alpha$ , כלומר שהתיקון "שולט" על ה-FWER. ההוכחה עושה שימוש בחסם האיחוד (אנ'):

FWER=P\left\{\bigcup _{i=1}^{m}\left(p_{i}\leq {\frac {\alpha }{m}}\right)\right\}\leq \sum _{i=1}^{m}\left\{P\left(p_{i}\leq {\frac {\alpha }{m}}\right)\right\}\leq m{\frac {\alpha }{m}}=\alpha

,

ללא צורך בהנחה שישנה תלות או אי-תלות בין ערכי ה-p-value.

הרחבות

הכללה

במקום לקבוע רמת מובהקות קבועה של $\alpha /m$ עבור כל אחת מההשערות הנבדקות, ניתן לבדוק את ההשערות עם רמות מובהקות אחרות בתנאי שהסכום של כולן הוא $\alpha$ . למשל, אם אנחנו מעוניינים ברמת מובהקות של 0.05 ויש לנו שתי השערות, במקום לבחור ברמת מובהקות של 0.05/2 = 0.025 עבור כל אחת, ניתן לבחור עבור אחת מהן ברמת מובהקות של 0.04 ועבור השנייה רמת מובהקות של 0.01.

רווחי סמך

ניתן להשתמש בתיקון בונפרוני על מנת לתקן רווחי סמך. אם מעוניינים למצוא $n$ רווחי סמך ברמת סמך כוללת של $1-\alpha$ , יש לקבוע עבור כל רווח בודד רמת סמך של $1-\alpha /n$ כדי להגיע לרמת הסמך המבוקשת עבור כל הרווחים יחדיו.

אלטרנטיבות

ישנן דרכים אחרות על מנת לשלוט ב-FWER (הסיכוי לטעות מסוג I בבדיקת משפחת השערות). לדוגמה, שיטת הולם-בונפרוני (אנ') היא שיטה "חזקה" יותר לשליטה ב-FWER מאשר תיקון בונפרוני, כלומר שהעוצמה הסטטיסטית שלה תמיד גדולה לפחות כמו זו שמתקבלת בתיקון בונפרוני, אך לעיתים גדולה יותר. בניגוד לתיקון בונפרוני, שיטה זאת אינה שולטת על תוחלת כמות הטעויות מסוג I במשפחת ההשערות הנבדקות (אלא רק על הסיכוי לכך שתהיה לפחות טעות אחת).

ביקורת

תיקון שמרני מדי

תיקון בונפרוני הוא תיקון שמרני - הוא מבטיח שרמת המובהקות של הבדיקה המרובה תהיה לא-גדולה מ- $\alpha$ (כמו שהוכח לעיל), אך החיסרון שלו הוא בכך שבמקרים רבים הוא מקטין את רמת המובהקות מעבר לנדרש. שמרנות זו מגדילה את הסיכוי לטעות מסוג II, ומקטינה את העוצמה הסטטיסטית של הבדיקה מעבר לנדרש (כלומר, ניתן היה להשיג את רמת המובהקות הנדרשת $\alpha$ עם עוצמה סטטיסטית גבוהה יותר).

יש שני גורמים עיקריים שעלולים לגרום לכך שרמת המובהקות של הבדיקה המרובה עם תיקון בונפרוני תהיה קטנה מ- $\alpha$ :

ישנה תלות בין הסטטיסטים של ההשערות השונות הנבדקות - תלות סטטיסטית בין הסטטיסטים המשמשים לבדיקת ההשערות השונות עשויה לגרום לכך ש- $\alpha$ , המייצג את הסיכוי לטעות מסוג I ב"לפחות אחת מהן" יהיה יותר קטן, לעומת מצב בו הן אינן תלויות. על מנת להמחיש זאת נסתכל על הסיכוי לכך שבקוביה אחת לפחות (נניח מתוך 2 קוביות) תצא התוצאה "3". אם הקוביות הן בלתי-תלויות, הסיכוי לכך הוא $1-(5/6)^{2}=11/36$ . לעומת זאת, אם תוצאות הקוביות תלויות זו בזו באופן מוחלט, כך שבשתיהן מתקבלת תמיד אותה תוצאה, הסיכוי הוא רק $1/6=6/36$ , סיכוי נמוך משמעותית.
כמות גדולה מאוד של השערות נבדקות - גורם זה הוא פחות משמעותי מהגורם הראשון, אבל הוא עדיין בעל משמעות. בהנחה שההשערות בלתי-תלויות אחת בשנייה, ובהינתן שרמת המובהקות של בדיקת השערה בודדה היא $\alpha$ , רמת המובהקות של בדיקה של $n$ השערות היא $1-(1-\alpha )^{n}$ , ולכן רמת המובהקות של בדיקת כל ההשערות יחדיו בהנחה שנעשה שימוש בתיקון בונפרוני היא $1-(1-\alpha /n)^{n}$ . עבור $n$ יחסית נמוך, מספר זה שווה בקירוב טוב מאוד ל- $\alpha$ , אך עבור $n$ גבוה רמת המובהקות שתתקבל תהיה קטנה במידה מסוימת מ- $\alpha$ .

חלוקה למשפחות

במסגרת תיקון בונפרוני, צריך קודם כל להחליט איך לקבץ את ההשערות הנבדקות ל"משפחות" (families) של השערות שלגביהן הגיוני שנרצה שיהיה למשפחה כיחידה אחת טעות מסוג I ( $\alpha$ ) שאינה עולה על ערך מסוים. על מנת להמחיש את הצורך בחלוקה למשפחות, נסתכל על חוקר המבצע שני מחקרים שונים ובשניהם מבצע בדיקת השערות - מחקר אחד עוסק בחקר התנהגות לווייתנים, והאחר עוסק בתכונות של מוליכים חשמליים. ברור שבמצב זה אין צורך לקבץ את ההשערות משני הניסויים ולעשות לשניהם ביחד את תיקון בונפרוני. עם זאת, בניגוד למקרה קיצוני זה, ישנם מצבים רבים בהם לא ברור האם יש לפצל השערות למספר משפחות או להשאירן ביחד באותה משפחה, או באיזה אופן לפצל אותן למספר משפחות.

הביקורת על תיקון בונפרוני היא שאין כללים ברורים ומוסכמים על הכל לגבי איך לבצע את החלוקה למשפחות, וכן שאופן החלוקה למשפחות עשוי לשנות באופן מהותי את תוצאות הבדיקה - מה שאומר שתוצאות הבדיקה עשויות להיות מושפעות מבחירה מסוימת שאינה טריוויאלית לגבי אופן החלוקה.

קישורים חיצוניים

תיקון בונפרוני, באתר MathWorld (באנגלית)