הדירות

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

הדירות (אנגלית: replicability ,reproducibility או repeatability) במדע היא היכולת לקבל שוב ושוב את אותן התוצאות של ניסוי מדעי או תצפית מדעית.

הדירות נחשבת בדרך-כלל כתנאי הכרחי לקיומו של מדע בעל-ערך. תוצאות ותצפיות שלא ניתן לחזור עליהן נחשבות כסממן של תגליות שגויות, פסבדו-מדע, או תחום קדם-מדעי שעדיין איננו מבוסס דיו.

הגדרות ומונחים[עריכת קוד מקור | עריכה]

המונח "הדירות" בעברית חודש על ידי האקדמיה ללשון, על פי שורש ממקור ארמי ה-ד-ר שמשמעותו "חזרה", וממנו נגזרה גם המילה "הדרן".‏[1]

באנגלית מתייחסים למושג במונחים replicability, repeatability או reproducibility. אין קונצנזוס כלל-מדעי לגבי המשמעות המדויקת של כל אחד מן המונחים האלו, אף כי בתחומים מסוימים של מדע עשויים להעדיף אחד מהם למשמעות מסוימת. המונח reproducible research נמצא מאז המאה ה-21 בשימוש בעיקר בתחום מדעי המחשב לציון היכולת לשחזר מתוך תצפית או ניסוי שכבר נערכו את הניתוח הסטטיסטי, התוצאות, הטבלאות והגרפים שפורסמו בספרות המדעית (ראו למטה בסעיף "מחקר הדיר"). בעקבות זאת יש המשתמשים במונח replicability ליכולת לערוך מחדש את הניסוי או התצפית ולקבל שוב ושוב את אותן התוצאות, למשל במועד אחר, על ידי נסיין אחר, או במעבדה אחרת. בתחומי הרפואה והפסיכולוגיה המונח repeatability בדרך-כלל מתייחס למידת הזהות בתוצאות של בדיקות חוזרות שנערכו באותו הנבדק, אך בתחומים אחרים מונח זה עשוי להתייחס גם לתוצאות בנבדקים שונים או בקבוצות שונות של נבדקים.

היסטוריה[עריכת קוד מקור | עריכה]

רוברט הוק מרכיב את משאבת האוויר תחת פיקוחו של רוברט בויל, בבית מרקחת באוקספורד (איור מודרני)

הראשון שביסס את חשיבותה של ההדירות במדע היה חלוץ המדע הניסויי רוברט בויל, במאה ה-17 בבריטניה. משאבת האוויר שפיתח בויל נבנתה כדי ליצור ולחקור ריק, אלא שמושג זה היה שנוי בזמנו במחלוקת פילוסופית קשה, והיו פילוסופים כמו תומאס הובס שסברו שריק איננו אפשרי. בויל נדרש איפוא לשאלה מהי עובדה מדעית, וקבע כי זוהי תוצאה אשר ניתן למדוד אותה באופן הדיר, כלומר פעם אחר פעם, ולשכנע את חברי הקהילה המדעית בקיומה. באותו זמן הניח בויל גם את היסודות למושגים נוספים העומדים בבסיס השיטה המדעית המודרנית, כמו המאמר המדעי, והיה בין מייסדי הקהילה המדעית המודרנית הראשונה - החברה המלכותית הבריטית.

משאבת האוויר, שבמושגי המאה ה-17 הייתה מכשיר מדעי יקר, מסובך וקשה לבנייה, גם הובילה לוויכוח המתועד הראשון על הדירות של תופעה מסוימת במדע. המדען ההולנדי כריסטיאן הויגנס בנה באמסטרדם את משאבת האוויר הראשונה שלא נמצאה תחת שליטתם הישירה של בויל ועוזרו דאז רוברט הוק. הוא דיווח על תופעה שבה הריק בתוך המשאבה שלו גרם למים "לרחף" בראש שפופרת ריקה (למעשה מוחזקים על ידי בועת אויר, מה שהויגנס כינה "anomalous suspension"). הוק ובויל לא הצליחו לשחזר את התופעה במשאבות האוויר שלהם, וכתוצאה מכך עלו ספקות לגבי נושא הריק בכללותו, ולגבי סמכותו המדעית של הויגנס בפרט. בהליך יוצא-דופן באותה תקופה הוזמן הויגנס לאנגליה בשנת 1663, ובהנחייתו הישירה הצליח הוק לשחזר את התופעה. בעקבות זאת נבחר הויגנס כחבר זר בחברה המלכותית. הסיבה המדויקת לחוסר ההדירות בתופעה זו הובררה במלואה רק במאה ה-20.

הסטטיסטיקאי רונלד פישר, שהניח בין השאר את היסודות לשיטה המדעית המודרנית של מובהקות סטטיסטית, כתב בחיבורו הקלאסי "תכנון ניסויים" משנת 1935 כי "אנחנו יכולים לומר שתופעה ניתנת להדגמה באופן ניסויי כאשר אנו יודעים לבצע ניסוי אשר רק לעתים רחוקות יתן לנו תוצאה בלתי-מובהקת סטטיסטית". הפילוסוף של המדע קרל פופר היה בוטה יותר בחיבורו משנת 1934 "הלוגיקה של תגליות מדעיות" (שהציג את עקרון ההפרכה), בו כתב "מקרים בודדים ובלתי-הדירים הם חסרי משמעות למדע". אמירות מעין אלו מבטאות דוגמה רווחת בקהילה המדעית המודרנית, בעיקר בתחומי מדעים מדויקים ומדעי החיים, לפיה הדירות הינה תנאי הכרחי (אם גם לא מספיק) לביסוסה של עובדה מדעית, ולעצם קיומה של סמכות מדעית בנושא כלשהו. למשל, בתחילת שנות ה-90 דחתה מרבית הקהילה המדעית את הטענות לביצוע היתוך קר. נימוק עיקרי לדחייה היה כשלונם של מרבית הניסיונות לשחזר את התופעה, אפילו לפני שהתגלתה השגיאה המקורית בחישוביהם של הכימאים שטענו לתגלית.

מחקר הדיר[עריכת קוד מקור | עריכה]

מחקר הדיר (Reproducible Research) הוא תחום חדש במדעי המחשב, העוסק ביכולת לחשב שוב מתוך נתונים שכבר נמדדו את התוצאות, הטבלאות והגרפים שפורסמו בספרות המדעית. יכולת כזו נחשבת כבסיס הכרחי למדע מודרני, אך מסובכת לביצוע בעיקר בתחומים מדעיים שבהם מחקרים מודדים כמויות עצומות של נתונים באופן אוטומטי, אוגרים אותם במסדי נתונים גדולים, ולעתים מבצעים עליהם חישובים הדורשים כוח חישובי עצום. דוגמאות טיפוסיות הם:

מסדי הנתונים במחקרים מעין אלו הם גדולים מכדי לפרסמם במאמרים מדעיים. לצורך זה מוקמים מסדי נתונים מיוחדים, שהם לעתים ציבוריים ופתוחים ברשת האינטרנט.

דרישה חשובה נוספת במחקר הדיר היא לשמור ולפרסם את התוכנה ששימשה לניתוח הנתונים באופן שניתן יהיה לחזור על החישובים ולקבל שוב תוצאות זהות. יכולת כזו חשובה בעיקר כאשר מבקשים לברר באיזו מידה תוצאות ומסקנות המחקר שהתפרסמו תלויות בהנחות מפשטות שונות, בשיטות בחישוב שנעשה בהן שימוש ,ואפילו בבאגים וטעויות שנפלו בביצוע ההליך החישובי המסובך.

מקרה מפורסם שהדגים את חשיבותו של מחקר הדיר אירע במאמר חשוב משנת 2010 מאת קן רוגוף וכרמן ריינרט מאוניברסיטת הרוורד, בעברם כלכלנים ראשיים של קרן המטבע הבינלאומית. המאמר השווה את הגרעון הממשלתי ב-20 מדינות שונות, הגיע למסקנות קשות מאוד לגבי חומרת המשבר הכלכלי, והייתה לו השפעה רבה על ניהול החוב החיצוני במדינות האיחוד האירופי, ובעיקר ביוון ופורטוגל. אך בשנת 2013 גילה סטודנט לכלכלה באוניברסיטת מסצ'וסטס אי-התאמות חשבוניות במאמר. הוא ביקש מן החוקרים את גיליון האקסל שבו נעשו החישובים, ומצא שעקב טעות, נוסחת הסכום החשובה ביותר שלהם סכמה רק 15 מתוך 20 המדינות, מה שהוליך לשגיאה גדולה בתוצאה הסופית ‏[2].

תגליות שגויות[עריכת קוד מקור | עריכה]

במאה ה-21 הזהירו מספר מדענים מפני כשלים ונטאים העלולים לגרום לחוסר הדירות בתחומים מסוימים של המדע המודרני, ובעיקר בפסיכולוגיה וברפואה. מבין מדענים אלו מפורסם בייחוד ג'ון יואנידיס, אפידמיולוג אמריקאי הטוען שבתחומים המדוברים, יותר מ-50% מן ה"תגליות" אשר מתפרסמות במאמרים מדעיים אינן משוחזרות בניסויים נוספים, והן למעשה שגויות[3]. בין הכשלים והנטאים אשר עלולים להשפיע על שיעור התגליות השגויות:

  • נטאי הפרסום (Publication Bias): כתבי-עת מדעיים לעתים קרובות מעדיפים לפרסם מחקרים המכריזים על תגליות, ובייחוד תגליות הזוכות לעניין ציבורי ופרסום באמצעי התקשורת, מאשר מחקרים הבודקים תגליות קודמות ומודיעים על כישלון לשחזר אותן.
  • אפקט המגרה (File drawer Effect): חוקרים רבים הנכשלים בשחזור תגלית עליה דיווח חוקר אחר אף אינם מנסים לפרסם את כשלונם, אם משום שהם מאשימים את עצמם בשגיאות טכניות ואם משום שהם מודעים לקושי לפרסם תוצאות שליליות.
דוגמה היפותטית: כיצד שיעור התגליות השגויות במדע עלול להיות גבוה בהרבה מרמת המובהקות הסטטיסטית
(א) נניח שבשנה מסוימת בתחום מסוים במדע נבדקו בניסויים 1000 השערות (משבצות), שמתוכן 100 השערות - שיעור של 10% - הן אכן נכונות (משבצות צהובות) והשאר שגויות (משבצות ירוקות).
(ב) לא כל ההשערות הנכונות תהפוכנה בהכרח לתגליות - העוצמה הסטטיסטית היא אחוז ההשערות אשר מתגלות בפועל בניסוי מתוך ההשערות הנכונות. אם נניח שבתחום המדעי המדובר העוצמה הסטטיסטית היא 80%, אזי רק 80 מתוך 100 ההשערות הנכונות תתקבלנה בניסויים כתגליות, בעוד ששאר ה-20 יחמקו מגילוי (משבצות כחולות). יתר על כן, אם רמת המובהקות הסטטיסטית הנהוגה בתחום היא 5%, אז מתוך 900 ההשערות שאינן נכונות, 5% או 45 השערות תתקבלנה בטעות כ"תגליות" (משבצות אדומות).
(ג) המספר הכללי של תגליות שתתפרסמנה באותה השנה בספרות המדעית יהיה איפוא 45+80=125, ומתוכן 45 תהיינה שגויות - שיעור תגליות שגויות של 36% הגבוה בהרבה מרמת המובהקות.

כתוצאה מנטאים כאלו, עלול להתרחש מצב שבו, למשל, אותם מחקרים שמצאו כי לתרופה חדשה יש השפעה חזקה מתפרסמים, בעוד שמחקרים אחרים שלא מצאו השפעה שלה אף אינם מגיעים לידיעת הקהילה המדעית בתחום. בשנים האחרונות חוקרים מציעים נהלים ומתודולוגיות חדשות במדע במטרה לבטל את השפעתם של נטאים כאלו.

כשל נפוץ אפילו בין מדענים רבים הוא לחשוב שאחוז התגליות השגויות במדע אינו יכול להיות גדול מרמת המובהקות הסטטיסטית המקובלת. במדעי הרפואה והביולוגיה מקובל לדחות השערה כאשר המובהקות הסטטיסטית בניסוי שבדק אותה שווה או גדולה מ-0.05 (שהם 5%), ולכן מדענים רבים סבורים אינטואיטיבית שלכל היותר 5% מן התגליות המתפרסמות בתחום הרפואה והביולוגיה עלולות להיות שגויות. אך ההגדרה הנכונה של מובהקות סטטיסטית היא הסיכוי לקבל את תוצאות הניסוי בהנחה שהשערת האפס היא נכונה, כלומר בהנחה שהשערת הניסוי שגויה (טעות מסוג I או בכינוי נפוץ באנגלית false positive). אחוז התגליות השגויות הכללי במדע תלוי לא רק ברמת המובהקות, אלא גם בשני גדלים חשובים נוספים - העוצמה הסטטיסטית, ובייחוד אחוז ההשערות הנכונות מתוך כלל ההשערות שנבדקו. בכך ניתן להיווכח בדוגמה המספרית ההיפותטית באיור שמשמאל.

בדוגמה זו ניתן לראות שלאחוז ההשערות הנכונות מתוך כלל ההשערות הנבדקות יש חשיבות רבה. אם מרבית ההשערות שמדענים בודקים בתחום מסוים אינן נכונות, אזי אפילו האחוז הקטן מתוכן שמתקבלות בטעות כתגליות עלול להיות גדול ממעט ההשערות הנכונות. למשל, אם בדוגמה המספרית באיור שמשמאל נקטין את אחוז ההשערות הנכונות ל-1% בלבד יתקבל שיעור תגליות שגויות של 86%. במצב היפותטי כזה גם רמת המובהקות הסטטיסטית המחמירה שדורשים המדענים בניסוי אינה מספקת להציל את התחום מן הקושי לנסח השערה נכונה. יואנידיס טוען כי מצב כזה שבו "רוב התגליות המתפרסמות הן שגויות" אכן מתרחש בפועל בתחומי מדע בעלי בסיס תאורטי חלש יחסית, כמו פסיכולוגיה[3].

חשוב לציין כי תהיה זו טעות להסיק שמרבית העובדות הנחשבות לקונצנזוס מדעי במדע המודרני הן בעצם שגויות. ממצאים אשר נחשבים לקונצנזוס במדע בדרך-כלל נבדקו ואושרו פעמים רבות, ולכן רמת הוודאות בהם קרובה ל-100%. הטיעון למעלה עוסק ב"תגליות" שהתקבלו רק פעם אחת ועדיין לא שוחזרו. מכאן מתחוורת חשיבותה העצומה של ההדירות לאמינותו של המדע.

אפקטים מתמעטים[עריכת קוד מקור | עריכה]

במקרים רבים במדע המודרני, אפילו כאשר מצליחים לשחזר תגליות חדשות במועד מאוחר יותר, על ידי נסיין אחר או במעבדה אחרת, מידת ההשפעה הנמדדת (ידועה כגודל האפקט, אנגלית: Effect Size) עלולה להיות קטנה ממידת ההשפעה שנמדדה במקור. מדענים התייחסו לתופעה זו במונח הפופולרי קללת המנצח (אנגלית: Winner's Curse) השאול מתחום הספורט, שם הוא מציין את חוסר יכולתו של ספורטאי שהשיג ניצחון או שיא מזהיר כלשהו לחזור עליו שוב.

קללת המנצח במדע נפוצה בעיקר בתחומים שבהם מקובל לבדוק השערות באמצעות רווחי סמך. רווח הסמך מתאר תחום סביר לעוצמת ההשפעה שנמדדה בניסוי. לדוגמה, בניסוי רפואי לאמידת השפעתה של תרופה חדשה כלשהי ייתכן שיחושב רווח סמך של 95% לשיפור שבין פי 2 לפי 4, במדד מקובל כלשהו לבריאות החולים. העובדה שאפילו הקצה התחתון של רווח זה גדול מ-0 פירושה שנמצאה לתרופה השפעה לטובה מובהקת סטטיסטית, ובניסוי חוזר לבדיקת התרופה נצפה למצוא 95% מן התוצאות בין 2 ל-4. ואולם הניסוי החוזר עלול למצוא שרוב התוצאות נופלות בין 0 ל-2, כלומר התרופה עדיין משפיעה לטובה במרבית המקרים, אך במידה פחותה בהרבה מזו שנאמדה בניסוי המקורי. מכיוון שבדרך-כלל לא נראה סביר לצפות שמידת השפעתה של תרופה תפחת עם הזמן בניסוי בלתי-תלוי, תוצאה כזו מעלה חשד שבניסוי המקורי נאמד בטעות ערך גבוה מן הערך האמיתי של השפעת התרופה.

בתרבות המדעית[עריכת קוד מקור | עריכה]

החשיבות הרבה של הדירות במדע משמעה ש"תוצאה לא הדירה" נחשבת מעין בדיחה. בשנת 1955, החלו הפיזיקאי צבי ליפקין ממכון ויצמן למדע ואלכסנדר כהן, מנהל המכון למחקר ביולוגי בישראל להוציא לאור כתב עת היתולי למדענים בשם Journal of Irreproducible Results, כלומר "כתב עת לתוצאות בלתי הדירות", המוכר יותר כ-JIR(אנ'), ‏[1]. לאחר שעבר מספר ידיים, כתב העת יוצא לאור מהוצאה בקליפורניה שבארצות הברית. אחד מעורכי המגזין ייסד את פרס איג נובל.

ראו גם[עריכת קוד מקור | עריכה]

לקריאה נוספת[עריכת קוד מקור | עריכה]

  • Steven Shapin and Simon Schaffer (1985) Leviathan and the Air-Pump: Hobbes, Boyle, and the Experimental Life. (2011 edition), Princeton University Press, Princeton, NJ

קישורים חיצוניים[עריכת קוד מקור | עריכה]

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ הפילוסוף של המדע יוסף אגסי נוהג להעיר כי המילה "חזירות" בעברית כבר הייתה תפוסה.
  2. ^ Paul Krugman, The Excel Depression. New York Times, April 18, 2013
  3. ^ 3.0 3.1 John P. A. Ioannidis, Why Most Published Research Findings Are False, PLoS Medicine, DOI: 10.1371/journal.pmed.0020124, 2005