הדירות

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

הדירות (אנגלית: replicability ולעתים גם reproducibility או repeatability) במדע היא היכולת לקבל שוב ושוב את אותן התוצאות של ניסוי מדעי או תצפית מדעית.

הדירות נחשבת בדרך-כלל כתנאי הכרחי לקיומו של מדע בעל-ערך. תוצאות ותצפיות שלא ניתן לחזור עליהן נחשבות כסממן של תגליות שגויות, פסבדו-מדע, או תחום קדם-מדעי שעדיין איננו מבוסס דיו.

הגדרות ומונחים[עריכת קוד מקור | עריכה]

המונח "הדירות" בעברית חודש על ידי האקדמיה ללשון, על פי שורש ממקור ארמי ה-ד-ר שמשמעותו "חזרה", וממנו נגזרה גם המילה "הדרן". הפילוסוף של המדע יוסף אגסי נוהג להעיר כי המילה "חזירות" בעברית כבר הייתה תפוסה.

באנגלית מתייחסים למושג במונח replicability, ולעתים repeatability או reproducibility. המונח האחרון נמצא מאז המאה ה-21 בשימוש בעיקר בתחום מדעי המחשב לציון היכולת לשחזר מתוך תצפית או ניסוי שכבר נערכו את הניתוח הסטטיסטי, התוצאות, הטבלאות והגרפים שפורסמו בספרות המדעית. בעקבות זאת יש המשתמשים במונח הראשון ליכולת לערוך מחדש את הניסוי או התצפית ולקבל שוב ושוב את אותן התוצאות, למשל במועד אחר, על ידי נסיין אחר, או במעבדה אחרת.

היסטוריה[עריכת קוד מקור | עריכה]

הוק מרכיב את משאבת האוויר תחת פיקוחו של בויל, בבית מרקחת באוקספורד (איור מודרני)

הראשון שביסס את חשיבותה של ההדירות במדע היה חלוץ המדע הניסויי רוברט בויל, במאה ה-17 בבריטניה. משאבת האוויר שפיתח בויל נבנתה כדי ליצור ולחקור ריק, אלא שמושג זה היה שנוי בזמנו במחלוקת פילוסופית קשה, והיו פילוסופים כמו תומאס הובס שסברו שריק איננו אפשרי. בויל נדרש איפוא לשאלה מהי עובדה מדעית, וקבע כי זוהי תוצאה אשר ניתן למדוד אותה באופן הדיר, כלומר פעם אחר פעם, ולשכנע את חברי הקהילה המדעית בקיומה. באותו זמן הניח בויל גם את היסודות למושגים נוספים העומדים בבסיס השיטה המדעית המודרנית, כמו המאמר המדעי, והיה בין מייסדי הקהילה המדעית המודרנית הראשונה - החברה המלכותית הבריטית.

משאבת האוויר, שבמושגי המאה ה-17 הייתה מכשיר מדעי יקר, מסובך וקשה לבנייה, גם הובילה לוויכוח המתועד הראשון על הדירות של תופעה מסוימת במדע. המדען ההולנדי כריסטיאן הויגנס בנה באמסטרדם את משאבת האוויר הראשונה שלא נמצאה תחת שליטתם הישירה של בויל ועוזרו דאז רוברט הוק. הוא דיווח על תופעה שבה הריק בתוך המשאבה שלו גרם למים "לרחף" בראש שפופרת ריקה (למעשה מוחזקים על ידי בועת אויר, מה שהויגנס כינה "anomalous suspension"). הוק ובויל לא הצליחו לשחזר את התופעה במשאבות האוויר שלהם, וכתוצאה מכך עלו ספקות לגבי נושא הריק בכללותו, ולגבי סמכותו המדעית של הויגנס בפרט. בהליך יוצא-דופן באותה תקופה הוזמן הויגנס לאנגליה בשנת 1663, ובהנחייתו הישירה הצליח הוק לשחזר את התופעה. בעקבות זאת נבחר הויגנס כחבר זר בחברה המלכותית. הסיבה המדויקת לחוסר ההדירות בתופעה זו הובררה במלואה רק במאה ה-20.

במדע מודרני[עריכת קוד מקור | עריכה]

הסטטיסטיקאי רונלד פישר, שהניח בין השאר את היסודות לשיטה המדעית המודרנית של מובהקות סטטיסטית, כתב בחיבורו הקלאסי "תכנון ניסויים" משנת 1935 כי "אנחנו יכולים לומר שתופעה ניתנת להדגמה באופן ניסויי כאשר אנו יודעים לבצע ניסוי אשר רק לעתים רחוקות יתן לנו תוצאה בלתי-מובהקת סטטיסטית". הפילוסוף של המדע קרל פופר היה בוטה יותר בחיבורו משנת 1934 "הלוגיקה של תגליות מדעיות" (שהציג את עקרון ההפרכה), בו כתב "מקרים בודדים ובלתי-הדירים הם חסרי משמעות למדע".

אמירות מעין אלו מבטאות דוגמה רווחת בקהילה המדעית המודרנית, בעיקר בתחומי מדעים מדויקים ומדעי החיים, לפיה הדירות הינה תנאי הכרחי (אם גם לא מספיק) לביסוסה של עובדה מדעית, ולעצם קיומה של סמכות מדעית בנושא כלשהו. למשל, בתחילת שנות ה-90 דחתה מרבית הקהילה המדעית את הטענות לביצוע היתוך קר. נימוק עיקרי לדחייה היה כשלונם של מרבית הנסיונות לשחזר את התופעה, אפילו לפני שהתגלתה השגיאה המקורית בחישוביהם של הכימאים שטענו לתגלית.

מחקר הדיר[עריכת קוד מקור | עריכה]

מחקר הדיר (Reproducible Research) הוא תחום חדש במדעי המחשב, העוסק ביכולת לחשב שוב מתוך נתונים שכבר נמדדו את התוצאות, הטבלאות והגרפים שפורסמו בספרות המדעית. יכולת כזו נחשבת כבסיס הכרחי למדע מודרני, אך מסובכת לביצוע בעיקר בתחומים מדעיים שבהם מחקרים מודדים כמויות עצומות של נתונים באופן אוטומטי, אוגרים אותם במסדי נתונים גדולים, ולעתים מבצעים עליהם חישובים הדורשים כוח חישובי עצום. דוגמאות טיפוסיות הם:

מסדי הנתונים במחקרים מעין אלו הם גדולים מכדי לפרסמם במאמרים מדעיים. לצורך זה מוקמים מסדי נתונים מיוחדים, שהם לעתים ציבוריים ופתוחים ברשת האינטרנט.

דרישה חשובה נוספת במחקר הדיר היא לשמור ולפרסם את התוכנה ששימשה לניתוח הנתונים באופן שניתן יהיה לחזור על החישובים ולקבל שוב תוצאות זהות. יכולת כזו חשובה בעיקר כאשר מבקשים לברר באיזו מידה תוצאות ומסקנות המחקר שהתפרסמו תלויות בהנחות מפשטות שונות, בשיטות בחישוב שנעשה בהן שימוש ,ואפילו בבאגים וטעויות שנפלו בביצוע ההליך החישובי המסובך.

מקרה מפורסם שהדגים את חשיבותו של מחקר הדיר אירע במאמר חשוב משנת 2010 מאת קן רוגוף וכרמן ריינרט מאוניברסיטת הרוורד, בעברם כלכלנים ראשיים של קרן המטבע הבינלאומית. המאמר השווה את הגרעון הממשלתי ב-20 מדינות שונות, הגיע למסקנות קשות מאוד לגבי חומרת המשבר הכלכלי, והייתה לו השפעה רבה על ניהול החוב החיצוני במדינות האיחוד האירופי, ובעיקר ביוון ופורטוגל. אך בשנת 2013 גילה סטודנט לכלכלה באוניברסיטת מסצ'וסטס אי-התאמות חשבוניות במאמר. הוא ביקש מן החוקרים את גיליון האקסל שבו נעשו החישובים, ומצא שעקב טעות, נוסחת הסכום החשובה ביותר שלהם סכמה רק 15 מתוך 20 המדינות, מה שהוליך לשגיאה גדולה בתוצאה הסופית.[דרוש מקור]

תגליות שגויות[עריכת קוד מקור | עריכה]

במאה ה-21 הזהירו מספר מדענים מפני כשלים ונטאים אשר גורמים לחוסר הדירות בתחומים מסוימים של המדע המודרני, ובעיקר בפסיכולוגיה וברפואה. מבין מדענים אלו מפורסם בייחוד ג'ון יואנידיס, פסיכולוג אמריקאי הטוען שבתחומים המדוברים, יותר מ-50% מן ה"תגליות" אשר מתפרסמות במאמרים מדעיים אינן משוחזרות בניסויים נוספים, והן למעשה שגויות. בין הכשלים והנטאים אשר עשויים להשפיע על שיעור התגליות השגויות:

  • נטאי הפרסום: כתבי-עת מדעיים לעתים קרובות מעדיפים לפרסם מחקרים המכריזים על תגליות, ובייחוד תגליות הזוכות לעניין ציבורי ופרסום באמצעי התקשורת, מאשר מחקרים הבודקים תגליות קודמות ומודיעים על כישלון לשחזר אותן.
  • אפקט המגרה: חוקרים רבים הנכשלים בשחזור תגלית עליה דיווח חוקר אחר אף אינם מנסים לפרסם את כשלונם, אם משום שהם מאשימים את עצמם בשגיאות טכניות ואם משום שהם מודעים לקושי לפרסם תוצאות שליליות.

כתוצאה מנטאים כאלו, עלול להתרחש מצב שבו, למשל, אותם מחקרים שמצאו כי לתרופה חדשה יש השפעה חזקה מתפרסמים, בעוד שמחקרים אחרים שלא מצאו השפעה שלה אף אינם מגיעים לידיעת הקהילה המדעית בתחום. בשנים האחרונות חוקרים מציעים נהלים ומתודולוגיות חדשות במדע במטרה לבטל את השפעתם של נטאים כאלו.

כשל נפוץ אפילו בין מדענים רבים הוא לחשוב שאחוז התגליות השגויות במדע אינו יכול להיות גדול מרמת המובהקות הסטטיסטית המקובלת. במדעי הרפואה והביולוגיה מקובל לדחות השערה כאשר המובהקות הסטטיסטית בניסוי שבדק אותה שווה או גדולה מ-0.05 (שהם 5%), ולכן מדענים רבים סבורים אינטואיטיבית שלכל היותר 5% מן התגליות המתפרסמות בתחום הרפואה והביולוגיה עלולות להיות שגויות. אך ההגדרה הנכונה של מובהקות סטטיסטית היא הסיכוי לקבל את תוצאות הניסוי בהנחה שהשערת האפס היא נכונה, כלומר בהנחה שהשערת הניסוי שגויה (טעות מסוג I או בכינוי נפוץ באנגלית false positive). אחוז התגליות השגויות הכללי במדע תלוי לא רק ברמת המובהקות, אלא גם בשני גדלים חשובים נוספים - העוצמה הסטטיסטית, ובייחוד אחוז ההשערות הנכונות מתוך כלל ההשערות שנבדקו. בכך ניתן להיווכח באמצעות הדוגמה המספרית הבאה:

נניח שבשנה מסוימת בתחום מסוים במדע נבדקו בניסויים 1000 השערות, שמתוכן 100 הן אכן נכונות (כלומר שיעור של 10%). לא כל ההשערות הנכונות תהפוכנה בהכרח לתגליות - העוצמה הסטטיסטית היא אחוז ההשערות אשר מתגלות בפועל בניסוי מתוך ההשערות הנכונות. אם נניח שבתחום המדעי המדובר העוצמה הסטטיסטית היא 80%, אזי רק 80 מתוך 100 ההשערות הנכונות תתקבלנה בניסויים כתגליות. יתר על כן, אם רמת המובהקות הסטטיסטית הנהוגה בתחום היא 5%, אז מתוך 900 ההשערות שאינן נכונות, 5% או 45 השערות תתקבלנה בטעות כ"תגליות". המספר הכללי של תגליות שתתפרסמנה באותה השנה בספרות המדעית יהיה איפוא 45+80=125, ומתוכן 45 תהיינה שגויות - שיעור תגליות שגויות של 36% הגבוה בהרבה מרמת המובהקות.

בדוגמה זו ניתן לראות שלאחוז ההשערות הנכונות מתוך כלל ההשערות הנבדקות יש חשיבות רבה. אם מרבית ההשערות שמדענים בודקים בתחום מסוים אינן נכונות, אזי אפילו האחוז הקטן מתוכן שמתקבלות בטעות כתגליות עלול להיות גדול ממעט ההשערות הנכונות. למשל, אם בדוגמה המספרית למעלה נקטין את אחוז ההשערות הנכונות ל-1% בלבד יתקבל שיעור תגליות שגויות של 86%, אשר תואם את אזהרתו של יואנידיס ש"רוב התגליות המתפרסמות הן שגויות". מכאן מסיק יואנידיס שבתחומי מדע בעלי בסיס תאורטי חלש יותר, כמו פסיכולוגיה, ייתכן שרמת המובהקות הסטטיסטית המחמירה שדורשים המדענים בניסוי אינה מספקת להציל את התחום מן הקושי לנסח השערה נכונה.

חשוב לציין כי תהיה זו טעות להסיק שמרבית העובדות הנחשבות לקונצנזוס מדעי במדע המודרני הן בעצם שגויות. ממצאים אשר נחשבים לקונצנזוס במדע בדרך-כלל נבדקו ואושרו פעמים רבות, ולכן רמת הוודאות בהם קרובה ל-100%. הטיעון למעלה עוסק ב"תגליות" שהתקבלו רק פעם אחת ועדיין לא שוחזרו. מכאן מתחוורת חשיבותה העצומה של ההדירות לאמינותו של המדע.

ראו גם[עריכת קוד מקור | עריכה]

לקריאה נוספת[עריכת קוד מקור | עריכה]

  • Steven Shapin and Simon Schaffer (1985) Leviathan and the Air-Pump: Hobbes, Boyle, and the Experimental Life. (2011 edition), Princeton University Press, Princeton, NJ