הדירות – הבדלי גרסאות

מתוך ויקיפדיה, האנציקלופדיה החופשית
תוכן שנמחק תוכן שנוסף
תמונה וניסוח זהיר יותר
←‏תגליות שגויות: מקור - יואנידיס
שורה 41: שורה 41:
==תגליות שגויות==
==תגליות שגויות==


במאה ה-21 הזהירו מספר מדענים מפני [[כשל לוגי|כשלים]] ו[[נטאי|נטאים]] אשר גורמים לחוסר הדירות בתחומים מסוימים של המדע המודרני, ובעיקר ב[[פסיכולוגיה]] וברפואה. מבין מדענים אלו מפורסם בייחוד ג'ון יואנידיס, פסיכולוג אמריקאי הטוען שבתחומים המדוברים, יותר מ-50% מן ה"תגליות" אשר מתפרסמות במאמרים מדעיים אינן משוחזרות בניסויים נוספים, והן למעשה שגויות. בין הכשלים והנטאים אשר עשויים להשפיע על שיעור התגליות השגויות:
במאה ה-21 הזהירו מספר מדענים מפני [[כשל לוגי|כשלים]] ו[[נטאי|נטאים]] אשר גורמים לחוסר הדירות בתחומים מסוימים של המדע המודרני, ובעיקר ב[[פסיכולוגיה]] וברפואה. מבין מדענים אלו מפורסם בייחוד ג'ון יואנידיס, פסיכולוג אמריקאי הטוען שבתחומים המדוברים, יותר מ-50% מן ה"תגליות" אשר מתפרסמות במאמרים מדעיים אינן משוחזרות בניסויים נוספים, והן למעשה שגויות<ref>{{צ-מאמר|מחבר = John P. A. Ioannidis|שם = Why Most Published Research Findings Are False|כתב עת = PLoS Medicine|שנת הוצאה = 2005|כרך = DOI: 10.1371/journal.pmed.0020124}}</ref>. בין הכשלים והנטאים אשר עשויים להשפיע על שיעור התגליות השגויות:


* '''נטאי הפרסום:''' כתבי-עת מדעיים לעתים קרובות מעדיפים לפרסם מחקרים המכריזים על תגליות, ובייחוד תגליות הזוכות לעניין ציבורי ופרסום באמצעי התקשורת, מאשר מחקרים הבודקים תגליות קודמות ומודיעים על כישלון לשחזר אותן.
* '''נטאי הפרסום:''' כתבי-עת מדעיים לעתים קרובות מעדיפים לפרסם מחקרים המכריזים על תגליות, ובייחוד תגליות הזוכות לעניין ציבורי ופרסום באמצעי התקשורת, מאשר מחקרים הבודקים תגליות קודמות ומודיעים על כישלון לשחזר אותן.

גרסה מ־16:47, 22 בספטמבר 2014

הדירות (אנגלית: replicability ,reproducibility או repeatability) במדע היא היכולת לקבל שוב ושוב את אותן התוצאות של ניסוי מדעי או תצפית מדעית.

הדירות נחשבת בדרך-כלל כתנאי הכרחי לקיומו של מדע בעל-ערך. תוצאות ותצפיות שלא ניתן לחזור עליהן נחשבות כסממן של תגליות שגויות, פסבדו-מדע, או תחום קדם-מדעי שעדיין איננו מבוסס דיו.

הגדרות ומונחים

המונח "הדירות" בעברית חודש על ידי האקדמיה ללשון, על פי שורש ממקור ארמי ה-ד-ר שמשמעותו "חזרה", וממנו נגזרה גם המילה "הדרן".[1]

באנגלית מתייחסים למושג במונחים replicability, repeatability או reproducibility. אין קונצנזוס כלל-מדעי לגבי המשמעות המדוייקת של כל אחד מן המונחים האלו, אף כי בתחומים מסויימים של מדע עשויים להעדיף אחד מהם למשמעות מסויימת. המונח reproducible research נמצא מאז המאה ה-21 בשימוש בעיקר בתחום מדעי המחשב לציון היכולת לשחזר מתוך תצפית או ניסוי שכבר נערכו את הניתוח הסטטיסטי, התוצאות, הטבלאות והגרפים שפורסמו בספרות המדעית (ראו למטה בסעיף "מחקר הדיר"). בעקבות זאת יש המשתמשים במונח replicability ליכולת לערוך מחדש את הניסוי או התצפית ולקבל שוב ושוב את אותן התוצאות, למשל במועד אחר, על ידי נסיין אחר, או במעבדה אחרת. בתחומי הרפואה והפסיכולוגיה המונח repeatability בדרך-כלל מתייחס למידת הזהות בתוצאות של בדיקות חוזרות שנערכו באותו הנבדק, אך בתחומים אחרים מונח זה עשוי להתייחס גם לתוצאות בנבדקים שונים או בקבוצות שונות של נבדקים.

היסטוריה

רוברט הוק מרכיב את משאבת האוויר תחת פיקוחו של רוברט בויל, בבית מרקחת באוקספורד (איור מודרני)

הראשון שביסס את חשיבותה של ההדירות במדע היה חלוץ המדע הניסויי רוברט בויל, במאה ה-17 בבריטניה. משאבת האוויר שפיתח בויל נבנתה כדי ליצור ולחקור ריק, אלא שמושג זה היה שנוי בזמנו במחלוקת פילוסופית קשה, והיו פילוסופים כמו תומאס הובס שסברו שריק איננו אפשרי. בויל נדרש איפוא לשאלה מהי עובדה מדעית, וקבע כי זוהי תוצאה אשר ניתן למדוד אותה באופן הדיר, כלומר פעם אחר פעם, ולשכנע את חברי הקהילה המדעית בקיומה. באותו זמן הניח בויל גם את היסודות למושגים נוספים העומדים בבסיס השיטה המדעית המודרנית, כמו המאמר המדעי, והיה בין מייסדי הקהילה המדעית המודרנית הראשונה - החברה המלכותית הבריטית.

משאבת האוויר, שבמושגי המאה ה-17 הייתה מכשיר מדעי יקר, מסובך וקשה לבנייה, גם הובילה לוויכוח המתועד הראשון על הדירות של תופעה מסוימת במדע. המדען ההולנדי כריסטיאן הויגנס בנה באמסטרדם את משאבת האוויר הראשונה שלא נמצאה תחת שליטתם הישירה של בויל ועוזרו דאז רוברט הוק. הוא דיווח על תופעה שבה הריק בתוך המשאבה שלו גרם למים "לרחף" בראש שפופרת ריקה (למעשה מוחזקים על ידי בועת אויר, מה שהויגנס כינה "anomalous suspension"). הוק ובויל לא הצליחו לשחזר את התופעה במשאבות האוויר שלהם, וכתוצאה מכך עלו ספקות לגבי נושא הריק בכללותו, ולגבי סמכותו המדעית של הויגנס בפרט. בהליך יוצא-דופן באותה תקופה הוזמן הויגנס לאנגליה בשנת 1663, ובהנחייתו הישירה הצליח הוק לשחזר את התופעה. בעקבות זאת נבחר הויגנס כחבר זר בחברה המלכותית. הסיבה המדויקת לחוסר ההדירות בתופעה זו הובררה במלואה רק במאה ה-20.

במדע מודרני

הסטטיסטיקאי רונלד פישר, שהניח בין השאר את היסודות לשיטה המדעית המודרנית של מובהקות סטטיסטית, כתב בחיבורו הקלאסי "תכנון ניסויים" משנת 1935 כי "אנחנו יכולים לומר שתופעה ניתנת להדגמה באופן ניסויי כאשר אנו יודעים לבצע ניסוי אשר רק לעתים רחוקות יתן לנו תוצאה בלתי-מובהקת סטטיסטית". הפילוסוף של המדע קרל פופר היה בוטה יותר בחיבורו משנת 1934 "הלוגיקה של תגליות מדעיות" (שהציג את עקרון ההפרכה), בו כתב "מקרים בודדים ובלתי-הדירים הם חסרי משמעות למדע".

אמירות מעין אלו מבטאות דוגמה רווחת בקהילה המדעית המודרנית, בעיקר בתחומי מדעים מדויקים ומדעי החיים, לפיה הדירות הינה תנאי הכרחי (אם גם לא מספיק) לביסוסה של עובדה מדעית, ולעצם קיומה של סמכות מדעית בנושא כלשהו. למשל, בתחילת שנות ה-90 דחתה מרבית הקהילה המדעית את הטענות לביצוע היתוך קר. נימוק עיקרי לדחייה היה כשלונם של מרבית הנסיונות לשחזר את התופעה, אפילו לפני שהתגלתה השגיאה המקורית בחישוביהם של הכימאים שטענו לתגלית.

מחקר הדיר

מחקר הדיר (Reproducible Research) הוא תחום חדש במדעי המחשב, העוסק ביכולת לחשב שוב מתוך נתונים שכבר נמדדו את התוצאות, הטבלאות והגרפים שפורסמו בספרות המדעית. יכולת כזו נחשבת כבסיס הכרחי למדע מודרני, אך מסובכת לביצוע בעיקר בתחומים מדעיים שבהם מחקרים מודדים כמויות עצומות של נתונים באופן אוטומטי, אוגרים אותם במסדי נתונים גדולים, ולעתים מבצעים עליהם חישובים הדורשים כוח חישובי עצום. דוגמאות טיפוסיות הם:

מסדי הנתונים במחקרים מעין אלו הם גדולים מכדי לפרסמם במאמרים מדעיים. לצורך זה מוקמים מסדי נתונים מיוחדים, שהם לעתים ציבוריים ופתוחים ברשת האינטרנט.

דרישה חשובה נוספת במחקר הדיר היא לשמור ולפרסם את התוכנה ששימשה לניתוח הנתונים באופן שניתן יהיה לחזור על החישובים ולקבל שוב תוצאות זהות. יכולת כזו חשובה בעיקר כאשר מבקשים לברר באיזו מידה תוצאות ומסקנות המחקר שהתפרסמו תלויות בהנחות מפשטות שונות, בשיטות בחישוב שנעשה בהן שימוש ,ואפילו בבאגים וטעויות שנפלו בביצוע ההליך החישובי המסובך.

מקרה מפורסם שהדגים את חשיבותו של מחקר הדיר אירע במאמר חשוב משנת 2010 מאת קן רוגוף וכרמן ריינרט מאוניברסיטת הרוורד, בעברם כלכלנים ראשיים של קרן המטבע הבינלאומית. המאמר השווה את הגרעון הממשלתי ב-20 מדינות שונות, הגיע למסקנות קשות מאוד לגבי חומרת המשבר הכלכלי, והייתה לו השפעה רבה על ניהול החוב החיצוני במדינות האיחוד האירופי, ובעיקר ביוון ופורטוגל. אך בשנת 2013 גילה סטודנט לכלכלה באוניברסיטת מסצ'וסטס אי-התאמות חשבוניות במאמר. הוא ביקש מן החוקרים את גיליון האקסל שבו נעשו החישובים, ומצא שעקב טעות, נוסחת הסכום החשובה ביותר שלהם סכמה רק 15 מתוך 20 המדינות, מה שהוליך לשגיאה גדולה בתוצאה הסופית [2].

תגליות שגויות

במאה ה-21 הזהירו מספר מדענים מפני כשלים ונטאים אשר גורמים לחוסר הדירות בתחומים מסוימים של המדע המודרני, ובעיקר בפסיכולוגיה וברפואה. מבין מדענים אלו מפורסם בייחוד ג'ון יואנידיס, פסיכולוג אמריקאי הטוען שבתחומים המדוברים, יותר מ-50% מן ה"תגליות" אשר מתפרסמות במאמרים מדעיים אינן משוחזרות בניסויים נוספים, והן למעשה שגויות[3]. בין הכשלים והנטאים אשר עשויים להשפיע על שיעור התגליות השגויות:

  • נטאי הפרסום: כתבי-עת מדעיים לעתים קרובות מעדיפים לפרסם מחקרים המכריזים על תגליות, ובייחוד תגליות הזוכות לעניין ציבורי ופרסום באמצעי התקשורת, מאשר מחקרים הבודקים תגליות קודמות ומודיעים על כישלון לשחזר אותן.
  • אפקט המגרה: חוקרים רבים הנכשלים בשחזור תגלית עליה דיווח חוקר אחר אף אינם מנסים לפרסם את כשלונם, אם משום שהם מאשימים את עצמם בשגיאות טכניות ואם משום שהם מודעים לקושי לפרסם תוצאות שליליות.
דוגמה היפותטית: כיצד שיעור התגליות השגויות במדע עלול להיות גבוה בהרבה מרמת המובהקות הסטטיסטית
(א) נניח שבשנה מסוימת בתחום מסוים במדע נבדקו בניסויים 1000 השערות (משבצות ירוקות), שמתוכן 100 השערות - שיעור של 10% - הן אכן נכונות (משבצות צהובות).
(ב) לא כל ההשערות הנכונות תהפוכנה בהכרח לתגליות - העוצמה הסטטיסטית היא אחוז ההשערות אשר מתגלות בפועל בניסוי מתוך ההשערות הנכונות. אם נניח שבתחום המדעי המדובר העוצמה הסטטיסטית היא 80%, אזי רק 80 מתוך 100 ההשערות הנכונות תתקבלנה בניסויים כתגליות, בעוד ששאר ה-20 יחמקו מגילוי (משבצות כחולות). יתר על כן, אם רמת המובהקות הסטטיסטית הנהוגה בתחום היא 5%, אז מתוך 900 ההשערות שאינן נכונות, 5% או 45 השערות תתקבלנה בטעות כ"תגליות" (משבצות אדומות).
(ג) המספר הכללי של תגליות שתתפרסמנה באותה השנה בספרות המדעית יהיה איפוא 45+80=125, ומתוכן 45 תהיינה שגויות - שיעור תגליות שגויות של 36% הגבוה בהרבה מרמת המובהקות.

כתוצאה מנטאים כאלו, עלול להתרחש מצב שבו, למשל, אותם מחקרים שמצאו כי לתרופה חדשה יש השפעה חזקה מתפרסמים, בעוד שמחקרים אחרים שלא מצאו השפעה שלה אף אינם מגיעים לידיעת הקהילה המדעית בתחום. בשנים האחרונות חוקרים מציעים נהלים ומתודולוגיות חדשות במדע במטרה לבטל את השפעתם של נטאים כאלו.

כשל נפוץ אפילו בין מדענים רבים הוא לחשוב שאחוז התגליות השגויות במדע אינו יכול להיות גדול מרמת המובהקות הסטטיסטית המקובלת. במדעי הרפואה והביולוגיה מקובל לדחות השערה כאשר המובהקות הסטטיסטית בניסוי שבדק אותה שווה או גדולה מ-0.05 (שהם 5%), ולכן מדענים רבים סבורים אינטואיטיבית שלכל היותר 5% מן התגליות המתפרסמות בתחום הרפואה והביולוגיה עלולות להיות שגויות. אך ההגדרה הנכונה של מובהקות סטטיסטית היא הסיכוי לקבל את תוצאות הניסוי בהנחה שהשערת האפס היא נכונה, כלומר בהנחה שהשערת הניסוי שגויה (טעות מסוג I או בכינוי נפוץ באנגלית false positive). אחוז התגליות השגויות הכללי במדע תלוי לא רק ברמת המובהקות, אלא גם בשני גדלים חשובים נוספים - העוצמה הסטטיסטית, ובייחוד אחוז ההשערות הנכונות מתוך כלל ההשערות שנבדקו. בכך ניתן להיווכח בדוגמה המספרית ההיפותטית באיור שמשמאל.

בדוגמה זו ניתן לראות שלאחוז ההשערות הנכונות מתוך כלל ההשערות הנבדקות יש חשיבות רבה. אם מרבית ההשערות שמדענים בודקים בתחום מסוים אינן נכונות, אזי אפילו האחוז הקטן מתוכן שמתקבלות בטעות כתגליות עלול להיות גדול ממעט ההשערות הנכונות. למשל, אם בדוגמה המספרית באיור שמשמאל נקטין את אחוז ההשערות הנכונות ל-1% בלבד יתקבל שיעור תגליות שגויות של 86%. במצב היפותטי כזה גם רמת המובהקות הסטטיסטית המחמירה שדורשים המדענים בניסוי אינה מספקת להציל את התחום מן הקושי לנסח השערה נכונה. יואנידיס טוען כי מצב כזה שבו "רוב התגליות המתפרסמות הן שגויות" אכן מתרחש בפועל בתחומי מדע בעלי בסיס תאורטי חלש יותר, כמו פסיכולוגיה.

חשוב לציין כי תהיה זו טעות להסיק שמרבית העובדות הנחשבות לקונצנזוס מדעי במדע המודרני הן בעצם שגויות. ממצאים אשר נחשבים לקונצנזוס במדע בדרך-כלל נבדקו ואושרו פעמים רבות, ולכן רמת הוודאות בהם קרובה ל-100%. הטיעון למעלה עוסק ב"תגליות" שהתקבלו רק פעם אחת ועדיין לא שוחזרו. מכאן מתחוורת חשיבותה העצומה של ההדירות לאמינותו של המדע.

ראו גם

קישורים חיצוניים

לקריאה נוספת

  • Steven Shapin and Simon Schaffer (1985) Leviathan and the Air-Pump: Hobbes, Boyle, and the Experimental Life. (2011 edition), Princeton University Press, Princeton, NJ

הערות שוליים

  1. ^ הפילוסוף של המדע יוסף אגסי נוהג להעיר כי המילה "חזירות" בעברית כבר הייתה תפוסה.
  2. ^ Paul Krugman, The Excel Depression. New York Times, April 18, 2013
  3. ^ John P. A. Ioannidis, Why Most Published Research Findings Are False, PLoS Medicine DOI: 10.1371/journal.pmed.0020124, 2005