ניסוי מבוקר הקצאה אקראית (Randomized Controlled Trial - RCT)

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש
תרשים הבנוי ממלבנים עם טקסט, המחוברים בחצים. הטקסט, מלמעלה למטה, ומימין לשמאל, הוא: n עברו הערכת התאמה; גיוס; לא הוכללו: n לא עמדו בכללי ההתאמה n סירבו להשתתף n סיבות אחרות; n הוקצו אקראית; הקצאה; n הוקצו להתערבות א' n עברו ההתערבות שהוקצתה n לא עברו ההתערבות (פירוט סיבות...); n הוקצו להתערבות ב' n עברו ההתערבות שהוקצתה n לא עברו ההתערבות (פירוט סיבות...); n אבדו למעקב n הפסיקו ההתערבות (פירוט סיבות...); מעקב; n נכללו בניתוח התוצאות n לא נכללו בניתוח התוצאות (פירוט סיבות...); n נכללו בניתוח התוצאות n לא נכללו בניתוח התוצאות (פירוט סיבות...); ניתוח
תרשים זרימה של 4 שלבים (רישום, הקצאת התערבות, מעקב וניתוח נתונים) של ניסוי הקצאה אקראית במקביל של שתי קבוצות (בניסוי מבוקר, אחת ההתערבויות משמשת כבקרה), מבוסס על הצהרת 'קונסורט' (CONSORT - CONsolidated Standards Of Reporting Trials) 2010[1]

ניסוי מבוקר הקצאה אקראית (או ניסוי עם בקרת אקראיות,[2] RCT ) הוא סוג של ניסוי מדעי (לעיתים קרובות - רפואי) שמטרתו לצמצם הטיה בעת בדיקת השפעת התערבויות (בדרך כלל טיפולים חדשים). הקצאה אקראית (רנדומיזציה) היא תהליך של הצבת נבדקי הניסוי בקבוצות טיפול או בקבוצות בקורת באמצעות שימוש במיקריות. RCT נעשה על ידי הקצאה אקראית של נבדקים לשתי קבוצות או יותר, מתן טיפול שונה בהן, ולאחר מכן השוואתם לפי השפעה נמדדת. בקבוצה אחת - קבוצת הניסוי - נערכת ההתערבות, ואילו בשנייה - הנקראת בדרך כלל קבוצת הביקורת - יש מצב חלופי, כגון תרופת דמה או אי התערבות. הקבוצות נמצאות במעקב בהתאם לתכנון הניסוי כדי לבחון כיצד השפיעה ההתערבות הניסויית.[3] השפעת הטיפול (יעילות, תועלת ונזק) מוערכת בהשוואה לבקרה. ייתכנו יותר מקבוצת טיפול אחת או יותר מקבוצת ביקורת אחת.

הניסוי עשוי להיות חד-סמיות, שבו הנבדקים לא יודעים לאיזו קבוצה הם הוקצו, או כפול סמיות, שבו לא הנבדקים ולא עורכי הטיפולים יודעים מהי הקצאת הנבדקים. הדבר נעשה על ידי שימוש בנהלים זהים ככל האפשר עם כל הנבדקים. כל הבדל חייב להיות מהותי לטיפולי ההשוואה (למשל, כאשר חוקרים טיפול קבוצתי לעומת טיפול אישי, ביקורי בית לעומת שיחות טלפון וכו').

האקראיות בהקצאת נבדקים לקבוצות מקטינה את ההטיה בבחירה ומבטלת את ההטיה בהקצאה, וכך מאזנת גורמים פרוגנוסטיים (ערפלנים) ידועים ובלתי ידועים בהקצאת טיפולים.[4] סמיות מפחיתה צורות אחרות של הטיות - של הנבדק ושל הנסיין .

RCT כפול סמיות נחשב תקן הזהב עבור ניסויים קליניים. הוא משמש לבחינת היעילות, התועלת והבטיחות של התערבויות רפואיות ועשוי גם לספק מידע על סיכונים כגון תופעות לוואי של תרופות.

המונחים "ניסויים מבוקרים עם הקצאה אקראית" (RCT) ו"ניסויי הקצאה אקראית" (RT) משמשים לעיתים כמילים נרדפות, אך המונח האחרון משמיט אזכור של בקרה ולכן עשוי לתאר מחקרים המשווים קבוצות טיפול מרובות זו עם זו בהיעדר קבוצת ביקורת.[5] ויותר מכך, באנגלית, ראשי התיבות RCT מורחבות לעיתים לא כ"ניסוי קליני אקראי" אלא כ"ניסוי השוואתי (באנגלית: Comperative) אקראי", מה שמוביל לעמימות בספרות המדעית .[6][7] לא כל הניסויים הקליניים האקראיים הם ניסויים מבוקרים אקראיים (וחלקם אף פעם לא יכולים להיות, כמו במקרים שבהם הבקרות יהיו לא מעשיות או לא מוסריות לביצוע). המונח ניסוי קליני אקראי מבוקר הוא מונח חלופי המשמש במחקר קליני ;[8] עם זאת, RCT מתבצעים גם בתחומי מחקר אחרים, כולל רבים מתחומי מדעי החברה.

היסטוריה[עריכת קוד מקור | עריכה]

הניסוי הקליני הראשון בוצע על ידי ג 'יימס לינד בשנת 1747 כדי למצוא טיפול לצפדינה.[9] ניסויים אקראיים הופיעו בפסיכולוגיה, שם הם הוצגו על ידי צ'ארלס סנדרס פירס וג'וזף יאסטרוב ב-1880,[10] ובחינוך.[11][12][13] בתחילת המאה ה-20, הופיעו גם ניסויי הצבה אקראית בחקלאות, על ידי יז'י ניימן[14] ורונלד א. פישר. מחקריו הניסויים של פישר וכתביו העלו את קרנם של ניסויי ההצבה האקראית.[15]

ב-1948 הופיע לראשונה RCT ברפואה כמאמר מדעי. כותרתו: "טיפול סטרפטומיצין בשחפת ריאתית" והוא תיאר מחקר של המועצה למחקר רפואי.[16][17][18] אחד מהמחברים של המאמר היה אוסטין ברדפורד היל, אשר נחשב כהוגה ה-RCT המודרני.[19]

עד סוף המאה ה-20, מחקרי RCT הוכרו כשיטה הסטנדרטית של "טיפולים רציונליים" ברפואה.[20] בשנת 2004, נכללו יותר מ 150,000 מחקרי RCT בספריית קוקרן .[19] כדי לשפר את הדיווח של מחקרי RCT בספרות הרפואית, קבוצה בינלאומית של מדענים ועורכים פרסמה את התקן המוסכם לדיווח על מחקרי רנדומיזציה (קונסורט) בשנת 1996, 2001 ו 2010, ואלה הפכו מקובלים.[21][22]

אתיקה[עריכת קוד מקור | עריכה]

עקרון האיזון הקליני ("אי-ודאות אמיתית בקרב מומחי הקהילה הרפואית... לגבי הטיפול המועדף"), שהיה מקובל לגבי ניסויים קליניים[23], יושם ל-RCT. אך לאתיקה של RCT יש שיקולים מיוחדים. ראשית, נטען כי איזון קליני בלבד אינו מספיק להצדקת RCT.[24] שנית, 'איזון קולקטיבי' יכול להתנגש עם העדר 'איזון אישי' (למשל, אמונה אישית שהתערבות יעילה).[25] לבסוף, העיצוב של Zelen, אשר שימש בכמה מחקרי רנדומיזציה מבוקרים, מקצה באקראי נבדקים לפני שהם נותנים הסכמה מדעת, מה שאמנם עשוי להיות אתי עבור מחקרי RCT של סקירת מחלות וטיפולים מסוימים, אך לא ייחשב מוסרי עבור רוב הניסויים הטיפוליים.[26][27]

אף על פי שהנבדקים כמעט תמיד נותנים הסכמה מדעת להשתתפותם ב- RCT, מחקרים משנת 1982 הראו כי נבדקי RCT עשויים להאמין כי הם יקבלו את הטיפול הטוב ביותר עבורם באופן אישי; כלומר, הם לא מבינים את ההבדל בין מחקר וטיפול.[28][29] נדרשים מחקרים נוספים כדי לקבוע את השכיחות ואת הדרכים לטפל ב'תפיסה הטיפולית המוטעית'.[29]

בתהליך הגיוס של נבדקים עלול שימוש בהסברים או דוגמאות לא מאוזנות ואופטימיות לגרום להטעייה לגבי מהות המחקר והצפי.[30] לדוגמה, חולים עם מחלה סופנית עשויים להצטרף לניסויים בתקווה להירפא, גם כאשר הטיפולים אינם צפויים להצליח בכך.

רישום מחקרים[עריכת קוד מקור | עריכה]

בשנת 2004, הוועדה הבינלאומית של עורכי הרפואה (ראשי תיבות באנגלית: ICMJE), שכללה את 12 כתבי העת היוקרתיים של הרפואה, הודיעה כי כל הניסויים המתחילים רישום של נבדקים לאחר 1 ביולי 2005 חייבים להיות רשומים מראש במאגר ציבורי על מנת שישקל פרסום של תוצאותיהם.[31] עם זאת, רישום מחקרים עשוי עדיין להתבצע מאוחר או בכלל לא.[32][33] כמו כן, כתבי עת רפואיים נמצאו איטיים בהתאמת מדיניות המחייבת רישום ניסוי קליני כתנאי חובה מוקדם לפרסום תוצאותיהם.[34]

סיווגים[עריכת קוד מקור | עריכה]

על פי מתווה המחקר[עריכת קוד מקור | עריכה]

דרך אחת לסווג מחקרי RCT היא על פי מתווה המחקר. מתווי מחקרי ה-RCT העיקריים בספרות הרפואית הם (מהנפוץ יותר לנפוץ פחות):[35]

  • קבוצות מקבילות (באנגלית: Parallel) - כל נבדק מוקצה באופן אקראי לקבוצה, וכל הנבדקים בקבוצה מקבלים (או לא מקבלים) התערבות.
  • מוצלב (באנגלית: Crossover) - לאורך תקופת המחקר, כל משתתף מקבל (או לא מקבל) התערבות, ברצף אקראי.[36][37]
  • אשכול (באנגלית: Cluster) - קבוצות קיימות של משתתפים (למשל, כפרים, בתי ספר, מרפאות) נבחרות באופן אקראי לקבל (או לא לקבל) התערבות.
  • פקטוריאל - כל משתתף מוקצה באופן אקראי לקבוצה המקבלת שילוב מסוים של התערבויות או אי-התערבויות (לדוגמה, קבוצה 1 מקבלת ויטמין X וויטמין Y, קבוצה 2 מקבלת ויטמין X ופלצבו Y, קבוצה 3 מקבלת פלצבו X וויטמין Y, וקבוצה 4 מקבלת פלצבו X ו- פלצבו Y).

ניתוח של 616 מחקרי RCT שנרשמו ב-PubMed במהלך חודש דצמבר 2006 מצא כי 78% היו ניסויים מקביליים (קבוצות מקבילות), 16% היו מוצלבים, 2% היו מפוצלי-גוף, 2% מחקרי אשכול ו-2% היו פקטריאליים.[35]

על פי התוצאה הנבחנת (חוללות לעומת תכליתיות, efficacy vs. effectiveness)[עריכת קוד מקור | עריכה]

מחקרי RCT יכולים להיות מסווגים כ"מדגימים" או "פרגמטיים".[38] מחקרי RCT "מדגימים" (באנגלית: Explanatory) בוחנים את חוללות ההתערבות (באנגלית: Efficacy), כלומר השפעה בתנאי ניסוי מבוקרים מאד ועם משתתפים שנבחרו בקפידה.[38] לעומתם מחקרי RCT "פרגמטיים" (pRCT) בוחנים אֵפֶקְטִיבִיות (באנגלית: Effectivity, תכליתיות) של הטיפול, על ידי בחירת משתתפים פחות קפדנית ובתנאים גמישים יותר. תנאים הדומים יותר לתנאי הפעילות הקלינית היומיומית. בדרך זו, מחקרי RCT פרגמטיים יכולים לתת מידע התומך בקבלת החלטות לגבי פעולה.[38]

על פי ההשערה (עליונות לעומת אי-נחיתות לעומת שקילות)[עריכת קוד מקור | עריכה]

סיווג נוסף של מחקרי RCT מקטלג אותם כ "ניסויי עליונות" (באנגלית: superiority), "ניסויי אי-נחיתות" (באנגלית: noninferiority) ו"ניסויי שקילות" (באנגלית:equivalence) אשר נבדלים בשיטה (מתודולוגיה) ובדיווח.[39] רוב מחקרי ה-RCT הם ניסויי עליונות, שבהם, לפי ההשערה, התערבות אחת היא עדיפה על אחרת באופן משמעותי מבחינה סטטיסטית.[39] חלק ממחקרי ה-RCT הם ניסויי אי-נחיתות (באנגלית: noninferiority) "כדי לקבוע אם טיפול חדש אינו גרוע יותר מאשר הטיפול המושווה אליו."[39] מחקרי RCT אחרים הם ניסויי שקילות שבהם ההשערה היא כי שתי התערבויות אינן נבדלות זו מזו.[39]

אקראיות[עריכת קוד מקור | עריכה]

היתרונות של הקצאה אקראית נאותה במחקרי RCT כוללים:[40]

  • ביטול הטיה בהקצאת ההתערבות, במיוחד הטיה בבחירה ומשתנים מתערבים (ערפלנים) אחרים.
  • הקלה על שמירת סמיות (מיסוך) של זהות-הטיפול מהחוקרים, מהמשתתפים ומבוחני-התוצאים.
  • מאפשרת שימוש בתאוריית ההסתברות כדי לבטא את הסיכוי שהבדל בתוצאה בין קבוצות הטיפול הוא מיקרי.

בהקצאה אקראית נאותה של הנבדקים להתערבויות שונות יש לקבוע שני הליכים: הליך ההקצאה והליך הסתרת ההקצאה. הליך הקצאה אקראית מטרתו ליצור רצף בלתי צפוי של הקצאות; הליך זה עשוי להיות הקצאה אקראית פשוטה של נבדקים לכל קבוצה בהסתברות שווה או עשוי להיות "מוגבל" (restricted), או "מסתגל" (adaptive). הליך הסתרת ההקצאה, משמעותו אמצעי זהירות קפדניים שננקטים על מנת להבטיח שהקצאת הקבוצה של המטופלים לא תיחשף מוקדם מדי. הליכים "שיטתיים" לא אקראיים של הקצאה קבוצתית, כגון החלפת נבדקים בין קבוצה אחת לאחרת, יכולים לגרום ל"אפשרויות זיהום בלתי מוגבלות" ולהפרה של סמיות ההקצאה.[41]

עקב קושי באיתור עדויות אמפיריות לכך שהקצאה אקראית נאותה משפיעה על התוצאות (בהשואה להקצאה אקראית לקויה), יש הטוענים כי חשיבתה פחותה לעומת חשיבות הסמיות.[42]

נהלים[עריכת קוד מקור | עריכה]

הקצאת הטיפול פירושה היחס הרצוי של הנבדקים בכל זרוע ניסוי.

הליך הקצאה אקראית אידיאלי הוא זה שישיג את המטרות הבאות:[43]

  • מיקסום כוח סטטיסטי, במיוחד בניתוח תת-קבוצות. באופן כללי, גודלי קבוצה שווים מגדילים למקסימום את הכוח הסטטיסטי, עם זאת, קבוצות בגדלים לא שווים עשויות לשפר כוח סטטיסטי לניתוחים מסוימים (למשל, השוואות מרובות של פלצבו לעומת מינונים שונים באמצעות הפרוצדורה של דנט[44] ), ולעיתים הן רצויות מסיבות לא אנליטיות (למשל, כאשר מוטיבציה של חולים להירשם לניסוי תתחזק אם יש בו סיכוי גבוה יותר לקבל את טיפול הבדיקה, או כאשר סוכנויות רגולטוריות עשויות לדרוש מספר מינימלי של חולים שייחשף לטיפול).[45]
  • מזעור בחירת הטיה. זו עלולה להתרחש אם החוקרים יכולים במודע או באופן לא מודע להעדיף רישום חולים לפי זרועות הטיפול. הליך אקראיות טוב יהיה בלתי צפוי, כך שהחוקרים לא יוכלו לנחש את הקצאת הקבוצה הבאה של הנבדק לפי הקצאת הנבדקים הקודמים. הסיכון של הטיה בבחירה הוא הגבוה ביותר כאשר הקצאות הטיפול הקודמות ידועות (כמו במחקרים ללא-סמיות) או ניתנות לניחוש (למשל אם לתרופה יש תופעות לוואי ייחודיות).
  • מזעור הטיה בהקצאה (או ערפלן). זו עלולה להתרחש כאשר משתנים המשפיעים על התוצאה אינם נחלקים באופן שווה בין קבוצות הטיפול, והשפעת הטיפול מתערבבת עם ההשפעה של המשתנים (כלומר, "הטיה מקרית"[40][46]). אם הליך ההקצאה האקראית גורם לחוסר איזון במשתנים הקשורים לתוצאה בין קבוצות, אומדני ההשפעה עשויים להיות מוטים אלא אם יעברו התאמה למשתנים (אשר עשויים להיות לא מדודים ולכן לא ניתנים להתאמה כזו).

אין הליך הקצאה אקראית יחיד העונה על מטרות אלה בכל הנסיבות. לכן על החוקרים לבחור מהו ההליך הנאות ביותר למחקר נתון לפי היתרונות והחסרונות שלו.

הליך הקצאה פשוט[עריכת קוד מקור | עריכה]

זהו הליך נפוץ ואינטואיטיבי, בדומה ל'זריקת מטבע חוזרת הוגנת',[40] הידוע גם בשם אקראיות מלאה או 'בלתי מוגבלת'. הוא חסין נגד הטיות הבחירה והמקריות. החיסרון העיקרי שלו הוא האפשרות של גודל קבוצות לא מאוזן במחקרי RCT קטנים (עם פחות מ-200 נבדקים).[47]

הליך הקצאה מוגבל[עריכת קוד מקור | עריכה]

כדי לאזן גדלים קבוצתיים במחקרי RCT קטנים יותר, מומלץ ליצור צורה כלשהי של רנדומיזציה "מוגבלת".[47] הסוגים העיקריים של אקראיות מוגבלת הנמצאים בשימוש ב-RCT הם:

  • הקצאה אקראית עם פרמוטציית בלוקיםאנגלית: permuted blocks) או אקראיות חסומהאנגלית: blocked randomization): "גודל בלוק" ו"יחס הקצאה" (מספר נבדקים בקבוצה אחת לעומת הקבוצה האחרת) מוגדרים מראש, ונבדקים מוקצים באופן אקראי בתוך כל בלוק.[41] לדוגמה, גודל בלוק של 6 וקצב הקצאה של 2:1 יוביל להקצאה אקראית של 4 נבדקים לקבוצה אחת ו -2 לאחרת. סוג זה של אקראיות יכול להיות משולב עם "אקראיות מרובדת", למשל לפי אתר, במחקר רב אתרים (באנגלית: multicenter trial), כדי להבטיח איזון טוב של מאפייני המשתתפים בכל קבוצה.[4] מקרה מיוחד של הליך אקראיות חסומה ממוחשב הוא הקצאה אקראית שבה המדגם כולו מטופל כבלוק אחד.[41] החסרון העיקרי בהליך אקראיות חסומה הוא שגם אם גודלי הבלוקים גדולים ומגוונים באופן אקראי, ההליך עלול להוביל להטיית בחירה.[48] חסרון נוסף הוא כי ניתוח נאות של נתונים מ-RCT של אקראיות חסומה דורש ריבוד לפי בלוקים.[49]
  • שיטות הקצאה אקראית מסתגלת של מטבע-מוטה (מהן הקצאה אקראית מהכד - באנגלית: urn randomization - היא הנפוצה ביותר): בשיטות לא נפוצות אלו, ההסתברות להיות מוקצה לקבוצה נעשית קטנה יותר אם הקבוצה מיוצגת יתר על המידה (וגם להפך, נעשית גדולה יותר אם הקבוצה אינה מיוצגת כראוי).[41] שיטות אלו נחשבות פחות מושפעות מהטיית הבחירה מאשר אקראיות חסומה.[49]

הקצאה מסתגלת[עריכת קוד מקור | עריכה]

לפחות שני סוגי הליכי הקצאה אקראית "הסתגלותית" שימשו במחקרי RCT, אך הם נדירים בהשוואה להקצאה אקראית פשוטה או מוגבלת:

  • הקצאה אקראית מסתגלת-למשתנים-נילויםאנגלית: Covariate-adaptive randomization), מתוכם סוג אחד הוא מזעור (מינימיזציה; באנגלית: minimization): ההסתברות להיות מוקצה לקבוצה משתנה כך ש"חוסר איזון משתנים" יהיה מזערי.[49]
  • הקצאה אקראית מסתגלת-לתגובהאנגלית: Response-adaptive randomization), הידועה גם בשם הקצאה אקראית המסתגלת לתוצאותאנגלית: outcome-adaptive randomization): ההסתברות להקצאה לקבוצה גדלה אם התגובות של החולים הקודמים בקבוצה היו רצויות.[49] נטען כי גישה זו היא אתית יותר מאשר סוגים אחרים של אקראיות כאשר ההסתברות כי טיפול יעיל (או לא יעיל) מתגבר במהלך RCT, אך הטענה טרם נבדקה היטב.[50]

הסתרת ההקצאה[עריכת קוד מקור | עריכה]

הסתרת ההקצאה (באנגלית: Allocation concealment), מוגדרת כ'נוהל להגנה על תהליך ההצבה האקראית, כך שהטיפול המוקצה אינו ידוע לפני כניסת המטופל למחקר' והיא חשובה ב-RCT.[51] בפועל, חוקרים קליניים במחקרי RCT מתקשים לעיתים קרובות לשמור על חוסר משוא פנים. פורסמו בספרות המדעית דיווחים על חוקרים המביטים במעטפות סגורות מול אור חזק כדי לקרוא את תוכנן, או פורצים למשרד כדי לגלות את רשימת ההקצאות.[41] פרקטיקות אלה מביאות להטיות בחירה וערפלנים (כאשר שני אלה אמורים להיות ממוזערים על ידי הצבה אקראית), ומאפשרים עיוות של תוצאות המחקר.[41] הסתרה נאותה של ההקצאה צריכה למנוע מהמטופלים ומהחוקרים כל גילוי של הקצאת הטיפול מרגע תחילת הניסוי וגם לאחר סיומו. בנוסף, גם תופעות לוואי הקשורות לטיפול עשויות להיות ייחודיות מספיק כדי לחשוף את ההקצאה לחוקרים או למטופלים ובכך להביא להטיה או להשפיע על פרמטרים סובייקטיביים שנאספים.

חלק מהשיטות הסטנדרטיות להבטחת הסתרת ההקצאה כוללות מעטפות ממוספרות, אטומות, חתומות (באנגלית: Sequentially Numbered, Opaque, Sealed Envelopes - SNOSE); מיכלים ממוספרים ברצף; הצבה אקראית מבוקרת של תרופות; והצבה אקראית מרכזית.[41] מומלץ לכלול שיטות להסתרת ההקצאה בפרוטוקול של ה-RCT ולפרט אותן בפרסום תוצאות המחקר; עם זאת, מחקר שנערך בשנת 2005 קבע כי ברוב מחקרי ה-RCT, לא ברורה שיטת ההסתרה בפרוטוקול שלהם, בפרסומים שלהם, או בשניהם.[52] מאידך גיסא, מחקר שנערך ב-2008 לגבי 146 מטא-אנליזות, הגיע למסקנה כי תוצאות מחקרי RCT עם הסתרת הקצאה לא מספקת או לא ברורה נוטות להיות מוטות כלפי תוצאות טובות רק כשתוצאות ה-RCT היו סובייקטיביות ולא אובייקטיביות.[53]

גודל המדגם[עריכת קוד מקור | עריכה]

מהימנות ה-RCT תלויה במספר 'יחידות הטיפול' (איברים, נבדקים או קבוצות נבדקים) שהוקצו לקבוצות הבקרה וההתערבות. גורם חשוב נוסף הוא 'השפעת הטיפול': מספר יחידות הטיפול הדרושות בשתי הקבוצות כדי לדחות את השערת האפס יוכל להיות קטן יותר כאשר השפעת הטיפול גדולה יותר. הכישלון בדחיית השערת האפס מרמז על כך שלטיפול אין השפעה מובהקת סטטיסטית על המטופלים במבחן נתון. מצד שני, ככל שגודל המדגם עולה, אותו RCT עשוי להיות מסוגל להדגים השפעה משמעותית של הטיפול, גם אם השפעה זו קטנה.[54]

סמיות[עריכת קוד מקור | עריכה]

RCT יכול להיות עם סמיות, (מכונה גם "ממוסך" מלשון מסכה) על ידי נוהל המונע מהמשתתפים במחקר, מטפלים, או בוחני-תוצאה מלדעת איזו התערבות ניתנה.[53] שלא כמו הסתרה של הקצאה, סמיות היא לעיתים לא הולמת או אף בלתי אפשרית לביצוע ב RCT; לדוגמה, אם הטיפול ב-RCT דורש השתתפות פעילה של המטופל (למשל, פיזיותרפיה), לא ניתן ליצור סמיות של המשתתפים לגבי ההתערבות.

באופן מסורתי, מחקרי RCT סווגו כ"בעלי סמיות יחידה", "כפולי סמיות", או "משולשי סמיות"; עם זאת, בשנת 2001 ו 2006 מחקרים הראו כי למונחים אלה יש משמעויות שונות עבור אנשים שונים.[55][56] הצהרת קונסורט 2010 מציינת כי על מחברים ועורכים להימנע מלהשתמש במונחים אלו; במקום זאת, דיווחים של RCT עם סמיות צריך לדון "אם נעשה מיסוך, מי היה 'סומא' לאחר הקצאה התערבויות (למשל, המשתתפים, מספקי הטיפול, מעריכי התוצאות) וכיצד."[57]

מחקרי RCT ללא סמיות (באנגלית: unblinded)[58] נקראים גם "פתוחים",[59] או "של תווית פתוחה" (אם ההתערבות היא תרופה).[60] מחקר מ-2008 הדגים כי תוצאות סוביקטיביות של RCT ללא סמיות נטו להיות מוטות לטובת השפעת טיפול מיטיבה, אך לא כך לגבי תוצאות אובייקטיביות;[53] למשל, ב-RCT של טיפולים לטרשת נפוצה, נוירולוגים ללא סמיות הרגישו שהטיפולים מועילים, בניגוד לנוירולוגים 'סומים'.[61] במחקרי RCT פרגמטיים, אף על פי שהמשתתפים והמטפלים הם לעיתים קרובות ללא סמיות, "עדיין רצוי ולעיתים קרובות ניתן להשאיר סמיות אצל מעריכי התוצאה או להשיג מקור אובייקטיבי של נתונים להערכת התוצאות."[38]

ניתוח נתונים[עריכת קוד מקור | עריכה]

סוגי השיטות הסטטיסטיות המשמשות במחקרי RCT תלויים במאפייני הנתונים וכוללים:

מעבר לשיטות הסטטיסטיות, שיקולים חשובים בניתוח נתוני RCT כוללים:

  • האם יש להפסיק את ה-RCT מוקדם בשל תוצאות ביניים? לדוגמה, ניתן להפסיק RCT בשלב מוקדם, אם מתברר כי ההתערבות מייצרת תועלת או נזק גדול מהצפוי, או אם חוקרים מוצאים ראיות להיעדר הבדל חשוב בין התערבויות ניסוי לבקרה.[62]
  • המידה שבה ניתן לנתח את הקבוצות בדיוק כפי שנוצרו בהקצאה האקראית (כלומר, אם נעשה שימוש ב'ניתוח לפי הכוונה לטפל' intention-to-treat analysis). ניתוח "טהור" כזה אפשרי רק כאשר זמינים נתוני תוצאות מלאים עבור כל הנבדקים שהוקצו;[63] כאשר חלק מנתוני התוצאות חסרים, אפשרויות הבחינה הסטטיסטית כוללות: ניתוח של מקרים עם תוצאות ידועות בלבד וניתוח תוך שימוש בנתונים משוערים.[64] עם זאת, ככל שהניתוחים יוכלו לכלול את סך המשתתפים בקבוצות שאליהם חולקו אקראית, ההטיה של ה-RCT תהיה פחותה.[64]
  • האם לבצע ניתוח תת-קבוצות (באנגלית: subgroup analysis)? לעיתים קרובות, ניתוחים אלה אינם רצויים שכן השוואות מרובות עשויות להניב ממצאים חיוביים כוזבים שאי אפשר לאשר על ידי מחקרים אחרים.[64]

דיווח על תוצאות[עריכת קוד מקור | עריכה]

הצהרת קונסורט CONSORT) 2010) היא מערך מינימלי, מבוסס ראיות, להמלצות על דיווחי RCT.[65] רשימת הקונסורט 2010 כוללת כ-25 פריטים (ביניהם רבים עם תת-פריטים), המתמקדים בניסויים של הקצאה אקראית יחידנית, עם שתי קבוצות במקביל, שהם הסוג השכיח ביותר של RCT.[66]

עבור עיצובי RCT אחרים, פורסמו "הרחבות קונסורט", למשל:

  • הצהרת קונסורט 2010: הרחבה על ניסויי הקצאה אקראית של אשכולות.[67]
  • הצהרת קונסורט 2010: התערבויות טיפוליות לא תרופתיות[68][69]

חשיבות יחסית ומחקרים תצפיתיים[עריכת קוד מקור | עריכה]

שני מחקרים, שפורסמו בכתב העת לרפואה של ניו-אינגלנד (באנגלית: New England Journal of Medicine) בשנת 2000, מצאו כי מחקרים תצפיתיים ומחקרי RCT הפיקו תוצאות דומות.[70][71] מחבריהם הטילו ספק "באמונה כי אין להשתמש במחקרים תצפיתיים לצורך הגדרת טיפול רפואי מבוסס ראיות", וכי תוצאות המחקר הן "עדות ברמה הגבוהה ביותר".[70][71] עם זאת, מחקר שפורסם ב-2001 בכתב העת של האיגוד הרפואי האמריקאי (באנגלית: JAMA Journal of American Medical Association) קבע כי בין מחקרים תצפיתיים לבין מחקרי RCT "ישנם פערים לא מקריים, ושכיח מאד למצוא ביניהם הבדלים בהערכת מידת ההשפעה של הטיפול".[72]

הועלו גם קווי טיעון אחרים כנגד תרומתם היחסית של מחקרי RCT לידע המדעי לעומת סוגי מחקר אחרים:

  • אם מדרגים סוגי מחקר לפי הפוטנציאל שלהם לתגליות חדשות, אזי ראיות אנקדוטיות תהינה בראש הרשימה, אחריהן מחקרים תצפיתיים, ואחריהם RCT.[73]
  • מחקרי RCT עשויים להיות מיותרים לבחינת טיפולים בעלי השפעות דרמטיות ומהירות ביחס למהלך הטבעי היציב או להדרדרות הצפויה.[74][75] דוגמה אחת היא כימותרפיה משולבת, כולל ציספלטין לסרטן אשכים גרורתי, שהגדיל את שיעור הריפוי מ -5% ל -60% במחקר לא אקראי.[75][76]

ככל השיטות הסטטיסטיות, גם מחקרי RCT עלולים ללקות בטעויות סטטיסטיות מסוג I ("חיובי כוזב") והן מסוג II ("שלילי כוזב") . לגבי שגיאות מסוג I, מחקר RCT טיפוסי ישתמש בערך p של 0.05 (כלומר, 1 ל-20) כהסתברות שיזהה שני טיפולים יעילים באותה מידה כאילו הם שונים באופן משמעותי.[77] באשר לשגיאות מסוג II, למרות פרסום של מאמר שפורסם ב-1978, שציין כי גודלי המדגם של מחקרי RCT רבים היו קטנים מכדי להסיק מסקנות ברורות לגבי התוצאות השליליות,[78] בשנים 2005–2006, שיעור לא מבוטל של דיווחי RCT עדיין כללו חישובי גודל מדגם לא מדויקים או חלקיים.[79]

ביקורת עמיתים[עריכת קוד מקור | עריכה]

ביקורת עמיתים לגבי התוצאות היא חלק חשוב של השיטה המדעית. הסוקרים בוחנים את תוצאות המחקר לגבי בעיות אפשריות בתכנון העלולות להוביל לתוצאות לא מהימנות (למשל על ידי יצירת הטיה שיטתית). העמיתים מעריכים את המחקר ביחס למחקרים קשורים וראיות אחרות, ושוקלים אם ניתן לקבל את מסקנות המחקר כמהימנות ומגובות בראיות. כדי להדגים באופן היתולי את הצורך בבדיקת עמיתים ואת הסכנה של הכללת יתר, פרסמו שני חוקרים ניסוי מבוקר עם הקצאה אקראית של 23 מתנדבים, שבו קיבלו הנבדקים מצנח או תרמיל ריק והתבקשו לקפוץ ממטוס קל או מסוק. הם דיווחו, במדויק, כי מצנחים לא צמצמו את הפציעה בהשוואה לתרמילים ריקים. ההקשר המרכזי שהגביל את תחולתה הכללית של המסקנה הזאת היה שכלי הטיס חנו על הקרקע, ושהמשתתפים קפצו רק מגובה של כשני רגל.[80]

יתרונות[עריכת קוד מקור | עריכה]

מחקרי RCT נחשבים לצורה האמינה ביותר של ראיות מדעיות בהיררכיה של הראיות המשפיעה על מדיניות הבריאות כיוון שהם מצמצמים סיבתיות-מזויפת והטיה. תוצאות RCT ניתן לשלב בסקירות שיטתיות אשר נמצאות יותר ויותר בשימוש כאמצעי להתערבות מבוססת ראיות. דוגמאות לחשיבות שמיחסים ארגונים מדעיים ל-RCT או לביקורות שיטתיות של מחקרי RCT כאיכות הגבוהה ביותר של ראיות יובאו להלן:

  • החל ב -1998, המועצה הלאומית לבריאות ולחקר רפואי של אוסטרליה קבעה ראיות מסוג 'רמה I', כאלו ש"התקבלו מסקירה שיטתית של כל ניסוי ה-RCT הרלוונטיים" ו'רמה 2' כאלו ש"התקבלו מלפחות RCT אחד מתוכנן כהלכה".[81]
  • מאז שנת 2001 לפחות, כוח המשימה של שירותי המניעה של ארצות הברית (ראשי תיבות באנגלית: USPSTF), המוציא המלצות לקביעת הנחיות קליניות, בחן הן את שיטת המחקר והן את תוקפו הפנימי, כסמנים לאיכותו.[82] הוא הכיר ב"ראיות המתקבלות מ-RCT נאות אחד לפחות", בעל תוקף פנימי טוב, כראיות האיכותיות ביותר העומדות לרשותו.[82]
  • קבוצת העבודה של GRADE הסיקה בשנת 2008 כי "ניסויים מבוקרים עם הקצאה אקראית, שלא נמצאו בהם מגבלות מהותיות, מהווים ראיות איכותיות".[83]
  • מרכז אוקספורד לרפואה מבוססת ראיות, בנושאים הקשורים ל-"טיפול / מניעה, סיבתיות / נזק", הגדיר לשנת 2011 ראיות של 'רמה 1a' כ"סקירה שיטתית של RCT המתאימים זה לזה", וכן ראיות 'רמה 1b' כ-RCT יחיד (עם מרווח ביטחון צר)."[84]

תוצאות מחקרי RCT מפתיעות וראויות לציון, כוללות:

  • לאחר אישור מינהל המזון והתרופות, תרופות נגד הפרעות קצב לב בשם פלקאיניד (flecainide) ואנקאיניד (encainide) הגיעו לשוק בשנת 1986 ו-1987 בהתאמה.[85] המחקרים הלא האקראיים לגבי התרופות תוארו כ"הצלחה מזהירה",[86] ותפוצתן בתחילת 1989 הגיעה לכ-165,000 מרשמים לחודש.[85] אולם באותה שנה, דו"ח ראשוני של RCT סיכם כי שתי התרופות הגדילו את התמותה[87] והמכירות של התרופות ירדו.[85]
  • לפני 2002, בהתבסס על מחקרים תצפיתיים, רופאים רשמו טיפול תחליף הורמונלי באופן שגרתי לנשים לאחר גיל המעבר כדי למנוע אוטם שריר הלב.[86] אך ב-2002 וב-2004, פרסומי RCT של ארגון הבריאות לנשים טענו כי נשים הנוטלות טיפול בתחליפי הורמונים עם אסטרוגן ופרוגסטין, היו בעלות שיעור גבוה יותר של אוטם שריר הלב מאשר נשים בקבוצת הפלצבו, וכי טיפול בתחליפי הורמון אסטרוגן בלבד לא גרם להפחתה השכיחות של מחלת לב כלילית.[88][89] הסברים אפשריים לפער בין המחקרים התצפיתיים ל-RCT הם בהבדלים במתודולוגיה, במשטרי ההורמונים בהם נעשה שימוש ובאוכלוסיות.[90][91] השימוש בתחליפי הורמונים פחת לאחר פרסום ה-RCT.[92]

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ K. F Schulz, D. G Altman, D. Moher, for the CONSORT Group, CONSORT 2010 Statement: updated guidelines for reporting parallel group randomised trials, BMJ 340, 2010-03-23, עמ' c332–c332 doi: 10.1136/bmj.c332
  2. ^ "A method for assessing the quality of a randomized control trial". Controlled Clinical Trials 2 (1): 31–49. 1981. PMID 7261638. doi:10.1016/0197-2456(81)90056-8. 
  3. ^ "Randomised controlled trial". National Institute for Health and Care Excellence, London, UK. 2019. בדיקה אחרונה ב-3 ביוני 2019. 
  4. ^ 4.0 4.1 D. Moher, S. Hopewell, K. F Schulz, V. Montori, CONSORT 2010 Explanation and Elaboration: updated guidelines for reporting parallel group randomised trials, BMJ 340, 2010-03-23, עמ' c869–c869 doi: 10.1136/bmj.c869
  5. ^ D. Moher, S. Hopewell, K. F Schulz, V. Montori, CONSORT 2010 Explanation and Elaboration: updated guidelines for reporting parallel group randomised trials, BMJ 340, 2010-03-23, עמ' c869–c869 doi: 10.1136/bmj.c869
  6. ^ "Design and analysis of randomized clinical trials requiring prolonged observation of each patient. I. Introduction and design". Br J Cancer 34 (6): 585–612. 1976. PMC 2025229. PMID 795448. doi:10.1038/bjc.1976.220. 
  7. ^ "Design and analysis of randomized clinical trials requiring prolonged observation of each patient. II. Analysis and examples". Br J Cancer 35 (1): 1–39. 1977. PMC 2025310. PMID 831755. doi:10.1038/bjc.1977.1. 
  8. ^ "Intracoronary autologous bone-marrow cell transfer after myocardial infarction: the BOOST randomised controlled clinical trial". Lancet 364 (9429): 141–8. 10 ביולי 2004. PMID 15246726. doi:10.1016/S0140-6736(04)16626-9. 
  9. ^ Dunn PM (ינואר 1997). "James Lind (1716-94) of Edinburgh and the treatment of scurvy". Arch. Dis. Child. Fetal Neonatal Ed. 76 (1): F64–5. PMC 1720613. PMID 9059193. doi:10.1136/fn.76.1.f64. 
  10. ^ Charles Sanders Peirce and Joseph Jastrow (1885). "On Small Differences in Sensation". Memoirs of the National Academy of Sciences 3: 73–83.  http://psychclassics.yorku.ca/Peirce/small-diffs.htm
  11. ^ Hacking, Ian (ספטמבר 1988). "Telepathy: Origins of Randomization in Experimental Design". Isis. A Special Issue on Artifact and Experiment 79 (3): 427–451. JSTOR 234674. MR 1013489. doi:10.1086/354775. 
  12. ^ Stephen M. Stigler (נובמבר 1992). "A Historical View of Statistical Concepts in Psychology and Educational Research". American Journal of Education 101 (1): 60–70. doi:10.1086/444032. 
  13. ^ Trudy Dehue (דצמבר 1997). "Deception, Efficiency, and Random Groups: Psychology and the Gradual Origination of the Random Group Design". Isis 88 (4): 653–673. PMID 9519574. doi:10.1086/383850. 
  14. ^ Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." Statistical Science 5 (4): 465–472. Trans. Dorota M. Dabrowska and Terence P. Speed.
  15. ^ Denis Conniffe, R.A. Fisher and the development of statistics - a view in his centerary year, Journal of The Statistical and Social Inquiry Society of Ireland, 1991
  16. ^
    שגיאות פרמטריות בתבנית:צ-מאמר

    פרמטרי חובה [ מחבר ] חסרים
    {{{מחבר}}}, Streptomycin Treatment of Pulmonary Tuberculosis: A Medical Research Council Investigation, BMJ 2, 1948-10-30, עמ' 769–782 doi: 10.1136/bmj.2.4582.769
  17. ^ Brown D (2 בנובמבר 1998). "Landmark study made research resistant to bias". Washington Post. 
  18. ^ "Comparison of effects in randomized controlled trials with observational studies in digestive surgery". Ann Surg 244 (5): 668–76. 2006. PMC 1856609. PMID 17060757. doi:10.1097/01.sla.0000225356.04304.bc. 
  19. ^ 19.0 19.1 "Randomized controlled trials". Am J Roentgenol 183 (6): 1539–44. 2004. PMID 15547188. doi:10.2214/ajr.183.6.01831539. 
  20. ^ Meldrum ML (2000). "A brief history of the randomized controlled trial. From oranges and lemons to the gold standard". Hematol Oncol Clin North Am 14 (4): 745–60, vii. PMID 10949771. doi:10.1016/S0889-8588(05)70309-9. 
  21. ^ D. Moher, S. Hopewell, K. F Schulz, V. Montori, CONSORT 2010 Explanation and Elaboration: updated guidelines for reporting parallel group randomised trials, BMJ 340, 2010-03-23, עמ' c869–c869 doi: 10.1136/bmj.c869
  22. ^ K. F Schulz, D. G Altman, D. Moher, for the CONSORT Group, CONSORT 2010 Statement: updated guidelines for reporting parallel group randomised trials, BMJ 340, 2010-03-23, עמ' c332–c332 doi: 10.1136/bmj.c332
  23. ^ Freedman B (1987). "Equipoise and the ethics of clinical research". N Engl J Med 317 (3): 141–5. PMID 3600702. doi:10.1056/NEJM198707163170304. 
  24. ^ Gifford F (1995). "Community-equipoise and the ethics of randomized clinical trials". Bioethics 9 (2): 127–48. PMID 11653056. doi:10.1111/j.1467-8519.1995.tb00306.x. 
  25. ^ "The ethics of randomised controlled trials from the perspectives of patients, the public, and healthcare professionals". Br Med J 317 (7167): 1209–12. 1998. PMC 1114158. PMID 9794861. doi:10.1136/bmj.317.7167.1209. 
  26. ^ Zelen M (1979). "A new design for randomized clinical trials". N Engl J Med 300 (22): 1242–5. PMID 431682. doi:10.1056/NEJM197905313002203. 
  27. ^ "What is Zelen's design?". Br Med J 316 (7131): 606. 1998. PMC 1112637. PMID 9518917. doi:10.1136/bmj.316.7131.606. 
  28. ^ "The therapeutic misconception: informed consent in psychiatric research". Int J Law Psychiatry 5 (3–4): 319–29. 1982. PMID 6135666. doi:10.1016/0160-2527(82)90026-7. 
  29. ^ 29.0 29.1 "Clinical trials and medical care: defining the therapeutic misconception". PLoS Med 4 (11): e324. 2007. PMC 2082641. PMID 18044980. doi:10.1371/journal.pmed.0040324. 
  30. ^ Jain SL (2010). "The mortality effect: counting the dead in the cancer trial". Public Culture 21 (1): 89–117. doi:10.1215/08992363-2009-017. 
  31. ^ "Clinical trial registration: a statement from the International Committee of Medical Journal Editors". The New England Journal of Medicine 351 (12): 1250–1. ספטמבר 2004. PMID 15356289. doi:10.1056/NEJMe048225. 
  32. ^ "Despite law, fewer than one in eight completed studies of drugs and biologics are reported on time on ClinicalTrials.gov.". Health Aff (Millwood) 30 (12): 2338–45. 2011. PMID 22147862. doi:10.1377/hlthaff.2011.0172. 
  33. ^ "Comparison of registered and published primary outcomes in randomized controlled trials.". JAMA 302 (9): 977–84. 2009. PMID 19724045. doi:10.1001/jama.2009.1242. 
  34. ^ Bhaumik, S (מרץ 2013). "Editorial policies of MEDLINE indexed Indian journals on clinical trial registration.". Indian Pediatr. 50 (3): 339–40. PMID 23680610. doi:10.1007/s13312-013-0092-2. 
  35. ^ 35.0 35.1 "The quality of reports of randomised trials in 2000 and 2006: comparative study of articles indexed in PubMed". BMJ 340: c723. 2010. PMC 2844941. PMID 20332510. doi:10.1136/bmj.c723. 
  36. ^ Jones, Byron; Kenward, Michael G. (2003). Design and Analysis of Cross-Over Trials (מהדורה Second). London: Chapman and Hall. 
  37. ^ Vonesh, Edward F.; Chinchilli, Vernon G. (1997). "Crossover Experiments". Linear and Nonlinear Models for the Analysis of Repeated Measurements. London: Chapman and Hall. עמ' 111–202. 
  38. ^ 38.0 38.1 38.2 38.3 Zwarenstein M, Treweek S, Gagnier JJ, Altman DG, Tunis S, Haynes B, Oxman AD, Moher D; CONSORT group; Pragmatic Trials in Healthcare (Practihc) group (2008). "Improving the reporting of pragmatic trials: an extension of the CONSORT statement". BMJ 337: a2390. PMC 3266844. PMID 19001484. doi:10.1136/bmj.a2390. 
  39. ^ 39.0 39.1 39.2 39.3 Piaggio G, Elbourne DR, Altman DG, Pocock SJ, Evans SJ; CONSORT Group (2006). "Reporting of noninferiority and equivalence randomized trials: an extension of the CONSORT statement". JAMA 295 (10): 1152–60. PMID 16522836. doi:10.1001/jama.295.10.1152. 
  40. ^ 40.0 40.1 40.2 "Generation of allocation sequences in randomised trials: chance, not choice". Lancet 359 (9305): 515–9. 2002. PMID 11853818. doi:10.1016/S0140-6736(02)07683-3. 
  41. ^ 41.0 41.1 41.2 41.3 41.4 41.5 41.6 "Allocation concealment in randomised trials: defending against deciphering". Lancet 359 (9306): 614–8. 2002. PMID 11867132. doi:10.1016/S0140-6736(02)07750-4. 
  42. ^ "In search of justification for the unpredictability paradox". Trials 15: 480. 2014. PMC 4295227. PMID 25490908. doi:10.1186/1745-6215-15-480. 
  43. ^ John M. Lachin, Statistical properties of randomization in clinical trials, Controlled Clinical Trials 9, 1988-12-01, עמ' 289–311 doi: 10.1016/0197-2456(88)90045-1
  44. ^ Rosenberger, James. "STAT 503 - Design of Experiments". Pennsylvania State University. בדיקה אחרונה ב-24 בספטמבר 2012. 
  45. ^ Avins, A L (1998). ""Can unequal be more fair? Ethics, subject allocation, and randomized clinical trials".". J Med Ethics 24 (6): 401–408. PMC 479141. PMID 9873981. doi:10.1136/jme.24.6.401. 
  46. ^ Buyse ME (1 בדצמבר 1989). "Analysis of clinical trial outcomes: some comments on subgroup analyses". Controlled Clinical Trials 10 (4 Suppl): 187S–194S. PMID 2605967. doi:10.1016/0197-2456(89)90057-3. 
  47. ^ 47.0 47.1 John M. Lachin, John P. Matts, L. J. Wei, Randomization in clinical trials: Conclusions and recommendations, Controlled Clinical Trials 9, 1988-12-01, עמ' 365–374 doi: 10.1016/0197-2456(88)90049-9
  48. ^ Lachin JM (1 בדצמבר 1988). "Statistical properties of randomization in clinical trials". Controlled Clinical Trials 9 (4): 289–311. PMID 3060315. doi:10.1016/0197-2456(88)90045-1. 
  49. ^ 49.0 49.1 49.2 49.3 John M. Lachin, John P. Matts, L. J. Wei, Randomization in clinical trials: Conclusions and recommendations, Controlled Clinical Trials 9, 1988-12-01, עמ' 365–374 doi: 10.1016/0197-2456(88)90049-9
  50. ^ "The use of response-adaptive designs in clinical trials". Controlled Clinical Trials 14 (6): 471–84. 1993. PMID 8119063. doi:10.1016/0197-2456(93)90028-C. 
  51. ^ "Allocation concealment and blinding: when ignorance is bliss". Med J Aust 182 (2): 87–9. 2005. PMID 15651970. 
  52. ^ "Comparison of descriptions of allocation concealment in trial protocols and the published reports: cohort study". BMJ 330 (7499): 1049. 2005. PMC 557221. PMID 15817527. doi:10.1136/bmj.38414.422650.8F. 
  53. ^ 53.0 53.1 53.2 "Empirical evidence of bias in treatment effect estimates in controlled trials with different interventions and outcomes: meta-epidemiological study". BMJ 336 (7644): 601–5. 2008. PMC 2267990. PMID 18316340. doi:10.1136/bmj.39465.451748.AD. 
  54. ^ Glennerster, Rachel; Kudzai Takavarasha (2013). Running randomized evaluations: a practical guide. Princeton: Princeton University Press. ISBN 9780691159249. 
  55. ^ "Physician interpretations and textbook definitions of blinding terminology in randomized controlled trials". J Am Med Assoc 285 (15): 2000–3. 2001. PMID 11308438. doi:10.1001/jama.285.15.2000. 
  56. ^ "Who is blinded in randomized clinical trials? A study of 200 trials and a survey of authors". Clin Trials 3 (4): 360–5. 2006. PMID 17060210. doi:10.1177/1740774506069153. 
  57. ^ D. Moher, S. Hopewell, K. F Schulz, V. Montori, CONSORT 2010 Explanation and Elaboration: updated guidelines for reporting parallel group randomised trials, BMJ 340, 2010-03-23, עמ' c869–c869 doi: 10.1136/bmj.c869
  58. ^ "The SANAD study of effectiveness of valproate, lamotrigine, or topiramate for generalised and unclassifiable epilepsy: an unblinded randomised controlled trial". Lancet 369 (9566): 1016–26. 2007. PMC 2039891. PMID 17382828. doi:10.1016/S0140-6736(07)60461-9. 
  59. ^ "Oral versus intravenous antibiotics for community acquired lower respiratory tract infection in a general hospital: open, randomised controlled trial". BMJ 310 (6991): 1360–2. 1995. PMC 2549744. PMID 7787537. doi:10.1136/bmj.310.6991.1360. 
  60. ^ Fukase K, Kato M, Kikuchi S, Inoue K, Uemura N, Okamoto S, Terao S, Amagai K, Hayashi S, Asaka M; Japan Gast Study Group (2008). "Effect of eradication of Helicobacter pylori on incidence of metachronous gastric carcinoma after endoscopic resection of early gastric cancer: an open-label, randomised controlled trial". Lancet 372 (9636): 392–7. PMID 18675689. doi:10.1016/S0140-6736(08)61159-9. 
  61. ^ "The impact of blinding on the results of a randomized, placebo-controlled multiple sclerosis clinical trial". Neurology 44 (1): 16–20. 1994. PMID 8290055. doi:10.1212/wnl.44.1.16. (הקישור אינו פעיל, 17.7.2019)
  62. ^ D. Moher, S. Hopewell, K. F Schulz, V. Montori, CONSORT 2010 Explanation and Elaboration: updated guidelines for reporting parallel group randomised trials, BMJ 340, 2010-03-23, עמ' c869–c869 doi: 10.1136/bmj.c869
  63. ^ "What is meant by intention to treat analysis? Survey of published randomised controlled trials". Br Med J 319 (7211): 670–4. 1999. PMC 28218. PMID 10480822. doi:10.1136/bmj.319.7211.670. 
  64. ^ 64.0 64.1 64.2 D. Moher, S. Hopewell, K. F Schulz, V. Montori, CONSORT 2010 Explanation and Elaboration: updated guidelines for reporting parallel group randomised trials, BMJ 340, 2010-03-23, עמ' c869–c869 doi: 10.1136/bmj.c869
  65. ^ CONSORT Group. "Welcome to the CONSORT statement Website". בדיקה אחרונה ב-29 במרץ 2010. 
  66. ^ Schulz KF, Altman DG, ((Moher D; for the CONSORT Group)) (23 במרץ 2010). "CONSORT 2010 Statement: updated guidelines for reporting parallel group randomised trials". BMJ 340: c332. PMC 2844940. PMID 20332509. doi:10.1136/bmj.c332. 
  67. ^ "Consort 2010 statement: extension to cluster randomised trials". BMJ 345 (e5661): e5661. 2012. PMID 22951546. doi:10.1136/bmj.e5661. 
  68. ^ "Extending the CONSORT Statement to randomized trials of nonpharmacologic treatment: explanation and elaboration". Annals of Internal Medicine 148 (4): 295–309. 2008. PMID 18283207. doi:10.7326/0003-4819-148-4-200802190-00008. 
  69. ^ "Methods and Processes of the CONSORT Group: Example of an Extension for Trials Assessing Nonpharmacologic Treatments". Annals of Internal Medicine 148 (4): W60–6. 2008. PMID 18283201. doi:10.7326/0003-4819-148-4-200802190-00008-w1. 
  70. ^ 70.0 70.1 "A comparison of observational studies and randomized, controlled trials". N Engl J Med 342 (25): 1878–86. 2000. PMID 10861324. doi:10.1056/NEJM200006223422506. 
  71. ^ 71.0 71.1 "Randomized, controlled trials, observational studies, and the hierarchy of research designs". N Engl J Med 342 (25): 1887–92. 2000. PMC 1557642. PMID 10861325. doi:10.1056/NEJM200006223422507. (הקישור אינו פעיל, 17.7.2019)
  72. ^ "Comparison of evidence of treatment effects in randomized and nonrandomized studies". J Am Med Assoc 286 (7): 821–30. 2001. PMID 11497536. doi:10.1001/jama.286.7.821. 
  73. ^ Vandenbroucke JP (11 במרץ 2008). "Observational research, randomised trials, and two views of medical science". PLoS Med 5 (3): e67. PMC 2265762. PMID 18336067. doi:10.1371/journal.pmed.0050067. 
  74. ^ Black N (1996). "Why we need observational studies to evaluate the effectiveness of health care". BMJ 312 (7040): 1215–8. PMC 2350940. PMID 8634569. doi:10.1136/bmj.312.7040.1215. 
  75. ^ 75.0 75.1 "When are randomised trials unnecessary? Picking signal from noise". Br Med J 334 (7589): 349–51. 2007. PMC 1800999. PMID 17303884. doi:10.1136/bmj.39070.527986.68. 
  76. ^ Einhorn LH (2002). "Curing metastatic testicular cancer". Proc Natl Acad Sci U S A 99 (7): 4592–5. PMC 123692. PMID 11904381. doi:10.1073/pnas.072067999. 
  77. ^ Wittes J (2002). "Sample size calculations for randomized controlled trials". Epidemiol Rev 24 (1): 39–53. PMID 12119854. doi:10.1093/epirev/24.1.39. 
  78. ^ "The importance of beta, the type II error and sample size in the design and interpretation of the randomized control trial. Survey of 71 "negative" trials". N Engl J Med 299 (13): 690–4. 1978. PMID 355881. doi:10.1056/NEJM197809282991304. 
  79. ^ "Reporting of sample size calculation in randomised controlled trials: review". Br Med J 338: b1732. 12 במאי 2009. PMC 2680945. PMID 19435763. doi:10.1136/bmj.b1732. 
  80. ^ Richard Harris (22 בדצמבר 2018). "Researchers Show Parachutes Don't Work, But There's A Catch". 
  81. ^ National Health and Medical Research Council (16 בנובמבר 1998). A guide to the development, implementation and evaluation of clinical practice guidelines. Canberra: Commonwealth of Australia. עמ' 56. ISBN 978-1-86496-048-8. בדיקה אחרונה ב-28 במרץ 2010. (הקישור אינו פעיל, 17.7.2019)
  82. ^ 82.0 82.1 Harris RP, Helfand M, Woolf SH, Lohr KN, Mulrow CD, Teutsch SM, Atkins D; Methods Work Group, Third US Preventive Services Task Force (2001). "Current methods of the US Preventive Services Task Force: a review of the process". Am J Prev Med 20 (3 Suppl): 21–35. PMID 11306229. doi:10.1016/S0749-3797(01)00261-6. 
  83. ^ Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schünemann HJ; GRADE Working Group (2008). "What is "quality of evidence" and why is it important to clinicians?". BMJ 336 (7651): 995–8. PMC 2364804. PMID 18456631. doi:10.1136/bmj.39490.551019.BE. 
  84. ^ Oxford Centre for Evidence-based Medicine (16 בספטמבר 2011). "Levels of evidence". בדיקה אחרונה ב-15 בפברואר 2012. 
  85. ^ 85.0 85.1 85.2 "Impact of the Food and Drug Administration approval of flecainide and encainide on coronary artery disease mortality: putting "Deadly Medicine" to the test". Am J Cardiol 79 (1): 43–7. 1 בינואר 1997. PMID 9024734. doi:10.1016/S0002-9149(96)00673-X. 
  86. ^ 86.0 86.1 Rubin R (16 באוקטובר 2006). "In medicine, evidence can be confusing - deluged with studies, doctors try to sort out what works, what doesn't". USA Today. בדיקה אחרונה ב-22 במרץ 2010. 
  87. ^ Cardiac Arrhythmia Suppression Trial (CAST) Investigators (10 באוגוסט 1989). "Preliminary report: effect of encainide and flecainide on mortality in a randomized trial of arrhythmia suppression after myocardial infarction. The Cardiac Arrhythmia Suppression Trial (CAST) Investigators". N Engl J Med 321 (6): 406–12. PMID 2473403. doi:10.1056/NEJM198908103210629. 
  88. ^ Rossouw JE, Anderson GL, Prentice RL, LaCroix AZ, Kooperberg C, Stefanick ML, Jackson RD, Beresford SA, Howard BV, Johnson KC, Kotchen JM, Ockene J; Writing Group for the Women's Health Initiative Investigators (17 ביולי 2002). "Risks and benefits of estrogen plus progestin in healthy postmenopausal women: principal results from the Women's Health Initiative randomized controlled trial". J Am Med Assoc 288 (3): 321–33. PMID 12117397. doi:10.1001/jama.288.3.321. 
  89. ^ "Effects of conjugated equine estrogen in postmenopausal women with hysterectomy: the Women's Health Initiative randomized controlled trial". JAMA 291 (14): 1701–12. 14 באפריל 2004. PMID 15082697. doi:10.1001/jama.291.14.1701. 
  90. ^ "Understanding the divergent data on postmenopausal hormone therapy". N Engl J Med 348 (7): 645–50. 2003. PMID 12584376. doi:10.1056/NEJMsb022365. 
  91. ^ Vandenbroucke JP (2009). "The HRT controversy: observational studies and RCTs fall in line". Lancet 373 (9671): 1233–5. PMID 19362661. doi:10.1016/S0140-6736(09)60708-X. 
  92. ^ "Changes in postmenopausal hormone replacement therapy use among women with high cardiovascular risk". Am J Public Health 99 (12): 2184–7. 15 באוקטובר 2009. PMC 2775780. PMID 19833984. doi:10.2105/AJPH.2009.159889.