מהימנות (שיטות מחקר)

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
Gnome-colors-edit-find-replace.svg יש לשכתב ערך זה. הסיבה לכך היא: הפתיח והמשך הערך מתייחסים לתחום הפסיכומטריה ומדעי ההתנהגות בלבד ומפנים לקישורים בתחום זה, בעוד שהערך אמור לעסוק בשיטות מחקר, הכוללות גם ביולוגיה, רפואה ועוד. כמו כן, הערך מערבב מהימנות עם תוקף, שני מושגים נפרדים ובלתי תלויים, והטענה שאחד הוא היבט של השני אינה נכונה. כמו כן הוא משתמש בניסוחים מעגליים כמו "המידה שבה כלי המדידה מודד" - שאינם עוזרים להבנה.
אתם מוזמנים לסייע ולתקן את הבעיות, אך אנא אל תורידו את ההודעה כל עוד לא תוקן הדף. אם אתם סבורים כי אין בדף בעיה, ניתן לציין זאת בדף השיחה.

מהימנות היא מונח בשיטות מחקר, המסמל את המידה שבה כלי המדידה מודד את הידע או הכישורים באופן עקבי. מדד נחשב למהימן, ככל שהוא משקף את הערכים האמיתיים שאותם הוא מיועד למדוד. כלומר, ככל שהוא מדויק יותר‏[1] ושיש בו פחות טעויות מדידה.

טעות מדידה היא הפער ההיפותטי בין הציון הנצפה לבין הציון האמיתי בהערכה מסוימת. טעויות מדידה פוגמות בשימושיות של המדידה, משום שהן מגבילות את מידת ההכללה של התוצאות מעבר למדידה הספציפית‏[1].

המהימנות נמדדת לצד התוקף של המחקר או המבחן. במקרים רבים מתייחסים למהימנות כמאפיין עצמאי של הנתונים המופקים מכלי המדידה. למעשה המהימנות היא אחד מההיבטים של התוקף, משום שרמת המהימנות מצביעה בסופו של דבר על מידת השימושיות והאמינות של הפרשנות המתבצעת על נתונים אלו‏[1].

שימוש במחקר[עריכת קוד מקור | עריכה]

מדידה בעלת מהימנות מלאה היא מדידה מדויקת אשר תפיק תוצאות זהות בבדיקות חוזרות של אותם נבדקים. הצורך בבדיקת המהימנות נובע מההנחה שבכל מדידה של מדעי ההתנהגות יש טעות כלשהי, היכולה להיגרם מסיבות הקשורות למטרת המדידה או מצב הנבדק. זאת אומרת שכלי המדידה יכולים להפיק נתונים שונים, גם כאשר המדידות החוזרות נערכות בתנאים מבוקרים מאוד. זאת משום שהמערכת האנושית היא מורכבת ומסובכת, כך שאינה מאפשרת בידוד מושלם של המרכיבים שמבקשים למדוד. בנוסף, על פי רוב המדידה נעשית באופן עקיף שיכול ליצור משתנים מתערבים המשפיעים על הביצוע של הנבדק ואינם בשליטת הבוחן‏[1].

מאחר שלמהימנות יש השלכות לגבי השימושיות של תוצאות המדידה, הצורך בדיוק גדל ככל שחשיבות ההחלטות המבוססות עליהן גדלה‏[1].

הערכה סטטיסטית של המהימנות[עריכת קוד מקור | עריכה]

בניגוד לתוקף, מהימנות ניתנת להערכה סטטיסטית.

לגבי מחקר או מבחן מהימן, ניתן להסיק בעזרת כלים סטטיסטיים שהתוצאות בו אינן מקריות, ויחסית אינן מושפעות מגורמים חיצוניים לבחינה (כגון מזג האוויר, היום בשבוע, שעה, עייפות וכו'). מידת המהימנות נמדדת בעזרת "מקדם המהימנות", הנע בין 0 (חוסר מהימנות) ל-1 (מהימנות מושלמת) ומשקף את המידה בה הערך הנצפה מושפע מהמשתנה הלטנטי (חבוי) שאותו אנו מודדים, לעומת השפעות אחרות, המכונות "רעש". מקדם המהימנות מוגדר כיחס שבין שונות המשתנה האמיתי לבין שונות המשתנה הנצפה (הנמדד באמצעות המכשיר שמהימנותו עומדת לבחינה):

r_{tt}=\frac{{\sigma}^2_t}{{\sigma}^2_o}=1-\frac{{{\sigma}^2_e}}{{{\sigma}^2_o}}

כאשר: σt סטיית תקן משתנה אמיתי; σo סטיית תקן משתנה נצפה; σe סטיית תקן משתנה הטעות. כאשר אין שום טעות מדידה, שונות משתנה הטעות היא 0 ומקדם המהימנות שווה 1. כאשר אין שונות במשתנה האמיתי וכל השונות של המשתנה הנצפה נובעת מטעויות מדידה, שונות משתנה הטעות שווה לשונות המשתנה הנצפה ולכן מקדם המהימנות שווה 0. לרוב השאיפה היא למקדם מהימנות של 0.8 ומעלה. הבעיה העיקרית היא שאין דרך לדעת את גודל השונות של המשתנה האמיתי. הערכים העומדים לרשותו של החוקר הם מטבע הדברים רק ערכי המשתנה הנצפה. לכן ההגדרה התאורטית כשהיא לעצמה אינה ישימה, ובפועל נעשה שימוש בשיטות מקורבות כמפורט להלן.

שיטות מעשיות לבדיקת מהימנות[עריכת קוד מקור | עריכה]

ישנן מספר שיטות לבדיקת מהימנות:

  • מהימנות מדידה: קריטריון המעריך את אמיתות הערכים שהתקבלו במדידה. אם המדידה מהימנה, הרי שחזרה עליה באותם תנאים תניב תוצאות זהות.
  • מהימנות מבחן חוזר: (Test-Retest) העיקביות של התוצאות בין מועדים שונים.
  • מהימנות טפסים מקבילים: מהימנות השוואת ההישגים של אותם נבדקים בשני מבחנים מקבילים.
  • מהימנות בין שופטים: עקביות תוצאות כלי מדידה פורמלי עבור מודדים שונים.
מהימנות בין שופטים נמדדת על ידי בדיקה של קבוצת תשובות או תוצרים של מבחן על ידי שני מעריכים והשוואת תוצאות הבדיקה. הגורם הנבדק הוא המתאם בין הציונים שניתנו על ידי שני המעריכים. אין צורך לבדוק מהימנות בין שופטים במבחנים המורכבים משאלות סגורות, שכן באלו אין השפעה למעריך על הציון.
  • מהימנות פנימית: מידת ההומוגניות של המבחן. אחת הדרכים למדוד מהימנות זו היא בעזרת נוסחת האלפא של קרונבאך, הבודקת את המהימנות הפנימית של המבחן על ידי בחינת המתאם הפנימי של הפריטים שבו. לרוב, השאיפה היא לקבל "אלפא" של 0.7 לפחות. בהנחה שהפריטים הנבדקים מתואמים זה עם זה חיובית, מהימנות האלפא של קרונבאך אמורה לגדול ככל שמספר הפריטים בשאלון גדל.

מבחן יכול להימצא מהימן בסוג מהימנות אחד ולא מהימן בסוג אחר – כל סוגי המהימנות חשובים, לא מספיק לקבל מהימנות גבוהה בסוג אחד ונמוכה באחר. לא ניתן לקבל החלטות על סמך נתונים מכלי-מדידה לא יציב (לא מהימן).

הגברת מהימנות בעת מבחן[עריכת קוד מקור | עריכה]

כדי להגביר מהימנות של מבחנים, מומלץ לבצע את הדברים הבאים:

  1. לבנות מבחן עם מספר רב יחסית של שאלות.
  2. לבחון כל נושא באמצעות מספר פריטים.
  3. לצמצם את הסיכוי להצליח באמצעות ניחוש או העתקה.
  4. לבדוק שאלות פתוחות (וגם עבודות) לפי קריטריון קבוע.

אם נערך מבחן חוזר (מועד ב', מבחן נוסף למי שנכשל וכיוצא בזה) יש להקפיד על:

  1. מבנה בחינה זהה (מספר השאלות וסוגן, יש/אין בחירה של שאלות).
  2. צורת בחינה זהה (שימוש/אי שימוש בחומר עזר, משך הזמן).

ראו גם[עריכת קוד מקור | עריכה]

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ 1.0 1.1 1.2 1.3 1.4 מנוחה בירנבוים (1997). חלופות בהערכת הישגים. רעננה: רמות.