מדגם
בסטטיסטיקה, מדגם הוא קבוצת פרטים המהווה מודל לאוכלוסייה אליה היא שייכת.
מחקר הנערך על מדגם מכונה סקר. הפרטים במדגם עשויים להיות בני אדם מאוכלוסייה אנושית כל שהיא, בעלי חיים ואפילו עצמים דוממים (למשל, מדגם של גפרורים נבדק כדי לאמוד את אחוז הגפרורים שלא נדלקים מכלל אוכלוסיית הגפרורים המיוצרת במפעל מסוים).
ככל שבחירת המדגם (דגימה) נעשית באופן התואם יותר את המלצות הסטטיסטיקאים, כך ניתן להסיק מהסקר מסקנות מדויקות יותר וסבירות יותר על אודות האוכלוסייה הרחבה שאותה מייצג המדגם. אולם, הרבה פעמים יש להתפשר על איכות המדגם.
תוכן עניינים |
[עריכה] מדוע משתמשים במדגם במקום בכלל האוכלוסייה?
רק לעתים רחוקות נערך מחקר בקרב כל האוכלוסייה הנבדקת. למחקר כזה קוראים מפקד אוכלוסין. לדוגמה (מפקד האוכלוסין והדיור, שאותו עורכת הלשכה המרכזית לסטטיסטיקה מדי עשר שנים בערך). הסיבות לכך שמפקדים הם מחקרים נדירים הן
- עלותו של מפקד עשויה להיות גבוהה מאוד.
- חלק מהמחקרים עושים נזק בלתי הפיך לפרטים הנבדקים. אין טעם, למשל, לבדוק אם כל הגפרורים שהמפעל מיצר באמת נדלקים.
- יש מחקרים שאוכלוסיית היעד שלהם כוללת גם פרטים שאי אפשר להשיג לצורך מחקר. הדוגמה המובהקת לזה היא במחקרים ברפואה. מחקר רפואי אינו מתעניין רק באוכלוסיית האנשים שכבר נולדו אלא ב-"אוכלוסיית העל" של כל האנשים שעשויים להיוולד.
[עריכה] מדגם מייצג
מדגם מייצג הוא גודל המדגם המינימלי, בדגימה היסתברותית, המאפשר דיוק ניכר בהסקת המידע הסטטיסטי. גודל זה מושפע הן מגודל האוכלוסייה כולה והן מהשונות שיש באוכלוסייה לגבי התכונה הנחקרת. לדוגמה - סקר בחירות במדינה עם אוכלוסייה גדולה שעל פי רוב נבחרות לפרלמנט שלה מפלגות רבות צריך להכיל מדגם גדול יותר מאשר סקר בחירות במדינה קטנה שעל פי רוב נבחרות לפרלמנט שלה רק שתי מפלגות.
[עריכה] סוגי מדגמים
על מנת שניתן יהיה להסיק מתוך המדגם מסקנות לגבי האוכלוסייה, על המדגם להיות מדגם הסתברותי. כדי שמדגם יוגדר כהסתברותי, לכל פרט באוכלוסייה חייב להיות סיכוי להיכלל במדגם, ועל הסיכוי הזה להיות ידוע - דבר המחייב מסגרת דגימה - רשימה הכוללת את כל הפרטים באוכלוסייה.
[עריכה] מדגמים הסתברותיים
מדגם הסתברותי הוא כל מדגם שהפרטים בו נבחרו בעזרת הגרלה מתוך כלל הפרטים שבאוכלוסייה. היכולת לדגום מדגם הסתברותי תלויה באפשרות לקיים הגרלה כזו. כדי לקיים הגרלה כזו צריך רשימה של כלל הפרטים שבאוכלוסייה. רשימה כזו קרויה מסגרת דגימה. במקרים רבים, מסגרת הדגימה היא רשימה מקורבת של כלל הפרטים באוכלוסייה. דוגמאות למסגרות דגימה: רשימת כל התלמידים הרשומים לכל בתי הספר בישראל היא מסגרת דגימה המכילה רשימה מקורבת של כלל הילדים בישראל בין הגילים שש לשמונה עשרה, פנקס הבוחרים הוא מסגרת דגימה המכילה רשימה מקורבת לכלל אזרחי ישראל מעל גיל 18.
- דגימה אקראית פשוטה
- המדגם ההסתברותי הפשוט ביותר נקרא מדגם אקראי פשוט. במדגם כזה כל פרט ופרט נבחר למדגם בהליך אקראי מתוך מסגרת הדגימה, כך שלכל פרט במסגרת יש אותו סיכוי להיות במדגם. מדגם כזה נותן ייצוג טוב של האוכלוסייה ויכולת הכללה, אך חסרונו הוא שתת-אוכלוסיות קטנות אינן באות לידי ביטוי בו, שכן אין כל ביטחון שאכן תידגם כמות מספקת מאותה תת-אוכלוסייה. דוגמה: אם מסגרת הדגימה היא רשימת שמות, כל שם ושם נבחר מהרשימה בהגרלת מקומו ברשימה.
- דגימה שיטתית
- בחירת הנדגם הראשון נעשית בהגרלה אקראית ובחירת שאר הנדגמים נעשית לפי יחס מסוים לנדגם הראשון. לדוגמה: אם מסגרת הדגימה היא ספר הטלפונים, שמו של הנדגם הראשון מוגרל במקריות מתוך כלל השמות שבספר הטלפונים, שמו של הנדגם השני מופיע בדיוק עשרה עמודים מאוחר יותר בספר הטלפונים, שמו של השלישי מופיע בדיוק עשרה עמודים אחרי השני וכך הלאה. דגימה שיטתית מונעת בחירת פרטים שמקומם במסגרת המדגם סמוך מסיבות שאינן מקריות. למשל, דגימה שיטתית של עשרה אנשים מספר הטלפונים תמנע מצב בו לרבים מהנדגמים יש אותו שם משפחה משום שהם מאותה העדה.
- דגימת שכבות
- כדי להבטיח ייצוג של תת-אוכלוסיות קטנות במדגם, אשר לא באות לידי ביטוי בדגימה אקראית פשוטה, ניתן להשתמש בדגימת שכבות. בעת בחירת המדגם, מבטיחים מכסה מסוימת של נדגמים מכל תת-אוכלוסייה. לאחר מכן, בעת הניתוח הסטטיסטי, משוקללות השכבות על מנת שלא ליצור הטיה בשל עודף יצוג של תת-הקבוצות.
- דגימת אשכולות
- שתי השיטות לעיל הן קשות ליישום באוכלוסיות גדולות (ברמת אוכלוסיית מדינה) משתי סיבות עיקריות: ראשית, מסגרת דגימה אינה זמינה תמיד לאוכלוסיות כאלו ושנית - התפרסות של המדגם על כל אזורי הארץ גוררת הוצאות גבוהות. במקרה כזה נעשה שימוש במדגם אשכולות. האוכלוסייה הנדגמת מחולקת לאשכולות (גאוגרפיים בדרך-כלל). לאחר מכן נערכת דגימה אקראית של אשכולות, ובשלב הבא - דגימה אקראית של פרטים מתוך כל אשכול שנבחר.
ניתן לשלב דגימת שכבות ודגימת אשכולות - לדוגמה, לבחור לפי שכבות מסוימות בתוך כל אשכול.
[עריכה] מדגמים לא הסתברותיים
עריכת מדגם הסתברותי עשויה להיות הליך ארוך ויקר. כמו כן, היא אינה אפשרית כאשר אין מסגרת דגימה. לכן, חוקרים משתמשים פעמים רבות במדגמים לא הסתברותיים.
שיטות שונות לדגימה לא הסתברותית:
- מדגם נוחות
- שיטה זו מתבססת על בחירת הנחקרים הנגישים ביותר לעורך המחקר. יתרונה הגדול של שיטה זו הוא המחיר הזול שלה. חסרונותיה הם שהמדגם יהיה בהכרח מקבוצה חברתית מסוימת ולכן לא יהיה מייצג. שיטה זו מקובלת במחקרים ראשוניים (כמו ניסוי פיילוט).
- מדגם מומחים
- מדגם מומחים הוא סוג של מדגם נוחות. במדגם כזה יש משתתפים בודדים המכירים היטב את אוכלוסיית היעד של המחקר ומנסים להעיד בשמה על צרכיה ודעתה. מדגם כזה מקובל בבדיקת אב טיפוס של ציוד טכנולוגי. שלושה עד חמישה מומחים לנגישות יכולים למצוא במחקר כזה בעיות בעיצוב המוצר שיפריעו לאנשים עם לקויות להשתמש בציוד.
- מדגם מתנדבים
- פרסום קריאה לנחקרים, בחינם או תמורת תשלום, וקבלת כל הפונים שנמצאים מתאימים למחקר. לשיטה זו יש חסרונות סטטיסטיים גדולים מזו של דגימת הנוחות משום שקשה לדעת מה הגורמים המטים את הדגימה - החוקר אינו יודע מה גורם לנבדקים לפנות אליו. שיטה זו גם יקרה יותר מדגימת הנוחות משום שהיא כוללת פרסום מודעות בציבור הרחב ועשויה לכלול נסיעות ארוכות לצורך פגישה עם המשתתפים במחקר. מקובל להשתמש בשיטה זו רק כשאין ברירה אחרת.
- מדגם כדור שלג
- לאחר פנייה של החוקר ל'מעגל הראשון' של הנדגמים, הם פונים לחבריהם ומפנים אותם לחוקר, וכך הלאה. שיטה זו שימושית במיוחד בחקר תופעות שאינן פומביות, כמו שימוש בסמים. חסרונה העיקרי הוא שהיא דוגמת רשת חברתית אחת.
[עריכה] זיווגים
דגימת זיווגים יכולה להיות הסתברותית או לא הסתברותית. מחקרים המשתמשים בשיטה זו הם בעלי כח סטטיסטי רב מאשר מחקרים שאינם משתמשים בה, משום שבשיטה זו כל נבדק מושווה לנבדק נוסף אחד בניגוד להשוואה כללית של שתי קבוצות מדגם.
דוגמאות לדגימת זיווגים אקראית:
- דגימה אקראית של זוגות תאומים והשוואתם - מחקרי תאומים.
- דגימה אקראית של זוגות נשואים והשוואתם.
- דגימה אקראית של אנשים כל שהם ובדיקתם פעם אחת לפני טיפול מסוים ופעם שניה אחרי אותו טיפול. כל אדם מושווה כך לעצמו לפני ואחרי הטיפול.
- בחירה אקראית של אנשים ועבור כל נבחר, בוחרים גם קרוב משפחה שלו מדרגה ראשונה (בנו, בתו, אחיו, אחותו, אביו או אמו).
- בחירה אקראית של אנשים והשוואת תפקוד יד ימינם לתפקוד יד שמאלם.
דגימת זיווגים שאינה אקראית משמשת נעשית כאשר קשה למצוא מדגם זיווגים אקראי. למשל, במקרה בו אוכלוסיית היעד קטנה. תפקוד ידיים אצל אנשים עם שיתוק מוחין מקובל לבדוק במדגם מזווג שבו אנשים שרק אחת מידיהם פגועה. אצל כל אחד מהם משווים את פעילות היד הפגועה לפעילות היד שאינה פגועה ומסיקים מסקנות על כלל האנשים שידיהם פגועות לעומת כלל האנשים שידיהם אינן פגועות[1].
[עריכה] גודל המדגם
גודל מדגם הוא גורם המשפיע מחד על עלות וזמן עריכת המחקר, אך מאידך על העוצמה סטטיסטית של המחקר ועל יכולתו של המדגם ליצג את כלל תת-האוכלוסיות שבאוכלוסייה הנחקרת. גודל המדגם הנדרש מושפע בעיקר מגודל רווח הסמך הנדרש לתוצאות הסקר, מגודל האוכלוסייה כולה ומהשונות שיש באוכלוסייה לגבי התכונה הנחקרת. לדוגמה - סקר בחירות במדינה עם אוכלוסייה גדולה שיש בה מפלגות רבות המתמודדות על השלטון צריך להכיל מדגם גדול יותר מאשר סקר בחירות במדינה קטנה שיש בה רק שתי מפלגות המתמודדות על השלטון.
כשנחקרת תכונה המתפלגת באוכלוסייה בהתפלגות נורמלית, באוכלוסייה שניתן להחשיב את גודלה לאין סופי, גודל המדגם הדרוש הוא
, כאשר סיגמא היא סטיית התקן של התכונה הנחקרת באוכלוסייה, E הוא גודל רווח הסמך הדרוש, וZ של חצי אלפא הוא גודל התלוי בהתפלגות הנורמלית הסטנדרטית ובמובהקות הדרושה.
[עריכה] מדגמים בבקרת איכות
בתהליך בקרת איכות של מוצר תעשייתי, נערכת בדיקה קפדנית של מדגם מתוך כלל המוצרים שיצאו מפס הייצור, כדי לעמוד על איכותם של כלל המוצרים. במקרה זה ניתן להסתפק במדגם אקראי, שהרי אין הבדל מהותי בין המוצרים היוצאים מפס הייצור.
דוגמאות למצבים שבהם נוצר צורך בבחירתה הקפדנית של אוכלוסיית מדגם:
- סקר בחירות: ניסיון לחזות את תוצאות הבחירות מיד עם תום יום הבחירות, על סמך מדגם קטן של אוכלוסיית המצביעים.
- סקר דעת קהל: סקר שבו נבדקת דעתו של ציבור מסוים (כל תושבי המדינה או מגזר מסוים מתוכם) בנושא מסוים.
- רייטינג: קביעת מספר הצופים בכל אחת מתוכניות הטלוויזיה המשודרות. לרייטינג השפעה גדולה על מחיר הפרסומות המשודרות בתוכנית ועל לוח השידורים, ולכן נודעת חשיבות גדולה להרכב אוכלוסיית המדגם. בישראל קובעת אוכלוסיית מדגם בת מאות ספורות של משפחות את הרייטינג המשקף את הצפייה בתוכניות המשודרות ליותר ממיליון משפחות.
[עריכה] ראו גם
[עריכה] קישורים חיצוניים
יורם שורק, הסטטיסטיקה לא אומרת הכל, באתר נענע 10
מאמר באנגלית על ביצוע מחקר בתנאי קונפליקט ועל דגימה בשיטת מדגם "כדור השלג" http://jpr.sagepub.com/content/48/4/423.abstract