מדגם

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בסטטיסטיקה, מדגם הוא קבוצת פרטים, המהווה מודל לאוכלוסייה, אליה היא שייכת. הפרטים במדגם עשויים להיות בני אדם מאוכלוסייה אנושית כל שהיא, בעלי חיים ואפילו עצמים דוממים (למשל, מדגם של גפרורים נבדק כדי לאמוד את אחוז הגפרורים שלא נדלקים, מכלל אוכלוסיית הגפרורים המיוצרת במפעל מסוים).

מחקר הנערך על מדגם מכונה סקר. ככל שבחירת המדגם ("דגימה") נעשית באופן התואם יותר את המלצות הסטטיסטיקאים, כך ניתן להסיק מהסקר מסקנות מדויקות יותר וסבירות יותר על אודות האוכלוסייה הרחבה שאותה מייצג המדגם. אולם, הרבה פעמים יש להתפשר על איכות המדגם.

הסיבות לשימוש במדגם[עריכת קוד מקור | עריכה]

בסטטיסטיקה נהוג להסיק ממסקנות אודות אוכלוסייה מסוימת על סמך מדגם‏[1]. רק לעתים רחוקות נערך מחקר בקרב כל האוכלוסייה הנבדקת. למחקר כזה קוראים מפקד אוכלוסין. לדוגמה (מפקד האוכלוסין והדיור, שאותו עורכת הלשכה המרכזית לסטטיסטיקה מדי עשר שנים בערך). הסיבות לכך שמפקדים הם מחקרים נדירים הן:

  1. עלותו של מפקד עשויה להיות גבוהה מאוד.
  2. חלק מהמחקרים עושים נזק בלתי הפיך לפרטים הנבדקים. אין טעם, למשל, לבדוק אם כל הגפרורים שהמפעל מיצר באמת נדלקים.
  3. יש מחקרים שאוכלוסיית היעד שלהם כוללת גם פרטים שאי אפשר להשיג לצורך מחקר. לדוגמה, אוכלוסיית המכורים לסמים - לא סביר שמאה אחוז מהמכורים לסמים יודו בדבר לצורך המחקר. דוגמה מובהקת אחרת לזה היא במחקרים ברפואה: מחקר רפואי אינו מתעניין רק באוכלוסיית האנשים שכבר נולדו אלא ב-"אוכלוסיית העל" של כל האנשים שעשויים להיוולד.

מדגם מייצג[עריכת קוד מקור | עריכה]

מדגם מייצג הוא גודל המדגם המינימלי, בדגימה היסתברותית, המאפשר דיוק ניכר בהסקת המידע הסטטיסטי. גודל זה מושפע הן מגודל האוכלוסייה כולה והן מהשונות שיש באוכלוסייה לגבי התכונה הנחקרת. לדוגמה - סקר בחירות במדינה עם אוכלוסייה גדולה, שעל פי רוב נבחרות לפרלמנט שלה מפלגות רבות צריך להכיל מדגם גדול יותר מאשר סקר בחירות במדינה קטנה, שעל פי רוב נבחרות לפרלמנט שלה רק שתי מפלגות.

גודל המדגם[עריכת קוד מקור | עריכה]

גודל מדגם הוא גורם המשפיע מחד על עלות וזמן עריכת המחקר, אך מאידך על העוצמה סטטיסטית של המחקר ועל יכולתו של המדגם ליצג את כלל תת-האוכלוסיות שבאוכלוסייה הנחקרת. גודל המדגם הנדרש מושפע בעיקר מגודל רווח הסמך הנדרש לתוצאות הסקר, מגודל האוכלוסייה כולה ומהשונות שיש באוכלוסייה לגבי התכונה הנחקרת.

כשנחקרת תכונה המתפלגת באוכלוסייה בהתפלגות נורמלית, באוכלוסייה שניתן להחשיב את גודלה לאין סופי, גודל המדגם הדרוש הוא  \left( \frac {\sigma z(\frac{\alpha}{2})}{E}\right)^2 , כאשר סיגמא היא סטיית התקן של התכונה הנחקרת באוכלוסייה, E הוא גודל רווח הסמך הדרוש, וZ של חצי אלפא הוא גודל התלוי בהתפלגות הנורמלית הסטנדרטית ובמובהקות הדרושה.

סוגי מדגמים[עריכת קוד מקור | עריכה]

כמו כל מודל אחר, ככול שקל יותר להשתכנע, שהוא מיצג נאמנה את המערכת שהוא מדמה, כך המסקנות המוסקות בעזרתו הן תקפות יותר. לכן "מדגם מייצג" (ראו למעלה) חייב להיות, בין השאר, מדגם הסתברותי. דהיינו, שלכל פרט באוכלוסייה חייב להיות סיכוי להיכלל במדגם ועל הסיכוי הזה להיות ידוע. סיכוי דגימה ידוע מחייב מסגרת דגימה - רשימה הכוללת את כל הפרטים באוכלוסייה.

כוח השכנוע של מחקרים, שנעשים בעזרת מדגמים לא הסתברותיים הוא נמוך יותר, אך לפעמים אין מנוס ממדגמים לא הסתברותיים.

מדגמים הסתברותיים[עריכת קוד מקור | עריכה]

מדגם הסתברותי הוא כל מדגם שהפרטים בו נבחרו בעזרת הגרלה מתוך כלל הפרטים שבאוכלוסייה. היכולת לדגום מדגם הסתברותי תלויה באפשרות לקיים הגרלה כזו. כדי לקיים הגרלה כזו צריך רשימה של כלל הפרטים שבאוכלוסייה. רשימה כזו קרויה מסגרת דגימה. במקרים רבים, מסגרת הדגימה היא רשימה מקורבת של כלל הפרטים באוכלוסייה. דוגמאות למסגרות דגימה: רשימת כל התלמידים הרשומים לכל בתי הספר בישראל היא מסגרת דגימה המכילה רשימה מקורבת של כלל הילדים בישראל בין הגילים שש לשמונה עשרה, פנקס הבוחרים הוא מסגרת דגימה המכילה רשימה מקורבת לכלל אזרחי ישראל מעל גיל 18.

דגימה אקראית פשוטה
המדגם ההסתברותי הפשוט ביותר נקרא מדגם אקראי פשוט. במדגם כזה כל פרט ופרט נבחר למדגם בהליך אקראי מתוך מסגרת הדגימה, כך שלכל פרט במסגרת יש אותו סיכוי להיות במדגם. מדגם כזה נותן ייצוג טוב של האוכלוסייה ויכולת הכללה, אך חסרונו הוא שתת-אוכלוסיות קטנות אינן באות לידי ביטוי בו, שכן אין כל ביטחון שאכן תידגם כמות מספקת מאותה תת-אוכלוסייה. דוגמה: אם מסגרת הדגימה היא רשימת שמות, כל שם ושם נבחר מהרשימה בהגרלת מקומו ברשימה.
דגימה שיטתית
בחירת הנדגם הראשון נעשית בהגרלה אקראית ובחירת שאר הנדגמים נעשית לפי יחס מסוים לנדגם הראשון. לדוגמה: אם מסגרת הדגימה היא ספר הטלפונים, שמו של הנדגם הראשון מוגרל במקריות מתוך כלל השמות שבספר הטלפונים, שמו של הנדגם השני מופיע בדיוק עשרה עמודים מאוחר יותר בספר הטלפונים, שמו של השלישי מופיע בדיוק עשרה עמודים אחרי השני וכך הלאה. דגימה שיטתית מונעת בחירת פרטים שמקומם במסגרת המדגם סמוך מסיבות שאינן מקריות. למשל, דגימה שיטתית של עשרה אנשים מספר הטלפונים תמנע מצב בו לרבים מהנדגמים יש אותו שם משפחה משום שהם מאותה העדה.
דגימת שכבות
כדי להבטיח ייצוג של תת-אוכלוסיות קטנות במדגם, אשר לא באות לידי ביטוי בדגימה אקראית פשוטה, ניתן להשתמש בדגימת שכבות. בעת בחירת המדגם, מבטיחים מכסה מסוימת של נדגמים מכל תת-אוכלוסייה. לאחר מכן, בעת הניתוח הסטטיסטי, משוקללות השכבות על מנת שלא ליצור הטיה בשל עודף יצוג של תת-הקבוצות.
דגימת אשכולות
שתי השיטות לעיל הן קשות ליישום באוכלוסיות גדולות (ברמת אוכלוסיית מדינה) משתי סיבות עיקריות: ראשית, מסגרת דגימה אינה זמינה תמיד לאוכלוסיות כאלו ושנית - התפרסות של המדגם על כל אזורי הארץ גוררת הוצאות גבוהות. במקרה כזה נעשה שימוש במדגם אשכולות. האוכלוסייה הנדגמת מחולקת לאשכולות (גאוגרפיים בדרך-כלל). לאחר מכן נערכת דגימה אקראית של אשכולות, ובשלב הבא - דגימה אקראית של פרטים מתוך כל אשכול שנבחר.

ניתן לשלב דגימת שכבות ודגימת אשכולות - לדוגמה, לבחור לפי שכבות מסוימות בתוך כל אשכול.

מדגמים לא הסתברותיים[עריכת קוד מקור | עריכה]

עריכת מדגם הסתברותי עשויה להיות הליך ארוך ויקר. כמו כן, היא אינה אפשרית כאשר אין מסגרת דגימה. לכן, חוקרים משתמשים פעמים רבות במדגמים לא הסתברותיים.

שיטות שונות לדגימה לא הסתברותית:

מדגם נוחות 
שיטה זו מתבססת על בחירת הנחקרים הקלים ביותר להשגה עבור עורך המחקר. יתרונה הגדול של שיטה זו הוא המחיר הזול שלה. חסרונותיה הם שהמדגם יהיה בהכרח מקבוצה חברתית מסוימת ולכן לא יהיה מייצג. שיטה זו מקובלת במחקרים ראשוניים (כמו ניסוי פיילוט).
מדגם מומחים 
מדגם מומחים הוא סוג של מדגם נוחות. במדגם כזה יש משתתפים בודדים המכירים היטב את אוכלוסיית היעד של המחקר ומנסים להעיד בשמה על צרכיה ודעתה. מדגם כזה מקובל בבדיקת אב טיפוס של ציוד טכנולוגי. שלושה עד חמישה מומחים לנגישות יכולים למצוא במחקר כזה בעיות בעיצוב המוצר שיפריעו לאנשים עם לקויות להשתמש בציוד.
מדגם מתנדבים 
פרסום קריאה לנחקרים, בחינם או תמורת תשלום, וקבלת כל הפונים שנמצאים מתאימים למחקר. לשיטה זו יש חסרונות סטטיסטיים גדולים מזו של דגימת הנוחות משום שקשה לדעת מה הגורמים המטים את הדגימה - החוקר אינו יודע מה גורם לנבדקים לפנות אליו. במקרה שבו הסקר לא יכול להתנהל מרחוק (דואר נייר, דואר אלקטרוני, לינק לאתר אינטרנט, ראיון בטלפון וכיוצא בזה) שיטה זו גם יקרה יותר מדגימת הנוחות משום שהיא כוללת פרסום מודעות בציבור הרחב ועשויה לכלול נסיעות ארוכות לצורך פגישה עם המשתתפים במחקר. מקובל להשתמש בשיטה זו רק כשאין ברירה אחרת.
מדגם כדור שלג 
לאחר פנייה של החוקר ל'מעגל הראשון' של הנדגמים, הם פונים לחבריהם ומפנים אותם לחוקר, וכך הלאה. שיטה זו שימושית במיוחד בחקר תופעות שאינן פומביות, כמו שימוש בסמים. חסרונה העיקרי הוא שהיא דוגמת רשת חברתית אחת.
מדגם בו נבחרת, באופן מכוון, קבוצה שדומה במדדים רבים ככול האפשר לאוכלוסייה הכללית 
סוג מדגם כזה אינו מקובל במחקר והוא משמש לדברים אחרים, כמו הרכבת חבר מושבעים. בכזה מדגם דואגים שאחוז הנשים, בני המיעוטים, העשירים, העניים, הצעירים, הזקנים, המלומדים וכיוצא בזה יהיה דומה ככול האפשר לזה שבאוכלוסייה הכללית. הרכבת מדגם כזה דורשת מאמץ רב, של למידה לעומק של פרטיהם הסוציולוגים של הרבה מאוד אנשים ויש בה מעט מאוד מקום לאקראיות. כזה מדגם עשוי בהחלט להיבחר באופן בו תוצאות הסקר מוחלטות מראש והן אינן גילוי מחקרי.

זיווגים[עריכת קוד מקור | עריכה]

דגימת זיווגים יכולה להיות הסתברותית או לא הסתברותית. מחקרים המשתמשים בשיטה זו הם בעלי כח סטטיסטי רב מאשר מחקרים שאינם משתמשים בה, משום שבשיטה זו כל נבדק מושווה לנבדק נוסף אחד, הדומה לו ככול האפשר בתכונות שאינן נחקרות, בניגוד להשוואה כללית של שתי קבוצות מדגם.

דוגמאות לדגימת זיווגים אקראית:

  • דגימות זוגיות בתוך משפחות:
    • דגימה אקראית של זוגות תאומים זהים והשוואתם - מחקרי תאומים - למשל, בסקר לשם הערכת הסיכוי של אדם לחלות במחלה מסוימת, אם התאום הזהה שלו כבר חלה בה. סקר מסוג זה יכול להעריך עד כמה מחלה מסוימת היא תלויה בתורשה.
    • מחקרי תאומים זהים ולא זהים - תאומים לא זהים עדיין דומים זה לזה יותר משני אחים, כי הם נולדו באותו יום וגדלו באותם תנאים. אחים אחרים עשויים להיות שונים יותר, משום שהבכור היה בן יחיד למשך כמה שנים וכיוצא בזה.
    • בחירה אקראית של אנשים ועבור כל נבחר, בוחרים גם קרוב משפחה שלו מדרגה ראשונה (בנו, בתו, אחיו, אחותו, אביו או אמו). לקרובי משפחה כאלה יש רק תורשתי דומה בהרבה מאשר לזרים מוחלטים או לזוגות נשואים.
    • דגימה אקראית של זוגות נשואים והשוואתם. למשל, השוואת משכורות נשים וגברים, כשהיא נעשית בין זוגות נשואים, מבטלת את ההשפעה של הגורמים הגאוגרפיים והסוציאליים שיש במדגמים אחרים - אם הגברים במדגם כמעט תמיד מרוויח יותר מהנשים שבו, במדגם זוגות נשואים, אי אפשר לומר שמקום המגורים או הרקע המשפחתי השפיעו על המסקנות, שהרי כל גבר הושווה לאישה שגרה במקום זהה לו והיא בת משפחתו.
  • דגימת אותו אדם פעמיים ליצירת זוג נדגם:
    • דגימה אקראית של אנשים כל שהם ובדיקת כל אדם פעם אחת לפני טיפול מסוים ופעם שנייה אחרי אותו טיפול. כל אדם מושווה כך לעצמו לפני ואחרי הטיפול.
    • בחירה אקראית של אנשים והשוואת תפקוד יד ימינם לתפקוד יד שמאלם.
  • זוגות שרירותיים - דגימה של שתי קבוצות אנשים אקראיות והשוואת כל אדם מאחת הקבוצות לזה שהכי דומה לו, סוציולוגית, בקבוצה השנייה. למשל, במדגם לצורך סקר דעות פוליטיות, המשווה בין שתי ערים, תושווה דעתה של אישה בת עשרים ושש , עם 12 שנות השכלה ממוצא ים-תיכוני בעיר א', לדעתה של אישה שוות גיל, השכלה ומוצא בעיר ב', דעתו של גבר בן שלושים עם תואר ראשון ממוצא סקנדינבי בעיר א' תושווה לדעתו של גבר שווה גיל, השכלה ומוצא בעיר ב' וכיוצא בזה.

דגימת זיווגים שאינה אקראית משמשת נעשית כאשר קשה למצוא מדגם זיווגים אקראי. למשל, במקרה בו אוכלוסיית היעד קטנה. תפקוד ידיים אצל אנשים עם שיתוק מוחין מקובל לבדוק במדגם מזווג שבו אנשים שרק אחת מידיהם פגועה. אצל כל אחד מהם משווים את פעילות היד הפגועה לפעילות היד שאינה פגועה ומסיקים מסקנות על כלל האנשים שידיהם פגועות לעומת כלל האנשים שידיהם אינן פגועות‏[2].


ראו גם[עריכת קוד מקור | עריכה]

קישורים חיצוניים[עריכת קוד מקור | עריכה]

יורם שורק, הסטטיסטיקה לא אומרת הכל, במדור "דברים שיורמים יודעים", באתר נענע 10

מאמר באנגלית על ביצוע מחקר בתנאי קונפליקט ועל דגימה בשיטת מדגם "כדור השלג" http://jpr.sagepub.com/content/48/4/423.abstract

ניסים כהן ותמר אריאלי (2013). סביבת קונפליקט כשדה מחקר: אתגרים ומדגם כדור השלג. פוליטיקה, 22: 26-2.

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ שמואל זמיר ורות בייט-מרום (2005). מבוא לסטטיסטיקה לתלמידי מדעי החברה א. רעננה: האוניברסיטה הפתוחה.
  2. ^ van Roon, D., Steenbergen, B., & Hulstijn, W. (2003). Reciprocal tapping in spastic hemiparesis. Clinical Rehabilitation, 14(6), 592-600.