הסקה סטטיסטית
הסקה סטטיסטית או סטטיסטיקה היסקית היא תהליך שבו מסיקים מסקנות על התכונות של התפלגות כלשהי, על בסיס ניתוח של מידע אמפירי. הניתוח של המידע מאפשר להסיק מסקנות לגבי התכונות של האוכלוסייה: בפרט ניתן להשתמש בניתוח בשביל לבצע בדיקת השערות ובשביל למצוא אומדנים לפרמטרים של האוכלוסייה.[א]
בעוד הסטטיסטיקה התיאורית עוסקת בתכונות של המדגם עצמו, ולכן אינה מניחה שבהכרח האוכלוסייה גדולה מהמדגם, ההנחה במסגרת הניתוח של הסטטיסטיקה ההיסקית היא שהאוכלוסייה גדולה יותר (בדרך כלל הרבה יותר) מכמות הפרטים שלגביהם בפועל נאסף המידע; כלומר ההנחה היא שהמידע שנאסף נדגם מתוך אוכלוסייה גדולה יותר.
הסבר כללי
[עריכת קוד מקור | עריכה]הסקה סטטיסטית מאפשרת לטעון טענות לגבי האוכלוסייה כולה, על אף שצפינו רק בחלק מתוך אוכלוסייה זו אותו דגמנו (באופן אקראי).
תהליך ההסקה הסטטיסטית מתחיל בבחירת מודל סטטיסטי של התהליך שבאמצעותו נוצר המידע,[ב] שנותן לנו להניח מהי צורת ההתפלגות של המידע,[ג] ולאחר מכן הסקת מסקנות מהמידע שנאסף תחת ההנחות של המודל.
מספר סטטיסטיקאים ידועים התבטאו בנושא ואמרו שבדרך כלל הבעיה הקשה ביותר בהסקה סטטיסטית היא התרגום של בעיות במציאות למודל סטטיסטי מתאים.
דוגמאות לשימוש בהסקה סטטיסטית
[עריכת קוד מקור | עריכה]- אמידה נקודתית – מתן ההערכה/האומדן הטוב ביותר עבור פרמטר מסוים.[א]
- אמידה של טווח – מציאת טווח מסוים שהסיכוי שהפרמטר האמיתי נמצא בתוכו הוא גבוה. אם הטווח הוא קטע רציף, הוא נקרא רווח בר-סמך, ומידת הוודאות לגבי הימצאותו של הפרמטר בטווח זה נקרא "רמת סמך".[ד]
- בדיקת השערות – ניסוח השערה ובדיקה אם ניתן לדחות אותה ברמה מסוימת של ודאות.[ה]
- סיווג של המידע לקבוצות וניתוח אשכולות.
קישורים חיצוניים
[עריכת קוד מקור | עריכה]- הסקה סטטיסטית, באתר אנציקלופדיה בריטניקה (באנגלית)
ביאורים
[עריכת קוד מקור | עריכה]- ^ 1 2 למשל, אם האוכלוסייה היא: "עצי האורן בשטח מדינת ישראל", והפרמטר הוא: "גובה", אז ניתן לאמוד את תוחלת הגובה שלהם או את סטיית התקן שלה.
- ^ למשל, בהטלת קובייה התהליך בו נוצר המידע הוא הטלת הקובייה כך שיש הסתברות מסוימת לכל פאה, כשסך ההסתברויות של 6 הפאות הוא 100%. אם הקובייה היא הוגנת, ההסתברויות של כל הפאות שוות זו לזו.
- ^ למשל: התפלגות נורמלית, התפלגות אחידה, התפלגות פואסונית וכו'.
- ^ למשל, אם האוכלוסייה היא: "עצי האורן בשטח מדינת ישראל", והפרמטר הוא: "גובה", אז ניתן לאמוד את תוחלת הגובה בתוך קטע, למשל: בין 12 מטרים ל-16 מטרים, עם רמת סמך של %X.
- ^ למשל, אם האוכלוסייה היא: "עצי האורן בשטח מדינת ישראל", והפרמטר הוא: "גובה", ניתן לנסח השערה שתוחלת הגובה גבוהה מ-100 מטרים, ולבדוק האם ניתן להסיק מהמדגם של עצים אותם מדדנו שברמת ודאות של 95% ההשערה הזו שגויה.