עוצמה סטטיסטית – הבדלי גרסאות

מתוך ויקיפדיה, האנציקלופדיה החופשית
תוכן שנמחק תוכן שנוסף
מ תיקון nowiki
Yoavd (שיחה | תרומות)
שורה 19: שורה 19:


=== ניתוח עוצמה סטטיסטית במחקר- ניתוח מקדים מול ניתוח רטרוספקטיבי ===
=== ניתוח עוצמה סטטיסטית במחקר- ניתוח מקדים מול ניתוח רטרוספקטיבי ===
ניתוח עוצמה סטטיסטית יכול להעשות לפני- ניתוח מקדים (''a priori''\ prospective) או אחרי-ניתוח רטרוספקטיבי (''post hoc''\ retrospectivi) אחרי ניתוח הנתונים. ניתוח מקדים נערך לפני ניתוח הנתונים של המחקר, ובדרך כלל משיג עוצמה סטטיסטית מספיקה. ניתוח רטרוספקיטיבי נערך אחרי שהמחקר נערך והתקבלו התוצאות, והוא עושה שימוש בגודל האפשט וגודל המדגם כדי לקבוע את העוצמה של המחקר, על בסיס ההנחה כי גודל האפקט במדגם שווה לזה באוכלוסייה. התועלת בניתוח מקדים לעוצמה סטטיסטית במערך מחקר ניסויי הוא מקובל בעולם; בעוד, ניתוח רטרוספקטיבי שנוי במחלוקת בקרב החוקרים.
ניתוח עוצמה סטטיסטית יכול להעשות לפני- ניתוח מקדים (''a priori''\ prospective) או אחרי-ניתוח רטרוספקטיבי (''post hoc''\ retrospectivi) אחרי ניתוח הנתונים. ניתוח מקדים נערך לפני ניתוח הנתונים של המחקר, ובדרך כלל משיג עוצמה סטטיסטית מספיקה. ניתוח רטרוספקטיבי נערך אחרי שהמחקר נערך והתקבלו התוצאות, והוא עושה שימוש בגודל האפקט וגודל המדגם כדי לקבוע את העוצמה של המחקר, על בסיס ההנחה כי גודל האפקט במדגם שווה לזה באוכלוסייה. התועלת בניתוח מקדים לעוצמה סטטיסטית במערך מחקר ניסויי הוא מקובל בעולם; בעוד, ניתוח רטרוספקטיבי שנוי במחלוקת בקרב החוקרים.


== תוכנות לניתוח עוצמה סטטיסטית ==
== תוכנות לניתוח עוצמה סטטיסטית ==

גרסה מ־08:40, 30 בדצמבר 2015

עוצמה סטטיסטית היא הסיכוי לדחיית השערת האפס (H0) במחקר על בסיס נתוני המדגם וקביעה כי יש קשר בין המשתנים באוכלוסייה, כאשר הקשר/הבדל אכן קיים במציאות.

למעשה עוצמה סטטיסטית היא 1-P כאשר P מייצג את הסיכוי לטעות מסוג שני (β). כאשר הסיכוי לטעות מסוג שני (β) נמוך וקרוב ל-0 העוצמה הסטטיסטית תגדל, וכאשר הסיכוי לטעות מסוג שני (β) גבוה, וקרוב ל-1 העוצמה הסטטיסטית תקטן. ככל שהמחקר שנערך רגיש יותר העוצמה הסטטיסטית גבוהה יותר והסיכוי לטעות מסוג β קטן יותר. לעיתים עו

דרכים להגדלת העוצמה הסטטיסטית:

1. רמת מובהקות– ככל שרמת המובהקות קטנה העוצמה הסטטיסטית גדלה. כאשר השטח הקריטי גדול יותר קל יותר לדחות את H0 ולכן העוצמה הסטטיסטית גדלה. 

2. שינוי סוג ההנחה לחד זנבי– שינוי ההנחה לחד זנבית מקלה על דחיית H0 מבלי לשנות את רמת המובהקות שכן מגדילים את שטח הדחייה. 

3. גודל האפקט (Effect size)– מדד סטנדרטי המלמד על עצמת הקשר בין המשתנים. (מידת ההשפעה של הטיפול/מניפולציה) בודקים את הקשר בין האוכלוסיות והפיזור. אם הפיזור/שונות (σ) קטן אז העוצמה גבוהה יותר וקל יותר לדחות את H0. אם ההבדל בין ממוצעי הקבוצות גדול העוצמה גבוהה וקל יותר לדחות את H0. נחשב דרך הכי משפיעה על העוצמה הסטטיסטית.

4. גודל המדגם – ככל שה-N גדל הסיכוי לדחות את H0 גדל ולכן העוצמה הסטטיסטית גדלה. מכיוון שהאוכלוסייה הכללית מיוצגת טוב יותר יש יותר סיכוי לזהות קשרים שקיימים באוכלוסייה.

5. מבחנים פרמטרים – עוצמה סטטיסטית גדולה יותר שכן נעשה שימוש במדד אינטרוולי שיש בו יותר מידע ולכן הוא יותר רגיש.

בבדיקת השערות עומדת לבחינה השערה, הנקראת 'השערת האפס'. לצורך החלטה מבצעים ניסוי, ומשלבים את התוצאות במבחן שנבחר מראש. תוצאת המבחן היא אחת משתי מסקנות אפשריות: לדחות את ההשערה, או שלא לדחות אותה. דחיית השערה על אודות הבדל בין שתי אוכלוסיות, למרות קיומו של הבדל כזה במציאות, נקראת שגיאה מסוג II. עוצמה סטטיסטית היא מידת הביטחון שלא הייתה שגיאה מסוג זה. זאת להבדיל ממובהקות סטטיסטית שהיא מידת הביטחון שלא נעשתה שגיאה מסוג I.

עוצמתו של מבחן סטטיסטי תלויה בגורמים התלויים בהליך המבחן עצמו (מבחן T דו זנבי דורש יותר פרטים מאשר חד זנבי), בגודל המדגם הסטטיסטי, בגודל האוכלוסייה הנחקרת (כל זמן שכלל האוכלוסייה קטנה יחסית), בהבדל הממוצע בפרמטר הנחקר של האוכלוסייה (הבדלים גדולים בין שתי תת-אוכלוסיות דורשים מדגם קטן יותר), בהתפלגות של פרמטר זה (התפלגות בינומית דורשת מדגם קטן יותר מאשר התפלגות נורמלית של משתנה רציף) ובמידת הדיוק שבמדידות.

ניתוח עוצמה סטטיסטית במחקר- ניתוח מקדים מול ניתוח רטרוספקטיבי

ניתוח עוצמה סטטיסטית יכול להעשות לפני- ניתוח מקדים (a priori\ prospective) או אחרי-ניתוח רטרוספקטיבי (post hoc\ retrospectivi) אחרי ניתוח הנתונים. ניתוח מקדים נערך לפני ניתוח הנתונים של המחקר, ובדרך כלל משיג עוצמה סטטיסטית מספיקה. ניתוח רטרוספקטיבי נערך אחרי שהמחקר נערך והתקבלו התוצאות, והוא עושה שימוש בגודל האפקט וגודל המדגם כדי לקבוע את העוצמה של המחקר, על בסיס ההנחה כי גודל האפקט במדגם שווה לזה באוכלוסייה. התועלת בניתוח מקדים לעוצמה סטטיסטית במערך מחקר ניסויי הוא מקובל בעולם; בעוד, ניתוח רטרוספקטיבי שנוי במחלוקת בקרב החוקרים.

תוכנות לניתוח עוצמה סטטיסטית

קיימות תוכניות אחדות לניתוח של עוצמה סטטיסטית. חלקן הן תוכנות מסחריות:

  • nQuery Advisor
  • PASS Sample Size Software
  • SAS Power and sample size
  • Stata

וישנן תוכנות ללא תשלום:

  • PS
  • Russ Lenth's power and sample-size page
  • G*Power (http://www.gpower.hhu.de/)
  • WebPower Free online statistical power analysis (http://webpower.psychstat.org)
  • A free online calculator that displays the formulas and assumptions behind the calculations is available at powerandsamplesize.com
  • R package pwr

הפניות

  • Ellis, P. D. (2010). The essential guide to effect sizes: Statistical power, meta-analysis, and the interpretation of research results. Cambridge University Press
  • Everitt, B. S., & Skrondal, A. (2002). The Cambridge dictionary of statistics.Cambridge: Cambridge
  • (Hoenig, J. M., & Heisey, D. M. (2001). The abuse of power. The American Statistician55(1
  • Thomas, L. (1997) Retrospective power analysis. Conservation Biology 11(1):276–280
  • Weisburd, D., & Britt, C. (2014). Defining the Observed Significance Level of a Test: A Simple Example Using the Binomial Distribution. In Statistics in Criminal Justice (pp. 145-170). Springer US.

קישורים חיצונים

  • Video: Power and Sample Size Primer by NCSS
  • WebPower - Free online sample size planning for one-way ANOVA, two-way ANOVA, repeated-measure ANOVA, SEM, multilevel modeling
  • PowerAndSampleSize.com – free, online power and sample size calculators with graphics highlighting sensitivity to input values
  • PASS – Power analysis and sample size software

ראו גם

  • הסקת מסקנות
  • Cohen, J. (1992). Statistical power analysis. Current directions in psychological science, 98-101.
ערך זה הוא קצרמר בנושא סטטיסטיקה. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.