ציון תקן

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
ציון התקן הינו המרחק והכיוון של תצפית או מומנט של מדגם מן המומנט הראשון של האוכלוסייה, תחת ההנחה כי האוכלוסייה מתפלגת נורמאלית.
Statistipedia.svg

ציון תקן (או, ציון תקן z) מבטא את מספר סטיות התקן של ערך של תצפית מתוחלת האוכלוסייה, או של ממוצע מדגם מתוחלת הדגימה. ציון התקן יכול לקבל כל ערך, חיובי או שלילי, כאשר ערך חיובי מצביע על תצפית (ממוצע של מדגם) הגבוהה בערכה המספרי מתוחלת האוכלוסייה (תוחלת הדגימה), וערך שלילי מצביע על תצפית (ממוצע של מדגם) הנמוכה בערכה המספרי מתוחלת האוכלוסייה (תוחלת הדגימה). תהליך חישוב ציון התקן נקרא גם תקנון או נירמול, וציון התקן יקרא גם ערך Z, ציון Z, או: הציון המתוקנן.

היתרון בחישוב ציון התקן הוא האפשרות לקבל אומדן נקודתי לערך מדגמי, שאינו תלוי בסולמות מדידה. החיסרון בחישוב זה הוא היישום המוגבל בשימוש אמפירי בו, מכיוון שניתן לחשבו רק כאשר מניחים התפלגות נורמלית של האוכלוסייה, ותוחלת ושונות ידועות באוכלוסייה.

חישוב ציון התקן[עריכת קוד מקור | עריכה]

חישוב ציון תקן של תצפית בודדת[עריכת קוד מקור | עריכה]

כאשר אנו מעוניינים לחשב את ציון התקן של תצפית בודדת אנו למעשה מחשבים את מרחקה (ביחידת מרחק של סטיות תקן) ממומנט נתון של אוכלוסייה מסוימת. על כן, בחישוב ציון התקן אנו מניחים כי התצפית שייכת לאוכלוסייה תאורטית על פיה אנו מתקננים. מכיוון שציון תקן יחושב רק תחת ההנחה שהאוכלוסייה מתפלגת נורמלית, ותוחלתה ושונותה ידועות, הנוטציה המקובלת לציון הנחה זו היא: X\thicksim N(\mu,\sigma^2) והטרמינולוגיה השגורה הנה: "X מתפלג נורמלי, עם תוחלת \mu ושונות \sigma^2".

בהינתן ערך נקודתי X עבור תצפית, ציון התקן של זו יהיה:

Z_{stat} = {X - \mu \over \sigma}

כאשר:

  • X הערך הנקודתי של התצפית
  • \mu תוחלת האוכלוסייה
  • \sigma סטיית התקן של האוכלוסייה
  • Z_{stat} ציון התקן של התצפית, או: ציון התקן של הסטטיסטי הנאמד

חישוב ציון תקן של ממוצע מדגם[עריכת קוד מקור | עריכה]

כאשר אנו מעוניינים לחשב את ציון התקן של ממוצע המדגם, אנו למעשה מחשבים את מרחק ממוצע זה (ביחידת מרחק של סטיות תקן) מתוחלת התפלגות הדגימה. על כן, אנו מניחים כי הממוצע שייך לאוכלוסיית ממוצעים תאורטית, על פיה אנו מתקננים. באופן דומה להנחות שיש להניח עבור התפלגות האוכלוסייה, כאן נניח כי כל המדגמים האפשריים בגודל של המדגם שלנו מתפלגים נורמלית, עם תוחלת ושונות דגימה ידועות. גם כאן הנוטציה המקובלת היא: \bar{X}\thicksim N(\mu,\frac{\sigma^2}\sqrt{n}) ונהוג לומר כי: "\bar{X} מתפלג נורמלי, עם תוחלת \mu ושונות \frac{\sigma^2}\sqrt{n}".

בהינתן ערך נקודתי \bar{X} עבור ממוצע מדגם בגודל n, ציון התקן של זה יהיה:

Z_{stat}=\dfrac{\bar{X}-\mu}\frac{\sigma}\sqrt{n}

כאשר:

  • \bar{X} ממוצע המדגם
  • \mu תוחלת התפלגות הדגימה
  • \frac{\sigma}\sqrt{n} סטיית התקן של התפלגות הדגימה
  • Z_{stat} ציון התקן של ממוצע המדגם, או: ציון התקן של הסטטיסטי הנאמד

נשים לב, כי ציון התקן של תצפית בודדת הוא למעשה המקרה המנוון בו n=1.

היסטוריה[עריכת קוד מקור | עריכה]

משמעות מתמטית[עריכת קוד מקור | עריכה]

הגדרה כללית עבור כל מומנט של משתנה מקרי X[עריכת קוד מקור | עריכה]

יהיה X משתנה מקרי המתפלג X\thicksim N(\mu,\sigma^2) כאשר: \mu:=E(X) ו- \sigma^2:=Var(X). ציון התקן של X יהיה:

Z_{X} = \frac{X - E(X)}\sqrt{Var(X)}

הקשר לפונקציות הסתברות[עריכת קוד מקור | עריכה]

משמעות ציון התקן תחת הגדרת פונקציית הצפיפות של משתנה מקרי המתפלג נורמלי[עריכת קוד מקור | עריכה]

תחת הנחת ההתפלגות הנורמלית של משתנה מקרי X, נתייחס אל ציון התקן כאל איבר בקבוצת המקורות של פונקציית הצפיפות. מכיוון שפונקציית הצפיפות של ההתפלגות הנורמלית אינה חד-חד ערכית, לכל y\in{Im[f_{X}]}, קיימים שני מקורות תחת המיפוי ההופכי, כאשר תכונת הזוגיות של הפונקציה מבטיחה כי:

\forall y\in{Im(f_{X})}\backslash\{0\}, f^{-1}_{X}(y)=\{Z_{X},-Z_{X}\}

משמעות ציון התקן תחת הגדרת פונקציית ההסתברות המצטברת של משתנה מקרי המתפלג נורמלי[עריכת קוד מקור | עריכה]

תחת הנחת ההתפלגות הנורמלית של משתנה מקרי X, נתייחס אל ציון התקן כאל מקור של פונקציית ההסתברות המצטברת. מכיוון שפונקציה זו חד-חד ערכית, כל ציון תקן ישלח לתמונה ייחודית לו בטווח. לפי הגדרת פונקציית ההסתברות המצטברת של משתנה מקרי נורמלי:

F_{X}(Z_x)= \int_{-\infty}^{Z_x} f_{X}(x)dx

מכיוון שלפונקציית ההסתברות המצטברת של ההתפלגות הנורמלית אין פתרון אנליטי, נהוג לחשב את ערכי F_{X} באמצעות קירוב נומרי דרך טבלאת ערכים נפוצים של האינטגרל, הקרויה טבלאת Z.

משמעות יישומית[עריכת קוד מקור | עריכה]

ניתן להתייחס לציון התקן כאל המרחק של פרט או ממוצע מדגם מתוחלת האוכלוסייה אליה אנו מניחים כי הוא שייך, במונחי סטיות תקן. דהיינו- ערכו המוחלט של ציון התקן מתייחס למספר סטיות התקן מהתוחלת, וסימנו- לכיוון ממנו מודדים את המרחק. ציון תקן גבוה יצביע על מרחק גדול מן התוחלת, כאשר סימן חיובי ילמד אותנו כי ערך התצפית גבוה מהתוחלת, וסימן שלילי- כי ערך זה נמוך מן התוחלת.

ערכו המספרי של ציון התקן יכול ללמד אותנו על ההסתברות למאורע בו אנו מתעניינים, תחת ההשערה כי המאורע נלקח מאוכלוסייה בעלת תוחלת ושונות נתונות. ככל שערכו המוחלט של ציון התקן גבוה יותר, כך הסתברותו תחת הנחות ההתפלגות הנתונה- נמוכה יותר. מכיוון שבהתפלגות הנורמלית, ההסתברות לכל מאורע נקודתי זניחה, נהוג לרב לחשב את ההסתברות לקבלת המאורע הרצוי, או מאורע קיצוני ממנו. מסיבה זו, ציון התקן גם מלמד אותנו על האחוזון אליו שייכת התצפית, ביחס לאוכלוסייה הכללית.

שימושים[עריכת קוד מקור | עריכה]

לציוני תקן שימוש רב במדעי החברה, הטבע והרפואה. הסיבה לפופולריות של מדד זה נובעת מההנחה הפרלימינרית שתופעות רבות מתפלגות בקירוב נורמלית, ועל כן נוח למקם ולאמוד תכונות של אוכלוסיות בעזרת מדד זה. מכיוון שבניסויים אמפיריים רבים אין אפשרות לדגום את כלל האוכלוסייה, נהוג לדגום מספר פרטים, ולבדוק האם מדגם זה אכן שייך לאוכלוסייה הכללית, והאם ניתן להסיק ממנו אליה.