ציון תקן

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
ציון התקן הינו המרחק והכיוון של תצפית או מומנט של מדגם מן המומנט הראשון של האוכלוסייה, תחת ההנחה כי האוכלוסייה מתפלגת נורמאלית.

ציון תקן (או, ציון תקן z) הינו משתנה מקרי נורמלי, אשר מבטא את המרחק של תצפית מן התוחלת במונחי יחידות סטיית תקן. ציון התקן יכול לקבל כל ערך, חיובי או שלילי, כאשר ערך חיובי מצביע על תצפית הגבוהה בערכה המספרי מתוחלת האוכלוסייה, וערך שלילי מצביע על תצפית הנמוכה בערכה המספרי מתוחלת האוכלוסייה. תהליך חישוב ציון התקן נקרא גם תקנון או נירמול, וציון התקן יקרא גם ערך Z, ציון Z, או: הציון המתוקנן.

היתרון בחישוב ציון התקן הוא האפשרות לקבל אומדן למיקום של ערך (וכפועל יוצא- גם להסתברות לקבל ערך זה, או ערך קיצוני ממנו), בהתפלגות נתונה- באופן שאינו תלוי בסולמות מדידה. החיסרון בחישוב זה הוא היישום המוגבל בשימוש אמפירי בו, מכיוון שניתן לחשבו רק כאשר מניחים התפלגות נורמלית של האוכלוסייה, ותוחלת ושונות ידועות באוכלוסייה.

חישוב ציון התקן[עריכת קוד מקור | עריכה]

חישוב ציון תקן של תצפית בודדת[עריכת קוד מקור | עריכה]

כאשר מעוניינים לחשב את ציון התקן של תצפית בודדת, למעשה מחשבים את מרחקה (ביחידת מרחק של סטיות תקן) ממומנט נתון של אוכלוסייה מסוימת. על כן, בחישוב ציון התקן מניחים כי התצפית שייכת לאוכלוסייה תאורטית על פיה מתקננים. מכיוון שציון תקן יחושב רק תחת ההנחה שהאוכלוסייה מתפלגת נורמלית, ותוחלתה ושונותה ידועות, הנוטציה המקובלת לציון הנחה זו היא: X\thicksim N(\mu,\sigma^2) והטרמינולוגיה השגורה הנה: "X מתפלג נורמלי, עם תוחלת \mu ושונות \sigma^2".

בהינתן ערך נקודתי X עבור תצפית, ציון התקן של זו יהיה:

Z_{x} = {x - \mu \over \sigma}

כאשר:

  • x הערך הנקודתי של התצפית
  • \mu תוחלת האוכלוסייה
  • \sigma סטיית התקן של האוכלוסייה
  • Z_{x} ציון התקן של התצפית, או: ציון התקן של הסטטיסטי הנאמד

חישוב ציון תקן של ממוצע מדגם[עריכת קוד מקור | עריכה]

כאשר מעוניינים לחשב את ציון התקן של ממוצע המדגם, למעשה מחשבים את מרחק ממוצע זה (ביחידת מרחק של סטיות תקן) מתוחלת התפלגות הדגימה. על כן, מניחים כי הממוצע שייך לאוכלוסיית ממוצעים תאורטית, על פיה מתקננים. באופן דומה להנחות שיש להניח עבור התפלגות האוכלוסייה, כאן נניח כי כל המדגמים האפשריים בגודל של המדגם שלנו מתפלגים נורמלית, עם תוחלת ושונות דגימה ידועות. גם כאן הנוטציה המקובלת היא: \bar{X}\thicksim N(\mu,\frac{\sigma^2}\sqrt{n}) ונהוג לומר כי: "\bar{X} מתפלג נורמלי, עם תוחלת \mu ושונות \frac{\sigma^2}\sqrt{n}".

בהינתן ערך נקודתי \bar{X} עבור ממוצע מדגם בגודל n, ציון התקן של זה יהיה:

Z_{\bar{X}}=\dfrac{\bar{X}-\mu}\frac{\sigma}\sqrt{n}

כאשר:

  • \bar{X} ממוצע המדגם
  • \mu תוחלת התפלגות הדגימה
  • \frac{\sigma}\sqrt{n} טעות התקן של התפלגות הדגימה
  • Z_{\bar{X}} ציון התקן של ממוצע המדגם, או: ציון התקן של הסטטיסטי הנאמד

נשים לב, כי ציון התקן של תצפית בודדת הוא למעשה המקרה המנוון בו n=1.

משמעות מתמטית[עריכת קוד מקור | עריכה]

הגדרה כללית עבור כל מומנט של משתנה מקרי X[עריכת קוד מקור | עריכה]

יהיה X משתנה מקרי המתפלג X\thicksim N(\mu,\sigma^2) כאשר: \mu:=E(X) ו- \sigma^2:=Var(X). לכל: x\in{Supp\{X\}} ציון התקן של ערך זה יהיה:

Z_{x} = \frac{x - E(X)}\sqrt{Var(X)}

מכיוון ש X הוא משתנה מקרי נורמלי, גם Z משתנה מקרי נורמלי שהתפלגותו:

Z\sim (0,1)

עם פונקצית צפיפות: f_Z(z)=\frac{1}{2\pi}e^{-\frac{z^2}{2\sigma^2}} ופונקציית הסתברות מצטברת: F_{Z}(z)= \int_{-\infty}^{z} f_{Z}dz, אותה נהוג לסמן בתור: \Phi(z)

משמעות ציון התקן תחת הגדרת פונקציית הצפיפות של משתנה מקרי המתפלג נורמלי[עריכת קוד מקור | עריכה]

תחת הנחת ההתפלגות הנורמלית של משתנה מקרי X, נתייחס אל ציון התקן כאל מדד למרחק ערך x\in{Supp\{X\}} מתוחלת X ביחידות מדידה של סטיות תקן.

מכיוון שפונקציית הצפיפות של משתנה מקרי נורמלי אינה חד-חד ערכית, לכל y\in{Im[f_{Z}(z)]}, קיימים שני מקורות תחת המיפוי ההופכי, כאשר תכונת הזוגיות של הפונקציה מבטיחה כי:

\forall y\in{Im(f_{Z})}\backslash\{0\}, f^{-1}_{Z}(y)=\{-z,z\}

על כן, ניתן להתייחס אל ציון התקן כמדד בעל גודל וכיוון כאשר |z| מלמד על המרחק האבסולוטי של ערך מן התוחלת, ו- sign\{z\} על מיקום הערך ביחס לציר סימטריה העובר דרך התוחלת.

משמעות ציון התקן תחת הגדרת פונקציית ההסתברות המצטברת של משתנה מקרי המתפלג נורמלי[עריכת קוד מקור | עריכה]

לפונקציית ההסתברות המצטברת של ההתפלגות הנורמלית אין פתרון אנליטי, ועל כן נהוג לחשב את ערכי F_{Z} באמצעות קירוב נומרי דרך טבלת ערכים נפוצים של האינטגרל, הקרויה טבלת Z, או טבלת ההסתברות הנורמלית. תחת הנחת ההתפלגות הנורמלית של משתנה מקרי X, פעולת התקנון מאפשרת להעריך את ההסתברות למאורעות שונים תחת מרחב ההסתברות של X בשימוש בפונקציית ההסתברות המצטברת של המשתנה Z בלבד, ללא פתרון נומרי של ערכי פונקציית הסתברות המשתנה המקורי, באופן הבא:

P(X<x)=P(\frac{X-\mu}{\sigma}<\frac{x-\mu}{\sigma})=P(Z<z)=\Phi(z)

משמעות יישומית[עריכת קוד מקור | עריכה]

ניתן להתייחס לציון התקן כאל המרחק של פרט או ממוצע מדגם מתוחלת האוכלוסייה אליה אנו מניחים כי הוא שייך, במונחי סטיות תקן. דהיינו- ערכו המוחלט של ציון התקן מתייחס למספר סטיות התקן מהתוחלת, וסימנו- לכיוון ממנו מודדים את המרחק. ציון תקן גבוה יצביע על מרחק גדול מן התוחלת, כאשר סימן חיובי ילמד אותנו כי ערך התצפית גבוה מהתוחלת, וסימן שלילי- כי ערך זה נמוך מן התוחלת.

ערכו המספרי של ציון התקן יכול ללמד אותנו על ההסתברות למאורע בו אנו מתעניינים, תחת ההשערה כי המאורע נלקח מאוכלוסייה בעלת תוחלת ושונות נתונות. ככל שערכו המוחלט של ציון התקן גבוה יותר, כך הסתברותו תחת הנחות ההתפלגות הנתונה- נמוכה יותר. מכיוון שבהתפלגות הנורמלית, ההסתברות לכל מאורע נקודתי זניחה, נהוג לרב לחשב את ההסתברות לקבלת המאורע הרצוי, או מאורע קיצוני ממנו. מסיבה זו, ציון התקן גם מלמד אותנו על האחוזון אליו שייכת התצפית, ביחס לאוכלוסייה הכללית. בנוסף, פעולת התקנון מאפשרת לנו להעריך הסתברויות ללא תלות בפרמטרים של האוכלוסיה ממנה נלקחו. כך למשל, השוואה בין שני מאורעות זהים, הלקוחים מאוכלוסיות שונות, תתאפשר תחת פעולת התקנון, אך תהיה חסרת משמעות כאשר ננסה להשוות בין הערכים המקוריים של המאורעות.

שימושים[עריכת קוד מקור | עריכה]

לציוני תקן שימוש רב במדעי החברה, הטבע והרפואה. הסיבה לפופולריות של מדד זה נובעת מההנחה הפרלימינרית שתופעות רבות מתפלגות בקירוב נורמלית, ועל כן נוח למקם ולאמוד תכונות של אוכלוסיות בעזרת מדד זה. מכיוון שבניסויים אמפיריים רבים אין אפשרות לדגום את כלל האוכלוסייה, נהוג לדגום מספר פרטים, ולבדוק האם מדגם זה אכן שייך לאוכלוסייה הכללית, והאם ניתן להסיק ממנו אליה.

דוגמאות[עריכת קוד מקור | עריכה]

שימוש בציוני תקן בהערכת הסתברות למאורע[עריכת קוד מקור | עריכה]

נגדיר את המשתנה המקרי X להיות מנת המשכל (במונחי נקודות IQ) של אדם באוכלוסיה הכללית. על פי אומדנים מקובלים, נהוג להניח כי מנת המשכל של אדם הנבחר באקראי מן האוכלוסיה הכללית תתפלג נורמלי באופן הבא:

התפלגות מנת המשכל באוכלוסיה הכללית.

X \thicksim N(100,15^2)

דהיינו, באופן נורמלי, עם תוחלת של 100 נקודות IQ ושונות של 225 נקודות IQ בריבוע.

נדגום באופן אקראי אדם ונשאל מהי ההסתברות שאדם זה מחונן. מכיוון שההגדרה הרווחת למחוננות היא ציון IQ של 135 נקודות או יותר, נהיה מעוניינים לחשב את ההסתברות לדגום באקראי אדם עם מנת משכל זו, או גבוהה ממנה.

נתקנן ערך זה ונחשב את ציון התקן המתאים לו:

Z_{x=135}=\frac{135-100}{15}=2.33

לאחר פעולת התקנון, ניתן לחשב את ההסתברות באופן הבא:

P(X\geqslant135)=P(\frac{X-100}{15}\geqslant\frac{135-100}{15})=P(Z\geqslant2.33)=1-P(Z<2.33)=1-\Phi(2.33)=1-0.9901=0.0099

כלומר, ההסתברות לדגום באקראי אדם מחונן- מתוך האוכלוסיית בני האדם הכללית- היא 0.99%.

שימוש בציוני תקן בהשוואה בין מאורעות מאוכלוסיות שונות[עריכת קוד מקור | עריכה]

בבחינה של שני מועמדים לעבודה המראיין מעוניין להכריע ביניהם על פי ציוני הגמר של אלו בתואר הראשון. שני המרואיינים סיימו את התואר הראשון בציון גמר של 85, אך באו משתי אוניברסיטאות שונות: A ו-B. המראיין פונה אל שתי האוניברסיטאות ומקבל מהן את המידע הבא:

באוניברסיטה A ציון הגמר הממוצע הינו 80, עם סטיית תקן של 10 נקודות.

באוניברסיטה B ציון הכמר הממוצע הינו 80, עם סטיית תקן של 5 נקודות.

המראיין מתקנן את ציוניהם של שני המועמדים בכדי להעריך עד כמה ציונם רחוק מן הציון הממוצע:

עבור המועמד הראשון, ציון התקן של ציונו הינו: Z_{85}=\frac{85-80}{10}=0.5

עבור המועמד השני, ציון התקן של ציונו הוא: Z_{85}=\frac{85-80}{5}=1

על כן, באופן יחסי- המועמד השני הצטיין יותר בלימודיו מהמועמד הראשון, מכיוון שציון הגמר שלו- ביחס לממוצע הציונים באוניברסיטה בה למד- גבוה יותר.

נשים לב, כי גם במקרה בו ציון הגמר של המועמד השני היה 84, המראיין עדיין היה אמור לבחור בו לעבודה, מכיוון שציון גמר זה עודנו נמצא במרחק גבוה ממחצית סטיית תקן ממוצע ציוני מוסד הלימוד:

Z_{84}=\frac{84-80}{5}=0.8>0.5