שכיח

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בסטטיסטיקה, שכיח - הוא הערך הנפוץ ביותר בסדרת ערכים. כלומר הערך ששכיחותו בסדרה היא הגבוהה ביותר. בדומה לממוצע ולחציון גם השכיח הוא אחד ממדדי המרכז של סדרת ערכים. דוגמה: מדגם כולל את הערכים הבאים: 7,5,89,7,7,7,5,5,4,4 - במדגם זה 7 הוא השכיח, משום שהוא מופיע יותר מכל ערך אחר.

בשונה למשל מהממוצע המחזיר תמיד ערך יחיד, לשכיח יכולות להיות תוצאות אחדות, כאשר ישנם ערכים אחדים שלכולם אותו מספר של מופעים (והוא גדול מזה של הערכים האחרים).

לשכיח יש חשיבות מיוחדת כאשר סדרת הערכים אינה מספרית, ולכן אי אפשר להציג לה ממוצע וחציון. דוגמה: בסדרת הערכים: "תפוח, בצל, אבטיח, תפוח, תפוח", הערך "תפוח" הוא השכיח.

דוגמה: במדגם שבא לאתר את המילים השכיחות ביותר בשפה האנגלית, נמצא שהשכיח, כלומר המילה הנפוצה ביותר, הוא המילה the.

בהתפלגות נורמלית, השכיח, הממוצע והחציון זהים. לכן, השוואה בין השכיח והחציון לבין הממוצע יכולה ללמד על השוני בין התפלגות נתונה לבין ההתפלגות הנורמלית. עם זאת, יש עוד התפלגויות רבות שבהן השכיח, הממוצע והחציון זהים, ובכל זאת אינן התפלגויות נורמליות.

יש להבחין בין שכיח בהתפלגות בדידה המתואר גרפית בדיאגרמת מקלות והוא הערך עם השכיחות (המקל)הגבוה ביותר (ייתכן יותר משכיח אחד), להתפלגות רציפה בה השכיח הוא הערך עם הצפיפות הגבוה ביותר, שיא הפונקציה.