טבלת שכיחות

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

טבלת שכיחויות היא טבלה שמציגה את השכיחויות של התוצאות השונות במדגם[1].

כל רשומה בטבלה מכילה את השכיחות או המנייה של הופעתם של ערכים בתוך קבוצה או מרווח מסוימים. בדרך זו הטבלה מסכמת את ההתפלגות של הערכים במדגם.

טבלת שכיחויות של משתנה יחיד[עריכת קוד מקור | עריכה]

טבלת שכיחויות של משתנה יחיד מאפשרת להציג מידע בצורה מאורגנת

דוגמה של טבלת שכיחויות עבור משתנה יחיד. טבלה זו מציגה את השכיחות של כל תגובה לשאלות של סקר.

דרוג מידת ההסכמה מספר
1 מסכים במידה רבה 20
2 מסכים 30
3 לא בטוח 20
4 לא מסכים 15
5 מתנגד 15

דרך נוספת להציג את הנתונים בטבלה היא ארגון הערכים של המשתנה לתת קבוצות כך שכל אחת מהן תתייחס לטווח של ערכים. למשל, ניתן להציג את הגובה של תלמידים בכיתה בדרך זו

טווח גובה מספר התלמידים מספר מצטבר
עד 150 ס"מ 25 25
151 - 160 ס"מ 35 60
161 - 170 ס"מ 20 80
171 - 180 ס"מ 20 100

טבלת השכיחויות מציגה את הסיכום של מידע המקובץ למחלקות שונות יחד עם מספר המקרים בכל מחלקה. זוהי דרך להציג מידע לא מאורגן כמו תוצאות של בחירות, הכנסה של אנשים מאזור מסוים, מכירות של מוצר בחודש נתון ועוד.

דרך נוספת להצגת הערכים הכלולים בכל מחלקה היא שימוש בסימנים המתמטיים המייצגים קטע פתוח וסגור. למשל:

  1. (נקרא "קטע פתוח")
  2. (נקרא "קטע סגור")

בנייה של טבלת שכיחויות[עריכת קוד מקור | עריכה]

בנייה של טבלת שכיחויות
חלק מתהליך הבנייה של טבלת שכיחויות כולל הגדרת גודל הקבוצות שאליהן יחולקו הנתונים

שלבים לבנייה של טבלת שכיחויות

  1. החלטה על מספר המחלקות - כמות קטנה או גדולה מידי לא יחשפו את הצורה הבסיסית של בסיס הנתונים ויקשו על פירוש המידע. ניתן לקבוע את המספר המרבי של המחלקות על ידי הנוסחה הבאה: או כאשר n הוא מספר התצפיות הכולל במדגם.
  2. חישוב הטווח של הנתונים - הטווח מחושב על ידי ההפרש בין הערך המקסימלי למינימאלי (Range = Max – Min). הטווח ישמש לקביעת גודל המחלקות.
  3. קביעת גודל המחלקות על ידי הנוסחה - .

באופן כללי הגודל של המחלקות צריך להיות אחיד, כאשר מכלול המחלקות צריך לתת ביטוי לכל הטווח. בעוד שישנה העדפה למחלקות אחידות בגודלן, ישנם מקרים בהם יהיה צורך למחלקות בעלות גודל שונה. למשל כדי להימנע מתאים ריקים או כמעט ריקים.

  1. קביעת גבולות המחלקות ובחירת נקודת התחלה מתאימה של המחלקה הראשונה שהיא שרירותית, הוא עשויה להיות קטנה או שווה לערך המינימאלי. בדרך כלל היא תתחיל לפני הערך המינימאלי באופן כזה שנקודת האמצע (הממוצע של הגבולות הנמוכים והגבוהים של המחלקה הראשונה) ממוקמת כראוי.
  2. סימון של קו אנכי (|) עבור כל תצפית במקום המתאים בטבלה.
  3. מציאת התדירויות הנדרשות.

תצוגה גרפית של טבלת שכיחויות[עריכת קוד מקור | עריכה]

חלק מהגרפים שבהם ניתן לעשות שימוש באמצעות טבלת השכיחויות הם:

  • דיאגרמת עוגה - גרף המראה את היחס בין החלקים לבין השלם ובינם לבין עצמם, כלומר את התפלגות השלם לחלקים היחסיים.
  • גרף עמודות - צורת הצגה גרפית של נתונים מספריים.
  • היסטוגרמה - נתונים בהיסטוגרמה מוצגים כמלבנים המייצגים מחלקות שונות (הקרויות גם קטגוריות), שאין ביניהן חפיפה, באוכלוסיית הנתונים לפי שכיחותן היחסית.

טבלת שכיחויות משותפת[עריכת קוד מקור | עריכה]

חישוב הסכומים בטבלת שכיחויות משותפת
טבלת שכיחויות משותפת של מקצוע ומגדר
טבלת שכיחויות משותפת של מקצוע ומגדר עם אחוזים

טבלת שכיחות משותפת לשני משתנים מוצגת כטבלת אפשרויות (Contingency table) דו כיוונית  

טבלת אפשרויות דו כיוונית
ריקוד ספורט טלוויזיה סה"כ
גברים 2 10 8 20
נשים 16 6 8 30
סה"כ 18 16 16 50

טור הסכום ושורת הסכום מייצגים את התדירויות השוליות (marginal frequencies or marginal distribution) בעוד שגוף הטבלה מציג את התדירויות המשולבות[2].

יישומים[עריכת קוד מקור | עריכה]

ניהול ועיבוד של מידע בטבלת שכיחויות פשוט יותר מהעבודה עם מידע גולמי. ישנם אלגריתמים פשוטים לחישוב של ממוצע, חציון וסטיית תקן מטבלאות אלו.

בדיקת השערות מתבססת על הבדלים ונקודות דמיון בין טבלאות שכיחויות. הערכה זו מתבססת על מדידה של נטייה מרכזית או ממוצע ומדידה של שונות כמו סטיית תקן.

טבלת השכיחויות נחשבת למצודדת כאשר קיים הפרש בין החציון ולבין הממוצע שלה.

הגבנוניות של הטבלה מתייחסת למידת הריכוז של הנתונים סביב הממוצע, או על פי השיא של התצוגה הגרפית שלה.

קישורים חיצוניים[עריכת קוד מקור | עריכה]

ויקישיתוף מדיה וקבצים בנושא טבלת שכיחות בוויקישיתוף

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ Australian Bureau of Statistics
  2. ^ Stat Trek, Statistics and Probability Glossary, s.v. Joint frequency