טבלת שכיחות – הבדלי גרסאות

מתוך ויקיפדיה, האנציקלופדיה החופשית
תוכן שנמחק תוכן שנוסף
שורה 72: שורה 72:
שלבים לבנייה של טבלת שכיחויות
שלבים לבנייה של טבלת שכיחויות
# החלטה על מספר המחלקות - כמות קטנה או גדולה מידי לא יחשפו את הצורה הבסיסית של בסיס הנתונים ויקשו על פירוש המידע. ניתן לקבוע את המספר המרבי של המחלקות על ידי הנוסחה הבאה: <math>Number of Classes = C = 1 + 3.3 log (n)</math> או <math> C = \sqrt{n} (approximately)</math> כאשר n הוא מספר התצפיות הכולל במדגם.
# החלטה על מספר המחלקות - כמות קטנה או גדולה מידי לא יחשפו את הצורה הבסיסית של בסיס הנתונים ויקשו על פירוש המידע. ניתן לקבוע את המספר המרבי של המחלקות על ידי הנוסחה הבאה: <math>Number of Classes = C = 1 + 3.3 log (n)</math> או <math> C = \sqrt{n} (approximately)</math> כאשר n הוא מספר התצפיות הכולל במדגם.
# חישוב הטווח של הנתונים - הטווח מחושב על ידי ההפרש בין הערך המקסימאלי למינימאלי (Range = Max – Min). הטווח ישמש לקביעת גודל המחלקות.
#
#





גרסה מ־22:48, 27 באוקטובר 2015

הערך נמצא בשלבי עבודה: כדי למנוע התנגשויות עריכה ועבודה כפולה, אתם מתבקשים שלא לערוך את הערך בטרם תוסר ההודעה הזו, אלא אם כן תיאמתם זאת עם מניח התבנית.
אם הערך לא נערך במשך שבוע ניתן להסיר את התבנית ולערוך אותו, אך לפני כן רצוי להזכיר את התבנית למשתמש שהניח אותה, באמצעות הודעה בדף שיחתו.
הערך נמצא בשלבי עבודה: כדי למנוע התנגשויות עריכה ועבודה כפולה, אתם מתבקשים שלא לערוך את הערך בטרם תוסר ההודעה הזו, אלא אם כן תיאמתם זאת עם מניח התבנית.
אם הערך לא נערך במשך שבוע ניתן להסיר את התבנית ולערוך אותו, אך לפני כן רצוי להזכיר את התבנית למשתמש שהניח אותה, באמצעות הודעה בדף שיחתו.

טבלת שכיחויות היא טבלה שמציגה את השכיחויות של תוצאות שונות במדגם[1].

כל רשומה בטבלה מכילה את השכיחות או המנייה של הופעתם של ערכים בתוך קבוצה או מרווח מסוימים. בדרך זו הטבלה מסכמת את ההתפלגות של הערכים במדגם.

טבלת שכיחויות של משתנה יחיד

טבלת שכיחויות של משתנה יחיד מאפשרת להציג מידע בצורה מאורגנת

דוגמה של טבלת שכיחויות עבור משתנה יחיד. טבלה זו מציגה את השכיחות של כל תגובה לשאלות של סקר.

דרוג מידת ההסכמה מספר
1 מסכים במידה רבה 20
2 מסכים 30
3 לא בטוח 20
4 לא מסכים 15
5 מתנגד 15

דרך נוספת להציג את הנתונים בטבלה היא ארגון הערכים של המשתנה לתת קבוצות כך שכל אחת מהן תתייחס לטווח של ערכים. למשל, ניתן להציג את הגובה של תלמידים בכיתה בדרך זו

טווח גובה מספר התלמידים מספר מצטבר
פחות מ 5.0 רגל 25 25
5.0–5.5 רגל 35 60
5.5–6.0 רגל 20 80
6.0–6.5 רגל 20 100

טבלת השכיחויות מציגה את הסיכום של מידע המקובץ למחלקות שונות יחד עם מספר המקרים בכל מחלקה. זוהי דרך להציג מידע לא מאורגן כמו תוצאות של בחירות, הכנסה של אנשים מאזור מסוים, מכירות של מוצר בחודש נתון ועוד.

בנייה של טבלת שכיחויות

בנייה של טבלת שכיחויות
חלק מתהליך הבנייה של טבלת שכיחויות כולל הגדרת גודל הקבוצות שאליהן יחולקו הנתונים

שלבים לבנייה של טבלת שכיחויות

  1. החלטה על מספר המחלקות - כמות קטנה או גדולה מידי לא יחשפו את הצורה הבסיסית של בסיס הנתונים ויקשו על פירוש המידע. ניתן לקבוע את המספר המרבי של המחלקות על ידי הנוסחה הבאה: או כאשר n הוא מספר התצפיות הכולל במדגם.
  2. חישוב הטווח של הנתונים - הטווח מחושב על ידי ההפרש בין הערך המקסימאלי למינימאלי (Range = Max – Min). הטווח ישמש לקביעת גודל המחלקות.


באופן כללי הגודל של המחלקות צריך להיות אחיד, כאשר מכלול המחלקות צריך לתת ביטוי לכל הטווח. בעוד שישנה העדפה למחלקות אחידות בגודלן, ישנם מקרים בהם יהיה צורך למחלקות בעלות גודל שונה. למשל בכדי להימנע מתאים ריקים או כמעט ריקים.

תצוגה גראפית של טבלת שכיחויות

חלק מהגרפים שבהם ניתן לעשות שימוש באמצעות טבלת השכיחויות הם:

  • דיאגרמת עוגה - גרף המראה את היחס בין החלקים לבין השלם ובינם לבין עצמם, כלומר את התפלגות השלם לחלקים היחסיים.
  • גרף עמודות - צורת הצגה גרפית של נתונים מספריים.
  • היסטוגרמה - נתונים בהיסטוגרמה מוצגים כמלבנים המייצגים מחלקות שונות (הקרויות גם קטגוריות), שאין ביניהן חפיפה, באוכלוסיית הנתונים לפי שכיחותן היחסית.

טבלת שכיחויות משותפת

חישוב הסכומים בטבלת שכיחויות משותפת
טבלת שכיחויות משותפת של מקצוע ומגדר
טבלת שכיחויות משותפת של מקצוע ומגדר עם אחוזים

טבלת שכיחות משותפת לשני משתנים מוצגת כטבלת אפשרויות (Contingency table) דו כיוונית  

טבלת אפשרויות דו כיוונית
ריקוד ספורט טלוויזיה סה"כ
גברים 2 10 8 20
נשים 16 6 8 30
סה"כ 18 16 16 50

טור הסכום ושורת הסכום מייצגים את התדירויות השוליות (marginal frequencies or marginal distribution) בעוד שגוף הטבלה מציג את התדירויות המשולבות[2].

יישומים

ניהול ועיבוד של מידע בטבלת שכיחויות פשוט יותר מהעבודה עם מידע גולמי. ישנם לוגריתמים פשוטים לחישוב של ממוצע, חציון וסטיית תקן מטבלאות אלו.

בדיקת השערות מתבססת על הבדלים ונקודות דמיון בין טבלאות שכיחויות. הערכה זו מתבססת על מדידה של נטייה מרכזית או ממוצע ומדידה של שונות כמו סטיית תקן.

טבלת השכיחויות נחשבת למצודדת בהתאם ליחס בין החציון והממוצע שלה.

הגבנוניות של הטבלה מתייחסת למידת הריכוז של הנתונים סביב הממוצע, או על פי השיא של התצוגה הגרפית שלה.

הערות שוליים

  1. ^ Australian Bureau of Statistics
  2. ^ Stat Trek, Statistics and Probability Glossary, s.v. Joint frequency

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא טבלת שכיחות בוויקישיתוף