התפלגות קטגוריאלית

מתוך ויקיפדיה, האנציקלופדיה החופשית
התפלגות קטגוריאלית
מאפיינים
פרמטרים מספר הקטגוריות (מספר שלם)
הסתברות לכל איבר בתומך
תומך
פונקציית הסתברות
(pmf)
ערך שכיח כך ש-

בתורת ההסתברות ובסטטיסטיקה, התפלגות קטגוריאלית (נקראת גם התפלגות ברנולי מוכללת [1] ) היא התפלגות בדידה המתארת את התוצאות האפשריות של משתנה מקרי שיכול לקבל על עצמו אחת מ- קטגוריות אפשריות, כאשר ההסתברות של כל קטגוריה מפורטת בנפרד. אין סדר טבעי לקטגוריות, אך לעיתים קרובות מצורפות תוויות מספריות מטעמי נוחות בתיאור ההתפלגות, (למשל ). ההתפלגות הקטגוריאלית ה--ממדית היא ההתפלגות הכללית ביותר שיש לה תומך עם איברים; כל התפלגות נפרדת אחרת עם תומך בגודל היא מקרה פרטי. הפרמטרים המציינים את ההסתברויות של כל תוצאה אפשרית מוגבלים רק על ידי העובדה שכל אחד מהם חייב להיות בטווח של עד , וכולם חייבים להסתכם ב-.

ההתפלגות הקטגוריאלית היא הכללה של התפלגות ברנולי, כלומר עבור משתנה בדיד עם יותר משתי תוצאות אפשריות, כגון הטלת קובייה. מצד שני, ההתפלגות הקטגוריאלית היא מקרה פרטי של ההתפלגות המולטינומית, שניתן לקבל משתנה מולטינומי כסיכום סדרה של משתנים קטגוריאלים.

מינוח[עריכת קוד מקור | עריכה]

לעיתים, ההתפלגות הקטגורית מכונה "התפלגות בדידה". עם זאת, תכונה זאת מתייחסת לא למשפחה מסוימת של התפלגויות אלא לסוג כללי של התפלגויות .

בתחומים מסוימים, כגון למידת מכונה ועיבוד שפה טבעית, מקובל לדבר בטעות על "התפלגות מולטינומית" כאשר הכוונה היא להתפלגות קטגוריאלית.[2] שימוש לא מדויק זה נובע מהעובדה שלעיתים נוח לבטא את התוצאה של התפלגות קטגוריאלית כווקטור " -מ- " (וקטור עם רכיב אחד השווה ל- וכל שאר הרכיבים ) במקום מספר שלם בטווח בין ל- ; בצורה זו, התפלגות קטגוריאלית שוות ערך להתפלגות מולטינומית עם חזרה .

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ Murphy, K. P. (2012). Machine learning: a probabilistic perspective, p. 35. MIT press. מסת"ב 0262018020.
  2. ^ Minka, T. (2003) Bayesian inference, entropy and the multinomial distribution. Technical report Microsoft Research.