מתאם – הבדלי גרסאות

מתוך ויקיפדיה, האנציקלופדיה החופשית
תוכן שנמחק תוכן שנוסף
אין תקציר עריכה
אין תקציר עריכה
שורה 5: שורה 5:
== דוגמאות ==
== דוגמאות ==


רבים נעשה ניסיון למצוא מתאם בין שינוי שנעשה ב[[משתנה בלתי תלוי]] לבין שינוי שנצפה ב[[משתנה תלוי|משתנה התלוי]].
=== מקדם המתאם של פירסון ===
קיימים כמה מדדי קשר, בהתאם ל[[סולם מדידה|סולם המדידה]] של המשתנים הנמדדים. במקרה של אי-התאמה בין הסולמות של שני משתנים, יש להשתמש במדד המתאים לסולם הנמוך מבין השניים.


=== מקדם המתאם של פירסון ===
ב[[מחקר]]ים רבים נעשה ניסיון למצוא מתאם בין שינוי שנעשה ב[[משתנה בלתי תלוי]] לבין שינוי שנצפה ב[[משתנה תלוי|משתנה התלוי]].

== מקדם המתאם של פירסון ==
{{ערך מורחב| מתאם פירסון}}
{{ערך מורחב| מתאם פירסון}}


המדד המוכר ביותר למדידת הקשר בין שני משתנים כמותיים הוא ״[[מתאם פירסון|מקדם המתאם של פירסון]]״ (לעיתים קרובות נקרא בפשטות "מתאם פירסון" או אף ״מקדם המתאם״). [[קרל פירסון]] פיתח את המקדם מתוך רעיון דומה אך מעט שונה של [[פרנסיס גולטון]]. מדד זה מודד את עוצמת הקשר הלינארי בין שני משתנים כמותיים, כאשר ערך של אחד מציין קשר לינארי חיובי מלא, וערך של 1- מציין קשר לינארי שלילי מלא. ערך של 0 מציין חוסר קשר לינארי. עם זאת ייתכןנו מצבים בהם ערכו של מתאם פירסון שווה לאפס, ועדיין קיים קשר ואף תלות סטטיסטית בין המשתנים, אך הקשר אינו לינארי. זה קורה למשל כאשר ההתפלגות המשותפת של שני המשתנים סימטרית סביב אפס.
המדד המוכר ביותר למדידת הקשר בין שני משתנים כמותיים הוא ״[[מתאם פירסון|מקדם המתאם של פירסון]]״ (לעיתים קרובות נקרא בפשטות "מתאם פירסון" או אף ״מקדם המתאם״). [[קרל פירסון]] פיתח את המקדם מתוך רעיון דומה אך מעט שונה של [[פרנסיס גולטון]]. מדד זה מודד את עוצמת הקשר הלינארי בין שני משתנים כמותיים, כאשר ערך של אחד מציין קשר לינארי חיובי מלא, וערך של 1- מציין קשר לינארי שלילי מלא. ערך של 0 מציין חוסר קשר לינארי. עם זאת ייתכןנו מצבים בהם ערכו של מתאם פירסון שווה לאפס, ועדיין קיים קשר ואף תלות סטטיסטית בין המשתנים, אך הקשר אינו לינארי. זה קורה למשל כאשר ההתפלגות המשותפת של שני המשתנים סימטרית סביב אפס.

: <math>

\rho_{X,Y}=\mathrm{corr}(X,Y)={\mathrm{cov}(X,Y) \over \sigma_X \sigma_Y} ={E[(X-\mu_X)(Y-\mu_Y)] \over \sigma_X\sigma_Y},

</math>

E מסמל את אופרטור התוחלת, cov מסמל שונות משותפת, ו־corr הוא סימון מקובל למקדם המתאם.
E מסמל את אופרטור התוחלת, cov מסמל שונות משותפת, ו־corr הוא סימון מקובל למקדם המתאם.


=== מקדם המתאם של פירסון ===
=== מקדם המתאם של ספירמן===
{{ערך מורחב| מקדם ספירמן}}
{{ערך מורחב| מקדם ספירמן}}


[[מקדם ספירמן]] הוא הכללה של מתאם פירסון שמתאימה למקרה בו לפחות אחד משני המשתנים נמדד בסולם סדר, והמשתנה השני יכול להימדד בסולם סדר, רווח או מנה. כדי לחשב את מתאם ספירמן מדרגים את הערכים של כל אחד מהמשתנים, כך שהתצפית שערכה הנמוך ביותר מקבלת דרגה השווה ל-1 וכן הלאה. לדוגמא, אם ערכי משתנה אחד הם "גבוה", "נמוך" ו-"בינוני", הדרגות יהיו 3, 1 ו-2 בהתאמה. לאחר מכן, מפעילים את נוסחת החישוב של מתאם פירסון על דרגות הערכים במקום על הערכים עצמם.
מקדמי דירוג מתאם, כמו [[מקדם ספירמן]] ומקדם קנדל מודדים את מידת הנטייה של מקדם לגדול, כאשר המקדם השני גדל, בלי לדרוש שהגדילה תיוצג על ידי קשר ליניארי.
אם כאשר משתנה אחד גדל, השני קטן, מקדמי דירוג המקדם יהיו שליליים. שכיח להתייחס למקדמי דירוג המתאם האלה כתחלופה למקדם של פירסון, המשמש להפחתה של כמות החישובים או לחלופין להפיכה של המקדם לפחות רגיש לאי-נורמליות בהתפלגות. עם זאת, להנחה הזאת אין בסיס מתמטי ממשי, שכן מקדמי דירוג מתאם מודדים סוג קשר שונה מהקשר אותו מודד המקדם של פירסון.

כדי להדגים את טבע דירוג המתאם, ואת ההבדל ממתאם ליניארי, בחנו את 4 זוגות המספרים (x, y):
(0, 1), (10, 100), (101, 500), (102, 2000)


=== מקדם הקשר של קרמר===
במעבר מזוג אחד להבא, ערך x גדל, וכך גם ערך y. קשר זה הוא מושלם, במובן שגידול בערך ה-x מלווה תמיד, ללא יוצא מן הכלל, בגידול בערך ה-y. כלומר, יש לנו דירוג מתאם מושלם, ומקדמי ספירמן וקנדל שווים בערכם ל-1, כאשר בדוגמה זו מקדם פירסון שווה בערכו ל-0.7544, ומצביע על כך שהנקודות רחוקות מלהיות על קו ישר. באופן זהה, אם הערך של y תמיד קטן ושל x תמיד גדל, דירוג המתאם יהיה 1-, ומתאם פירסון יהיה קרוב ל-1 או ל-1-, תלוי במיקום הנקודות ביחס לקו ישר. אף על פי שבמקרים קיצוניים של דירוג מתאם מושלם שני המקדמים שווים זה לזה, זהו לא המקרה בדרך כלל, ולכן ערכים של שני המקדמים לא יכולים להיות מושווים באופן משמעותי. למשל, עבור שלושת הזוגות (1, 1) (2, 3) (3, 2) מקדם ספירמן הוא 0.5, בעוד שמקדם קנדל הוא 1/3.
מקדם הקשר של קרמר (המסומן בדרך כלל באות V) פותח על ידי הסטטיסטיקאי השוודי הראלד קרמר. מקדם זה מתאים למדידת עצמת הקשר בין שני משתנים קטגוריים. הוא מבוסס על ערכו של סטטיסטי חי-בריבוע המיועד לבדיקת ההשערה הסטטיסטית של אי תלות בין המשתנים, כאשר ערך זה מתוקנן לפי מספר הקטגוריות של כל אחד מהמשתנים והוצאת שורש. ערכו של מקדם המתאם של קרמר נע בין 0 ל-1, כאשר ערך 0 מציין אי תלות סטטיסטית בין המשתנים.


== מדדים נוספים של תלות בקשר משתנים אקראיים ==
=== מדדים נוספים של תלות בקשר משתנים אקראיים ===
המידע הניתן על ידי מקדם המתאם לא מספיק על מנת להגדיר את מבנה התלות בין משתנים אקראיים. מקדם המתאם מגדיר את מבנה התלות לחלוטין רק במקרים מאוד מסוימים, למשל כאשר ההתפלגות היא [[התפלגות רב-נורמלית]] (ראה דיאגרמה בתחילת העמוד). במקרה של התפלגות אליפטית הוא מאפיין את אליפסות הצפיפות השווה. עם זאת, הוא לא מאפיין לחלוטין את מבנה התלות.
המידע הניתן על ידי מקדם המתאם לא מספיק על מנת להגדיר את מבנה התלות בין משתנים אקראיים. מקדם המתאם מגדיר את מבנה התלות לחלוטין רק במקרים מאוד מסוימים, למשל כאשר ההתפלגות היא [[התפלגות רב-נורמלית]] (ראה דיאגרמה בתחילת העמוד). במקרה של התפלגות אליפטית הוא מאפיין את אליפסות הצפיפות השווה. עם זאת, הוא לא מאפיין לחלוטין את מבנה התלות.



גרסה מ־19:12, 23 באוקטובר 2018

מִתְאָם או קשר (באנגלית association) הוא תכונה של קשר סטטיסטי בין שני משתנים. בדרך כלל עוצמת הקשר נמדדת על ידי מדד סטטיסטי המכונה "מקדם מתאם" או "מקדם קשר". יש מספר רב של מקדמי קשר, השונים זה מזה באופן שבו מוגדר הקשר בין המשתנים. אופן הגדרת הקשר תלוי גם בסולמות המדידה של המשתנים.

בדרך כלל ערכיהם של מקדמי הקשר נעים בין 1- ל-1, או בין 0 ל-1. ערך של 0 מציין בדרך כלל חוסר קשר בין המשתנים (במובן שבו הוגדר הקשר), וערכים של 1 או של 1- מציינים בדרך כלל קשר מלא בין המשתנים.

דוגמאות

רבים נעשה ניסיון למצוא מתאם בין שינוי שנעשה במשתנה בלתי תלוי לבין שינוי שנצפה במשתנה התלוי.

מקדם המתאם של פירסון

ערך מורחב – מתאם פירסון

המדד המוכר ביותר למדידת הקשר בין שני משתנים כמותיים הוא ״מקדם המתאם של פירסון״ (לעיתים קרובות נקרא בפשטות "מתאם פירסון" או אף ״מקדם המתאם״). קרל פירסון פיתח את המקדם מתוך רעיון דומה אך מעט שונה של פרנסיס גולטון. מדד זה מודד את עוצמת הקשר הלינארי בין שני משתנים כמותיים, כאשר ערך של אחד מציין קשר לינארי חיובי מלא, וערך של 1- מציין קשר לינארי שלילי מלא. ערך של 0 מציין חוסר קשר לינארי. עם זאת ייתכןנו מצבים בהם ערכו של מתאם פירסון שווה לאפס, ועדיין קיים קשר ואף תלות סטטיסטית בין המשתנים, אך הקשר אינו לינארי. זה קורה למשל כאשר ההתפלגות המשותפת של שני המשתנים סימטרית סביב אפס. E מסמל את אופרטור התוחלת, cov מסמל שונות משותפת, ו־corr הוא סימון מקובל למקדם המתאם.

מקדם המתאם של ספירמן

מקדם ספירמן הוא הכללה של מתאם פירסון שמתאימה למקרה בו לפחות אחד משני המשתנים נמדד בסולם סדר, והמשתנה השני יכול להימדד בסולם סדר, רווח או מנה. כדי לחשב את מתאם ספירמן מדרגים את הערכים של כל אחד מהמשתנים, כך שהתצפית שערכה הנמוך ביותר מקבלת דרגה השווה ל-1 וכן הלאה. לדוגמא, אם ערכי משתנה אחד הם "גבוה", "נמוך" ו-"בינוני", הדרגות יהיו 3, 1 ו-2 בהתאמה. לאחר מכן, מפעילים את נוסחת החישוב של מתאם פירסון על דרגות הערכים במקום על הערכים עצמם.

מקדם הקשר של קרמר

מקדם הקשר של קרמר (המסומן בדרך כלל באות V) פותח על ידי הסטטיסטיקאי השוודי הראלד קרמר. מקדם זה מתאים למדידת עצמת הקשר בין שני משתנים קטגוריים. הוא מבוסס על ערכו של סטטיסטי חי-בריבוע המיועד לבדיקת ההשערה הסטטיסטית של אי תלות בין המשתנים, כאשר ערך זה מתוקנן לפי מספר הקטגוריות של כל אחד מהמשתנים והוצאת שורש. ערכו של מקדם המתאם של קרמר נע בין 0 ל-1, כאשר ערך 0 מציין אי תלות סטטיסטית בין המשתנים.

מדדים נוספים של תלות בקשר משתנים אקראיים

המידע הניתן על ידי מקדם המתאם לא מספיק על מנת להגדיר את מבנה התלות בין משתנים אקראיים. מקדם המתאם מגדיר את מבנה התלות לחלוטין רק במקרים מאוד מסוימים, למשל כאשר ההתפלגות היא התפלגות רב-נורמלית (ראה דיאגרמה בתחילת העמוד). במקרה של התפלגות אליפטית הוא מאפיין את אליפסות הצפיפות השווה. עם זאת, הוא לא מאפיין לחלוטין את מבנה התלות.

מתאם מרחק ומתאם בראוני (Brownie coeffiecient) הובאו על מנת לטפל במחסור של מתאם פירסון שיוכל להיות אפס עבור משתנים תלויים אקראיים; מתאם מרחק אפסי ומתאם בראוני אפסי מצביעים על חוסר תלות.

ראו גם

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא מתאם בוויקישיתוף
ערך זה הוא קצרמר בנושא סטטיסטיקה. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.