מתאם – הבדלי גרסאות

מתוך ויקיפדיה, האנציקלופדיה החופשית
תוכן שנמחק תוכן שנוסף
המשך שדרוג העך - הוספת דוגמה נוספת - ICC
מתאם וסיבתיות
שורה 24: שורה 24:


מתאם מרחק ומתאם בראוני (Brownie coeffiecient) הובאו על מנת לטפל במחסור של מתאם פירסון שיוכל להיות אפס עבור משתנים תלויים אקראיים; מתאם מרחק אפסי ומתאם בראוני אפסי מצביעים על חוסר תלות.
מתאם מרחק ומתאם בראוני (Brownie coeffiecient) הובאו על מנת לטפל במחסור של מתאם פירסון שיוכל להיות אפס עבור משתנים תלויים אקראיים; מתאם מרחק אפסי ומתאם בראוני אפסי מצביעים על חוסר תלות.

== מתאם וסיבתיות ==
מתאם גבוה המעיד על עוצמת קשר חזקה בין שני משתנים אינו בהכרח מעיד על [[סיבתיות|קשר סיבתי]] בין שני המשתנים. מתאם גבוה בין שני משתנים יכול להתקבל באופן מקרי לחלוטין, במקרה שיש משתנה שלישי המשפיע על ערכי שני המשתנים שהמתאם נמדד ביניהם, ובמקרים נוספים.

עם זאת, מתאם גבוה יוביל בדרך כלל לבדיקה האם יש קשר סיבתי בין המשתנים, וקיומו של מתאם גבוה הוא אחד הקריטריונים של [[ברדפורד היל]] להסקת סיבתיות.

המסקנה ההפוכה הינה נכונה: קשר סיבתי בין שני משתנים יגרום למתאם, בדרך כלל גבוה, בין שני המשתנים.<ref>{{צ-מאמר|מחבר=Naomi Altman & Martin Krzywinski|שם=Association, correlation and causation|כתב עת=Nature Methods|כרך=12|סדרה=10|עמ=899-900|שנת הוצאה=201|קישור=https://www.nature.com/articles/nmeth.3587}}</ref>


== ראו גם ==
== ראו גם ==

גרסה מ־14:04, 24 באוקטובר 2018

מִתְאָם או קשר (באנגלית association) הוא תכונה של קשר סטטיסטי בין שני משתנים. קשר זה אינו חייב להיות סיבתי. בדרך כלל עוצמת הקשר נמדדת על ידי מדד סטטיסטי המכונה "מקדם מתאם" או "מקדם קשר". יש מספר רב של מקדמי קשר, השונים זה מזה באופן שבו מוגדר הקשר בין המשתנים. אופן הגדרת הקשר תלוי גם בסולמות המדידה של המשתנים.

בדרך כלל ערכיהם של מקדמי הקשר נעים בין 1- ל-1, או בין 0 ל-1. ערך של 0 מציין בדרך כלל חוסר קשר בין המשתנים (במובן שבו הוגדר הקשר), וערכים של 1 או של 1- מציינים בדרך כלל קשר מלא בין המשתנים.

דוגמאות

מקדם המתאם של פירסון

ערך מורחב – מתאם פירסון

המדד המוכר ביותר למדידת הקשר בין שני משתנים כמותיים הוא ״מקדם המתאם של פירסון״ (לעיתים קרובות נקרא בפשטות "מתאם פירסון" או אף ״מקדם המתאם״). קרל פירסון פיתח את המקדם מתוך רעיון דומה אך מעט שונה של פרנסיס גולטון. מדד זה מודד את עוצמת הקשר הלינארי בין שני משתנים כמותיים, כאשר ערך של אחד מציין קשר לינארי חיובי מלא, וערך של 1- מציין קשר לינארי שלילי מלא. ערך של 0 מציין חוסר קשר לינארי. עם זאת ייתכנו מצבים בהם ערכו של מתאם פירסון שווה לאפס, ועדיין קיים קשר ואף תלות סטטיסטית בין המשתנים, אך הקשר אינו לינארי. זה קורה למשל כאשר ההתפלגות המשותפת של שני המשתנים סימטרית סביב אפס.

מקדם המתאם של ספירמן

ערך מורחב – מתאם ספירמן

מקדם ספירמן הוא הכללה של מתאם פירסון שמתאימה למקרה בו לפחות אחד משני המשתנים נמדד בסולם סדר, והמשתנה השני יכול להימדד בסולם סדר, רווח או מנה. כדי לחשב את מתאם ספירמן מדרגים את הערכים של כל אחד מהמשתנים, כך שהתצפית שערכה הנמוך ביותר מקבלת דרגה השווה ל-1 וכן הלאה. לדוגמא, אם ערכי משתנה אחד הם "גבוה", "נמוך" ו-"בינוני", הדרגות יהיו 3, 1 ו-2 בהתאמה. לאחר מכן, מפעילים את נוסחת החישוב של מתאם פירסון על דרגות הערכים במקום על הערכים עצמם.

מקדם הקשר של קרמר

מקדם הקשר של קרמר (המסומן בדרך כלל באות V) פותח על ידי הסטטיסטיקאי השוודי הראלד קרמר. מקדם זה מתאים למדידת עצמת הקשר בין שני משתנים קטגוריים. הוא מבוסס על ערכו של סטטיסטי חי-בריבוע המיועד לבדיקת ההשערה הסטטיסטית של אי תלות בין המשתנים, כאשר ערך זה מתוקנן לפי מספר הקטגוריות של כל אחד מהמשתנים והוצאת שורש. ערכו של מקדם המתאם של קרמר נע בין 0 ל-1, כאשר ערך 0 מציין אי תלות סטטיסטית בין המשתנים.

מקדם המתאם התוך-אשכולי

מקדם המתאם התוך-אשכולי (Intraclass correlation או ICC) מודד את עצמת הקשר בין משתנה כמותי ומשתנה קטגורי. המקדם, שפיתח רונלד פישר, מבוסס על הפרמטרים של מודל ניתוח שונות חד כיווני. מודל זה משווה בין הממוצעים של משתנה כמותי הנמדד באופן בלתי תלוי במספר קבוצות. המדד הוא היחס בין השונות שבין הקבוצות ובין השונות הכוללת, וערכו נע בין 0 ל-1.

מדדים נוספים של תלות בקשר משתנים אקראיים

המידע הניתן על ידי מקדם המתאם לא מספיק על מנת להגדיר את מבנה התלות בין משתנים אקראיים. מקדם המתאם מגדיר את מבנה התלות לחלוטין רק במקרים מאוד מסוימים, למשל כאשר ההתפלגות היא התפלגות רב-נורמלית (ראה דיאגרמה בתחילת העמוד). במקרה של התפלגות אליפטית הוא מאפיין את אליפסות הצפיפות השווה. עם זאת, הוא לא מאפיין לחלוטין את מבנה התלות.

מתאם מרחק ומתאם בראוני (Brownie coeffiecient) הובאו על מנת לטפל במחסור של מתאם פירסון שיוכל להיות אפס עבור משתנים תלויים אקראיים; מתאם מרחק אפסי ומתאם בראוני אפסי מצביעים על חוסר תלות.

מתאם וסיבתיות

מתאם גבוה המעיד על עוצמת קשר חזקה בין שני משתנים אינו בהכרח מעיד על קשר סיבתי בין שני המשתנים. מתאם גבוה בין שני משתנים יכול להתקבל באופן מקרי לחלוטין, במקרה שיש משתנה שלישי המשפיע על ערכי שני המשתנים שהמתאם נמדד ביניהם, ובמקרים נוספים.

עם זאת, מתאם גבוה יוביל בדרך כלל לבדיקה האם יש קשר סיבתי בין המשתנים, וקיומו של מתאם גבוה הוא אחד הקריטריונים של ברדפורד היל להסקת סיבתיות.

המסקנה ההפוכה הינה נכונה: קשר סיבתי בין שני משתנים יגרום למתאם, בדרך כלל גבוה, בין שני המשתנים.[1]

ראו גם

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא מתאם בוויקישיתוף
ערך זה הוא קצרמר בנושא סטטיסטיקה. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.
  1. ^ Naomi Altman & Martin Krzywinski, Association, correlation and causation, Nature Methods, 10 12, 201, עמ' 899-900