לדלג לתוכן

הבדלים בין גרסאות בדף "מתאם"

נוספו 34 בתים ,  לפני שנתיים
כל מיני שינויים קטנים
(הפניות לערך על מקדם הקשר של קראמר)
(כל מיני שינויים קטנים)
גאלטון פירסם את מסקנותיו בשלושה מאמרים שהופיעו בשנים 1885-1888. מקדם המתאם שהציע התבסס על ההנחה שלשני המשתנים הנמדדים יש [[התפלגות רב-נורמלית|התפלגות משותפת דו-נורמלית]]. החישוב שלו התבסס על שרטוט הנתונים בגרף, מדידה פיזית של שיפוע [[רגרסיה ליניארית|קו הרגרסיה]] בין המשתנים, וחישוב [[סטיית תקן|סטיות התקן]] שלהם (אם כי לא במפורש – מושג סטיית התקן הופיע והוגדר מאוחר יותר).
 
גאלטון עמד גם על תכונותיו של מקדם המתאם שחישב המוכרות לנו כיום: ערך של 1 מציין קשר חיובי מלא, ערך םם0 מציין חוסר קשר, וכולי. הוא היה מודע לכך שהמקדם שחישב מודד קשר לינארי בלבד בין המשתנים, והבהיר כי אין להסיק קשר סיבתי בין המשתנים רק על סמך מתאם גבוה ביניהם.
 
[[קרל פירסון]] המשיך את עבודתו של גאלטון ובנה את המסגרת המתמטית שבה שולב מקדם המתאם, ביחד עם המושג של סטיית התקן, וזאת בשני מאמרים שפירסם ב-1893 וב-1896. במאמרים אלה הגדיר את מקדם המתאם המוכר לנו היום כ-"מקדם פירסון", והראה כי אין צורך בהנחת ההתפלגות הנורמלית של גאלטון.
 
מקדם המתאם של פירסון הוגדר למדידת הקשר בין שני משתנים כמותיים. פירסון ניסה לפתח מקדם דומה למדידת הקשר בין שני משתנים איכותיים (קטגוריים), שנתוניהם מוצגים בלוח שכיחות דו מימדי. ב-1900 הוא הציג את סטטיסטי [[חי בריבוע|חי-בריבוע]], שמבטא רעיון דומה לרעיון של מקדם המתאם. מקדם המתאם התבסס על ההפרשים בין התצפיות והממוצע שלהן. סטטיסטי חי בריבוע מבוסס על ההפרש בין מספר התצפיות בתא מסויים בלוח השכיחות הדו מימדי, והמספר הצפוי של התצפיות באותו תא בהנחה כי יש אי תלות בין משתנים.
 
במקביל לפיתוח מדד החי בריבוע, ניסה פירסון גם להכליל את מקדם המתאם למדידת קשר בין שני משתנים איכותיים על ידי הכנסת הנחה על קיומו של [[משתנה נסתר]] (לטנטי). לדוגמא, אם יש משתנה המתאר את גובהו של אדם באוכלוסייה מסויימת כ-"נמוך" או "גבוה", ערכים אלה נקבעים על ידי התפלגות הגבהים של האנשים באוכלוסייה, וניתן להניח כי זוהי התפלגות נורמלית. כאשר דנים בשני משתנים, טען פירסון כי ניתן להניח שקיימים שני משתנים נסתרים עם התפלגות משותפת דו נורמלית. תחת הנחה זו פיתח את מקדם המתאם הטטרכורי, ומאוחר יותר את מקדם המתאם הפוליכורי.
{{ערך מורחב| מתאם פירסון}}
 
המדד המוכר ביותר למדידת הקשר בין שני משתנים כמותיים הוא ״[[מתאם פירסון|מקדם המתאם של פירסון]]״ (לעיתים קרובות נקרא בפשטות "מתאם פירסון" או אף ״מקדם המתאם״). מדד זה מודד את עוצמת הקשר הליניארי בין שני משתנים כמותיים, כאשר ערך של אחד1 מציין קשר ליניארי חיובי מלא, וערך של 1- מציין קשר ליניארי שלילי מלא. ערך של 0 מציין חוסר קשר ליניארי. עם זאת ייתכנו מצבים בהם ערכו של מתאם פירסון שווה לאפס, ועדיין קיים קשר ואף תלות סטטיסטית בין המשתנים, אך הקשר אינו ליניארי. זה קורה למשל כאשר ההתפלגות המשותפת של שני המשתנים סימטרית סביב אפס.
 
=== מקדם המתאם של ספירמן===
 
=== מקדם המתאם התוך-אשכולי ===
[[מקדם המתאם התוך-אשכולי]] (Intraclass correlation או ICC) מודד את עצמת הקשר בין משתנה כמותי ומשתנה קטגורי. המקדם, שפיתח [[רונלד פישר]], מבוסס על הפרמטרים של מודל [[ניתוח שונות]] חד כיווני. מודל זה משווה בין הממוצעים של משתנה כמותי הנמדד באופן בלתי תלוי במספר קבוצות. המדד הוא היחס בין השונות שבין הקבוצות ובין השונות הכוללת, וערכו נע בין 0 ל-1.
 
=== מדדים נוספים של תלות בקשר משתנים אקראיים ===
* [[מתאם ספירמן]]
* [[מקדם הקשר של קראמר]]
*[[סיבתיות]]
 
==קישורים חיצוניים==