לדלג לתוכן

הבדלים בין גרסאות בדף "מתאם"

הוסרו 8 בתים ,  לפני שנתיים
אין תקציר עריכה
מושג המתאם הופיע לראשונה במחקריו של [[פרנסיס גולטון|סיר פרנסיס גאלטון]]. הוא התעניין אינטליגנציה האנושית וניסה לברר האם אינטליגנציה עוברת התורשה. לשם כך היה זקוק למדד שיבטא את הקשר המשותף (Co-relation) בין רמת האינטליגנציה של דור מסוים ורמת האינטליגנציה של הדור הקודם. קשר משותף חזק היה מספיק לדעתו להוכיח גם קשר סיבתי – האינטליגנציה מועברת בירושה מאבות לבנים. עם זאת, הבין כי החשיבות המדעית של מדידת הקשר בין שני משתנים משתרעת מעבר לבעיה הספציפית בה התעניין, ולכן פיתח את רעיונותיו גם על ידי מחקר של נתונים אחרים, כגון תכונות פיזיקליות של בני אדם ושל צמחים.
 
גאלטון פרסם את מסקנותיו בשלושה מאמרים שהופיעו בשנים 1885-1888. מקדם המתאם שהציע התבסס על ההנחה שלשני המשתנים הנמדדים יש [[התפלגות רב-נורמלית|התפלגות משותפת דו-נורמלית]]. החישוב שלו התבסס על שרטוט הנתונים בגרף, מדידה פיזית של שיפוע [[רגרסיה ליניאריתלינארית|קו הרגרסיה]] בין המשתנים, וחישוב [[סטיית תקן|סטיות התקן]] שלהם (אם כי לא במפורש – מושג סטיית התקן הופיע והוגדר מאוחר יותר).
 
גאלטון עמד גם על תכונותיו של מקדם המתאם שחישב המוכרות לנו כיום: ערך של 1 מציין קשר חיובי מלא, ערך 0 מציין חוסר קשר, וכולי. הוא היה מודע לכך שהמקדם שחישב מודד קשר ליניארילינארי בלבד בין המשתנים, והבהיר כי אין להסיק קשר סיבתי בין המשתנים רק על סמך מתאם גבוה ביניהם.
 
[[קרל פירסון]] המשיך את עבודתו של גאלטון ובנה את המסגרת המתמטית שבה שולב מקדם המתאם, ביחד עם המושג של סטיית התקן, וזאת בשני מאמרים שפרסם ב-1893 וב-1896. במאמרים אלה הגדיר את מקדם המתאם המוכר לנו היום כ-"מקדם פירסון", והראה כי אין צורך בהנחת ההתפלגות הנורמלית של גאלטון.
{{ערך מורחב| מתאם פירסון}}
 
המדד המוכר ביותר למדידת הקשר בין שני משתנים כמותיים הוא ״[[מתאם פירסון|מקדם המתאם של פירסון]]״ (לעיתים קרובות נקרא בפשטות "מתאם פירסון" או אף ״מקדם המתאם״). מדד זה מודד את עוצמת הקשר הלינארי בין שני משתנים כמותיים, כאשר ערך של 1 מציין קשר לינארי חיובי מלא, וערך של 1- מציין קשר ליניארילינארי שלילי מלא. ערך של 0 מציין חוסר קשר לינארי. עם זאת ייתכנו מצבים בהם ערכו של מתאם פירסון שווה לאפס, ועדיין קיים קשר ואף תלות סטטיסטית בין המשתנים, אך הקשר אינו לינארי. זה קורה למשל כאשר ההתפלגות המשותפת של שני המשתנים סימטרית סביב אפס.
מקדם זה נקרא באנגלית "correlation coeffcient", ובשפה יום יומית בעברית נהוג לכנות מתאם על פי מקדם זה כ-"קורלציה". עם זאת, חשוב להבהיר כי סוגי קשר אחרים בין משתנים אינם מכונים באנגלית במילה "correlation", ולכן אם רוצים להקפיד על שפה סטטיסטית מדוייקת אין להשתמש במילה "קורלציה" כביטוי כללי עבור קשר בין שני משתנים.
 
עם זאת, מתאם גבוה יוביל בדרך כלל לבדיקה האם יש קשר סיבתי בין המשתנים, וקיומו של מתאם גבוה הוא אחד הקריטריונים של [[ברדפורד היל]] להסקת סיבתיות.
 
המסקנה ההפוכה הינה נכונה: קשר סיבתי בין שני משתנים יגרום למתאם, בדרך כלל גבוה, בין שני המשתנים.<ref>{{צ-מאמר|מחבר=Naomi Altman & Martin Krzywinski|שם=Association, correlation and causation|כתב עת=Nature Methods|כרך=12|סדרה=10|עמ=899-900|שנת הוצאה=201|קישור=https://www.nature.com/articles/nmeth.3587}}</ref> יש לציין כי המתאם הזה אינו חייב להיות מתאם ליניארילינארי.
 
== ראו גם ==