לדלג לתוכן

הבדלים בין גרסאות בדף "מתאם"

נוספו 18 בתים ,  לפני 3 שנים
מ
בוט החלפות: לעיתים, \1ליניארי
מ (בוט החלפות: לעיתים, \1ליניארי)
'''מִתְאָם''' או '''קוֹרֶלַצְיָה''' הוא [[מדד]] [[סטטיסטיקה|סטטיסטי]] המעריך את העקביות ביחסים בין כמה [[משתנה|משתנים]], כלומר, האם ישנה עקביות בין שינוי במשתנה אחד מהם לבין שינוי במשתנה אחר. כאשר המתאם מלמד התאמה גבוהה ביחסים בין המשתנים לעתיםלעיתים הדבר רומז גם על קשר של סיבתיות אך לא בהכרח. ערכו של מתאם המבטא התאמה מוחלטת הוא 1+, ושל מתאם המבטא התאמה הפוכה – 1-.
 
קיימים כמה מדדי קשר, בהתאם ל[[סולם מדידה|סולם המדידה]] של המשתנים הנמדדים. במקרה של אי-התאמה בין הסולמות של שני משתנים, יש להשתמש במדד המתאים לסולם הנמוך מבין השניים.
{{ערך מורחב| מתאם פירסון}}
 
המדד המוכר ביותר למדידת התלות בין שתי כמויות הוא [[מתאם פירסון]], או ״מקדם המתאם של פירסון״ (לעתיםלעיתים קרובות נקרא בפשטות ״מקדם המתאם״).
הוא מתקבל כתוצאה של חילוק ה[[שונות משותפת]] של שני המשתנים במכפלת [[סטיית תקן|סטיית התקן]] שלהם.
[[קרל פירסון]] פיתח את המקדם מתוך רעיון דומה אך מעט שונה של [[פרנסיס גולטון]].
מקדם המתאם הוא סימטרי, כלומר corr(X,Y) = corr(Y,X).
 
מתאם פירסון שווה 1+ במקרה של קורלציה – קשר לינאריליניארי ישיר (גדל) שלם. הוא שווה ל־{{D}}-1 במקרה של אנטי-קורלציה – קשר לינאריליניארי הפוך (קטן) שלם. הוא שווה לערכים אחרים בין 1- ל-1+ בכל המקרים האחרים. הערך מצביע על מידת ה[[תלות הלינאריתהליניארית]] בין המשתנים. כאשר הוא שואף לאפס, יש פחות קשר (קרוב יותר לחוסר-קורלציה). ככל שהמקדם מתקרב ל-1+ או ל־{{D}}-1, כך הקורלציה בין המשתנים גדלה.
 
אם המשתנים הם בלתי תלויים, מתאם פירסון שווה ל-0. ההפך אינו נכון, מכיוון שהמתאם מזהה תלותיות לינאריותליניאריות בין שני משתנים בלבד.
לדוגמה, נניח שהמשתנה האקראי X מפולג באופן סימטרי סביב 0, וY = X<sup>2</sup>. במקרה כזה Y נקבע לחלוטין לפי X, כך ש-X ו-Y תלויים זה בזה, אבל הקורלציה ביניהם היא 0; הם אינם מקושרים. עם זאת, במקרה הספציפי שבו X ו-Y הם בעלי [[התפלגות רב-נורמלית]], חוסר קורלציה היא שוות ערך לחוסר תלות.
 
 
אם x ו-y הם תוצאות של המדדים שמכילים שגיאת מדידה, הגבולות הריאליסטיים של מקדם המתאם אינם בין 1- ל-1+ אלא בתחום קטן יותר.
במקרה של מודל לינאריליניארי עם משתנה יחיד לא תלותי, מקדם הקביעה הוא הריבוע של r, מקדם המתאם של פירסון.
 
== מקדמי דירוג המתאם ==
{{ערך מורחב| מקדם ספירמן}}
 
מקדמי דירוג מתאם, כמו [[מקדם ספירמן]] ומקדם קנדל מודדים את מידת הנטייה של מקדם לגדול, כאשר המקדם השני גדל, בלי לדרוש שהגדילה תיוצג על ידי קשר לינאריליניארי.
אם כאשר משתנה אחד גדל, השני קטן, מקדמי דירוג המקדם יהיו שליליים. שכיח להתייחס למקדמי דירוג המתאם האלה כתחלופה למקדם של פירסון, המשמש להפחתה של כמות החישובים או לחלופין להפיכה של המקדם לפחות רגיש לאי-נורמליות בהתפלגות. עם זאת, להנחה הזאת אין בסיס מתמטי ממשי, שכן מקדמי דירוג מתאם מודדים סוג קשר שונה מהקשר אותו מודד המקדם של פירסון.
 
כדי להדגים את טבע דירוג המתאם, ואת ההבדל ממתאם לינאריליניארי, בחנו את 4 זוגות המספרים (x, y):
(0, 1), (10, 100), (101, 500), (102, 2000)