שונות משותפת – הבדלי גרסאות

מתוך ויקיפדיה, האנציקלופדיה החופשית
תוכן שנמחק תוכן שנוסף
Agzarar (שיחה | תרומות)
מ הגהה
אין תקציר עריכה
שורה 1: שורה 1:
ב[[תורת ההסתברות]] וב[[סטטיסטיקה]], ה'''שונות המשותפת''' ('''covariance''') היא מדד לקשר בין שני [[משתנה מקרי|משתנים מקריים]]. השונות המשותפת חיובית כאשר המשתנים נוטים לסטות מהממוצע באותו כיוון (שניהם מעליו או ששניהם מתחתיו באותו [[מאורע]]), ושלילית כאשר הם משתנים בכיוונים מנוגדים זה לזה.
ב[[תורת ההסתברות]] וב[[סטטיסטיקה]], ה'''שונות המשותפת''' ('''covariance''') היא מדד לקשר בין שני [[משתנה מקרי|משתנים מקריים]]. השונות המשותפת חיובית כאשר המשתנים נוטים לסטות מהממוצע באותו כיוון (שניהם מעליו או ששניהם מתחתיו באותו [[מאורע]]), ושלילית כאשר הם משתנים בכיוונים מנוגדים זה לזה.


אם מנרמלים את השונות המשותפת באמצעות חלוקתה במכפלת [[סטיית תקן|סטיות התקן]] של המשתנים המעורבים, מתקבל מדד הנקרא "[[מקדם המתאם]]", שערכו בין 1 ל-1-. אם המקדם קרוב לערכים הקיצוניים, זהו אות לכך שהמשתנים קשורים זה בזה (קשר שעשוי להיות סיבתי, אך אינו בהכרח כזה). אפשר לראות במושג זה הכללה של ה[[שונות]], משום שהשונות המשותפת של משתנה מקרי עם עצמו, שווה לשונות שלו. השונות המשותפת של משתנים [[תלות (הסתברות)|בלתי תלויים]] שווה לאפס, אך אם השונות המשותפת שווה לאפס, המשתנים אינם בהכרח בלתי תלויים, אלא רק [[מתאם פירסון|בלתי מתואמים]].
אם מנרמלים את השונות המשותפת באמצעות חלוקתה במכפלת [[סטיית תקן|סטיות התקן]] של המשתנים המעורבים, מתקבל מדד הנקרא "[[מקדם המתאם]]", שערכו בין 1 ל-1-. אם המקדם קרוב לערכים הקיצוניים, זהו אות לכך שהמשתנים קשורים זה בזה (קשר שעשוי להיות סיבתי, אך אינו בהכרח כזה). אפשר לראות במושג זה הכללה של ה[[שונות]], משום שהשונות המשותפת של משתנה מקרי עם עצמו, שווה לשונות שלו. השונות המשותפת של משתנים [[תלות (הסתברות)|בלתי תלויים]] שווה לאפס, אך אם השונות המשותפת שווה לאפס, המשתנים אינם בהכרח בלתי תלויים, אלא רק [[מתאם פירסון|בלתי מתואמים]].
שורה 5: שורה 5:
== הגדרה ==
== הגדרה ==


נסמן ב-<math>\ \mu_X=\operatorname{E}(X), \mu_Y=\operatorname{E}(Y)</math> את ה[[תוחלת|תוחלות]] של המשתנים המקריים <math>\ X </math> ו-<math>\ Y </math>. השונות המשותפת של השניים מוגדרת להיות:
נסמן ב-<math>\ \mu_X=\operatorname{E}(X), \mu_Y=\operatorname{E}(Y)</math> את ה[[תוחלת|תוחלות]] של המשתנים המקריים <math>\ X </math> ו-<math>\ Y </math>. השונות המשותפת של השניים מוגדרת להיות:
:<math>\ \operatorname{cov}(X,Y) = \operatorname{E}(XY)-\mu_X\mu_Y
:<math>\ \operatorname{cov}(X,Y) = \operatorname{E}(XY)-\mu_X\mu_Y
= \operatorname{E}((X-\mu_X)(Y-\mu_Y))
= \operatorname{E}((X-\mu_X)(Y-\mu_Y))
</math>.
</math>.


מ[[אי-שוויון קושי-שוורץ]] נובע שתמיד <math>|\operatorname{cov}(X,Y)|^2\leq V(X)V(Y) </math>, כאשר <math>V(X)</math> היא ה[[שונות]] של המשתנה המקרי X (וכן ל-Y). בפרט, השונות המשותפת קיימת (וסופית) כל אימת שלמשתנים X ו-Y יש שונות (סופית). מאותה סיבה, ה[[ערך מוחלט|ערך המוחלט]] של [[מתאם פירסון#אנלוגיה מתמטית הסתברותית|מקדם המתאם]] <math>\ \rho(X,Y)=\frac{\operatorname{cov}(X,Y)}{\sqrt{V(X)V(Y)}}</math> אינו עולה על 1.
מ[[אי-שוויון קושי-שוורץ]] נובע שתמיד <math>|\operatorname{cov}(X,Y)|^2\leq V(X)V(Y) </math>, כאשר <math>V(X)</math> היא ה[[שונות]] של המשתנה המקרי X (וכן ל-Y). בפרט, השונות המשותפת קיימת (וסופית) כל אימת שלמשתנים X ו-Y יש שונות (סופית). מאותה סיבה, ה[[ערך מוחלט|ערך המוחלט]] של [[מתאם פירסון#אנלוגיה מתמטית הסתברותית|מקדם המתאם]] <math>\ \rho(X,Y)=\frac{\operatorname{cov}(X,Y)}{\sqrt{V(X)V(Y)}}</math> אינו עולה על 1.
שורה 14: שורה 14:
== תכונות ==
== תכונות ==


למשתנים ששונותם המשותפת אפס, קוראים '''משתנים בלתי מתואמים'''. כל שני משתנים בלתי תלויים הם בלתי מתואמים, אבל ההפך אינו נכון.
למשתנים ששונותם המשותפת אפס, קוראים '''משתנים בלתי מתואמים'''. כל שני משתנים בלתי תלויים הם בלתי מתואמים, אבל ההפך אינו נכון.


השונות המשותפת היא [[תבנית ביליניארית]], כלומר, <math>\operatorname{cov}(aX+bY,Z) = a\cdot \operatorname{cov}(X,Z)+b\cdot \operatorname{cov}(Y,Z)</math>, וכן ברכיב הימני. זוהי תבנית סימטרית, שהיא [[תבנית חיובית לחלוטין|חיובית לחלוטין]] על מרחב המשתנים המקריים (כאשר מזהים משתנים שההפרש ביניהם קבוע [[כמעט תמיד|בהסתברות 1]]), מכיוון שלמשתנה שאינו קבוע בהסתברות 1, יש שונות חיובית. מכאן שהשונות המשותפת מגדירה [[מכפלה פנימית]] על מרחב המשתנים המקריים עד-כדי הזיהוי הנזכר לעיל.
השונות המשותפת היא [[תבנית ביליניארית]], כלומר, <math>\operatorname{cov}(aX+bY,Z) = a\cdot \operatorname{cov}(X,Z)+b\cdot \operatorname{cov}(Y,Z)</math>, וכן ברכיב הימני. זוהי תבנית סימטרית, שהיא [[תבנית חיובית לחלוטין|חיובית לחלוטין]] על מרחב המשתנים המקריים (כאשר מזהים משתנים שההפרש ביניהם קבוע [[כמעט תמיד|בהסתברות 1]]), מכיוון שלמשתנה שאינו קבוע בהסתברות 1, יש שונות חיובית. מכאן שהשונות המשותפת מגדירה [[מכפלה פנימית]] על מרחב המשתנים המקריים עד-כדי הזיהוי הנזכר לעיל.

גרסה מ־13:38, 24 באפריל 2019

בתורת ההסתברות ובסטטיסטיקה, השונות המשותפת (covariance) היא מדד לקשר בין שני משתנים מקריים. השונות המשותפת חיובית כאשר המשתנים נוטים לסטות מהממוצע באותו כיוון (שניהם מעליו או ששניהם מתחתיו באותו מאורע), ושלילית כאשר הם משתנים בכיוונים מנוגדים זה לזה.

אם מנרמלים את השונות המשותפת באמצעות חלוקתה במכפלת סטיות התקן של המשתנים המעורבים, מתקבל מדד הנקרא "מקדם המתאם", שערכו בין 1 ל-1-. אם המקדם קרוב לערכים הקיצוניים, זהו אות לכך שהמשתנים קשורים זה בזה (קשר שעשוי להיות סיבתי, אך אינו בהכרח כזה). אפשר לראות במושג זה הכללה של השונות, משום שהשונות המשותפת של משתנה מקרי עם עצמו, שווה לשונות שלו. השונות המשותפת של משתנים בלתי תלויים שווה לאפס, אך אם השונות המשותפת שווה לאפס, המשתנים אינם בהכרח בלתי תלויים, אלא רק בלתי מתואמים.

הגדרה

נסמן ב- את התוחלות של המשתנים המקריים ו-. השונות המשותפת של השניים מוגדרת להיות:

.

מאי-שוויון קושי-שוורץ נובע שתמיד , כאשר היא השונות של המשתנה המקרי X (וכן ל-Y). בפרט, השונות המשותפת קיימת (וסופית) כל אימת שלמשתנים X ו-Y יש שונות (סופית). מאותה סיבה, הערך המוחלט של מקדם המתאם אינו עולה על 1.

תכונות

למשתנים ששונותם המשותפת אפס, קוראים משתנים בלתי מתואמים. כל שני משתנים בלתי תלויים הם בלתי מתואמים, אבל ההפך אינו נכון.

השונות המשותפת היא תבנית ביליניארית, כלומר, , וכן ברכיב הימני. זוהי תבנית סימטרית, שהיא חיובית לחלוטין על מרחב המשתנים המקריים (כאשר מזהים משתנים שההפרש ביניהם קבוע בהסתברות 1), מכיוון שלמשתנה שאינו קבוע בהסתברות 1, יש שונות חיובית. מכאן שהשונות המשותפת מגדירה מכפלה פנימית על מרחב המשתנים המקריים עד-כדי הזיהוי הנזכר לעיל.

מטריצת השונויות

אם X הוא וקטור של משתנים מקריים, מסמנים ב- את מטריצת השונויות המשותפות, שהרכיב ה-(i,j) שלה הוא השונות המשותפת . טרסנפורמציה ליניארית של המשתנים מביאה לחפיפה של מטריצת השונויות: אם A מטריצה קבועה, אז .

ראו גם

קישורים חיצוניים