לדלג לתוכן

מבחן גריינג'ר

מתוך ויקיפדיה, האנציקלופדיה החופשית
כאשר סדרה עתית X גריינג'ר-מסבירה את סדרה עתית Y, כיוון ועוצמת השינוי בערכי X, יופיעו בקירוב גם בסדרה Y, לעיתים בפיגור.

מבחן גריינג'ר הוא מבחן סטטיסטי הבודק את כוחה של סדרה עתית אחת בניבוי סדרה עתית אחרת. מבחן זה עושה שימוש ברגרסיה ליניארית עם משתנים בפיגור ובמבחני מובהקות שונים כגון מבחן F, קריטריון האינפורמציה של Akaike וקריטריון בייס. המבחן בודק את ההשערה כי תוספת של ערכים בפיגור של משתנה מסביר X למשוואה המכילה ערכים בפיגור של משתנה מוסבר Y, תגדיל את כוח ההסבר של המודל. במקרה שהשערה זו מתקבלת, נהוג לומר כי "X גריינג'ר-מסביר את Y".

המבחן פותח על ידי החוקר קלייב גריינג'ר בשנת 1969, והפך לרווח בעיקר בתחומי הכלכלה. עם השנים הפך המבחן לשימושי ומקובל גם בתחומי המדעים המדויקים כגון מדעי המוח, הנדסה ומדעי המחשב.

קשר סיבתי חד כיווני פשוט

[עריכת קוד מקור | עריכה]

תהיה סדרה עתית סטאציונריות בה מתקיים קשר אוטו-רגרסיבי פשוט: , עבור כלשהו, ותהיה סדרה עתית סטציונרית נוספת.

עבור ,מרחב האינפורמציה שנצברה עבור כלל המשתנים במודל עד לתקופה , ומרחבי האינפורמציה של הסדרות ו- , נסמן את שני תתי-המרחבים הבאים:

  • מרחב האינפורמציה שנצברה אודות המשתנה בעבר:
  • מרחב האינפורמציה שנצברה אודות המשתנה בעבר ובנקודה הנוכחית:

נאמר כי גריינג'ר-מסביר את אם ורק אם: .

כלומר, שימוש בכלל האינפורמציה במרחב עדיף על שימוש בכלל האינפורמציה אותו המרחב, למעט האינפורמציה אודות .

מבחינת משוואות האמידה, נאמר כי המשוואה: בעלת כוח הסבר רב יותר מן המשוואה: .

הרחבת המודל

[עריכת קוד מקור | עריכה]

קשרים חד כיווניים

[עריכת קוד מקור | עריכה]

קשר סיבתי מיידי

[עריכת קוד מקור | עריכה]

ההבדל העיקרי בין קשר סיבתי פשוט לקשר סיבתי מיידי, הוא בבחינת כוח ההסבר של ערך הסדרה בנקודת הזמן בה אומדים את . על כן, נאמר כי גריינג'ר-מסביר באופן מיידי את אם ורק אם: .

כלומר, שימוש בכלל האינפורמציה במרחב , עדיף על שימוש בכלל האינפורמציה אותו המרחב, למעט האינפורמציה אודות .

מבחינת משוואות האמידה, נאמר כי המשוואה: בעלת כוח הסבר רב יותר מן המשוואה: .

קשר סיבתי בפיגור

[עריכת קוד מקור | עריכה]

עבור הסדרה נגדיר את הסדרה , כאשר: .

נאמר כי גריינג'ר-מסביר בפיגור את , אם ורק אם הוא המספר הטבעי הקטן ביותר עבורו: .

כלומר, שימוש בערכים: לא תורם לכח ההסבר של את .

מבחינת משוואת האמידה, נאמר כי המשוואה: בעלת כוח הסבר רב יותר מהמשוואה: , וגם מן המשוואה: .

קשרים דו-כיווניים

[עריכת קוד מקור | עריכה]

מבחן גריינג'ר מתיר גם הרחבה של המודל, לבדיקה של קשרים דו-כיוונים של הסדרות ו- זו על זו. לשם כך נניח כעת כי עבור שתי הסדרות העתיות, , קיים מודל אוטו-רגרסיבי מובהק. דהיינו, קיים צמד מודלים, בעלי כח הסבר מתקבל על הדעת, מן הצורה:

היזון חוזר

[עריכת קוד מקור | עריכה]

תחת אותן ההגדרות ואותם הסימונים, נאמר כי קיים היזון חוזר בין ל- אם ורק אם מתקיימים יחדיו שני התנאים הבאים:

במצב זה, מתקיים קשר סיבתי חד כיווני פשוט עבור שתי הסדרות, כמסבירות זו של זו. אם כך, זוג משוואות האמידה:

יהיה בעל כוח הסבר רב יותר מזוג המשוואות:

מבחן גריינג'ר מהווה כלי אנליטי חזק בתחומים רבים, אך אינו חסין (robust) דיו כדי לכמת את כלל הקשרים הסיבתיים בין סדרות עתיות. מגבלותיו העיקריות הן:

  • יכולת מוגבלת להסיק אודות קשר סיבתי - קיומו של קשר סיבתי בו משתנה אחד גריינג'ר-מסביר משתנה אחר, אינו מאפשר דחייה של ההשערה לגבי קיומו של מסביר נוסף, שאינו כלול במודל, אך מסביר את שני המשתנים יחד. מסיבה זו, קיימת הפרדה טרמינולוגית ברורה בין סיבתיות לגריינג'ר-סיבתיות.
  • בעיית הרגרסיה המלאכותית - מכיוון שאמידה, מעצם הגדרתה, מגבילה עצמה לכמות נתונים מסוימת, בטווח זמן מסוים, היא עשויה ללכוד תופעה מקרית, אותה נפרש כחוקיות בהשפעת משתנה אחד על האחר. סדרות עתיות, הן המועדות ביותר לבעיית הרגרסיה המלאכותית, עקב השרירותיות בבחירת טווח זמני האמידה, ומגבלות מידע קיים על התופעה הנאמדת בעבר.
  • בעיות של שימוש יתר במשתנים - מכיוון שסדרות עתיות מושפעות מערכיהן בעבר, השימוש במספר רב יותר של משתנים בפיגור אמור לכאורה להגדיל את כוח ההסבר של המודל. בפועל, ככל שכמות המשתנים גדולה יותר, כך כוח ההסבר של המודל הולך ופוחת. שימוש במספר רב מדי של משתנים בפיגור עשוי להניב מודל עם כח הסבר מרובה גבוה, אך עם אומדים מוטים.
  • הנחת ההתפלגות הנורמלית של הטעות המקרית - מודל משוואת האמידה במבחן גריינג'ר תקף רק עבור סדרות בהן הטעות המקרית מתפלגת נורמלית. בסדרות פיננסיות הנחה זו אינה מתקיימת. מסיבה זו, פותחו לאחרונה הרחבות שונות למבחן גריינג'ר שמאפשרות סטיה מהנחה זו.

דוגמה ליישום מבחן גרייג'ר

[עריכת קוד מקור | עריכה]

חיזוי צמיחת תוצר במשק כלכלי.

כלכלן מעוניין לבצע חיזוי של צמיחת התוצר השנתית במשק, בשימוש במודל אוטו-רגרסיבי. הכלכלן מסתמך הפרדיגמה הפשוטה לפיה תוצר המשק הוא סך ערכי הסחורות והשירותים שייצר המשק בשנה נקובה, ועל כן מקור הכנסה זה למשק משמש לצריכה פרטית, לצריכה ממשלתית ולהשקעה. מכיוון שהשקעה גוררת (בין היתר) גם תפוקת ייצור גבוהה יותר, הכלכלן מניח כי הקשר בין צמיחת התוצר בשנה נתונה לשנים הקודמות הוא קשר חיובי. על כן, המודל האוטורגרסיבי הפשוט לחיזוי צמיחת התוצר הוא:

כאשר Y הוא שיעור צמיחת התוצר השנתי, עבור N שנים.

הכלכלן כורה את נתוני צמיחת התוצר של המשק ב-20 השנים האחרונות ומגיע למשוואת האמידה הבאה:

דהיינו, המודל האוטורגרסיבי בעל כוח ההסבר הרב ביותר הוא זה המשתמש בנתוני צמיחת התוצר של השנתיים החולפות.

בהמשך, משער הכלכלן כי שיעור המועסקים בכח העבודה במשק יכול גם הוא לתרום ליכולת ניבוי צמיחת התוצר במשק, שכן שיעור מועסקים גבוה יותר מצביע (בין היתר) על הכנסה פנויה גבוהה יותר, ועל ביקוש גבוה יותר למוצרים- ביקוש המקבל מענה דרך תהליכי הייצור במשק. על כן, מודל עם משתנים בפיגור לחיזוי צמיחת התוצר הוא כעת:

כאשר X הוא שיעור המועסקים השנתי במשך, עבור M שנים.

מכיוון שהכלכלן מעוניין לבדוק את כוחה של סדרת נתוני התעסוקה בניבוי צמיחת התוצר, המודל מצטמצם לכדי המודל הבא:

הכלכלן כורה את נתוני התעסוקה של המשק ב-20 השנים האחרונות ומגיע למשוואת האמידה הבאה:

דהיינו, מתוך כלל המודלים בהם נעשה שימוש בשני ערכים בפיגור של משתנה צמיחת התוצר, המודל בעל כוח ההסבר הרב ביותר הוא זה המשתמש בנתוני צמיחת התוצר בשנה החולפת.

עובדה זו כשלעצמה אינה מספיקה כדי לקבוע כי שיעור התעסוקה גריינג'ר מסביר את צמיחת התוצר, ועל כן על הכלכלן להשוות בין השונות המוסברת של משוואות האמידה כדי להכריע. במקרה בו השונות המוסברת במודל המשלב את שיעור התעסוקה גבוהה מזו של המודל האוטורגרסיבי הפשוט, יוכל הכלכלן להסיק כי אכן שיעור התעסוקה גריינג'ר מסביר את צמיחת התוצר.

לקריאה נוספת

[עריכת קוד מקור | עריכה]
  • Granger, C. W. (1969). Investigating causal relations by econometric models and cross-spectral methods. Econometrica: Journal of the Econometric Society, 424-438.