ניתוח גורמים מגשש

מתוך ויקיפדיה, האנציקלופדיה החופשית
מודל ניתוח גורמים מגשש

בסטטיסטיקה רב-משתנית, ניתוח גורמים מגששאנגלית: exploratory factor analysis, בראשי תיבות EFA) הוא שיטה סטטיסטית המשמשת לחשיפת המבנה החבוי של קבוצת משתנים. ניתוח זה הוא טכניקה השייכת לקטגוריה של ניתוח גורמים, המתמקדת בזיהוי הקשרים החבויים בין משתנים כאשר אין לחוקר השערה "מוקדמת" לגבי גורמים העומדים בבסיס התופעה הנחקרת. מודל הבוחן מבנה ספציפי של גורמים הוא ניתוח גורמים מאשש, שהליך השימוש בו שונה משימוש ב-EFA. שימוש מרכזי ל-EFA הוא חקר תוקף המבנה בעת פיתוח סולם (Scale) המהווה מדד לקונסטרקט או תכונה נמדדת. ה-EFA במקרה זה משמש ככלי לזיהוי תתי קונסטרקטים חבויים העומדים בבסיס סוללת השאלות אשר בוחנות את הקונסטרקט.

EFA מבוסס על מודל גורם משותף. במודל זה, המשתנים באים לידי ביטוי כפונקציה של גורמים משותפים, גורמים ייחודיים ורעש. כל גורם ייחודי משפיע רק על משתנה אחד. גורמים משותפים משפיעים על כמה משתנים, ו"טעינות" הגורמים (Factor loading) הם מדדים להשפעה של הגורמים על המשתנים המקוריים. למטריצה המסכמת את הטעינות ביחס לגורמים השונים נהוג לקרוא מטריצת הגורמים.

ניתוח קדם לניתוח הגורמים[עריכת קוד מקור | עריכה]

לפני השימוש בניתוח הגורמים על החוקר לוודא כי אכן ניתוח גורמים הוא מודל טוב לאמידת המידע אשר ברשותו. בנוסף על החוקר לגשש אחר מספר הגורמים הראוי למידול המידע.

התאמת ניתוח גורמים למידע[עריכת קוד מקור | עריכה]

תנאי מקדים לשימוש בניתוח הגורמים הוא ווידוא כי קיים מתאם לפחות בין חלק מהמשתנים. מבחן סטטיסטי נפוץ להשערה כי כל המתאמים בין כל משתנה לבין כל משתנה אינם שווים ל- הוא מבחן ברטלט לכַּדּוּרִיּוּת (Bartlett test of sphericity, 1951). אם תוצאת המבחן היא מובהקת, אזי מבחן ברטלט מצביע על כך שמטריצת הקורלציות של המשתנים אינה שווה למטריצת יחידה, ובמקרה זה ניתן לבצע ניתוח גורמים. הנוסחה לחישוב מבחן ברטלט היא כדלהלן:

כאשר det מסמן דטרמיננטה, הוא מספר התצפיות, מספר המשתנים, ו- היא מטריצת הקורלציות. תחת השערת האפס, ביטוי זה מתפלג עם דרגות חופש.

מבחן נוסף המשמש לבחינת התאמת המידע ל-EFA היא מבחן קייזר מאייר אולקין (Kaiser-Meyer-Olkin) או בקיצור מבחן KMO. מבחן זה מבוסס על חישובי היחס בין מתאמי פירסון בין כל משתנה לכל ומשתנה, לבין חישובי מתאם חלקי בין כל משתנה לכל משתנה, תוך ניכוי השפעתם של שאר המשתנים אשר נבחנים להיכנס לניתוח EFA. נהוג להתייחס לתוצאות KMO הגבוהות מ-0.8 כטובות להפעלת ניתוח EFA. תוצאות נמוכות מ-0.5 במבחן זה מעידות על כך שבין חלק מהמשתנים ישנה התאמה שלילית אשר דורשת התייחסות. היפוך כיווניותם של משתנים אלו, או הסרתם יכולה להיות התייחסות ראויה[1].

הנוסחה לחישוב מדד ה-KMO הוא כדלהלן:

כאשר מייצג את הקורלציה החלקית בין משתנה j ל-k (הקורלציה ביניהם בהסרת השפעת כל שאר המשתנים על הקורלציה).

בחירת מספר הגורמים המתאים[עריכת קוד מקור | עריכה]

כאשר בוחרים כמה גורמים לכלול במודל, על החוקר לשקלל הן את המידה שבה המודל מסביר טוב את המתאמים המקוריים בין משתנים לבין עצמם, כמו גם את המידה שבה המודל פרסימוני, כלומר אינו מכיל מורכבות יתר על המידה.

"אמידת יתר של מספר הפקטורים" מתרחש כאשר יותר מדי גורמים כלולים במודל. במקרה זה המודל עלול להקשות על הפרשנות התאורטית של הממצאים.

"אמידת חסר" מתרחשת כאשר מעט מדי גורמים כלולים במודל. אם לא נכללים מספיק גורמים במודל, הדבר עלול להתבטא בטעויות במודל המצומצם שנאמד. בפרט, משתנים בעלי טעינות גבוהה על גורם שאינו כלול במודל עלולים להטען באופן שגוי על גורמים שכן נכללים בו, ולבלגן את הטעינויות של שאר המשתנים. לעיתים מצב שכזה עלול לגרום לקיבוץ שני גורמים לגורם אחד.

ישנם מספר הליכים מקובלים אשר נועדו לקבוע מספר הגורמים האופטימלי. הליכים אלה אלה כוללים לדוגמה את הכלל של קייזר (Kaiser, 1960)[2], לפיו יש לבחור את מספר הגורמים אשר כל גורם הוא בעל ערך עצמי הגבוה מ-1. לשיקול זה יש בסיס תאורטי הגורס כי על כל גורם להסביר יותר ממוצע השונות למשתנה המוסברת על ידי המשתנים המקוריים. כלל נוסף נפוץ הוא הכלל על שם קאטל (Cattell 1966) הגורס כי יש להשתמש באיור הנקרא Scree plot המציג את הערך העצמי של כל אחד מהגורמים. באיור זה לפי קאטל (1966) יש לחפש שינוי ניכר לעין (ברך) בשיפועים בין כל שני גורמים בשלשת גורמים עוקבים (לדוגמה יש להשוות את השיפוע בין הגורם הראשון לשני עם השיפוע בין הגורם השני לשלישי). כאשר נמצא שינוי שכזה, אזי יש לבחור את הגורם הראשון בשלשה. דרך נוספת לקבוע את מספר הגורמים היא הניתוח המקביל של הורן (Horn, 1965). לפי שיטה זו יש לבחון באמצעות סימולציות מבוססות פרמוטציות את הסבירות לקבלת ערך עצמי שהתקבל ב-Scree plot או גבוה ממנו באקראי. מספר הגורמים נקבע לפי המספר של הגורמים אשר לא סביר שהערך העצמי שלהם התקבל באקראי.

שימוש ברוטציה[עריכת קוד מקור | עריכה]

רוטציה של הגורמים המתקבלים בניתוח הוא שלב נפוץ ב-EFA. הרוטציה מסייעת בפרשנות מטריצת הגורמים שמופקת באמצעות ניתוח הגורמים. לכל פתרון עם שני גורמים או יותר יש אינסוף כיוונים של הגורמים שיסבירו את הנתונים באותה מידה. מכיוון שאין פתרון ייחודי, החוקר חייב לבחור פתרון יחיד מתוך אינסוף האפשרויות. המטרה של הרוטציה היא לסובב את הגורמים שנמצאו במרחב רב-ממדי כדי להגיע לפתרון עם המבנה הפשוט הטוב ביותר. ישנם שני סוגים עיקריים של סיבוב גורמים: סיבוב אורתוגונלי וסיבוב אלכסוני.

רוטציה אורתוגונלית[עריכת קוד מקור | עריכה]

סיבובים אורתוגונליים מגבילים את הגורמים להיות מאונכים זה לזה ולפיכך הם ללא קורלציה זה עם זה. היתרון של סיבוב מסוג זה הוא הפשטות והבהירות הקונספטואלית שלו. במדעי החברה, לעיתים קרובות יש בסיס תאורטי לצפות שמבנים יהיו מתואמים זה עם זה, ולכן סיבובים אורתוגונליים עשויים להיות לא מאוד מציאותיים כי הם לא מאפשרים קורלציה בין פקטורים.

סיבוב אלכסוני[עריכת קוד מקור | עריכה]

סיבובים אלכסוניים מאפשרים קורלציות בין הגורמים שנמצאו. יתרון של סיבוב אלכסוני הוא בכך שהוא מייצר פתרונות עם מבנה פשוט טוב יותר כאשר גורמים צפויים להיות בקורלציה זה עם זה. סיבובים אלה עשויים לייצר פתרונות דומים לסיבוב אורתוגונלי אם הגורמים אינם מתואמים זה עם זה.

פתרון לא מסובב[עריכת קוד מקור | עריכה]

הפתרון הלא מסובב הוא למעשה סיבוב אורתוגונלי הממקסם את השונות של הגורמים הראשונים. הפתרון הבלתי מסובב נוטה לתת גורם כללי עם טעינות גבוהה של רוב המשתנים. פתרון זה עשוי להיות שימושי אם משתנים רבים נמצאים בקורלציה זה עם זה.

פרשנות הפקטור[עריכת קוד מקור | עריכה]

טעינות הגורמים הם ערכים מספריים המציינים את החוזק והכיוון של הגורם על המשתנים. על מנת לזהות את משמעות הגורמים במודל, על החוקרים לבחון את דפוס טעינות הגורמים כדי לראות אילו פריטים בעלי טעינות גבוהה על אחד הגורמים ולקבוע מה המשותף לפריטים הללו.

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ Cerny, C.A., & Kaiser, H.F. (1977). A study of a measure of sampling adequacy for factor-analytic correlation matrices. Multivariate Behavioral Research, 12(1), 43-47.
    Dziuban, C. D., & Shirkey, E. C. (1974). When is a correlation matrix appropriate for factor analysis? Psychological Bulletin, 81, 358-361.
    Kaiser, H.F. (1970). A second generation Little Jiffy. Psychometrika, 35, 401-415.
  2. ^  Kaiser, H.F. (1960). "The application of electronic computers to factor analysis". Educational and Psychological Measurement. 20: 141–151. doi:10.1177/001316446002000116.