הורדת ממד
בסטטיסטיקה, למידת מכונה ותורת האינפורמציה, תהליך הורדת ממד (dimensionality reduction) הוא תהליך של צמצום מספר משתנים מתוך כלל המידע, על מנת לשמר כמה שיותר מהמשמעות של המידע עצמו.
שיטות להורדת ממד
[עריכת קוד מקור | עריכה]בחירת מאפיינים (Feature selection)- גישה בה ננסה לבחור תת-קבוצה של משתנים מתוך כלל המשתנים, לתת הקבוצה הזאת נקרא מאפיין (feature). המטרה בגישה זאת היא לבחור את המאפיינים שמייצגים בצורה אופטימלית את המידע.
הטלת מאפיינים (feature projection) - בגישה זו נמיר את המידע על ידי המרה של מידע המאופיין כמרחב בעל ממדים רבים (high-dimensional space) למידע המיוצג במרחב עם פחות ממדים. ההמרה יכולה להיות המרה ליניארית כמו בשיטת ניתוח גורמים ראשיים (PCA), והיא יכולה להיות גם המרה לא-ליניארית כמו ב-Autoencoders.
במקרים מסוימים, סוגים בסיסיים של ניתוח נתונים, כמו סיווג או רגרסיה יתבצעו בצורה יותר מדויקת על מידע שעבר הורדת ממדים מאשר על המידע המקורי.[1]
היתרונות של הורדת ממד
[עריכת קוד מקור | עריכה]- הורדת נפח האחסון הנדרש על מנת לאחסן את המידע.
- הורדה של מידע עודף גורמת לביצועים טובים יותר באלגוריתמים של למידת מכונה.
- קל יותר לייצר ויזואליזציות של מידע כאשר מבטאים אותו במספר מועט של ממדים, כמו בגרף דו-ממדי או תלת-ממדי.
הערות שוליים
[עריכת קוד מקור | עריכה]- ^ Rico-Sulayes, Antonio (2017). "Reducing Vector Space Dimensionality in Automatic Classification for Authorship Attribution". Revista Ingeniería Electrónica, Automática y Comunicaciones. 38 (3): 26–35.