הורדת ממד – ויקיפדיה

בסטטיסטיקה, למידת מכונה ותורת האינפורמציה, תהליך הורדת ממד (dimensionality reduction) הוא תהליך של צמצום מספר משתנים מתוך כלל המידע, על מנת לשמר כמה שיותר מהמשמעות של המידע עצמו.

שיטות להורדת ממד

[עריכת קוד מקור | עריכה]

בחירת מאפיינים (Feature selection)- גישה בה ננסה לבחור תת-קבוצה של משתנים מתוך כלל המשתנים, לתת הקבוצה הזאת נקרא מאפיין (feature). המטרה בגישה זאת היא לבחור את המאפיינים שמייצגים בצורה אופטימלית את המידע.

הטלת מאפיינים (feature projection) - בגישה זו נמיר את המידע על ידי המרה של מידע המאופיין כמרחב בעל ממדים רבים (high-dimensional space) למידע המיוצג במרחב עם פחות ממדים. ההמרה יכולה להיות המרה ליניארית כמו בשיטת ניתוח גורמים ראשיים (PCA), והיא יכולה להיות גם המרה לא-ליניארית כמו ב-Autoencoders.

במקרים מסוימים, סוגים בסיסיים של ניתוח נתונים, כמו סיווג או רגרסיה יתבצעו בצורה יותר מדויקת על מידע שעבר הורדת ממדים מאשר על המידע המקורי.^[1]

היתרונות של הורדת ממד

[עריכת קוד מקור | עריכה]

הורדת נפח האחסון הנדרש על מנת לאחסן את המידע.
הורדה של מידע עודף גורמת לביצועים טובים יותר באלגוריתמים של למידת מכונה.
קל יותר לייצר ויזואליזציות של מידע כאשר מבטאים אותו במספר מועט של ממדים, כמו בגרף דו-ממדי או תלת-ממדי.

הערות שוליים

[עריכת קוד מקור | עריכה]

^ Rico-Sulayes, Antonio (2017). "Reducing Vector Space Dimensionality in Automatic Classification for Authorship Attribution". Revista Ingeniería Electrónica, Automática y Comunicaciones. 38 (3): 26–35.

בינה מלאכותית
כללי	מבחן טיורינג • היסטוריה של הבינה המלאכותית • ציר הזמן של בינה מלאכותית • התקדמות הבינה המלאכותית • אוריינות AI • סוכן תבוני • AI-שלמות מערכת מומחה • אסדרת בינה מלאכותית (בישראל) • בינה מלאכותית צרה • בינה חישובית • הסברתיות בינה מלאכותית • הפרדוקס של מורבק • סוכן תבוני • אתיקה של בינה מלאכותית
תחומים	עיבוד שפה טבעית • ראייה ממוחשבת • בינה מלאכותית יוצרת • אומנות בינה מלאכותית
סוגי למידת מכונה	מערכת לומדת • למידה מונחית • למידה בלתי מונחית • למידה עמוקה • למידת חיזוק • סיווג בייסיאני נאיבי • רשת בייסיאנית
אלגוריתמי למידת מכונה קלאסית	פרספטרון • עץ החלטה • מכונת וקטורים תומכים • Bag of words • אלגוריתם k-מרכזים • אלגוריתם מיקסום התוחלת • הורדת ממד • אלגוריתם שכן קרוב • יער אקראי • Q-learning •‏ T-SNE •‏ Tf–idf • חיזוק גרדיאנט
למידה עמוקה	רשת עצבית מלאכותית • רשת זרימה קדימה • רשת עצבית רקורסיבית • פונקציית אקטיבציה • טרנספורמר • Attention •‏ GAN
עיבוד שפה טבעית	מודל שפה • שיכון מילים (אנ') • בלשנות חישובית • תרגום מכונה • חילוץ מידע (אנ') • ניתוח סנטימנט • זיהוי חלקי דיבר (אנ') • מערכת זיהוי דיבור • זיהוי ישויות • כריית טקסט • תיוג תפקידים סמנטי • Word2vec • מודל שפה גדול • GPT •‏ BERT (אנ') • מודל Bag-of-words (אנ') • יצירת טקסט בשפה טבעית (אנ') • מילת עצירה • ניתוח מחרוזות • Stemming (אנ') • למטיזציה (אנ')
יישומים לבינה מלאכותית (אנ')	צ'אטבוט • זיהוי דובר • זיהוי עצמים • זיהוי תבניות • עוזר וירטואלי • זיהוי תווים אופטי • מחולל תמונות • הזיות
מערכות בינה מלאכותית	אלייזה • ChatGPT •‏ DALL-E •‏ Midjourney •‏ Gemini •‏ Perplexity •‏ GitHub Copilot • דיפ־פייק • סירי • Google Assistant • אמזון אלכסה
סוגיות בטיחות בינה מלאכותית (אנ')	סכנה קיומית מבינה מלאכותית כללית • בינה מלאכותית חזקה • יישור בינה מלאכותית (אנ') • בקרת יכולות בינה מלאכותית (אנ') • השתלטות בינה מלאכותית (אנ') • בינה מלאכותית ידידותית (אנ') • התכנסות אינסטרומנטלית (אנ') • סינגולריות טכנולוגית
ספריות בשימוש נרחב	TensorFlow •‏ PyTorch •‏ Torch •‏ Hugging Face •‏ Keras •‏ spaCy (אנ') •‏ Caffe
לקטגוריית הבינה המלאכותית