למידה בלתי מונחית

למידה בלתי מונחית (Unsupervised Learning) היא טכניקה בלמידה חישובית שבה מנסים ללמוד את התכונות והמבנה של אוסף דוגמאות נתונים כאשר הנתונים זמינים כפי שהם ללא תוספת תיוגים^[1]. למשל, נתונים הכוללים מידע רפואי על נבדק, כמו: חום, דופק, לחץ דם; ללא תיוג המציין אם הנתונים שייכים לאדם חולה או בריא. התובנות לגבי התכונות של הנתונים הבלתי מתויגים יכולות לשמש למשל כדי לזהות אנומליות או כדי לחלק את הנתונים לקטגוריות. זאת להבדיל מלמידה מונחית שבה הנתונים הזמינים כוללים גם תיוג ומטרת הלימוד היא בדרך כלל לחזות את התיוג של נתונים עתידיים (למשל לחזות אם נתונים רפואיים שלא תויגו עדיין שייכים לאדם חולה).

למידה מונחית לעומת למידה בלתי מונחית[עריכת קוד מקור | עריכה]

איור 1: נתונים מתויגים לצורך למידה מונחית

איור 2: נתונים לא מתויגים לצורך למידה בלתי מונחית

נניח שזמינים נתונים רפואיים כפי שתוארו בהקדמה כשכל דגימה מתויגת עם אחת משלושה מצבים קליניים. איור 1 מראה הצגה של נתונים מתויגים כאלה במישור כשכל מצב קליני מיוצג על ידי צבע שונה. למידה מונחית תנסה ללמוד את ההתאמה של התיוגים לנתונים כדי לחזות את התיוג של נתונים חדשים ובלתי מתויגים שיגיעו עבור חולה חדש. למשל אם יתקבלו נתונים חדשים ולא מתויגים של חולה שיופיעו באזור הימני העליון של הדיאגרמה, ניתן אולי לשער שמתאים לו התיוג הכחול. שימוש ברשת עצבית מלאכותית היא אחת מהטכניקות הרבות המקובלות לביצוע למידה מונחית שכזאת.

פעמים רבות הנתונים הזמינים ללימוד אינם כוללים תיוגים. בדוגמה הרפואית שלמעלה למשל ייתכן שאי אפשר עדיין לגבש דעה לגבי המצב הקליני, או שאין בנמצא את המומחים הדרושים לשם כך, או שהנתונים רבים מדי, או שפשוט הנתונים הגיעו ממקור שלא כלל את התיוגים. איור 2 מראה הצגה של נתונים לא מתויגים כאלה במישור. למרות שחסרים התיוגים, עדיין ניתן ללמוד די הרבה מנתונים כאלה. למשל, גם ללא התיוגים, ניתן לראות שהנתונים מקובצים בשלושה מקבצים עיקריים. אפשר כך לחלק את הדגימות (או את החולים בדוגמה שלנו) לשלוש קטגוריות (חסרות שם). ניתן כך לשייך גם כל דגימה חדשה לאחת מהקטגוריות הללו. ייתכן שבהמשך נגלה מה הטיפול המתאים לכל קטגוריה ומן סתם ניתן להן שמות. אפשר גם ללמוד תכונות של קטגוריות, למשל מעברים צפויים של אינדיבידואלים בין קטגוריות. חלוקת נתונים כזאת למקבצים דומים היא התחום של ניתוח אשכולות^[2] - שיטה נפוצה בלמידה בלתי מונחית.

לימוד בלתי מונחה יכול גם לזהות אנומליות בנתונים - כלומר דגימות חריגות שאינן תואמות את הדפוס של שאר התצפיות. למשל באיור 2 ניתן לשער שהנקודה השמאלית תחתונה הקיצונית היא חריגה ורחוקה מכל קטגוריה. בעולם הרפואי דגימה שכזאת יכולה להוות אות אזהרה שיוביל לבדיקות מעמיקות יותר של הנבדק. דוגמה נפוצה נוספת לזיהוי אנומליות בנתונים לא מתויגים היא זיהוי של התקפות סייבר. כאן, הדגימות כוללות תכונות שנמדדו עבור תעבורות רשת. דגימות אלה נלקחות בזמן אמת ולא תמיד ניתן להשיג תיוג מיידי לגבי הסכנה שבהם. זיהוי של דגימה חדשה כחריגה הוא אפשרי כאמור אפילו ללא תיוג שכזה ויכול להוביל לשליחת אות אזהרה או אף נקיטת צעדי הגנה באופן אוטומטי. קיימות שיטות רבות לזיהוי אנומליות בנתונים בלתי מתויגים^[3] - כמו למשל זיהוי חריגוּת סטטיסטית, או מרחק קיצוני ממקבץ שזוהה קודם בשיטות של ניתוח אשכולות שהוזכרה מעלה.

טכניקה נוספת המשמשת לימוד בלתי מונחה היא ניתוח גורמים ראשיים^[4]. כאן הנתונים מועברים למערכת קואורדינטות חדשה שבה הקואורדינטות החדשות מסודרות לפי שונות הולכת וקטנה. השימוש הנפוץ בשיטה הוא לצורך מציאת ייצוג יותר קומפקטי ומייצג של הנתונים על ידי שימוש במספר קטן יותר של קואורדינטות שעדיין כוללות את רוב השונות הנמצאת בנתונים.

שיטות נוספות המשמשות בלמידה בלתי מונחית מופיעות להלן.

טכניקות ללמידה בלתי מונחית[עריכת קוד מקור | עריכה]

קישורים חיצוניים[עריכת קוד מקור | עריכה]

שי שלו שוורץ ושי בן דוד, Understanding Machine Learning: From Theory to Algorithms, Cambridge University Press, 2014
קורס בלמידת מכונה מאוניברסיטת בן-גוריון שבנגב.
קורס בלמידת מכונה מאוניברסיטת Caltech (אנגלית).

הערות שוליים[עריכת קוד מקור | עריכה]

^ Learning From Data Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin, ספר וצילומי הרצאות בלמידה חישובית שניתנו במכון הטכנולוגי של קליפורניה Caltech
^ אלגוריתם k-מרכזים וניתוח אשכולות היררכי באתר של אנדרו מור הכולל את הרצאותיו בנושאי למידה חישובית באוניברסיטת קרנגי מלון
^ סקר שיטות לזיהוי אנומליות ויקטוריה הוג' וג'ים אוסטין, אוניברסיטת יורק
^ ניתוח מרכיבים ראשיים (PCA) – למה, איך ואיך לא - יוסי לוי, נסיכת המדעים

[1] Learning From Data Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin, ספר וצילומי הרצאות בלמידה חישובית שניתנו במכון הטכנולוגי של קליפורניה Caltech

[2] אלגוריתם k-מרכזים וניתוח אשכולות היררכי באתר של אנדרו מור הכולל את הרצאותיו בנושאי למידה חישובית באוניברסיטת קרנגי מלון

[3] סקר שיטות לזיהוי אנומליות ויקטוריה הוג' וג'ים אוסטין, אוניברסיטת יורק

[4] ניתוח מרכיבים ראשיים (PCA) – למה, איך ואיך לא - יוסי לוי, נסיכת המדעים

[1]

[2]

[3]

[4]

תחומים במדעי המחשב
יסודות מתמטים	לוגיקה מתמטית • תורת הקבוצות • תורת המספרים • תורת הגרפים • תורת הטיפוסים • תורת הקטגוריות • אנליזה נומרית • תורת האינפורמציה
תורת החישוביות	תורת האוטומטים • תורת הרקורסיה • תורת הסיבוכיות • מחשוב קוונטי
אלגוריתמים ומבנה נתונים	אנליזה של אלגוריתמים • גאומטריה חישובית
שפות תכנות ומהדרים	מפרש • פרדיגמת תכנות (תכנות פרוצדורלי • תכנות מונחה עצמים • תכנות פונקציונלי • תכנות לוגי)
חישוב מבוזר ועיבוד מקבילי	עיבוד מקבילי • מחשוב סריגי • בקרת מקביליות
הנדסת תוכנה	ניתוח מערכות מידע • עיצוב תוכנה • תכנות מחשבים • שיטות פורמליות • בדיקות תוכנה • מתודולוגיית פיתוח תוכנה
תקשורת	ניתוב • טופולוגיית רשת • קריפטוגרפיה
מסד נתונים	מסד נתונים יחסי • SQL • תנועה • אינדקסים • כריית מידע • CAP theorem
בינה מלאכותית	חשיבה אוטומטית • בלשנות חישובית • ראייה ממוחשבת • עיבוד שפה טבעית • בינה חישובית • מערכת מומחה • למידה חישובית • רובוטיקה
גרפיקה	הדמיה ממוחשבת • הנפשה ממוחשבת • עיבוד תמונה
שפות פורמליות	שפה רגולרית • שפה חסרת הקשר • שפה תלוית הקשר • ההיררכיה של חומסקי
שימושים במדע	ביואינפורמטיקה • מדעים קוגניטיביים • כימיה חישובית • פיזיקה חישובית • אנליזה נומרית

בינה מלאכותית
כללי	מבחן טיורינג • היסטוריה של הבינה המלאכותית • ציר הזמן של בינה מלאכותית • התקדמות הבינה המלאכותית (אנ') • AI-שלמות מערכת מומחה • אסדרת בינה מלאכותית • בינה מלאכותית צרה • בינה חישובית • הסברתיות בינה מלאכותית • הפרדוקס של מורבק • סוכן תבוני • אתיקה של בינה מלאכותית
תחומים	עיבוד שפה טבעית • ראייה ממוחשבת • בינה מלאכותית יוצרת • אומנות בינה מלאכותית
סוגי למידת מכונה	מערכת לומדת • למידה מונחית • למידה בלתי מונחית • למידה עמוקה • למידת חיזוק • סיווג בייסיאני נאיבי • רשת בייסיאנית
אלגוריתמי למידת מכונה קלאסית	פרספטרון • עץ החלטה • מכונת וקטורים תומכים • Bag of words • אלגוריתם k-מרכזים • אלגוריתם מיקסום התוחלת • הורדת ממד • אלגוריתם שכן קרוב • Q-learning •‏ T-SNE •‏ Tf–idf • חיזוק גרדיאנט
למידה עמוקה	רשת עצבית מלאכותית • רשת זרימה קדימה • רשת עצבית רקורסיבית • טרנספורמר • Attention •‏ GAN
עיבוד שפה טבעית	מודל שפה • שיכון מילים (אנ') • בלשנות חישובית • תרגום מכונה • חילוץ מידע (אנ') • ניתוח סנטימנט • זיהוי חלקי דיבר (אנ') • מערכת זיהוי דיבור • זיהוי ישויות • כריית טקסט • תיוג תפקידים סמנטי • Word2vec • מודל שפה גדול • GPT •‏ BERT (אנ') • מודל Bag-of-words (אנ') • יצירת טקסט בשפה טבעית (אנ') • מילת עצירה • ניתוח מחרוזות • Stemming (אנ') • למטיזציה (אנ')
יישומים לבינה מלאכותית (אנ')	צ'אטבוט • זיהוי דובר • זיהוי עצמים • זיהוי תבניות • עוזר וירטואלי • זיהוי תווים אופטי • מחולל תמונות (הזיות (אנ'))
מערכות בינה מלאכותית	אלייזה • ChatGPT •‏ DALL-E •‏ Midjourney •‏ Gemini •‏ Perplexity •‏ GitHub Copilot • דיפ־פייק • סירי • Google Assistant • אמזון אלכסה
סוגיות בטיחות בינה מלאכותית (אנ')	סכנה קיומית מבינה מלאכותית כללית • בינה מלאכותית חזקה • יישור בינה מלאכותית (אנ') • בקרת יכולות בינה מלאכותית (אנ') • השתלטות בינה מלאכותית (אנ') • בינה מלאכותית ידידותית (אנ') • התכנסות אינסטרומנטלית (אנ') • סינגולריות טכנולוגית
ספריות בשימוש נרחב	TensorFlow •‏ PyTorch •‏ Torch •‏ Hugging Face •‏ Keras •‏ spaCy (אנ') •‏ Caffe
לקטגוריית הבינה המלאכותית