רשת קוהונן

רשת קוהונן הידועה גם כ-Self Organizing Map, או בקיצור SOM, היא מודל של רשת עצבית מלאכותית שנסמך על למידה בלתי מונחית (unsupervised learning) כדי ליצור מיפוי ממימד גבוה של קלטים רציפים למימד פלט נמוך ובדיד. את המודל ניסח הפרופסור הפיני טאובו קוהונן.

תיאור כללי

הטופולוגיה של רשת קוהונן בנויה כמפה דו-ממדית או גריד של נוירונים. כל נוירון במפה מיוצג על ידי וקטור של ערכים שמימדו זהה למימד הקלט. קלטים קרובים מבחינה מטרית מותאמים לנוירונים שכנים בגריד. המיפוי מתבצע לרוב באמצעות מדידת המרחק האוקלידי של הקלט מכל נוירון במפה. הנוירון הקרוב ביותר לדוגמת הקלט נבחר. בשלב האימון של רשת קוהונן מבוצע בנוירון המתאים ביותר לקלט שינוי בערכיו כך שיתקרב לקלט המוצג. השינויים בשלב האימון מבוצעים גם בנוירון הנבחר וגם בשכניו במפה לפי פונקציית שכנות שקובעת את מידת ההשפעה של השינוי לגביהם.

המטרה היא, שלאחר מס' רב של איטרציות, בהן הנוירון הנבחר (BMU - Best Matching Unit) ושכניו, יתכנסו למצב בו הם מייצגים וקטורים קרובים יחסית מהמימד המקורי. כך, מסייע האלגוריתם להורדת מימד, בכך שהוא משמר גם במימד הנמוך את הקרבה בין הווקטורים במימד המקורי. ניתן להשתמש גם בגריד תלת-ממדי. זה נעשה באמצעות מטריצת משקלים (נקרא גם מטריצת שכנויות) המוגדרת על ידי המשתמש, בה בדרך כלל נותנים משקל מרבי לאיבר המרכזי במטריצה, וככל שמתרחקים מהמרכז, המשקלים פוחתים (כמו למשל במסיכה גאוסיאנית). במהלך האימון, כל דגימה במימד n מחפשת את הנוירון בגריד שהכי קרוב אליו במרחק אוקלידי. לאחר שנוירון זה נבחר (לנוירון כזה קוראים BMU), מטריצת השכנויות תמוקם כך שנוירון זה יהיה במרכזה, ואז יתבצע האימון על כל הנוירונים שבסביבה (כמובן כולל את נוירון ה-BMU עצמו), ע"פ המשקלים של המטריצה. כך, בעזרת מטריצת השכנויות, נוצר מצב בו "שכנים" בגריד "מתקרבים" אחד לשני במרחק האוקלידי שלהם.

האלגוריתם מתאים גם ל-ניתוח אשכולות (clustering) כאשר כל אחד מאיברי הגריד הוא קלאסטר. במקרים בהם אין מבחינת המשתמש חשיבות רבה להורדת המימד, אלא רק ל-clustering, ניתן אף להשתמש בגריד של מימד אחד (במילים אחרות - וקטור אחד של נוירונים). גם שימוש בגריד של מימד אחד צפוי למקם באינדקסים צמודים קלאסטרים קרובים מהמימד המקורי, דבר שנותן ערך מוסף על אלגוריתם clustering רגיל שאין בו סדר. השימוש לטובת clustering הוא מקרה פרטי של השימוש באלגוריתם זה.

אלגוריתם הלמידה

צור רשת של נוירונים המאותחלים לערכים אקראיים.
לכל וקטור $D(t)$ $D(t)$ מתוך דוגמאות הלמידה בצע:
1. מצא את $BMU(t)$ , הווקטור הכי קרוב ל $D(t)$ במפה (לרוב על פי מרחק אוקלידי).
2. לכל נוירון ברשת, עדכן:
  1. $w(t+1)=w(t)+F(w(t),BMU(t))*a(t)*(D(t)-w(t))$
הקטן את $a(t)$
חזור לשלב 2 (החיצוני) כל עוד $a(t)>0$

כאשר

$w(t)$ הוא הערך של נוירון w בזמן t ברשת
$BMU(t)$ הוא הערך של הנוירון ברשת שנמצא כקרוב ביותר לקלט הנתון D בזמן t
$F(w(t),BMU(t))\in [0,1]$ היא פונקציית השכנות של הרשת, כך שככל ש w קרוב יותר טופולוגית ל BMU, הערך של F מתקרב ל 1 וככל שהם רחוקים יותר זה מזה הערך של F מתקרב יותר ל 0 בהתאם.
$a(t)\in [0,1]$ הוא קצב הלמידה של הרשת שדועך ככל שתהליך הלמידה מתקדם.
$D(t)-w(t)$ הוא ההפרש בין הערך של הקלט D לנוירון w בזמן t.

לקריאה נוספת

http://davis.wpi.edu/~matt/courses/soms/

קישורים חיצוניים

מדיה וקבצים בנושא רשת קוהונן בוויקישיתוף