מכונת וקטורים תומכים

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

מכונת וקטורים תומכים (באנגלית Support Vector Machine, לרוב נכתב ונהגה כראשי-תבות SVM) היא טכניקה של למידה מונחית (supervised). אלגוריתם למידה חישובית זה הוצג על ידי ולדימיר ופניק בשנת 1963, ומאז מהווה כלי מרכזי בפתרון בעיות באמצעים סטטיסטיים. כנהוג בתחום זה, דוגמאות האימון מיוצגות כווקטורים במרחב לינארי. שלב האימון תכליתו בניית מסווג (classifier) אשר מפריד נכון ככל האפשר בין דוגמאות אימון חיוביות ושליליות. המסווג שנוצר ב SVM הוא המפריד הלינארי אשר יוצר מרווח גדול ככל האפשר בינו לבין הדוגמאות הקרובות לו ביותר בשתי הקטגוריות.

רציונאל[עריכת קוד מקור | עריכה]

ה SVM בונה מישור-על (Hyperplane) שהוא המפריד הלינארי (מפריד את המרחב לשני חצאי מרחבים שכל אחד מהם אמור להכיל בעיקר דוגמאות מסוג אחד), וכן שני מישורי-על מקבילים לו, אחד מכל צד, במרחק זהה, אשר מתלכדים עם דוגמת אימון אחת מכל מחלקה. מטרת ה SVM היא להגדיל את המרחק בין המפריד הלינארי ובין כל אחד מהמישורים המקבילים (מרחק המכונה שוליים), ולמעשה למצוא את המפריד בעל השוליים הרחבים ביותר. דוגמאות האימון המתלכדות עם מישורי השוליים נקראות וקטורים תומכים, ומכאן נגזר שם האלגוריתם.

הפרדה לא לינארית[עריכת קוד מקור | עריכה]

לעתים קרובות בעיות בעולם האמיתי לא ניתנות לסווג בעזרת מפריד לינארי.

penalty[עריכת קוד מקור | עריכה]

כאמור, אלגוריתם הלמידה מנסה לספק שתי מטרות: סווג נכון של דוגמאות האימון ומיקסום של השוליים. לא אחת המטרות נמצאות בסתירה, ואז יש צורך להגדיר איזו מטרה יותר חשובה. רוב המימושים של SVM מגדירים קבוע ענישה (penalty) על סווג לא נכון (מסומן באות c). ערך c גבוה פירושו העדפת הסווג הנכון על פני שוליים רחבים, ו c נמוך מעדיף הכללה (שוליים רחבים), גם במחיר שדוגמאות האימון הספציפיות אינן מסווגות נכון.

Kernel Trick[עריכת קוד מקור | עריכה]

צעד נוסף וחשוב אותו נוקטים מדעני המחשב מכונה "תעלול הגרעין". מהלך זה מעתיק את דוגמאות האימון מהמרחב הלינארי המקורי למרחב במימד גבוה יותר, מתוך הנחה שבמרחב החדש ימצא מפריד לינארי טוב יותר מאשר במרחב המקורי. ההעתקה נעשית בעזרת התעלול - מחליפים את המכפלה הפנימית בה משתמשים עבור המפריד הלינארי, בפונקציית kernel אשר מדמה את פיזורם מחדש של הווקטורים המקוריים במרחב עשיר יותר, ללא עלות חישובית משמעותית. המפריד הלינארי במרחב הווקטורי החדש הוא מפריד לא לינארי במרחב המקורי. את מלאכת הסיווג מבצעים אף היא בעזרת אופרטור הגרעין.

מימושים נבחרים[עריכת קוד מקור | עריכה]

  • ספריית libsvm , תומכת בסיווג ורגרסיה בעזרת סוגים שונים של SVM. הספרייה נכתבה במקור ב C++ וקיימות עבורה תוכנות מעטפת במגוון רב של שפות תכנות ופלטפורמות.
  • svmlight
P Computer-science.png ערך זה הוא קצרמר בנושא מדעי המחשב. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.