למידה מונחית

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה לניווט קפיצה לחיפוש
דוגמה למערכת למידה מונחית. בשלב הראשון נאספות התצפיות. בשלב השני הן מחולקות למדגם אימון ומדגם בדיקה. אחר כך הלומד (אלגוריתם הלמידה) משתמש בדוגמאות המתויגות ממדגם האימון כדי ללמוד מודל חיזוי. באמצעות מדגם הבדיקה ניתן לבדוק את טיב המודל.

למידה מונחית (Supervised learning) היא טכניקה בלמידה חישובית על מנת ללמוד פונקציה ("היפותזה") על בסיס סט אימון. סט האימון מכיל דגימות מתוך התפלגות משותפת של מרחב האלמנטים ומרחב התיוגים. מטרת הלמידה המונחית היא ללמוד על ההתפלגות המשותפת, ומתוך כך לנבא עבור אלמנט את התיוג שלו. בעיות שבהן עוסקת למידת מונחית כוללות בין היתר רגרסיה ובעיות סיווג.

מרחב ההיפותזות הוא מרחב המכיל פונקציות ממרחב האלמנטים למרחב התיוגים. עבור סט האימון לכל היפותזה יש שגיאה אמפירית - אחוז השגיאות של ההיפותזה על סט האימון. לכל היפותזה יש שגיאת הכללה - התוחלת של טעות בתיוג על פני ההתפלגות המשותפת.

לדוגמה: מרחב האלמנטים הוא מרחב של ווקטורים שמכילים מידע רפואי על חולה: חום, דופק, לחץ דם. מרחב התיוגים מכיל את התיוגים חולה ובריא. יש לנו מידע רפואי על אנשים, ואת הדיאגנוזה שלהם, האם הם בריאים או חולים, ונרצה לנסח היפותזה ששגיאת ההכללה שלה קטנה ככל האפשר. אנו רוצים להימנע מהיפותזה שהשגיאה האמפירית שלה קטנה, אולם שגיאת ההכללה שלה גדולה. לדוגמה בהינתן המדגם נגדיר את התיוג של האנשים שבמדגם להיות התיוג שקיבלנו, ואת כל שאר האנשים נתייג כבריאים. השגיאה האמפירית היא 0, אולם נצפה ששגיאת ההכללה תהיה גדולה יחסית.

חסם הופדינג נותן דרך לקבל את מספר הדגימות הדרושות על מנת להבטיח שהשגיאה האמפירית תהיה קרובה לשגיאת ההכללה.

שיטות ואלגוריתמים[עריכת קוד מקור | עריכה]

בין השיטות הנפוצות המשמשות בתחום הלמידה המונחית:

ראו גם[עריכת קוד מקור | עריכה]

P Computer-science.svg ערך זה הוא קצרמר בנושא מדעי המחשב. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.