למידה מונחית

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

למידה מונחית היא טכניקה בלמידה חישובית על מנת ללמוד פונקציה ("היפותזה") מתוך סט אימון. סט האימון מכיל דגימות מתוך התפלגות משותפת של מרחב האלמנטים ומרחב התיוגים. מטרת הלמידה המונחית היא ללמוד על ההתפלגות המשותפת, ומתוך כך לנבא עבור אלמנט את התיוג שלו.

מרחב ההיפותזות הוא מרחב המכיל פונקציות ממרחב האלמנטים למרחב התיוגים. עבור סט האימון לכל היפותזה יש שגיאה אמפירית - אחוז השגיאות של ההיפותזה על סט האימון. לכל היפותזה יש שגיאת הכללה - התוחלת של טעות בתיוג על פני ההתפלגות המשותפת.

לדוגמה: מרחב האלמנטים הוא מרחב של ווקטורים שמכילים מידע רפואי על חולה: חום, דופק, לחץ דם. מרחב התיוגים מכיל את התיוגים חולה ובריא. יש לנו מידע רפואי על אנשים, ואת הדיאגנוזה שלהם, האם הם בריאים או חולים, ונרצה לנסח היפותזה ששגיאת ההכללה שלה קטנה ככל האפשר. אנו רוצים להימנע מהיפותזה שהשגיאה האמפירית שלה קטנה, אולם שגיאת ההכללה שלה גדולה. לדוגמה בהינתן המדגם נגדיר את התיוג של האנשים שבמדגם להיות התיוג שקיבלנו, ואת כל שאר האנשים נתייג כבריאים. השגיאה האמפירית היא 0, אולם נצפה ששגיאת ההכללה תהיה גדולה יחסית.

חסם הופדינג נותן דרך לקבל את מספר הדגימות הדרושות על מנת להבטיח שהשגיאה האמפירית תהיה קרובה לשגיאת ההכללה.

P Computer-science.png ערך זה הוא קצרמר בנושא מדעי המחשב. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.