גרירה טקסטואלית

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

גרירה טקסטואלית (Textual Entailment - TE) היא יחס מכוון בין טקסטים, המבטא את העובדה שהנכונות של טקסט אחד גוררת את הנכונות של טקסט אחר. אחת הבעיות האופייניות לתחום של עיבוד שפה טבעית בעזרת מחשב היא הבעיה של זיהוי גרירה טקסטואלית (RTE): בהינתן טקסט (t) והיפותזה (h), על המחשב להחליט האם הטקסט גורר את ההיפותזה, כלומר, האם אדם סביר הקורא את הטקסט יגיע למסקנה שההיפותזה נכונה.

לדוגמה, נתבונן בטקסטים הבאים:

  • טקסט: "תרח הוליד את אברם את נחור ואת הרן, והרן הוליד את לוט"
  • היפותיזה א: "לוט הוא נכד של תרח"
  • היפותיזה ב: "תרח הוא גבר"
  • היפותיזה ג: "תרח הוא בן 70"
  • היפותיזה ד: "תרח הוא עקר"

הטקסט גורר את היפותיזה א ואת היפותיזה ב; הטקסט לא גורר את היפותיזה ג; והטקסט סותר את היפותזה ד.

תוכנת מחשב שמטרתה לזהות גרירה טקסטואלית צריכה להיות בעלת ידע במגוון רחב של תחומים, החל בתחום המילולי, דרך התחום התחבירי, ועד לתחום הסמנטיקה וידע על העולם.

זיהוי גרירה טקסטואלית יכול לשמש כשלב ביניים במספר רב של אפליקציות הקשורות לעיבוד שפה טבעית, כגון: חיפוש תשובות לשאלות בטקסט גדול, הפקת מידע מתוך טקסט לפי תבנית, סיכום מסמכים אוטומטי, ועוד.

קישורים חיצוניים[עריכת קוד מקור | עריכה]

P Computer-science.svg ערך זה הוא קצרמר בנושא מדעי המחשב. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.