תיוג תפקידים סמנטי

בעיבוד שפה טבעית, תיוג תפקידים סמנטי (נקרא גם ניתוח סמנטי רדוד) הוא תהליך שמתייג מילים או ביטויים במשפט לפי תפקידם הסמנטי במשפט, כגון מבצע, מטרה, או תוצאה.

תיוג תפקידים סמנטי משמש למציאת "משמעות" המשפט. לשם כך הוא מוצא את הארגומנטים הקשורים לפרדיקטים או לפעלים המופיעים במשפט ומה תפקידו של כל ארגומנט.

היסטוריה[עריכת קוד מקור | עריכה]

בשנת 1968, הוצע הרעיון לתיוג תפקידים סמנטי לראשונה על ידי צ'ארלס פילמור. הצעתו הובילה לפיתוחו של פרויקט FrameNet, שהפיק את הלקסיקון החישובי הגדול הראשון שתיאר פרדיקטים רבים ואת תפקידם. פרויקט זה דרש משאבים רבים. דן ג'ורפסקי ודניאל גילדע פיתוח מערכת אוטומטית ראשונה שמבוססת על FrameNet.

קורפוס נוסף שמשמש למשימת התיוג הסמנטי הוא PropBank. מערכות אוטומטיות רבות לתיוג תפקידים סמנטיים משתמשות בקורפוס זה כסט הלמידה שלהן.

תיוג סמנטי של דוגמאות אימון כמו ב-PropBank או ב-FrameNet דרש משאבים רבים מאוד, בין היתר מפני שלא כל דובר שפה היה יכול לתייג את דוגמאות האימון, אלא היה צורך במומחים בבלשנות כדי לבצע תיוגים נכונים.

בשנת 2015 הוצעה שיטה חדשה בשם QA-SRL (Question-Answer Driven Semantic Role Labeling). שיטה זו משתמשת בשפה טבעית בשביל לתייג שפה טבעית. לפי שיטה זו, כל דובר שפה יכול לתייג משפטים, על ידי מענה על שאלות פשוטות שמגיעות בפורמט מובנה. זהו יתרון מובהק של השיטה, שכן אפשר להשתמש ב-crowdsourcing זול ומהיר בשביל לתייג דוגמאות אימון ובכך להשיג מדגמי אימון גדולים מאוד, מה שעשוי להביא לשיפור בתוצאות.^[1]

שימושים[עריכת קוד מקור | עריכה]

תיוג תפקידים סמנטי משמש כדי לגרום למחשב להבין את התפקידים הסמנטיים של מילים בתוך משפטים. תיוג טוב יותר של תפקידים סמנטיים במשפט עשוי להוביל לשיפור במשימות כגון תרגום מכונה, מענה לשאלות, חילוץ מידע, סיכום טקסט אוטומטי, כריית נתוני טקסט וזיהוי דיבור.

ראו גם[עריכת קוד מקור | עריכה]

הערות שוליים[עריכת קוד מקור | עריכה]

^ Luheng He, M. Lewis, Luke Zettlemoyer, Question-Answer Driven Semantic Role Labeling: Using Natural Language to Annotate Natural Language, EMNLP, 2015 doi: 10.18653/v1/D15-1076

[1] Luheng He, M. Lewis, Luke Zettlemoyer, Question-Answer Driven Semantic Role Labeling: Using Natural Language to Annotate Natural Language, EMNLP, 2015 doi: 10.18653/v1/D15-1076

[1]

בינה מלאכותית
כללי	מבחן טיורינג • היסטוריה של הבינה המלאכותית • ציר הזמן של בינה מלאכותית • התקדמות הבינה המלאכותית (אנ') • AI-שלמות מערכת מומחה • אסדרת בינה מלאכותית (אנ') • בינה מלאכותית צרה • בינה חישובית • הסברתיות בינה מלאכותית • הפרדוקס של מורבק • סוכן תבוני • אתיקה של בינה מלאכותית
תחומים	עיבוד שפה טבעית • ראייה ממוחשבת • בינה מלאכותית יוצרת • אומנות בינה מלאכותית
סוגי למידת מכונה	מערכת לומדת • למידה מונחית • למידה בלתי מונחית • למידה עמוקה • למידת חיזוק • סיווג בייסיאני נאיבי • רשת בייסיאנית
אלגוריתמי למידת מכונה קלאסית	פרספטרון • עץ החלטה • מכונת וקטורים תומכים • Bag of words • אלגוריתם k-מרכזים • אלגוריתם מיקסום התוחלת • הורדת ממד • אלגוריתם שכן קרוב • Q-learning •‏ T-SNE •‏ Tf–idf • חיזוק גרדיאנט
למידה עמוקה	רשת עצבית מלאכותית • רשת זרימה קדימה • רשת עצבית רקורסיבית • טרנספורמר • Attention •‏ GAN
עיבוד שפה טבעית	מודל שפה • שיכון מילים (אנ') • בלשנות חישובית • תרגום מכונה • חילוץ מידע (אנ') • ניתוח סנטימנט • זיהוי חלקי דיבר (אנ') • מערכת זיהוי דיבור • זיהוי ישויות • כריית טקסט • תיוג תפקידים סמנטי • Word2vec • מודל שפה גדול • GPT •‏ BERT (אנ') • מודל Bag-of-words (אנ') • יצירת טקסט בשפה טבעית (אנ') • מילת עצירה • ניתוח מחרוזות • Stemming (אנ') • למטיזציה (אנ')
יישומים לבינה מלאכותית (אנ')	צ'אטבוט • זיהוי דובר • זיהוי עצמים • זיהוי תבניות • עוזר וירטואלי • זיהוי תווים אופטי • מחולל תמונות (הזיות (אנ'))
מערכות בינה מלאכותית	אלייזה • ChatGPT •‏ DALL-E •‏ Midjourney •‏ Gemini •‏ Perplexity •‏ GitHub Copilot • דיפ־פייק • סירי • Google Assistant • אמזון אלכסה
סוגיות בטיחות בינה מלאכותית (אנ')	סכנה קיומית מבינה מלאכותית כללית • בינה מלאכותית חזקה • יישור בינה מלאכותית (אנ') • בקרת יכולות בינה מלאכותית (אנ') • השתלטות בינה מלאכותית (אנ') • בינה מלאכותית ידידותית (אנ') • התכנסות אינסטרומנטלית (אנ') • סינגולריות טכנולוגית
ספריות בשימוש נרחב	TensorFlow •‏ PyTorch •‏ Torch •‏ Hugging Face •‏ Keras •‏ spaCy (אנ') •‏ Caffe
לקטגוריית הבינה המלאכותית