טטואבה

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

טטואבה (Tatoeba, ביפנית: たとえば = "לדוגמה") הוא פרויקט של שיתוף פעולה בינלאומי שמטרתו לאסוף ולרכז מספר רב של משפטים, המתורגמים ממספר רב של שפות למגוון שפות אחרות.

שם הפרויקט הוא המילה היפנית שפירושה "לדוגמה", כלומר, דוגמה לשימושי לשון שונים במילים ובביטויים. בסיס הנתונים של טטואבה מכיל מספר רב של משפטים לדוגמה, שתורגמו ועדיין מתורגמים למכלול רחב של שפות. מכלול התרגומים משמש מעין מילון תרגום רב-לשוני; כאשר מחפשים בו תרגום למילה כלשהי, האתר מציג משפטים לדוגמה שבהם משולבת המילה המבוקשת.

הרכב[עריכת קוד מקור | עריכה]

אוסף הטקסטים של טטואבה מבוסס על קורפוס "טאנאקה" (אוסף גדול של משפטים מקבילים ביפנית ובאנגלית), שנוספו אליו שפות רבות אחרות החל משנת 2006, תחת ניהולה של טראנג הו (Trang Ho).

תצוגה גרפית: כל צומת מייצג משפט; כל חץ מצביע על קישור בין שני משפטים; כאשר שני משפטים מחוברים, יש להם אותה משמעות.

אתר הפרויקט[עריכת קוד מקור | עריכה]

אתר פרויקט טטואבה מכיל מגוון כלים ואמצעים המאפשרים חיפוש ועריכה של המשפטים. בפרויקט משתתפת קהילה רחבה של תורמים דוברי שפות רבות, העוסקים בהזנה, בתרגום ובעריכה של המשפטים בשפות השונות.

נכון לתחילת מרץ 2013, טטואבה כוללת כ-2,180,000 משפטים ב-121 שפות. חמש השפות המכילות את המספר הרב ביותר של משפטים בפרויקט נכון לנקודת הזמן האמורה הן אנגלית, אספרנטו, גרמנית, צרפתית וספרדית.

קישורים חיצוניים[עריכת קוד מקור | עריכה]