Music OCR

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

Music OCR הוא יישום של טכנולוגית זיהוי תווים אופטי לצורך המרת תווי מוזיקה מודפסים לפורמט דיגיטלי בר-עריכה (כגון MusicXML ו-LilyPond) ובר-נגינה (כגון MIDI).

היסטוריה[עריכת קוד מקור | עריכה]

מחקר ראשוני בזיהוי של תווי מוזיקה מודפסים נעשה בשנות ה-60 המאוחרות של המאה ה-20 ב-MIT ומכונים נוספים. ‏[1]

המוצר המסחרי הראשון בתחום, MIDISCAN, שוחרר ב-1991 על ידי חברת Musitek.

בניגוד לזיהוי אופטי של טקסט, שבו המילים מעובדות בטור, זיהוי אופטי של מוזיקה מחייב עיבוד של אלמנטים מקבילים. לכן, המיקום היחסי של סימני הדינמיקה והוראות ביצוע מוזיקליות נוספות מהווים חלק חשוב מאלגוריתם הזיהוי.

תוכנות זיהוי מודרניות הינן בעלות יכולת דיוק של מעל ל-99% עבור סריקה איכותית וסימון סטנדרטי.[דרוש מקור] מכיוון שנקודה מסמלת סטוקטו או הארכת תו, כל "הפרעה" בסריקה עלולה לגרום לשגיאות בפיענוח.

תוכנות לזיהוי אופטי של תווי מוזיקה[עריכת קוד מקור | עריכה]

תוכנות קוד פתוח[עריכת קוד מקור | עריכה]

  • Audiveris - מבוסס ג'אווה (רישיון: GPL)

תוכנות מסחריות[עריכת קוד מקור | עריכה]

shazam (גרסה לפלאפונים)

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ Pruslin, Dennis Howard, Automatic Recognition of Sheet Music, 1966 (גישה לקובץ בתאריך 2007-01-24)

קישורים חיצוניים[עריכת קוד מקור | עריכה]