Music OCR

Music OCR הוא יישום של טכנולוגית זיהוי תווים אופטי לצורך המרת תווי מוזיקה מודפסים לפורמט דיגיטלי בר-עריכה (כגון MusicXML ו-LilyPond) ובר-נגינה (כגון MIDI).

היסטוריה[עריכת קוד מקור | עריכה]

מחקר ראשוני בזיהוי של תווי מוזיקה מודפסים נעשה בשנות ה-60 המאוחרות של המאה ה-20 ב-MIT ומכונים נוספים. ^[1]

המוצר המסחרי הראשון בתחום, MIDISCAN, שוחרר ב-1991 על ידי חברת Musitek.

בניגוד לזיהוי אופטי של טקסט, שבו המילים מעובדות בטור, זיהוי אופטי של מוזיקה מחייב עיבוד של אלמנטים מקבילים. לכן, המיקום היחסי של סימני הדינמיקה והוראות ביצוע מוזיקליות נוספות מהווים חלק חשוב מאלגוריתם הזיהוי.

לתוכנות זיהוי מודרניות יכולת דיוק של מעל ל-99% עבור סריקה איכותית וסימון סטנדרטי.^[^{דרוש מקור]} מכיוון שנקודה מסמלת סטקטו או הארכת תו, כל "הפרעה" בסריקה עלולה לגרום לשגיאות בפענוח.