ראייה ממוחשבת
מתוך ויקיפדיה, האנציקלופדיה החופשית
ראייה ממוחשבת היא ענף של מדעי המחשב העוסק בפיענוח, ניתוח, ועיבוד של אותות וידאו, ובמילים פשוטות יותר: מתן יכולת למחשב להבנת מידע חזותי מתמונות וסרטי וידאו ומתן אפשרות של מניפולציות עליהם.
תוכן עניינים |
[עריכה] הקדמה
העיניים מתפקדות כמצלמות וידאו צבעוניות ברזולוציה גבוהה ביותר (כ־60 מגהפיקסל) ובקצב של 20 תמונות בשנייה, והמידע הרב שנקלט, מעובד ומנותח במהירות שיא, תוך ברירת העיקר, ניפוי הטפל מהעיקר, ופיענוח המושתת על בינה אנושית. אופן פעולתו של מנגנון זה, המאפשר לתינוק בן שנתיים את היכולת לזהות את אמו, והמאפשר לזהות אדם שלא ראינוהו שנים ארוכות, או את היכולת לקרוא כל כתב יד, כמו גם את היכולת לזהות איום, מכל גורם אפשרי, עדיין לא ברור לנו.
ענף זה מנסה ליצור כלים לוגיים, כדי לחקות את הניתוח ועיבוד הנתונים שהמוח האנושי מבצע בעקבות הראייה. יתרון המיכון בעניין זה הוא ברור, המידע שמצלמות יכולות לקבל, לעבד ולנתח, הוא לאין שיעור מדויק וכמותי, מאשר העין והמוח האנושי מסוגלים לשאת, אף ברזולוציה יחסית נמוכה.
אחת הדרכים בניתוח התמונה, נעשית בפירוק התמונה לאבני הבסיס שמרכיבות אותה. נקודות אלו נקראות פיקסלים. כך נעשה ניסיון להגדיר ולזהות דפוסים של קבוצות פיקסלים, ושינויים של צבעי הפיקסלים המתרחשים במעבר מתמונה לתמונה. כדי לקבל אמת מידה של מרחק ויכולת ראייה תלת ממדית, יש כמה שיטות. אחת מהן היא שימוש בשתי מצלמות בזויות שונות, על מנת לקבל ראיה סטריאוסקופית, בדומה לראייה האנושית.
[עריכה] נושאים בראייה ממוחשבת
- עיבוד תמונה
- ייצוב תמונה. בתחום זה מקבלים תמונה רועדת ממצלמה ומייצבים אותה.
- יצירת פנורמה. בתחום זה יוצרים פנורמה ממספר תמונות או מסרט וידאו.
- הדמיית תלת ממד. בתחום זה מקבלים נתונים שטוחים והופכים אותם לתמונה או סרט תלת ממדיים.
- אינטרפולציה של תמונה. הוספת פרטים וחידוד של התמונה.
- מניפולציה על תמונה. שינוי פרטים מסוימים בתמונה לצרכים כאלו ואחרים.
- זיהוי אובייקטים
- גילוי וזיהוי תנועה VMD. בתחום זה התוכנה מגלה תנועה של עצם כפי שהוגדרה לה.
- עיקוב אחר אובייקט. עקיבת המצלמה אחרי האובייקט.
- פענוח כתב אופטי OCR. "הבנת" הכתב האופטי והמרתו לכתב מוקלד. תהליך שהאדם עושה בעיניו. ההפך מהדפסה.
- זיהוי תוואי שטח וקריאת מפות. דומה לOCR רק שהקריאה כאן היא של שטח.
- השוואת אובייקטים. בתחום זה מנסים למצוא התאמה בין אובייקט פיזי לבין מאגר כמו פנים וטביעות אצבעות
- זיהוי פתולוגיות בתחום הרפואי
- התמצאות מרחבית
- ניווט אוטומטי. בתחום זה מנסים להקנות לרובוט אפשרות לפענח את השטח ולנוע בו באופן חופשי.
[עריכה] יישומי ראייה ממוחשבת
- שימושים אזרחיים ומסחריים:
-
-
- ישומי ראיה ממוחשבת לקריאה:
-
-
- מיון דואר ממוחשב על פי קריאת המיקוד (והכתובת) מהמעטפות
- הקראה ממוחשבת של ספר לאוזניות של עיוור או דיסלקט. לפעולה כזו יש שני שלבים 1. פענוח תמונת הדף לתמליל כתוב 2. תמליל כתוב לתמליל מוקרא. (ראו גם טכנולוגיה מסייעת).
- זיהוי מכוניות באמצעות קריאת לוחיות הרישוי בכניסה לכבישי אגרה או בכניסה למגרשי חניה.
- פענוח כתב מתוך תמונה וזיהוי כתב של כתב יד במחשבי כף יד תוך כדי כתיבה.
-
-
- ישומי ראיה ממוחשבת שלא לקריאה:
-
-
- תנועה עצמאית של רובוטים לשאיבת אבק או גינון.
- נהיגה אוטומטית של מכוניות: (בקרת שיוט: שמירת מרחק, בלימת חירום, זיהוי תוואי דרך, ניבוי והתכוננות לתאונה צפויה).
- אזעקה ויזואלית שנעשית לפי זיהוי תמונה מסוימת או תנועה והגבה כלפיה.
- הדמיית תלת ממד של שרטוטים טכניים של תוכנות שרטוט.
- מיון וספירת דגי נוי.
- אומדן מספר אנשים במקומות ציבוריים.
- הנחיית עיוורים באמצעות מצלמה שתתאר את השטח באופן קולי, תבחין ברוחב של הדרך ותודיע האם הצבע התחלף ברמזור. שימוש זה עדיין נדיר (ראו גם טכנולוגיה מסייעת).
- אינדיקציה ביציאה ובחזרה מפרסומות בטלוויזיה.
- התרעה וצנזור של תמונות פורנוגרפיות בסרטים ובאינטרנט.
- שתילת פרסומות במשחקי כדורגל וכדורסל.
- הפעלת המחשב באופן חזותי, אם בעיקוב אחרי הפנים או אחרי עכבר כפפה.
- ליטוש יהלומים מדויק, באופן שיחסוך מחומר הגלם של היהלום.
- מערכת בקרה מרומזרת, המפעילה את הרמזורים לפי מספר המכוניות הממתינות בתור.
- סיווג איכות של נתחי בשר בקר.
- תוכנות מחשב שמפענחות ועוקבות אחר תנועות המשתמש ומחליפות תנועות יד, ראש או עין בשימוש בעכבר. סידור כזה מאפשר שימוש במחשב עבור נכי תנועה קשים מאוד שאינם יכולים לתפעל עכבר בשום דרך אחרת (ראו גם טכנולוגיה מסייעת).
- שימושים בידוריים:
- תוכנות מחשב שמפענחות ועוקבות אחר תנועות המשתמש. ראוי לציין את ה-'PlayStation Eye Toy' - זוהי מצלמה שמתחברת לקונסולת המשחקים פלייסטיישן
- קיימים מספר משחקים שניתן לשחק בהם בשילוב עם תנועה שמפוענחת על ידי המצלמה. כמו כן, ישנם מספר פיתוחים חופשיים של טכנולוגיה דומה למחשב האישי.
- שימושים משטרתיים:
- איתור מכוניות מבוקשות, על פי לוחיות הרישוי.
- זיהוי אנשים לפי פניהם במאגרים.
- זיהוי והתאמה של טביעות אצבעות לאלו שנמצאות במאגר ממוחשב. תוכנה צרפתית שנמצאת בשימוש במשטרת ישראל.
- שימושים צבאיים וביטחוניים:
- תצפיות על תאי שטח גדולים.
- הדמיית תמונת תלת ממד ממפות ומתצלומי אוויר ויצירת פנורמות מתצלומים או מסרט וידאו.
- אבטחת מתקנים והתרעה על פריצה לאזורים מסווגים.
- מידור אזורים בעזרת ביומטריה מבוססת זיהוי אובייקטים של קריאת רשתית העין למשל.
- פיתוח אמצעי לחימה משולבי אוטומציה, כמו ניווט אוטומטי של טילים או כלי תעופה אחרים וכמו צידוד אוטומטי של טנקים לעבר מטרות ניידות.
- זיהוי סיכונים באופן חזותי.
- שימושים רפואיים:
- פענוח וניתוח מצבים פתלוגים לפי צילומי רנטגן והדמיות CT ,MRI ואולטרה סאונד. במיוחד בתחומים כמו איתור וסימון גידולים, בעיות אצל עוברים, בדיקת צפיפות עצם, שברי הליכה ודומיהם.
סרטים לא מעטים שמתארים עולם עתידני כמו למשל הסרט "דוח מיוחד", עושים שימוש ביישומיה של הראייה הממוחשבת. האם הראייה הממוחשבת תחיה את חזון הבלהות של "האח הגדול" של ג'ורג' אורוול ב"1984", כאשר הממסד יוכל לעקוב אחרי אזרחיו, או לייצר רובוטים שוטרים בעלי כוח לא רגיל וכלי נשק קטלניים או רובוטים מרגלים זעירים שיעקבו אחריך לפי פקודה? עדיין לא ברור, אבל ברור שהיא תהיה הסיוט הגדול של הפושעים ומפירי החוק, כשמיליוני עיניים מלאכותיות יעקבו אחריהם, לפחות בכל מקום ציבורי.
[עריכה] אתגרים בתחום
- ראייה תלת ממדית ופרספקטיבה. היכולת להבחין בין עצמים קרובים לרחוקים, והיכולת לאמוד מרחק של עצמים.
- אבחנה בעצמים והגדרתם. היכולת לאבחן את גבולות העצמים ואת סוגיהם.
- התגברות על זיופים. היכולת להבדיל בין פנים של אדם לתמונה המושמת לפני המצלמה.
- פענוח כתב יד. תחום שעדיין אתגרי, בשל השוני הרב בין צורות האותיות של כתב היד, ובמיוחד בשפה העברית.
- הגדרת יופי באופן ממוחשב. על פי הכלל הסימטרי של יחס הזהב, שעצמים יפים הם עצמים שמתקיים בינם לבין עצמם בהבטים שונים היחס הגאומטרי של 1.618
- יצירת ממשקים חדשים עם המחשב, שיתבססו על ראיה ממוחשבת בנוסף לאמצעי הקלט המוכרים, למשל מיקום סמן העכבר בהתבסס על תנועת העיניים.
[עריכה] תחומים קרובים
ראו גם: אקסטרפולציה, אינטרפולציה, פיקסל, קצב רענון
[עריכה] קישורים חיצוניים
- חברת פרוטרק לראייה ממוחשבת, ייצוב תמונות, התאמת תמונות וגילוי תנועה, אתר הבית
- חברת ליגטורה ל-OCR, אתר הבית
- תוכנה חפשית hocr לביצוע OCR עברי, אתר הבית
- חברת מוביל איי לראייה ממוחשבת לרכב, אתר הבית
- תוכנה שמזהה כפפה ירוקה שהמשתמש לובש, כולל קוד מקור
- משחקים שונים שמשתמשים בטכנולוגיה לזיהוי אף
- כתבות ב-ynet על חברת מוביל איי:
- עמית לאוזון, נוגעים בעתיד, מהארץ
- עמית לאוזון, הקשר הישראלי
- עמית לאוזון, חידושים בהילוך גבוה
- מדענים יפניים פיתחו "עין אלקטרונית" לעיוורים, Measurment Science and Technology

