ביואינפורמטיקה
ביואינפורמטיקה (ביולוגיה חישובית) עוסקת בחקר המידע הביולוגי באמצעות מחשב. זהו ענף המדע העוסק בניתוח, ארגון והבנה של המידע השאוב מניסויים ביולוגים. הביואינפורמטיקה מיישמת כלים מתחום מדעי המחשב, המתמטיקה, הסטטיסטיקה ותורת המידע לשם עיבוד מידע ביולוגי רחב היקף. כלים אלה כוללים מודלים מתמטיים, אלגוריתמים ותוכניות מחשב, שמתאפיינים בהתמודדות עם מאגרי מידע גדולים, בעיות בסיבוכיות גבוהה, וחיפוש אחר תבניות.
תחום מדעי זה החל פורח בשנים האחרונות, הן בזכות זמינותם של מאגרי מידע ביולוגיים הולכים וגדלים (כגון: GenBank ,EMBL ,NCBI ,PubMed), והן בזכות פיתוחים טכנולוגיים בתחום חומרת המחשב, בתחום האלגוריתמים ובתחום מסדי הנתונים המאפשרים התמודדות ראויה עם אתגרים אלו.
תוכן עניינים |
תחומי הביואינפורמטיקה [עריכה]
הביואינפורמטיקה עוסקת בנושאים מגוונים:
- ניתוח רצפי DNA - כתוצאה מפרויקט הגנום האנושי ומפרויקטים אחרים כמו פרויקט "אלף הגנומים" [1] זמינה בידי החוקרים רשימה הולכת וגדלה של אורגניזמים אשר יש עבורם את רצף ה-DNA. על ידי סריקת רצפים אלו ניתן לזהות תופעות שונות ברצף כגון אפיון גנים, זיהוי רצפי בקרה שונים ואתרי קישור של פקטורי שעתוק, זיהוי רצפים חוזרים, זיהוי נקודות שחבור חליפי (Alternative Splicing) ועוד.
- ניתוח ומידול תלת ממדי של מולקולות ביולוגיות מורכבות - בעיקר חלבונים וחומצות גרעין (DNA ו-RNA). מידע לגבי המבנה התלת ממדי של חלבונים מושג על ידי קריסטלוגרפיה או NMR של חלבונים, אשר מפיקים קואורדינטות תלת ממדיות לכל אטום המרכיב את החלבון. למולקולות פשוטות יותר, כגון מולקולות RNA, ניתן לחזות את מבנן השניוני על פי הרצף ברמת דיוק סבירה.
- עצים פילוגנטיים המצביעים על דמיון בין אורגניזמים. בניית עץ פילוגנטי הייתה נעשית בעבר על פי תכונות חיצוניות של אורגניזמים שונים, וכיום היא נעשית על פי הבדלים ברצף ה-DNA בין גנים דומים באורגניזמים שונים.
- סימולציה של תהליכים ביולוגיים באמצעות תוכנת מחשב.
- ניתוח מידע לגבי ביטוי גנים המופק על ידי שבבי DNA - שבבי DNA מאפשרים לדגום את תמונת המצב של ביטוי רבבות גנים ברקמה מסוימת (מדידת רמת ה-RNA של הגנים). מידע המגיע משבבי DNA שהופקו מקבוצה של מספר אוכלוסיות שונות מאפשרת לזהות גנים אשר מעורבים במצבים שונים המפרידים בין האוכלוסיות השונות (למשל בריאים לעומת חולים בסרטן, או אוכלוסיות החולות בסוגים שונים של סרטן או אוכלוסיות המגיבות באופן שונה לתרופה מסוימת).
- רשתות ביולוגיות - מאפשר בניית מיפוי של אינטראקציות בין גנים, חלבונים ומולקולות בקרה באורגניזם מסוים.
עם מקורות המידע הזמינים לניתוח ביואינפורמטי נמנים:
- המידע השאוב מפרויקט הגנום ומפרויקטים דומים אחרים המביאים לזמינותם של רצפי DNA של רשימה הולכת וגדלה של אורגניזמים.
- מבנים תלת ממדיים של חלבונים וחומצות גרעין (DNA ו-RNA)
- תבניות התבטאות גנים תאיות
- סקירות מגע בין חלבוני
- עצים פילוגנטיים המצביעים על דמיון בין אורגניזמים
בנוסף למחקר התאורטי הנרחב ולהעמקת בסיס הידע הביולוגי, טמון בביואינפורמטיקה פוטנציאל טיפולי-קליני: בגילוי ואבחון מחלות גנטיות מולדות, באבחון מוקדם של מחלות נרכשות עם בסיס גנטי מובהק כדוגמת הסרטן ואף בפיתוח תרופות.
שפות תכנות כגון Perl ופייתון הפכו לכלי עיקרי ליישומי ביואינפורמטיקה, ובעקבותיהן באו פרויקטים כגון BioPerl, הכוללים אוסף של אלגוריתמים לתחום זה.
שיטות בביואינפורמטיקה [עריכה]
עימוד רצפים [עריכה]
עימוד רצפים (באנגלית: Sequence Alignment) מתייחס לשיטות ממוחשבות המאפשרות להעמיד מספר רצפי DNA, RNA או חלבון שונים זה מעל זה באופן שידגיש דמיון בין הרצפים. דמיון עשוי להעיד על קשרים אבולוציוניים, במבנה או בתפקוד.
כיום זמינים בידנו רצפי ה-DNA של רשימה הולכת וגדלה של אורגניזמים. חלקים גדולים מהגנום שמורים בין אורגניזמים שונים. למשל, רצף ה-DNA המקודד לחלבון המוגלובין שמור מאוד לאורך האבולוציה - כלומר, האזור ב-DNA שמקודד לגן זה דומה מאוד בין בעלי חיים שונים.
ניתוח שבבי DNA [עריכה]
מרבית הגנים בתא אינם מבוטאים - כלומר, אינם משועתקים מ-DNA ל-RNA שליח (אשר בדרך כלל מתורגם לבסוף לחלבון). קבוצה קטנה של גנים מבוטאת בסוגי תאים שונים (House Keeping Genes - גנים הנחוצים לתחזוקה בסיסית של מרבית התאים), וקבוצה אחרת של גנים מתבטאת רק בתאים מסוג מסוים (למשל גן ההמוגולובין מתבטא באופן נורמלי רק בתאי דם אדומים).
שבב DNA (DNA Microarray), מאפשר לדגום את רמת הביטוי של אלפי גנים בו זמנית בדגימה שנלקחה מרקמה מסוימת של תאים. שבב ה-DNA מודד למעשה את כמות ה-RNA שליח שנוצרה ממספר גדול של גנים, וניתן להפיקו עבור רקמות שונות שנלקחו מאותו פרט. ישנם שבבי DNA המתאימים לאורגניזמים שונים בהם האדם והעכבר.
ניסוי טיפוסי של שבבי DNA כולל הפקה של שבבי DNA ממספר גדול ככל האפשר של רקמות (3-200~), והתוצר שלו הוא טבלת ביטוי אשר ציר ה-X שלה מכיל את שמות הדגימות, ציר ה-Y את שמות הגנים, וערכיה מבטאים את רמת הביטוי בערכי פלואורסנציה. על טבלת ביטוי זו ניתן להריץ אלגוריתמי מחשב שונים במטרה להפיק תובנות ביולוגיות חשובות.
פעמים רבות נשאף לזהות גנים, אשר הביטוי שלהם מבדיל בין שתי אוכלוסיות של דגימות.
למשל, אם לקחנו דגימות ממוח של 10 אנשים בריאים, ודגימות מ-10 גידולים סרטניים, נשאף למצוא גנים אשר מתבטאים נמוך בכל הדגימות הבריאות, וגבוה בכל הדגימות הסרטניות (או להפך). גנים כאלו יאפשרו לנו ללמוד על התהליך הביולוגי העומד מאחורי המחלה הנחקרת (אם אכן יש הבדל מובהק בין רמת הביטוי של גנים אלו בשתי האוכלוסיות, אזי סביר שהחלבונים אשר גנים אלו מקודדים, מעורבים בהיווצרות המצב הביולוגי שמבדיל בין שתי האוכלוסיות).
שלב מקדים לאנליזה המתוארת לעיל עשוי להיות שימוש באלגוריתם קיבוץ (clustering) אשר מציב זה ליד זה גנים (או דגימות) בעלי דפוס ביטוי דומה.
קישורים חיצוניים [עריכה]
- מרית סלוין, מדע חדש נולד, באתר הארץ, 22.3.2001