RNA-seq

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
Gnome-edit-clear.svg ערך זה זקוק לעריכה: ייתכן שהערך סובל מפגמים טכניים כגון מיעוט קישורים פנימיים, סגנון טעון שיפור או צורך בהגהה, או שיש לעצב אותו.
אתם מוזמנים לסייע ולתקן את הבעיות, אך אנא אל תורידו את ההודעה כל עוד לא תוקן הדף. אם אתם סבורים כי אין בדף בעיה, ניתן לציין זאת בדף השיחה.

רנ"א-סק (ריצוף-רנ"א), הקרוי גם "ריצוף טרנסקריפטום שלם בשיטת שוט-גאן", מתייחס לשימוש בטכנולוגיות ריצוף בתפוקה-גבוה (high-throughput sequencing) של רצפי דנ"א קומפלמנטרי (cDNA) על מנת לקבל אינפורמציה לגבי תכולת הרנ"א של דגימה נחקרת. הטכניקה אומצה למחקרי מחלות כגון סרטן. עם כיסוי עמוק ורזולוציה ברמת הבסיס, שיטות ריצוף הדור-הבא (next-generation sequencing) מספקות אינפורמציה לגבי שונות בביטוי גנים, כולל אללים ותוצרי שיחבור שונים; רנ"א לא-מקודד; מוטציות שלאחר תרגום; עריכת רנ"א (RNA editing); ואיחוי גנים.

היסטוריה[עריכת קוד מקור | עריכה]

התפתחותם של טכנולוגיות ריצוף הדור-הבא (next-generation sequencing) או ריצוף בתפוקה-גבוה (high-throughput sequencing), פתחו דלתות חדשות לתחום ריצוף הדנ"א (DNA sequencing). ככל שהבנת טכנולוגיות אלו נהיית יותר נפוצה וכלים חדשים מפותחים, שיטות חדשניות ליישום טכנולוגיות אלו נוצרות גם כן.

בהסתמך על הדרישות הנמוכות של טכנולוגיות הריצוף בתפוקה-גבוה לתוצר רצף נוקליאוטידים, יחד עם הכיסוי, העמוק, והרזולוציה ברמת הבסיס, הובילו לכך שהשימוש בטכנולוגיות אלה התרחב לתחום הטרנסקריפטומיקה (transcriptomics). טרנסקריפטומיקה הינו ענף מחקרי העוסק באיפיון הרנ"א המשועתק מגנום (genome) נחקר מסוים. למרות שטרנסקריפטומים יותר דינמים מדנ"א גנומי, מולקולות אלה מספקות גישה ישירה לבקרת גנים (gene regulation) ומהוות אינדיקציה לגבי רמות חלבון. ריצוף טרנסקריפטומים אינו רעיון חדש. שיטות שונות המבוססות על שיטת ריצוף – סאנגר (Sanger sequencing) המסורתית (והיקרה יותר), פותחו בעבר על מנת לקבוע רצף דנ"א קומפלמנטרי (cDNA). כמו כן קיימות שיטות נוספות המשתמשות במטודולוגיות כגון SAGE (Serial analysis of gene expression), CAGE (cap analysis gene expression) ו-MPSS (massively parallel signature sequencing).

ריצוף הטרנסקריפטום (רנ"א–סק) יכול להתבצע על בסיס מגוון פלטפורמות, על מנת לבחון רעיונות והיפוטזות שונות. לדוגמה, שימוש בפלטפורמת האנליזה הגנומית של אילומינה ( Genome AnalyzerIllumina) מאפשר ריצוף טרנסקריפטומים לקבלת פרופיל ביטוי בתאי יונקים, בתאי גזע (על ידי ABI Solid Sequencing) וכן לקבלת מפת הפולימורפיזם החד-בסיסיים (SNPs) בתירס באמצעות 454 Sequencing Roche's. למרות ההבדלים הטכנים בין פלטפורמה לפלטפורמה, האינפורמציה הנאספת מכל אחת היא במהותה זהה.

שיטות[עריכת קוד מקור | עריכה]

ספריית רנ"א 'פולי (איי)[עריכת קוד מקור | עריכה]

Postscript-viewer-shaded.png ערך מורחב – פוליאדנילציה

תהליך יצירת ספריות רצפים יכול להשתנות בהתאם לפלטפורמה בה משתמשים בריצוף בתפוקה-גבוה, כאשר לכל אחת מן הפלטפורמות ישנם מספר ערכות שעוצבו לצורך בניית ספריות מסוגים שונים, המסגלות את תוצאות הריצוף לדרישות הספציפיות של אותו מכשיר.

בהתאם לסוג התעתיק הנבדק, ישנם מאפיינים משותפים לכל טכנולוגיה. לרוב באנליזת אמ-רנ"א (mRNA) מקודד, הזנב ה-3' בעל פולי אדנילציה (poly A) משמש כמטרה על מנת להבטיח הפרדה בין רנ"א מקודד לרנ"א לא מקודד. תהליך זה יכול להיות מושג בקלות יחסית על ידי קשירת אוליגונוקליאוטידים של פולי טי (poly T) בצורה קוולנטית לסובסטראט מסוים (בדר"כ בקולונה). מחקרים רבים משתמשים בבידים מגנטים לצרוך שלב זה. באתר Protocol Online ניתן למצוא רשימה של פרוטוקולים לבידוד אמ-רנ"א (mRNA).

מחקרים הבודקים את הטרנסקריפטום גם מחוץ לטווח הפולי איי, כלומר גם גנים אשר לא מקודדים לחלבון, הראו שכאשר היה שימוש בבידים מגנטים מסוג פולי טי, תעתיקי הרנ"א שדווקא לא נקשרו לבידים, יכולים לספק מידע חשוב אודות רנ"א לא מקודד שטרם התגלה והיה עובר ללא אבחנה אחרת.

כמו כן, מכיוון שרנ"א ריבוזומלי (rRNA) מהווה מעל 90% מסה"כ הרנ"א בתא נתון, מחקרים הראו שהוצאת רנ"א זה מהדגימה, באמצעות היברידיזציה של גלאים ספציפים כנגדו, מגדילה את היכולת לשלוף מידע מהחלק הנותר של הטרנסקריפטום.

השלב הבא הינו שיעתוק-מהופך (reverse transcription). עקב הנטייה הרנדומלית ל-5' הנגרמת כתוצאה משיעתוק-מהופך וגם השפעת המבנים השניוניים על אתרי הקשירה לפריימרים, מומלץ לעשות הידרוליזה של הרנ"א לכ200-300 בסיסים טרם השיעתוק המהופך וע"י כך לצמצם את היקף שתי הבעיות בו זמנית. למרות זאת, ישנם שיקלולי תמורות עם שיטה זו, שכן באופן כללי רוב גופי התעתיקים מומרים בצורה יעילה לדנ"א, בעוד שקצוות ה-3' וה-5' פחות. בהתאם למטרות המחקר, חוקרים יכולים להחליט האם ליישם שלב זה או לא. לאחר סינטוז הדנ"א הקומפלמנטרי ניתן להמשיך ולקטעו בהתאם לאורך המקטע הרצוי כפי שמצוין בטבלה 1. התבנית כעת מוכנה לשיטת הריצוף הרצויה.

טכנולוגיות ריצוף של הדור-הבא[עריכת קוד מקור | עריכה]

Postscript-viewer-shaded.png ערך מורחב – ריצוף DNA

טכנולוגיות ריצוף בתפוקה-גבוה מייצרות מיליוני קריאות קצרות מספריה של רצפי נוקליאוטידים. בין אם רצפים אלה הינם רנ"א, דנ"א או תערובת של שניהם, מנגנון הריצוף של כל פלטפורמה זהה. הטכנולוגיות הנפוצות ביותר הינן של אילומינה, סוליד, איון טורנט, 454 ועוד.‏[1]

ריצוף רנ"א ישיר[עריכת קוד מקור | עריכה]

מכיוון שהמרת רנ"א לדנ"א קומפלמנטרי באמצעות שיעתוק-מהופך יכול ליצור ארטיפקטים אשר עשוים להפריע לאיפיון ולכימות התעתיקים, מפותחת כעת טכנולוגיה חדשה בשם ' ריצוף רנ"א ישיר ברמת המולקולה הבודדה' (DRSTM) על ידי חברת הליקוס (Helicos). טכנולוגיה זו מרצפת מולקולות רנ"א בצורה ישירה באופן מאסיבי-מקבילי, מבלי להמיר רנ"א לדנ"א קומלפמנטרי או לבצע מניפולציות אחרות כגון ליגציה ואמפליפיקציה לתעתיקים.

יישור הטרנסקריפטום (Transcriptome alignment)‏[2][עריכת קוד מקור | עריכה]

עקב אורכן הקצר של הקריאות (בפלטפורמת האנליזה הגנומית של אילומינה יכול להגיע לכ-36 בסיסים) הרכבה דה-נובו (de novo) עשויה להיות קשה מאוד (למרות שקיימות מספר תוכנות המסוגלות לעשות זאת כגון Velvet (algorithm)). קושי זה נובע מהעובדה שלא ניתן ליצור אזורי חפיפה גדולים בין הקריאות השונות, טכניקה אשר מקלה באופן משמעותי לבנות מחדש את הרצף המקורי. כמו כן גם הכיסוי העמוק של הקריאות מקשה על המחשב לעקוב אחר כל צורות היישור האפשריות. ניתן לעקוף מכשול זה במידה מסוימת על ידי ריצוף רצפים ארוכים יותר מאותה דגימה באמצעות טכנולוגיות ריצוף אחרות כמו סאנגר, ולהשתמש בקריאות ארוכות אלה כ"שלד" או תבנית על בסיסו יהיה ניתן להרכיב קריאות מאזורים בעיתיים (רצפים חוזרניים למשל).

הגישה המומלצת היא ליישר את מיליוני הקריאות לגנום-מקור (reference genome). ישנם כלים רבים ליישור קריאות גנומיות לגנום-מקור (כלים ליישור רצפים - sequence alignment tools ), אך תשומת לב מרובה נזקקת כאשר מיישרים טרנסקריפטום לגנום, במיוחד כאשר מתמודדים עם גנים בעלי אינטרונים.

כפי שהוזכר לעיל, סיפריות הרצפים המקודדים נוצרות על ידי מיצוי כלל האמ-רנ"א מדגימה באמצעות גלאים לזנב הפולי-איי של התעתיק, אשר מוסף למולקולת האמ-רנ"א לאחר שיעתוק, כלומר לאחר הליך השיחבור. לפיכך, מקורן של הסיפריות שנוצרות, כמו גם הקריאות הקצרות עצמן המתקבלות מהמכשיר, אינו יכול להיות מרצפי אינטרונים. עקב כך, כאשר מנסים ליישר קריאות קצרות אלו לגנום-מקור, רק הקריאות הקצרות המיושרות בטווח אקסוני לחלוטין יתאימו, בעוד שלקריאות מצמתים בין אקסונים לא תמצא התאמה.

שיטה אפשרית לנסות ולעקוף בעיה זו היא על ידי יישור קריאות קצרות אלו לגנום-פרוקסי אשר נוצר באמצעות רצפי אקסונים ידועים. אין צורך שבגנום זה יהיה כיסוי של רצפי אקסונים שלמים, אלה מספיק רק טווח שיבטיח שהקריאות הקצרות יוכלו להתאים לשני צדדיו של צומת אקסון-אקסון עם מינימום חפיפה. כמו כן, קיימים פרוטוקולים ניסיוניים אשר מאפשרים יצירת קריאות המבדילות לגדיל ספציפי. קיימות מספר ערכות תוכנה ליישור קריאות קצרות (short read alignment), ולאחרונה אף פותחו אלגוריתמים מיוחדים ליישור טרנסקריפטומים כגון TopHat ו-Cufflinks.

אנליזה‏[3][עריכת קוד מקור | עריכה]

ביטוי גנים[עריכת קוד מקור | עריכה]

איפיון רמות ביטוי של גנים (gene expression) על ידי כימות רמות האמ-רנ"א בתא, הינו מושא מחקרי חשוב עבור חוקרים כבר לא מעט זמן. בעקבות גילוים של אירועים רגולתורים שונים המתרחשים לאחר-שיעתוק (כגון RNA interference) , הוכח בעבר כי לא תמיד קיימת קורולציה חזקה בין רמות האמ-רנ"א לבין רמות החלבון של אותו תעתיק. אף על פי כן, מדידת רמות האמ-רנ"א עדיין מהווה כלי שימושי ביותר לקביעת השפעותיהם של איתותים חיצוניים (כגון טיפול תרופתי) על מכונות השיעתוק התאיות, וכן מצביעה על הבדלים בין תאים במצבם הבריא והחולה.

גישת המיקרו-אריי (Microarray)[עריכת קוד מקור | עריכה]

לפני המצאת הרנ"א-סק, דנ"א מיקרו-אריי (DNA microarrays) הייתה השיטה המחקרית השולטת לאנליזת הטרנסקריפטום על ידי יצירת פרופילים של רמות ביטוי גנים (gene expression profiling). למרות שגם כיום מחקרים לא מעטים משתמשים במיקרו-אריי ומייצרים תוצאות מלהיבות במעט זמן יחסית, מגבלות ניסויות פנימיות של שיטה זו גורמות לרנ"א-סק להיות השיטה המועדפת. מגבלה גדולה וחשובה ביותר של האריי הינה העובדה שיש צורך לדעת איזה רצפים מחפשים, ולהכין לכל רצף נחקר גלאי מתאים על מנת לזהות ובסופו של דבר לכמת את התעתיקים, בעוד ששיטת הרנ"א- סק הינה בעלת אופי של "שאלה פתוחה" אשר מניבה תוצאות גם ללא ידע מוקדם כלל על רצפי התעתיקים הנחקרים. ככל שהמחקר בתחום הרנ"א-סק גדל ומתרחב ומניב תוצאות מבטיחות וקבועות, נשאלת השאלה "האם זהו תחילתו של סוף עידן המיקרו-אריי?". אף על פי כן, עדיין ליישומים רבים, מיקרו-אריי הינה השיטה המועדפת. לא רק ששיטה זו זולה פי 10-100 בהשוואה לאותה רזולוציית דיוק ברנ"א-סק, אלה שגם פרוטוקולי העבודה של רנ"א-סק עדיין לוקים בחסר בכל הקשור לשלבי הליגציה הנחוצים. מגבלה נוספת לכימות פרופיל ביטוי גנים באמצעות רנ"א-סק הינה שתעתיקים שכיחים (כמו אלה של גנים "שומרי-בית") אחראים לעיקר האינפורמציה המרוצפת. כך למשל בדגימה טיפוסית, 5% מהגנים מהווים כ-75% מהקריאות המרוצפות. כתוצאה מכך קשה למדוד את שכיחות התעתיקים הנותרים בצורה אמינה ולכן רוב המדידות מושפעות מ"רעש" רב.

כיסוי כמדד לביטוי[עריכת קוד מקור | עריכה]

רמות ביטוי יכולות להיות מחולצות באמצעות רנ"א-סק רק בהתאם ליכולת שליפה של רצף נתון. מחקרי טרנסקריפטומיקה בשמרים למשל, הראו שנדרש כיסוי של פי-4 (fourfold coverage) לאמפליקונים (amplicons) על מנת שאלו יהיו מאופיינים ומוגדרים כגן מבוטא. כאשר הטרנסקריפטום מקוטע לפני הפיכתו לדנ"א-קומפלמנטרי, מספר הקריאות המיוחסות לאקסון מסוים, מנורמל לאורכו בחיה (in vivo), מניב רמות ביטוי לגן שהם בקורולציה לאלו המושגים באמצעות qPCR.

גילוי שונות ברמת הנוקליאוטיד הבודד[עריכת קוד מקור | עריכה]

Postscript-viewer-shaded.png ערך מורחב – SNP

שונות ברמת הנוקליאוטיד הבודד בטרנסקריפטום נחקרה בתירס באמצעות פלטפורמת רוצ'ה 454 (Roche 454 sequencing). באמצעות טכנולוגיה זו חולצו בערך 7000 פולימורפיזמים חד-בסיסיים (SNPs) שונים. לאחר אימות בעזרת שיטת סאנגר, אושרו כמעט 5000 פולימורפיזמים חד-בסיסיים שונים המשתרעים על פני למעלה מ-2400 גנים בתירס.

כיסוי/עומק[עריכת קוד מקור | עריכה]

כיסוי ועומק יכולים להשפיע על המוטציות שמתגלות במהלך הריצוף. בהתחשב שדינמיקת התא הינה תלוית ביטוי, אלל מסוים עשוי לא להתגלות הן מפני שאינו מצוי בגנום והן מפני שהגן אינו מבוטא בזמן המדידה. רנ"א-סק יכול להניב אינפורמציה נוספת אודות רמות הביטוי של כל אלל של גן מסוים וע"י כך לנסות ולכמת את אופי ההטרוזיגוטיות של גן נתון. במחקרים אסוציאתיבים, גנוטיפים מיוחסים למחלה, ורמות ביטוי עשויות להיות מיוחסות למחלה גם כן. באמצעות רנ"א-סק ניתן למדוד את הקשר בין שני משתנים מיוחסים אלה, כלומר מהו טיב הקשר לרמות ביטוי של אלל מסוים. עומק הריצוף הנחוץ לאפליקציה מסוימת יכול להיות מחולץ מניסוי מקדים קטן יותר (pilot experiment).

השוואת רמות ביטוי אללים לתאי הרבייה[עריכת קוד מקור | עריכה]

הדרך היחידה להיות בטוח בוודאות במוטציות של פרט מסוים, היא על ידי השוואת רצפי הטרנסקיפטום של הפרט לרצפי הדנ"א הגנומי בתאי הרבייה של אותו פרט. תהליך זה מאפשר להבדיל בין גנים הומוזיגוטים לבין שונות בביטוי של אחד מהאללים. כמו גם, תהליך זה יכול לספק מידע אודות גנים לשלא התבטאו כלל במהלך לקיחת הדגימה לניסוי.

איפיון שינויים שלאחר-שיעתוק[עריכת קוד מקור | עריכה]

באמצעות השוואת רצפי הטרנסקריפטום לגנום של פרט מסוים ניתן לזהות עריכות שלאחר-שיעתוק. כך למשל, במקרה שפרט מסוים הינו הומוזיגוט לגן מסוים, אך כל תעתיקי הרנ"א שהתגלו היו מטיפוס של אלל אחר שלא תואם לגרסה הגנומית, ניתן לקבוע שאכן התרחש אירוע עריכה שלאחר-שיעתוק.

באופן כללי וריאציות ברמת הבסיס הבודד באמ-רנ"א אינן נחשבות כמשפיעות על שונות פונקצינאלית בין תאים. הסיבה לכך היא מפני ששינויים אלה נעלמים עם דגרגציית מולקולת הרנ"א ואינם תמידיים, אולם הם בהחלט עשויים להשפיע על תהליכי התרגום והשיחבור של אותו תעתיק. כמו כן מכיוון שמנגנוני תיקון הדנ"א היעילים אינם פועלים על מולקולות רנ"א ניתן לזהות וריאציות כאלה בתדירות גבוה יחסית, ואף הוצע לקשור הליך זה למחלות פריון (חלקיק חלבוני זיהומי) כמו TSE (transmissible spongiform encephalopathies.).

גילוי איחוי גנים‏[4][עריכת קוד מקור | עריכה]

גנים מאוחים, הנוצרים בעקבות מודיפיקציות מבניות שונות בגנום, זכו לאחרונה להרבה תשומת לב עקב הקשרם לסרטן. היכולת של שיטת הרנ"א-סק לנתח טרנסקיפטום שלם מדגימה בצורה רנדומלית, הפכה את השיטה לכלי שימושי לגילוי אירועים שכיחים אלו בסרטן. הרעיון מתבסס על אותו הליך של יישור קריאות טרנסקריפטומיות קצרות לגנום מקור. רוב הקריאות הקצרות יותאמו לאזורי אקסונים או לצמתים בין אקסונים בלוקוס נתון, אך ייתכן מצב בו יהיו קריאות אשר יותאמו לקטעי אקסונים משני גנים שונים. מצב כזה יוכיח איחוי אפשרי בין גנים, אך עקב אורכם הקצר של הקריאות יהיה הרבה "רעש" במדידה. גישה אחרת היא שימוש בקריאות צמד-סוף (paired end), כאשר מספר רב של קריאות כאלה יותאמו לקצוותם של שני אקסונים שונים, ברמת כיסוי גבוה, יהיה ניתן לגלות אירועי איחוי חדשים.

נושאים שיש להתחשב בהם[עריכת קוד מקור | עריכה]

איסוף מידע על ידי ריצוף הטרנסקריפטום, נתון לאותן המגבלות המשויכות לאנליזות ביטוי רנ"א אחרות:

  1. ביטוי תלוי-רקמה: ביטוי גנים אינו אחיד בכל התאים של אורגניזם ותלוי רבות בסוג הרקמה ממנה נלקחו התאים הנחקרים.
  2. ביטוי תלוי-זמן: בזמן מחזור חייו של תא, פרופיל ביטוי הגנים משתנה בהתאם לזמן ביום, גירויים מהסביבה וכו'.

עקב כך, יש להיזהר מהסקת מסקנות מתוצאות מחקרי ריצוף שכן חלק מהמידע שנאסף אולי לא משקף את הפרט עצמו. דוגמה לכך היא גילוי וריאציות ברמת הבסיס הבודד ברנ"א שמתבטא, אשר לא בהכרח משקפות את הגנוטיפ של אותו הפרט. ייתכן ואלל המקור פשוט לא מתבטא באותה רקמה ו/או זמן, ומודיפיקציות תלויות רקמה/זמן שינו את התעתיק בדגימה הספציפית הנחקרת.

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ ראו גם DNA sequencing#High-throughput_sequencing בוויקיפדיה האנגלית
  2. ^ ראו גם: Sequence alignment software#Short-Read Sequence Alignment
  3. ^ ראו גם: List of RNA-Seq bioinformatics tools בויקיפדי האנגלית
  4. ^ ראו גם Fusion gene בוויקיפדיה האנגלית