הדפדפן הגנומי של אוניברסיטת קליפורניה

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
Gnome-edit-clear.svg ערך זה זקוק לעריכה: ייתכן שהערך סובל מפגמים טכניים כגון מיעוט קישורים פנימיים, סגנון טעון שיפור או צורך בהגהה, או שיש לעצב אותו.
אתם מוזמנים לסייע ולתקן את הבעיות, אך אנא אל תורידו את ההודעה כל עוד לא תוקן הדף. אם אתם סבורים כי אין בדף בעיה, ניתן לציין זאת בדף השיחה.
BrowserFoxp2.jpg

הדפדפן הגנומי של אוניברסיטת קליפורניה בסנטה קרוז (UCSC) הוא אתר אינטרנט אינטרקאטיבי המציע גישה לרצפי מידע גנטי של מגוון מינים חסרי חוליות ובעלי חוליות ושל אורגניזמים מודל גדולים ומכיל אוסף גדול של הסברים וקישורים מתאימים. הדפדפן הוא מערכת כלים מבוססי רשת שנכתבו בקוד פתוח על MySQL (מערכת לניהול מסדי נתונים) בשביל לאפשר יכולות ויזואליות מהירות, אבחון מהיר וחיפוש מידע במספר רב של רמות.

היסטוריה[עריכת קוד מקור | עריכה]

האתר נבנה לראשונה ומנוהל על ידי ג'ים קנט, בוגר אוניברסיטת קליפורניה, סנטה קרוז ועל ידי דיויד האסלר, פרופ' למדעי המחשב ולהנדסה ביומולקולרית. הדפדפן הגנומי התחיל את דרכו כמקור להפצה של פירותיו הראשונים של פרויקט הגנום האנושי. ממומן על ידי המכון הרפואי ע"ש הווארד היוז ועל ידי המכון הלאומי לחקר הגנום האנושי (NHGRI- אחד ממכוני המחקר לבריאות הלאומיים של ארצות הברית), הדפדפן אִפשר הצגה גרפית של הטיוטה הראשונית לארגון כרומוזומאלי באופן מלא של רצף הגנום האנושי. כיום, הדפדפן משמש גנטיקאים, ביולוגים מולקולריים ורופאים, ובין היתר גם סטודנטים ומורים לאבולוציה שנדרשים לגישה למידע גנומי.

גנומים[עריכת קוד מקור | עריכה]

בשנים שמאז השקתו, הדפדפן הגנומי הורחב על מנת להכיל רצפים גנומים של כל המינים בבעלי החוליות ושל מינים חסרי חוליות נבחרים שלהם כיסוי רצפים גנומי נרחב. כיסוי נחוץ כדי לאפשר חפיפה בין מקטעים גנומים מרוצפים כדי לאפשר בנייה נכונה של אזורים מתמשכים גדולים יותר בגנום. רצפים גנומים עם כיסוי נמוך יותר מופיעים במספר מסלולים (tracks) בחלק מהדפדפנים האחרים, אך האופי המקוטע של רצפים אלו הופך אותם ללא מתאימים לדפדפנים אשר מאופיינים באופן מלא (fully featured browsers). המינים המצויים בדפדפני גנומים המאופיינים באופן מלא מוצגים בטבלה הבאה:

חסרי חוליות מיתרניים לא יונקים יונקים לא פרימטים פרימטים
איזמלון (Branchiostoma lanceolatum) תרנגולת עכבר בן אדם
Ciona intestinalis דג זברה חולדה שימפנזה
קיפוד ים (Strongylocentrotus purpuratus) לטאת Anolis carolinensis קביה (שרקן) אורנגוטנג
11 מיני דרוזופילה צפרדע (Xenopus tropicalis) ארנב מקוק רזוס
2 מיני אנופלס זברה פינק חתול מרמוסט
honey bee פהקן (Tetraodon nigroviridis) כלב
C. elegans ‏+ 5 תולעים אחרות פוגו פנדה
ארנב ים (Aplysia californica) עוקצן תלת קוצי (Gasterosteus aculeatus) סוס
שמר ארזנית יפנית (Oryzias latipes) חזיר
צמד הים (Petromyzon marinus) פרה
אליגטור אמריקני פיל
אופוסום
ברווזן


פונקציונליות הדפדפן[עריכת קוד מקור | עריכה]

כמות המידע הגדולה שהצטברה בספרות על מערכות בולוגיות דורשת לאסוף ולעבד את המידע על ידי שימוש בכלים ביואינפורמטיים. הדפדפן הגנומי של אונ' קליפורניה מציג אוסף מגוון בסיסי נתונים מפורשים (annotation datasets), הידועים כמסלולים (tracks) ומוצגים באופן גרפי, כולל מערכי mRNA, מיפוי של אלמנטים חוזרנים בDNA, חיזוי גנים, מידע על ביטויי גנים (gene-expression data), מידע הקשור במחלות (המייצג את הקשר בין הגנים למחלות), ומיפוי של שבבי גנים (chip) זמינים מסחרית (כמו אילומינה ו-אג'ילנט). הפרדיגמה הבסיסית להצגה היא להראות את הרצף הגנומי בצורה אופקית ולהראות ייצוגים גרפיים של המיקומים של הmRNA, חיזוי גנים ועוד. בלוקים של צבע לאורך הצירים מראים את מיקומם של מערכי סוגי המידע המגוונים. היכולת להראות את המגוון הרחב הזה של סוגי המידע על ציר יחיד (coordinate axis) הופך את הדפדפן לכלי שימושי לאינטגרציה אנכית של המידע. כדי למצוא גן או אזור גנומי, המשתמש יכול להקליד את שם הגן(BRCA1), או את מספר הגישה של הRNA, את השם הקטלוגי של אזור גנומי לפי קונטיגים (contig)( 20p13-פס 13 בזרוע הקצרה של כרומוזום 20) או את המיקום הכרומוזומאלי (chr17:38,450,000-38,531,000). הצגת המידע בפורמט גרפי מאפשר לדפדפן להציג לינק גישה למידע מפורט של כל סוג מידע (אנוטאציה). עמוד הפרטים על גן של UCSC Genes track מספק מספר רב יותר של לינקים למידע יותר ספציפי על הגן ממקורות מידע רבים אחרים, כמו Online Mendelian (OMIM)Inheritance in Man ו – SwissPort.

תוכנת הדפדפן הגנומי מעוצבת לצורך הצגת מידע מורכב ורב,על כן נועד לפעול במהירות. על ידי 55 מיליון RNAs מהמאגר GenBank ל-81 גנומים מאורגנים (הרבה מ-46 המינים שרוצפו יש להם יותר מגרסת ארגון אחת), הדפדפן מאפשר גישה מיידית להצלבת כל RNA לכל מין שרוצף. צירוף של סוגים רבים של נתונים יאפשר לחוקרים להציג בדיוק את השילוב של הנתונים שיענו על שאלות ספציפיות שירצו לשאול. בנוסף, פלט תמונת PDF או כיתוב פונקציונאליים שאפשר להוציא מהדפדפן על ידי "צילום" המידע המוצג מאפשר לחוקרים לפרסם את המידע במאמרים אקדמיים. מאפיין ייחודי ושימושי שמבדיל בין הדפדפן הגנומי של UCSC מדפדפנים אחרים הוא שינוי של התצוגה באופן רציף תוך כדי עבודה לפי הצורך. הרצף יכול להופיע בכל גודל שהוא, מרמת הבסיס הבודד ועד הצגה של כרומוזום שלם (כרומוזום 1 באדם= 245 מיליון בסיסים) תוך שילוב של הצגה מלאה של מסלולי מידע קשורים(tracks). חוקרים יכולים להציג גן בודדת אקסון בודד או פס (בנד) כרומוזומאלי יחיד, המציג עשרות או מאות גנים תוך שילוב עם קישורי מידע (אנוטאציות) רבים אחרים. תכונה נוחה של הוזזה ומיקוד הקיים בדפדפן מאפשר למשתמש לבחור כל אזור בגנום, להציגו ולהרחיב אותו לכדי הצגה של מסך מלא.

ניתן לחוקרים להשתמש בדפדפן כדי להציג מידע משלהם דרך הכלי של יצירת מסלול משלהם, Custom Tracks tool. כלי זה מאפשר למשתמש להעלות קבצים עם המידע שצבר במחקרו ולראות את המידע ולהציגו בהקשר של הגנום בכללותו עם כל ה-tracks האחרים הקיימים כבר בדפדפן. כמו כן, בשימוש בכלי Table Browser, המשתמש יכול לשלוף מידע ספציפי שמעניין אותו הקיים בדפדפן (למשל, לראות/ לקבל קובץ המכיל רק את ה-SNPs שמשנים חומצה אמינית ברצף החלבון), ולהצליב מידע בין נתונים הקיימים כבר בדפדפן לבין המידע שלו ולראות את זה בדפדפן כ-Custom Track. כל הצגה בדפדפן שיוצר המשתמש ניתן לשתף עם משתמשים אחרים ולשמור את המידע דרך הכלי של Saved Sessions tool.

מסלולי המידע (tracks)בדפדפן[עריכת קוד מקור | עריכה]

בדפדפן יש גם מסלולים רבים אחרים אשר מחולקים לפי קטגוריות שונות, ומובאים ממקורות רבים. המסלולים כוללים תצוגת חיזוי גנים, מודיפיקציות על היסטונים, מתילציות בגנום, מיקומים של CpG islands, אתרי קישור של פקטורי שעתוק מכמה מקורות לפי חיזויים חישוביים או בעקבות ניסויי chIP, מיקום נוקלאוזומים ו-DNaseI hypersensitivity, מקורות מידע מהספרות, השוואות בין גרסת הגנום ההומני כיום לבין הגרסה של האדם הניאנדרטאלי ועוד.
בין היתר, החל להתווסף מידע רב עקב פרויקט ה-ENCODE, פרויקט כלל עולמי שמטרתו לאפיין אלמנטים שונים בגנומים שונים בין היתר של ה-C.elegans, הדרוזופילה מלנוגסטר ושל האדם הכוללים אלמנטים מרמת ה-DNA ועד זיהוי מיפוי נוקלאוזומים ואינטראקציות כרומוזומאליות. קישורים רבים למידע שנאגר עקב הפרויקט אפשר לראות כמסלולים שנוספו בדפדפן הגנומי ומסומן לידם סמל בצבע שחור-אפור הנראה כסימנים < ו- > אחד על השני.

מידע על שונות[עריכת קוד מקור | עריכה]

הרבה סוגים של מידע על שונות מוצגים ונמצאים בדפדפן גם כן. לדוגמה, כל ההקשרים והתוכן הקיימים במאגר המידע dbSNP מ-NCBI הממופים בגנום ההומני, של העכבר ושל עוד מינים קיימים בדפדפן. מערך מידע זה נובע מפרויקט אלף הגנומים (1000 genome project), ברגע שהם מפרסמים ב-dbSNP. עוד סוגי מידע על שונות אחרים כוללים שונות סמפר החזרות של רצפים חוזרניים בגנום (CNV) ותדירויות האללים של גנים באוכלוסיית האדם בעולם המובאים לדפדפן מפרויקט ה-HapMap. הדפדפן הגנומי מציע מידע ייחודי על השוואת גנומיים לרוב המינים שמצויים בדפדפן. מערכי ההשוואה מוצגים בצורה גרפים של יחסים וקשרים אבולוציוניים בין המינים. אופן תצוגה זה הופך לכלי שימושי לחוקר, היכול להראות אזורים של שימור בין קבוצות של מינים ועל סמך זה, לעשות ניסוי לאלמנטים פונקציונאליים בגנום, גם באזורים שלא ידועים, ולהראות בצורה חזקה אבולוציה של מינים. דרך ה-44 מסלולים להשוואה על הגנום ההומני מראה בבירור שככל שהולכים אחורה באבולוציה הרצף פחות נשמר, אך אזורים חשובים ופונקציונאלים של הגנום (אקסונים ואתרי בקרה) שמורים מאוד גם במינים רחוקים מהאדם.

כלים לעיבוד מידע[עריכת קוד מקור | עריכה]

אתר ה-UCSC מכיל בתוכו גם סט כלים המאפשר לעשות אנליזות ועיבודים שונים לגנום, באופן פשוט. כלים אלה כוללים:

  • BLAT - כלי לבדיקת התאמת רצפים בגנומים שונים. כלי זה גם שימושי למציאה פשוטה של רצפים בתוך מקטע של רצף מאסיבי (למשל הגנום ההומני) מתוך כל אחד מהגנומים המאופיינים בדפדפן.
  • lifeOver - כלי המשתמש בהתאמה כלל גנומית כדי לאפשר מעבר של רצפים מגרסה אחת של גנום מסוים לאחרת או בין גנומים של מינים שונים.
  • Genome Graphs - כלי שמאפשר למשתמש לראות את כל הכרומוזומים בבת אחד ולהציג תוצאות ממחקרים כלל גנומיים (GWAS).
  • Gene Sorter - כלי המציג גנים המקובצים לקבוצות לפי פרמטרים ללא קשר למיקום הגנומי שלהם, כמו למשל על פי דפוס ביטוי בקרמה מסוימת.

יצירת קישורים לגיליון נתונים לתצוגת UCSC Genome Browser[עריכת קוד מקור | עריכה]


משתמשים רבים של הדפדפן הזה אוספים מידע משלהם בגיליון נתונים ב-Excel, יכולים ליצור קישור לדפדפן תוך שימוש במידע שבגיליון נתונים. לדוגמה, לגנטיקאי קליני יש רשימות של אזורים גנומיים מחולים המכילים מחיקות והוספות בגנום, שנקבעו על ידי comparative genomic hybridization (CGH). אזורים אלה יכולים להוות מקור מידע להצגה בדפדפן לכל אחד שש לו גישה ברגע שיעלה אותם כגיליון נתונים לדפדפן. ucscLinks.xls :Click to download the spreadsheet

שימוש זהיר בהעתקת והעברת המידע מה-Excel יכול לאפשר הגעה לקישור לגיליוניי המידע ללא צורך בשינוי נוסף. התאמה אישית של הקישורים מה- Excel התכנים של התמונה לעיל (cell G22 בגיליון נתונים עדכני) הם כדלקמן: =HYPERLINK("http://genome.ucsc.edu/cgi-bin/hgTracks?db=hg19&position="&E22&"&dgv=pack&knownGene=pack&omimGene=pack","ucsc") דוגמה זו מצתיגה איך ליצור קישור שפועל על tracks ספציפיים הקשורים לעניין מסוים. במקרה זה, שלושה מסלולים (tracks) מופיעים באופן מפורש: Database of Genomic Variants (table: dgv)

UCSC Genes (table: knownGene)
OMIM Genes (table: omimGene2) 

כל מסלול (track) נראה באופן של "pack" בקישור שלמעלה: dgv=pack

knownGene=pack
omimGene=pack

כל מסלול שנפתח ישאר פתוח ויוצג כאשר חלון חדש של הדפדפן נפתח מאותו מחשב. מסלול חדש יכול להיות מוסף תוך שימוש ב-tableName ובאפשרויות התצוגה הקיימות לו. &snp131=dense (for hg18)

&snp135=dense (for hg19)

אפשר פשוט להוסיף לאחר ה-url תוספת של תצוגה תוך שימוש באופן הרישום של tableName=, קשור לקישור על ידי &. הדרך הקלה ביותר ללמוד את השם של הטבלה שבבסיס המסלול היא לעבור ללחוץ על שם המסלול בדפדפן ולקרוא את התיאור והקישור הקיימים בתחתית דף הדפדפןץ הטבלה מוצגת ב-url כך:
g=tableName

אופציות התצוגה לכל מסלול הם:

hide
dense
squish
pack
full

התאמה אישית של קישורים[עריכת קוד מקור | עריכה]

קישורים ישירים לדפדפן יכולים להיווצר על ידי יצירת ה-URL. לדוגמה, אם רוצים ליצור קישור ישיר לדף המידע של הגן SIRT1 למשל, הידוע גם כדף hgGene, לגרסה hg19 של הגנום ההומני, צריך ליצור את ה-URL הבא כאשר “db=” מוקצה למאגר המידע ממנו נשלוף את הדף ושאליו נגיע בקישור ו- “hgg_gene=” מוקצה לגן עצמו: http://genome.ucsc.edu/cgi-bin/hgGene?db=hg19&hgg_gene=SIRT1 באופן דומה, קישור ישיר למאגר המידע בגרסת hg19 עבור מיקום הגן SIRT1 יכול להיעשות על ידי knownCanonical database, מאגר מידע שלפעמים מכיל את האיזופורם הכי ארוך של הגן ביחס לקבוצת הגנים המצויים ב-UCSC: http://genome.ucsc.edu/cgi-bin/hgTracks?db=hg19&singleSearch=knownCanonical&position=SIRT1 לצורך אלה שמעלים מסלולים בעצמם, קישור ישיר יכול להיפתח בדפדפן ולהציג את המידע על ידי יצירת הפורמט הבא כאשר משתמשים בביטוי "hubUrl" המוקצה למיקום אינטרנטי של הקובץ בתור קובץ טקסט: http://genome.ucsc.edu/cgi-bin/hgTracks?db=hg19&hubUrl=http://ftp.ebi.ac.uk/pub/databases/ensembl/encode/integration_data_jan2011/hub.txt מקור פתוח בסיס הקוד של הדפדפן הגנומי של UCSC פתוח גם לשימושים לא מסחריים, וזה נעשה בעיקר על ידי קבוצות מחקר מקומיות הרוצות לראות את המידע שברשותן בדפדפן כדי לעבוד באופן נוח יותר עם כלים שהדפדפן מציע ללא שקבוצות מחקר אחרות יראו אותו. הדפדפן של UCSC מוצג גם בכמה מיקומים כלל עולמיים באינטרנט.


הקוד של הדפדפן ניתן לשימוש גם בתצוגת נפרדות למשל על ידי דפדפנים אחרים כגון, UCSC Malaria Genome Browser וה-Archaea Browser.

מקורות[עריכת קוד מקור | עריכה]

1. ^ Fujita PA, Rhead B, Zweig AS, Hinrichs AS, Karolchik D, Cline MS, Goldman M, Barber GP, Clawson H, Coelho A, Diekhans M, Dreszer TR, Giardine BM, Harte RA, Hillman-Jackson J, Hsu F, Kirkup V, Kuhn RM, Learned K, Li CH, Meyer LR, Pohl A, Raney BJ, Rosenbloom KR, Smith KE, Haussler D, Kent WJ (Jan 2011). "The UCSC Genome Browser database: update 2011". Nucleic Acids Res. 39 (Database issue): D876–82. doi:10.1093/nar/gkq963. PMID 20959295.

2. ^ Kent WJ, Sugnet CW, Furey TS, Roskin KM, Pringle TH, Zahler AM, Haussler D (June 2002). "The human genome browser at UCSC". Genome Res. 12 (6): 996–1006.

3. ^ Kuhn, RM, Karolchik D, Zweig AS, Wang T, Smith KE, Rosenbloom KR, Rhead B, Raney BJ, Pohl A, Pheasant M, Meyer L, Hsu F, Hinrichs AS, Harte RA, Giardine B, Fujita P, Diekhans M, Dreszer T, Clawson H, Barber GP, Haussler D, Kent WJ (January 2009). "The UCSC Genome Browser Database: update 2009". Nucleic Acids Res. 37: D755–D761.

4. ^ "High-coverage" here means 6x coverage, or six times more total sequence than the size of the genome.

5. ^ Kent WJ. BLAT - the BLAST-like alignment tool. Genome Res. 2002 Apr;12(4):656-64.

קישורים חיצוניים[עריכת קוד מקור | עריכה]