לדלג לתוכן

הדפדפן הגנומי של אוניברסיטת קליפורניה בסנטה קרוז

מתוך ויקיפדיה, האנציקלופדיה החופשית
יש לערוך ערך זה. ייתכן שהערך סובל מבעיות ניסוח, סגנון טעון שיפור או צורך בהגהה, או שיש לעצב אותו, או מפגמים טכניים כגון מיעוט קישורים פנימיים.
אתם מוזמנים לסייע ולערוך את הערך. אם לדעתכם אין צורך בעריכת הערך, ניתן להסיר את התבנית. ייתכן שתמצאו פירוט בדף השיחה.
יש לערוך ערך זה. ייתכן שהערך סובל מבעיות ניסוח, סגנון טעון שיפור או צורך בהגהה, או שיש לעצב אותו, או מפגמים טכניים כגון מיעוט קישורים פנימיים.
אתם מוזמנים לסייע ולערוך את הערך. אם לדעתכם אין צורך בעריכת הערך, ניתן להסיר את התבנית. ייתכן שתמצאו פירוט בדף השיחה.

הדפדפן הגנומי של אוניברסיטת קליפורניה בסנטה קרוז (UCSC) הוא אתר אינטרנט אינטראקטיבי המציע גישה לרצפי מידע גנטי של מגוון מינים חסרי חוליות ובעלי חוליות ושל אורגניזמים מודל גדולים ומכיל אוסף גדול של הסברים וקישורים מתאימים. הדפדפן הוא מערכת כלים מבוססי רשת שנכתבו בקוד פתוח על MySQL (מערכת לניהול מסדי נתונים) בשביל לאפשר יכולות ויזואליות מהירות, אבחון מהיר וחיפוש מידע במספר רב של רמות.

האתר נבנה לראשונה ומנוהל על ידי ג'ים קנט, בוגר אוניברסיטת קליפורניה בסנטה קרוז ועל ידי דייוויד האסלר, פרופסור למדעי המחשב ולהנדסה ביומולקולרית. הדפדפן הגנומי התחיל את דרכו כמקור להפצה של פירותיו הראשונים של פרויקט הגנום האנושי. ממומן על ידי המכון הרפואי ע"ש הווארד היוז ועל ידי המכון הלאומי לחקר הגנום האנושי (NHGRI - אחד ממכוני מחקר הבריאות הלאומיים של ארצות הברית), הדפדפן אִפשר הצגה גרפית של הטיוטה הראשונית לארגון כרומוזומאלי באופן מלא של רצף הגנום האנושי. כיום, הדפדפן משמש גנטיקאים, ביולוגים מולקולריים ורופאים, ובין היתר גם סטודנטים ומורים לאבולוציה שנדרשים לגישה למידע גנומי.

בשנים שמאז השקתו, הדפדפן הגנומי הורחב על מנת להכיל רצפים גנומים של כל המינים בכבעלי החוליות ושל מינים חסרי חוליות נבחרים שלהם כיסוי רצפים גנומי נרחב. כיסוי נחוץ כדי לאפשר חפיפה בין מקטעים גנומים מרוצפים כדי לאפשר בנייה נכונה של אזורים מתמשכים גדולים יותר בגנום. רצפים גנומים עם כיסוי נמוך יותר מופיעים במספר מסלולים (tracks) בחלק מהדפדפנים האחרים, אך האופי המקוטע של רצפים אלו הופך אותם ללא מתאימים לדפדפנים אשר מאופיינים באופן מלא (fully featured browsers). המינים המצויים בדפדפני גנומים המאופיינים באופן מלא מוצגים בטבלה הבאה:

נגיפים חסרי חוליות שניוני פה מיתרניים לא יונקים יונקים לא פרימטים פרימטים
אבולה 11 מיני דרוזופילה אזמלון (Branchiostoma lanceolatum) תרנגולת עכבר אדם
2 מיני אנופלס Ciona intestinalis דג זברה חולדה שימפנזה
honey bee קיפוד ים (Strongylocentrotus purpuratus) לטאת Anolis carolinensis קביה (שרקן) אורנגוטנג
C. elegans ‏+ 5 תולעים אחרות צפרדע (Xenopus tropicalis) ארנב מקוק רזוס
ארנב ים (Aplysia californica) זברה פינק חתול מרמוסט
שמר פהקן (Tetraodon nigroviridis) כלב בבון
פוגו פנדה שימפנזה ננסי
עוקצן תלת קוצי (Gasterosteus aculeatus) סוס גלגו ענק צפוני
ארזנית יפנית (Oryzias latipes) חזיר מקוק סרטנים
צמד הים (Petromyzon marinus) פרה גיבון לבן-לחיים צפוני
אליגטור אמריקני פיל גורילה
שיבוט אטלנטי (Gadus morhua) אופוסום למור עכברי (Microcebus murinus)
קיווי חום דרומי (Apteryx australis) ברווזן קוף סנאי בוליביאני (Saimiri boliviensis)
תוכון אלפקה קופיף פיליפיני
לטימריה (Latimeria chalumnae) ארמדיל
דג כימראי (Callorhinchus milii) אוגר סיני
פרוש קרקע בינוני דולפינן
אמנון היאור (Oreochromis niloticus) חמוס
צבגון מצויר מערבי (Chrysemys picta bellii) קיפוד אירופי
תרנגול הודו מצוי חולדת קנגורו אורד (Dipodomys ordii)
תחש נהרות קריבי
עטלף פרי ענק (Pteropus vampyrus) 
נשפון (Myotis lucifugus)
לוויתן גוץ
חולד ערום
אופוסום קצר-זנב (Monodelphis domestica)
פיקה (Ochotona princeps)
שפן סלע
כבש
חדף
עצלן דו-אצבע של הופמן
סנאי (Spermophilus tridecemlineatus)
שד טסמני
טנרק קיפודי קטן (Echinops telfairi)
טופיה צפונית (Tupaia belangeri)
וולאבי תמר (Macropus eugenii)
קרנף רחב-שפה

פונקציונליות הדפדפן

[עריכת קוד מקור | עריכה]

כמות המידע הגדולה שהצטברה בספרות על מערכות ביולוגיות דורשת לאסוף ולעבד את המידע על ידי שימוש בכלים ביואינפורמטיים. הדפדפן הגנומי של אונ' קליפורניה מציג אוסף מגוון בסיסי נתונים מפורשים (annotation datasets), הידועים כמסלולים (tracks) ומוצגים באופן גרפי, כולל מערכי mRNA, מיפוי של אלמנטים חוזרנים בDNA, חיזוי גנים, מידע על ביטויי גנים (gene-expression data), מידע הקשור במחלות (המייצג את הקשר בין הגנים למחלות), ומיפוי של שבבי גנים (chip) זמינים מסחרית (כמו אילומינה ואג'ילנט). הפרדיגמה הבסיסית להצגה היא להראות את הרצף הגנומי בצורה אופקית ולהראות ייצוגים גרפיים של המיקומים של הmRNA, חיזוי גנים ועוד. בלוקים של צבע לאורך הצירים מראים את מיקומם של מערכי סוגי המידע המגוונים. היכולת להראות את המגוון הרחב הזה של סוגי המידע על ציר יחיד (coordinate axis) הופך את הדפדפן לכלי שימושי לאינטגרציה אנכית של המידע. כדי למצוא גן או אזור גנומי, המשתמש יכול להקליד את שם הגן(BRCA1), או את מספר הגישה של הRNA, את השם הקטלוגי של אזור גנומי לפי קונטיגים (contig)( 20p13-פס 13 בזרוע הקצרה של כרומוזום 20) או את המיקום הכרומוזומאלי (chr17:38,450,000-38,531,000). הצגת המידע בפורמט גרפי מאפשר לדפדפן להציג לינק גישה למידע מפורט של כל סוג מידע (אנוטאציה). עמוד הפרטים על גן של UCSC Genes track מספק מספר רב יותר של קישורים למידע יותר ספציפי על הגן ממקורות מידע רבים אחרים, כמו Online Mendelian (OMIM)Inheritance in Man ו – SwissPort.

תוכנת הדפדפן הגנומי מעוצבת לצורך הצגת מידע מורכב ורב, על כן נועד לפעול במהירות. על ידי 55 מיליון RNAs מהמאגר GenBank ל-81 גנומים מאורגנים (הרבה מ-46 המינים שרוצפו יש להם יותר מגרסת ארגון אחת), הדפדפן מאפשר גישה מיידית להצלבת כל RNA לכל מין שרוצף. צירוף של סוגים רבים של נתונים יאפשר לחוקרים להציג בדיוק את השילוב של הנתונים שיענו על שאלות ספציפיות שירצו לשאול. בנוסף, פלט תמונת PDF או כיתוב פונקציונליים שאפשר להוציא מהדפדפן על ידי "צילום" המידע המוצג מאפשר לחוקרים לפרסם את המידע במאמרים אקדמיים. מאפיין ייחודי ושימושי שמבדיל בין הדפדפן הגנומי של UCSC מדפדפנים אחרים הוא שינוי של התצוגה באופן רציף תוך כדי עבודה לפי הצורך. הרצף יכול להופיע בכל גודל שהוא, מרמת הבסיס הבודד ועד הצגה של כרומוזום שלם (כרומוזום 1 באדם= 245 מיליון בסיסים) תוך שילוב של הצגה מלאה של מסלולי מידע קשורים(tracks). חוקרים יכולים להציג גן בודדת אקסון בודד או פס (בנד) כרומוזומלי יחיד, המציג עשרות או מאות גנים תוך שילוב עם קישורי מידע (אנוטאציות) רבים אחרים. תכונה נוחה של הוזזה ומיקוד הקיים בדפדפן מאפשר למשתמש לבחור כל אזור בגנום, להציגו ולהרחיב אותו לכדי הצגה של מסך מלא.

ניתן לחוקרים להשתמש בדפדפן כדי להציג מידע משלהם דרך הכלי של יצירת מסלול משלהם, Custom Tracks tool. כלי זה מאפשר למשתמש להעלות קבצים עם המידע שצבר במחקרו ולראות את המידע ולהציגו בהקשר של הגנום בכללותו עם כל ה-tracks האחרים הקיימים כבר בדפדפן. כמו כן, בשימוש בכלי Table Browser, המשתמש יכול לשלוף מידע ספציפי שמעניין אותו הקיים בדפדפן (למשל, לראות/ לקבל קובץ המכיל רק את ה-SNPs שמשנים חומצה אמינית ברצף החלבון), ולהצליב מידע בין נתונים הקיימים כבר בדפדפן לבין המידע שלו ולראות את זה בדפדפן כ-Custom Track. כל הצגה בדפדפן שיוצר המשתמש ניתן לשתף עם משתמשים אחרים ולשמור את המידע דרך הכלי של Saved Sessions tool.

מסלולי המידע (tracks) בדפדפן

[עריכת קוד מקור | עריכה]

בדפדפן יש גם מסלולים רבים אחרים אשר מחולקים לפי קטגוריות שונות, ומובאים ממקורות רבים. המסלולים כוללים תצוגת חיזוי גנים, מודיפיקציות על היסטונים, מתילציות בגנום, מיקומים של CpG islands, אתרי קישור של פקטורי שעתוק מכמה מקורות לפי חיזויים חישוביים או בעקבות ניסויי chIP, מיקום נוקלאוזומים ו-DNaseI hypersensitivity, מקורות מידע מהספרות, השוואות בין גרסת הגנום ההומני כיום לבין הגרסה של האדם הניאנדרטלי ועוד.
בין היתר, החל להתווסף מידע רב עקב פרויקט ה-ENCODE, פרויקט כלל עולמי שמטרתו לאפיין אלמנטים שונים בגנומים שונים בין היתר של ה-C.elegans, של תסיסנית המחקר ושל האדם הכוללים אלמנטים מרמת ה-DNA ועד זיהוי מיפוי נוקלאוזומים ואינטראקציות כרומוזומאליות. קישורים רבים למידע שנאגר עקב הפרויקט אפשר לראות כמסלולים שנוספו בדפדפן הגנומי ומסומן לידם סמל בצבע שחור-אפור הנראה כסימנים < ו- > אחד על השני.

מידע על שונות

[עריכת קוד מקור | עריכה]

סוגים רבים של מידע על שונות מוצגים ונמצאים בדפדפן גם כן. לדוגמה, כל ההקשרים והתוכן הקיימים במאגר המידע dbSNP מ-NCBI הממופים בגנום ההומני, של העכבר ושל עוד מינים קיימים בדפדפן. מערך מידע זה נובע מפרויקט אלף הגנומים (1000 genome project), ברגע שהם מפרסמים ב-dbSNP. עוד סוגי מידע על שונות אחרים כוללים שונות סמפר החזרות של רצפים חוזרניים בגנום (CNV) ותדירויות האללים של גנים באוכלוסיית האדם בעולם המובאים לדפדפן מפרויקט ה-HapMap. הדפדפן הגנומי מציע מידע ייחודי על השוואת גנומיים לרוב המינים שמצויים בדפדפן. מערכי ההשוואה מוצגים בצורה גרפים של יחסים וקשרים אבולוציוניים בין המינים. אופן תצוגה זה הופך לכלי שימושי לחוקר, היכול להראות אזורים של שימור בין קבוצות של מינים ועל סמך זה, לעשות ניסוי לאלמנטים פונקציונליים בגנום, גם באזורים שלא ידועים, ולהראות בצורה חזקה אבולוציה של מינים. דרך ה-44 מסלולים להשוואה על הגנום ההומני מראה בבירור שככל שהולכים אחורה באבולוציה הרצף פחות נשמר, אך אזורים חשובים ופונקציונלים של הגנום (אקסונים ואתרי בקרה) שמורים מאוד גם במינים רחוקים מהאדם.

כלים לעיבוד מידע

[עריכת קוד מקור | עריכה]

אתר ה-UCSC מכיל בתוכו גם סט כלים המאפשר לעשות אנליזות ועיבודים שונים לגנום, באופן פשוט. כלים אלה כוללים:

  • BLAT - כלי לבדיקת התאמת רצפים בגנומים שונים. כלי זה גם שימושי למציאה פשוטה של רצפים בתוך מקטע של רצף מאסיבי (למשל הגנום ההומני) מתוך כל אחד מהגנומים המאופיינים בדפדפן.
  • lifeOver - כלי המשתמש בהתאמה כלל גנומית כדי לאפשר מעבר של רצפים מגרסה אחת של גנום מסוים לאחרת או בין גנומים של מינים שונים.
  • Genome Graphs - כלי שמאפשר למשתמש לראות את כל הכרומוזומים בבת אחד ולהציג תוצאות ממחקרים כלל גנומיים (GWAS).
  • Gene Sorter - כלי המציג גנים המקובצים לקבוצות לפי פרמטרים ללא קשר למיקום הגנומי שלהם, כמו למשל על פי דפוס ביטוי בקרמה מסוימת.

יצירת קישורים לגיליון נתונים לתצוגת UCSC Genome Browser

[עריכת קוד מקור | עריכה]
ערך זה מועמד להעברה לוויקיספר
ערך זה נראה כספר לימוד או מדריך. ויקיפדיה איננה מאגר מדריכים או ספרי לימוד אבל ויקיספר כן. אם לדעתכם ערך זה הוא בעל חשיבות אנציקלופדית, אנא ציינו זאת בדף השיחה של הערך.
ערך זה מועמד להעברה לוויקיספר
ערך זה נראה כספר לימוד או מדריך. ויקיפדיה איננה מאגר מדריכים או ספרי לימוד אבל ויקיספר כן. אם לדעתכם ערך זה הוא בעל חשיבות אנציקלופדית, אנא ציינו זאת בדף השיחה של הערך.


משתמשים רבים של הדפדפן הזה אוספים מידע משלהם בגיליון נתונים ב-Excel, יכולים ליצור קישור לדפדפן תוך שימוש במידע שבגיליון נתונים. לדוגמה, לגנטיקאי קליני יש רשימות של אזורים גנומיים מחולים המכילים מחיקות והוספות בגנום, שנקבעו על ידי comparative genomic hybridization (CGH). אזורים אלה יכולים להוות מקור מידע להצגה בדפדפן לכל אחד שש לו גישה ברגע שיעלה אותם כגיליון נתונים לדפדפן. ucscLinks.xls :Click to download the spreadsheet

שימוש זהיר בהעתקת והעברת המידע מה-Excel יכול לאפשר הגעה לקישור לגיליונות המידע ללא צורך בשינוי נוסף. התאמה אישית של הקישורים מה- Excel התכנים של התמונה לעיל (cell G22 בגיליון נתונים עדכני) הם כדלקמן:

=HYPERLINK("http://genome.ucsc.edu/cgi-bin/hgTracks?db=hg19&position="&E22&"&dgv=pack&knownGene=pack&omimGene=pack","ucsc")

דוגמה זו מצתיגה איך ליצור קישור שפועל על tracks ספציפיים הקשורים לעניין מסוים. במקרה זה, שלושה מסלולים (tracks) מופיעים באופן מפורש: Database of Genomic Variants (table: dgv)

UCSC Genes (table: knownGene)
OMIM Genes (table: omimGene2) 

כל מסלול (track) נראה באופן של "pack" בקישור שלמעלה: dgv=pack

knownGene=pack
omimGene=pack

כל מסלול שנפתח יישאר פתוח ויוצג כאשר חלון חדש של הדפדפן נפתח מאותו מחשב. מסלול חדש יכול להיות מוסף תוך שימוש ב-tableName ובאפשרויות התצוגה הקיימות לו. &snp131=dense (for hg18)

&snp135=dense (for hg19)

אפשר פשוט להוסיף לאחר ה-url תוספת של תצוגה תוך שימוש באופן הרישום של tableName=, קשור לקישור על ידי &. הדרך הקלה ביותר ללמוד את השם של הטבלה שבבסיס המסלול היא לעבור ללחוץ על שם המסלול בדפדפן ולקרוא את התיאור והקישור הקיימים בתחתית דף הדפדפן הטבלה מוצגת ב-url כך:
g=tableName

אופציות התצוגה לכל מסלול הם: hide, dense, squish, pack, full.

התאמה אישית של קישורים

[עריכת קוד מקור | עריכה]

קישורים ישירים לדפדפן יכולים להיווצר על ידי יצירת ה-URL. לדוגמה, אם רוצים ליצור קישור ישיר לדף המידע של הגן SIRT1 למשל, הידוע גם כדף hgGene, לגרסה hg19 של הגנום ההומני, צריך ליצור את ה-URL הבא כאשר “db=” מוקצה למאגר המידע ממנו נשלוף את הדף ושאליו נגיע בקישור ו- “hgg_gene=” מוקצה לגן עצמו: http://genome.ucsc.edu/cgi-bin/hgGene?db=hg19&hgg_gene=SIRT1 באופן דומה, קישור ישיר למאגר המידע בגרסת hg19 עבור מיקום הגן SIRT1 יכול להיעשות על ידי knownCanonical database, מאגר מידע שלפעמים מכיל את האיזופורם הכי ארוך של הגן ביחס לקבוצת הגנים המצויים ב-UCSC: http://genome.ucsc.edu/cgi-bin/hgTracks?db=hg19&singleSearch=knownCanonical&position=SIRT1 לצורך אלה שמעלים מסלולים בעצמם, קישור ישיר יכול להיפתח בדפדפן ולהציג את המידע על ידי יצירת הפורמט הבא כאשר משתמשים בביטוי "hubUrl" המוקצה למיקום אינטרנטי של הקובץ בתור קובץ טקסט: http://genome.ucsc.edu/cgi-bin/hgTracks?db=hg19&hubUrl=http://ftp.ebi.ac.uk/pub/databases/ensembl/encode/integration_data_jan2011/hub.txt מקור פתוח בסיס הקוד של הדפדפן הגנומי של UCSC פתוח גם לשימושים לא מסחריים, וזה נעשה בעיקר על ידי קבוצות מחקר מקומיות הרוצות לראות את המידע שברשותן בדפדפן כדי לעבוד באופן נוח יותר עם כלים שהדפדפן מציע ללא שקבוצות מחקר אחרות יראו אותו. הדפדפן של UCSC מוצג גם בכמה מיקומים כלל עולמיים באינטרנט.

הקוד של הדפדפן ניתן לשימוש גם בתצוגת נפרדות למשל על ידי דפדפנים אחרים כגון, UCSC Malaria Genome Browser וה-Archaea Browser.

קישורים חיצוניים

[עריכת קוד מקור | עריכה]