בנק מידע החלבונים

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בנק מידע החלבונים (אנגלית: Protein Data Bank או בראשי תיבות PDB) הוא מאגר מידע ממוחשב אשר מכיל תיאור של המבנה התלת ממדי של מולקולות ביולוגיות גדולות, כדוגמת חלבונים וחומצות גרעין. המידע, שבדרך כלל מושג בקריסטלוגרפיה באמצעות קרני רנטגן או בספקטרוסקופיה באמצעות NMR, ונשלח על ידי ביולוגים וביוכימאים מרחבי העולם, ניתן לאחזור בחינם מהאינטרנט. על בנק המידע מפקח ארגון ושמו "Worldwide Protein Data Bank" ("בנק מידע החלבונים ברחבי העולם" בראשי תיבות wwPDB).

בנק המידע הוא מקור חשוב בתחומי הביולוגיה המבנית כדוגמת גנומיקה מבנית. מרבית כתבי העת המדעיים, וכמה מהארגונים המחלקים מענקי מחקר כדוגמת המכונים הלאומיים לבריאות (NIH) שבארצות הברית, דורשים כיום מהמדענים לשלוח מידע על מבנים שפוענחו לבנק המידע. בנק המידע הוא המקור הראשי למאות מאגרי מידע נגזרים המסווגים את המידע בצורה שונה. דוגמאות הן שיטת הסיווג המכונה SCOP (ראשי תיבות של Structural Classification of Proteins – סיווג מבני של חלבונים) ושיטת הסיווג CATH (ראשי תיבות של שיטת הסיווג Class Architecture Topology Homologous superfamily – מחלקה, ארכיטקטורה, טופולוגיה ומשפחת על הומולוגית) מסווגים מבנים על פי סוג המבנה ומניחים קשרים אבולוציונריים, שיטת הסיווג GO (ראשי תיבות Gene ontology – אונטולוגיה של גנים) מסווגת מבנים על בסיס גנים.‏[1]

היסטוריה[עריכת קוד מקור | עריכה]

בנק מידע החלבונים (PDB) החל כמיזם עצמאי של כמה מדענים.‏[1] ב-1971 הסכים וולטר המילטון (Walter Hamilton) מהמעבדה הלאומית בברוקהייבן (Brookhaven National Laboratory) לנהל את ה-PDB בברוקהייבן. המילטון נפטר שנתיים אחר כך, וטום קוזטלה (Tom Koeztle) נטל על עצמו את ניהול ה-PDB. בינואר 1994 מונה הקריסטלוגרף והביולוג הישראלי פרופ' יואל זוסמן ממכון ויצמן למנהל ה-PDB. באוקטובר 1998‏‏[2] הועבר ה-PDB לResearch Collaboratory for Structural Bioinformatics או בראשי תיבות RSCB. ההעברה הושלמה ביוני 1999. כמנהל בנק המידע מונתה הלן ברמן מאוניברסיטת רוטגרס (אחד מהמוסדות החברים ב-RSCB).‏[3] עם הקמת ה-wwPDB ב-2003 הפך ה-PDB להיות ארגון בינלאומי. כל אחד מארבעת החברים בארגון (שניים מארצות הברית, ארגון אירופי וארגון יפני) יכול לפעול כמרכז לאחסון, עיבוד נתונים והפצה של המידע המצוי ב-PDB. עיבוד נתונים מתייחס לעובדה שהצוות של ה-wwPDB בוחן ומעיר הערות על כל מבנה המתקבל. המידע נבדק בצורה ממוחשבת לישימות המבנה. (תוכנת הבדיקה שוחררה לציבור בלא תשלום).

תכולה[עריכת קוד מקור | עריכה]

בנק מידע החלבונים מתעדכן פעם בשבוע (ביום שלישי). בדומה, האתר PDB Holdings List מתעדכן פעם בשבוע. נכון לשבוע של ה-9 במרץ 2010 הכיל המאגר 63,956 מבנים של חלבונים שפוענחו על פי הפירוט הבא:

שיטת
הפענוח
חלבונים חומצות גרעין תרכובות
חלבון/חומצת גרעין
אחרים סך-הכול
עקיפה של קרני רנטגן 51633 1200 2386 17 55236
NMR 7228 895 154 7 8284
מיקרוסקופ אלקטרוני 184 17 73 0 274
מעורב 18 1 1 1 21
אחר 120 4 4 13 141
סך הכול 59183 2117 2618 38 63956
ל-44,624 מבנים ב-PDB יש קובץ structure factor
ל-5,574 מבנים יש קובץ NMR restraint

הטבלה מראה כי מרבית המבנים פוענחו על ידי עקיפה באמצעות קרני רנטגן, אבל בשנים האחרונות כ-15% מהמבנים נקבעים על ידי שימוש ב-NMR, ומספר נמוך מזה באמצעות מיקרוסקופ אלקטרוני או,ליתר דיוק, קריו-מיקרוסקופ אלקטרוני, שכן הדגימה נחקרת בטמפרטורה של חנקן נוזלי (הקלקה על המספרים בטבלה המוצגת באתר מראה דוגמאות למבנים שפוענחו בשיטה זו).

החשיבות של קובצי ה-structure factor שהוזכרו דלעיל היא שעבור מבנים ב-PDB שנקבעו על ידי עקיפה של קרני רנטגן, שלהם יש קובץ מבנה, ניתן לצפות במפת צפיפות האלקטרונים. המידע על מבנים אלו מאוחסן ב-electron density server, שם ניתן לצפות במפות האלקטרונים.

בעבר גדל מספר המבנים ב-PDB כמעט בצורה מעריכית. ב-2007 נוספו 7,263 מבנים. לעומת זאת, ב-2008 נוספו רק 7,073 מבנים, כך שנראה כאילו קצב הוספת המבנים הולך ופוחת. ועם זאת, ב-2009 נוספו 7,448 מבנים, המספר הגבוה ביותר שנוסף בשנה אחת.

פורמט הקובץ[עריכת קוד מקור | עריכה]

הפורמט המקורי בו נעשה שימוש ב-PDB היה קרוי פורמט PDB. פורמט זה היה מוגבל לרוחב של כרטיסי מחשב מנוקבים, כלומר 80 תווים בשורה. החל משנת 1996 החל להיכנס לשימוש הפורמט "mmCIF" (ראשי תיבות של "macromolecular Crystallographic Information file" - קובץ מידע קריסטלוגרפי מאקרומולקולרי). גרסת XML של פורמט זה תוארה ב-2005.‏[4] את קובצי המבנה ניתן להוריד בכל אחד משלושת הפורמטים. למעשה, קבצים בודדים נטענים בקלות לתוך תוכנות גרפיות תוך שימוש בכתובות רשת (URL):

  • לקבצים בפורמט PDB יש להשתמש ב: http://www.pdb.org/pdb/files/4hhb.pdb.gz
  • לקבצים בפורמט PDBML‏ (XML) יש להשתמש ב: http://www.pdb.org/pdb/files/4hhb.xml.gz

ה-"4hhb" הוא מזהה ה-PDB. כל מבנה המתפרסם ב-PDB מקבל מזהה בן ארבעה תווים אלפאנומריים, ה-PDB ID שלו (לא ניתן להשתמש במספר מזהה זה כמזהה של הביומולקולה, שכן לעתים קרובות מכיל ה-PDB כמה מבנים לאותה מולקולה – בסביבות או תצורות שונות – תחת PDB ID שונים).

צפייה במידע[עריכת קוד מקור | עריכה]

ניתן לצפות בתצוגה גרפית של המבנים בעזרת אחת מכמה תוכנות חופשיות. בין התוכנות החופשיות, אם כי לא בקוד פתוח מצויות:

  • VMD – ראשי תיבות של Visual molecular dynamics
  • MDL Chime
  • Swiss-PDB Viewer
  • StarBiochem – תוכנת הצגה מולקולות אינטראקטיבית הכתובה ב-Java והכוללת מנוע חיפוש בתוך בנק מידע החלבונים.
  • Sirius visualization software
  • VisProt3DS – כלי לדימות של חלבון בתלת ממד בתצוגה סטריאוסקופית

אתר ה-PDB של ה-RSCB מכיל רשימה נרחבת של תוכנות לתצוגה של מולקולות (חופשיות ומסחריות) ותוכנות תקע לדפדפני אינטרנט.

קישורים חיצוניים[עריכת קוד מקור | עריכה]

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ 1.0 1.1 Berman, H. M. (January 2008). "The Protein Data Bank: a historical perspective". Acta Crystallographica Section A: Foundations of Crystallography A64 (1): 88–95. doi:10.1107/S0108767307035623. 
  2. ^ Berman, H. M.; et al. (January 2000). "The Protein Data Bank". Nucleic Acids Res. 28 (1): 235–242. doi:10.1093/nar/28.1.235. PMID 10592235. PMC:102472. 
  3. ^ RCSB PDB Staff
  4. ^ Westbrook, J.; et al. (2005). "PDBML: the representation of archival macromolecular structure data in XML". Bioinformatics 21 (7): 988–992. doi:10.1093/bioinformatics/bti082.