בנק מידע החלבונים

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בנק מידע החלבונים (אנגלית: Protein Data Bank או בראשי תיבות PDB) הוא מאגר מידע ממוחשב אשר מכיל תיאור של המבנה התלת ממדי של מולקולות ביולוגיות גדולות, כדוגמת חלבונים וחומצות גרעין. המידע, שבדרך כלל מושג בקריסטלוגרפיה באמצעות קרני רנטגן או בספקטרוסקופיה באמצעות NMR, ונשלח על ידי ביולוגים וביוכימאים מרחבי העולם, ניתן לאחזור בחינם מהאינטרנט. על בנק המידע מפקח ארגון ושמו "Worldwide Protein Data Bank" ("בנק מידע החלבונים ברחבי העולם" בראשי תיבות wwPDB).

בנק המידע הוא מקור חשוב בתחומי הביולוגיה המבנית כדוגמת גנומיקה מבנית. מרבית כתבי העת המדעיים, וכמה מהארגונים המחלקים מענקי מחקר כדוגמת המכונים הלאומיים לבריאות (NIH) שבארצות הברית, דורשים כיום מהמדענים לשלוח מידע על מבנים שפוענחו לבנק המידע. בנק המידע הוא המקור הראשי למאות מאגרי מידע נגזרים המסווגים את המידע בצורה שונה. דוגמאות הן שיטת הסיווג המכונה SCOP (ראשי תיבות של Structural Classification of Proteins – סיווג מבני של חלבונים) ושיטת הסיווג CATH (ראשי תיבות של שיטת הסיווג Class Architecture Topology Homologous superfamily – מחלקה, ארכיטקטורה, טופולוגיה ומשפחת על הומולוגית) מסווגים מבנים על פי סוג המבנה ומניחים קשרים אבולוציונריים, שיטת הסיווג GO (ראשי תיבות Gene ontology – אונטולוגיה של גנים) מסווגת מבנים על בסיס גנים.‏[1]

היסטוריה[עריכת קוד מקור | עריכה]

בנק מידע החלבונים (PDB) החל כמיזם עצמאי של כמה מדענים.‏[1] ב-1971 הסכים וולטר המילטון (Walter Hamilton) מהמעבדה הלאומית בברוקהייבן (Brookhaven National Laboratory) לנהל את ה-PDB בברוקהייבן. המילטון נפטר שנתיים אחר כך, וטום קוזטלה (Tom Koeztle) נטל על עצמו את ניהול ה-PDB. בינואר 1994 מונה הקריסטלוגרף והביולוג הישראלי פרופ' יואל זוסמן ממכון ויצמן למנהל ה-PDB. באוקטובר 1998‏‏[2] הועבר ה-PDB לResearch Collaboratory for Structural Bioinformatics או בראשי תיבות RSCB. ההעברה הושלמה ביוני 1999. כמנהל בנק המידע מונתה הלן ברמן מאוניברסיטת ראטגרס (אחד מהמוסדות החברים ב-RSCB).‏[3] עם הקמת ה-wwPDB ב-2003 הפך ה-PDB להיות ארגון בינלאומי. כל אחד מארבעת החברים בארגון (שניים מארצות הברית, ארגון אירופי וארגון יפני) יכול לפעול כמרכז לאחסון, עיבוד נתונים והפצה של המידע המצוי ב-PDB. עיבוד נתונים מתייחס לעובדה שהצוות של ה-wwPDB בוחן ומעיר הערות על כל מבנה המתקבל. המידע נבדק בצורה ממוחשבת לישימות המבנה. (תוכנת הבדיקה שוחררה לציבור בלא תשלום).

תכולה[עריכת קוד מקור | עריכה]

בנק מידע החלבונים מתעדכן פעם בשבוע (ביום שלישי). בדומה, האתר PDB Current Holdings Breakdown מתעדכן פעם בשבוע. נכון לשבוע של ה-13 בינואר 2015 הכיל המאגר 105,732 מבנים של חלבונים שפוענחו על פי הפירוט הבא:

דוגמאות למבנים של חלבונים מה-PDB (נוצרו על ידי תוכנת כימרה של אוניברסיטת UCSF)
שיטת
הפענוח
חלבונים חומצות גרעין תרכובות
חלבון/חומצת גרעין
אחרים סך-הכול
עקיפה של קרני רנטגן 88,026 1,598 4,332 4 93,960
NMR 9,466 1,104 222 7 10,799
מיקרוסקופ אלקטרוני 522 29 164 0 715
מעורב 68 3 2 1 74
אחר 161 4 6 13 184
סך הכול 98,243 2,738 4,726 25 105,732
ל-83,534 מבנים ב-PDB יש קובץ structure factor
ל-8,114 מבנים יש קובץ NMR restraint
ל-1,871 מבנים יש קובץ chemical shifts
ל-686 מבנים ב-PDB יש קובץ מיפוי 3 ממדי המאוחסן ב-EM Data Bank

הטבלה מראה כי מרבית המבנים פוענחו על ידי עקיפה באמצעות קרני רנטגן, אבל בשנים האחרונות כ-10% מהמבנים נקבעים על ידי שימוש ב-NMR, ומספר נמוך מזה באמצעות מיקרוסקופ אלקטרוני או, ליתר דיוק, קריו-מיקרוסקופ אלקטרוני, שכן הדגימה נחקרת בטמפרטורה של חנקן נוזלי (הקלקה על המספרים בטבלה המוצגת באתר מראה דוגמאות למבנים שפוענחו בשיטה זו).

החשיבות של קובצי ה-structure factor שהוזכרו דלעיל היא שעבור מבנים ב-PDB שנקבעו על ידי עקיפה של קרני רנטגן, שלהם יש קובץ מבנה, ניתן לצפות במפת צפיפות האלקטרונים. המידע על מבנים אלו מאוחסן ב-electron density server, שם ניתן לצפות במפות האלקטרונים.

בעבר גדל מספר המבנים ב-PDB כמעט בצורה מעריכית, וב-2014 עבר מספר המבנים את נקודת ה-100,000,‏[4] ועם זאת, מ-2007 החל קצב הגידול להתייצב והוא מתקרב ל-10,000 מבנים חדשים מדי שנה.

פורמט הקובץ[עריכת קוד מקור | עריכה]

הפורמט המקורי בו נעשה שימוש ב-PDB היה קרוי פורמט PDB. פורמט זה היה מוגבל לרוחב של כרטיסי מחשב מנוקבים, כלומר 80 תווים בשורה. החל משנת 1996 החל להיכנס לשימוש הפורמט "mmCIF" (ראשי תיבות של "macromolecular Crystallographic Information file" - קובץ מידע קריסטלוגרפי מאקרומולקולרי). גרסת XML של פורמט זה תוארה ב-2005.‏[5] את קובצי המבנה ניתן להוריד בכל אחד משלושת הפורמטים. למעשה, קבצים בודדים נטענים בקלות לתוך תוכנות גרפיות תוך שימוש בכתובות רשת (URL):

  • לקבצים בפורמט PDB יש להשתמש ב: http://www.pdb.org/pdb/files/4hhb.pdb.gz
  • לקבצים בפורמט PDBML‏ (XML) יש להשתמש ב: http://www.pdb.org/pdb/files/4hhb.xml.gz

ה-"4hhb" הוא מזהה ה-PDB. כל מבנה המתפרסם ב-PDB מקבל מזהה בן ארבעה תווים אלפאנומריים, ה-PDB ID שלו (לא ניתן להשתמש במספר מזהה זה כמזהה של הביומולקולה, שכן לעתים קרובות מכיל ה-PDB כמה מבנים לאותה מולקולה – בסביבות או תצורות שונות – תחת PDB ID שונים).

צפייה במידע[עריכת קוד מקור | עריכה]

ניתן לצפות בתצוגה גרפית של המבנים בעזרת אחת מכמה תוכנות חופשיות. בין התוכנות החופשיות, אם כי לא בקוד פתוח מצויות:

  • VMD – ראשי תיבות של Visual molecular dynamics
  • MDL Chime
  • Swiss-PDB Viewer
  • StarBiochem – תוכנת הצגה מולקולות אינטראקטיבית הכתובה ב-Java והכוללת מנוע חיפוש בתוך בנק מידע החלבונים.
  • Sirius visualization software
  • VisProt3DS – כלי לדימות של חלבון בתלת ממד בתצוגה סטריאוסקופית

אתר ה-PDB של ה-RSCB מכיל רשימה נרחבת של תוכנות לתצוגה של מולקולות (חופשיות ומסחריות) ותוכנות תקע לדפדפני אינטרנט.

קישורים חיצוניים[עריכת קוד מקור | עריכה]

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ 1.0 1.1 Berman, H. M. (January 2008). "The Protein Data Bank: a historical perspective". Acta Crystallographica Section A: Foundations of Crystallography A64 (1): 88–95. doi:10.1107/S0108767307035623. 
  2. ^ Berman, H. M.; et al. (January 2000). "The Protein Data Bank". Nucleic Acids Res. 28 (1): 235–242. doi:10.1093/nar/28.1.235. PMC 102472. PMID 10592235.  Deprecated coauthors parameter (עזרה)
  3. ^ RCSB PDB Staff
  4. ^ Hard data מתוך Nature
  5. ^ Westbrook, J.; et al. (2005). "PDBML: the representation of archival macromolecular structure data in XML". Bioinformatics 21 (7): 988–992. doi:10.1093/bioinformatics/bti082.  Deprecated coauthors parameter (עזרה)