איי CpG

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

בגנומיקה, איי CpGאנגלית: CpG islands) אלו הם אזורים גנומיים בעלי שכיחות גבוהה של אתרי CpG. ה"p" ב-CpG מייצג את הקשר הפוספודיאסטרי שבין ציטוזין (C) לגואנין (G), הנוצר בעת פילמור חומצת הגרעין. ה-C וה-G מצויים זה לצד זה ברצף ה-DNA או ה-RNA עקב קישורם הכימי בקשר הפוספודיאסטרי שהינו קשר קוולנטי, להבדיל מקשרי המימן הנוצרים בעת זיווג בסיסים בין ציטוזין וגואנין המצויים זה מול זה בחומצת גרעין בעלת מבנה דו-גדילי, כדוגמת DNA המצוי בתאים.

גואנין
ציטוזין

אין הגדרה אובייקטיבית לאיי CpG וההגדרה הפורמלית הרווחת של אי CpG היא - אזור בעל לפחות 200 זוגות בסיסים, בעל שכיחות C ו-G הגבוהה מ-50% ובעל יחס observed-to-expected של CpG (המחושב על ידי הנוסחה - ((Num of CpG/(Num of C × Num of G)) × Total number of nucleotides in the sequence)) הגבוה מ60%.

איי CpG ביונקים[עריכת קוד מקור | עריכה]

בגנומים של יונקים, איי CpG הם לרוב באורך של 300-3,000 זוגות בסיסים, ונמצאים בתוך או בסמיכות ל40% מהפרומוטורים של הגנים. אצל בני אדם - כ70% מהפרומוטורים מכילים ריכוז CpG גבוה ועקב כך איי CpG הם דרך נוחה לזיהוי מיקומם של גנים. מחקר שנערך ב-2002, המבוסס על סקירה נרחבת של רצף הכרומוזומים ההומניים 21 ו-22 מצא כי בניגוד לאזורים גנומיים העשירים ב-GC כגון חזרות מסוג Alu, איי CpG "אמיתיים", המקושרים לאזורי ה5' של גנים, הם אזורים באורך של יותר מ-500 זוגות בסיסים, בעלי לפחות 55% של GC ובעלי יחס observed-to-expected של CpG הגבוה מ65%.

מאפיינים[עריכת קוד מקור | עריכה]

איי CpG מאופיינים בשכיחות CpG של לפחות 60% מהשכיחות המצופה, שהיא בערך 4-5% (בגנום האנושי כ-42% מהנוקליאוטידים הם G או C ולכן ההסתברות לקבל אתר CpG צריכה להיות 0.21*0.21=4.41%), כלומר שכיחות של לפחות 2.6% (0.6*0.0441=0.02646), בעוד שבשאר הגנום שכיחות ה-CpG נמוכה יותר - פחות מ1%. בניגוד לאתרי CpG באזורים המקודדים בתוך גנים, ברוב המקרים אתרי CpG באיי CpG שבתוך פרומוטורים אינם ממותלים במידה והגן מתבטא. ההבחנה בתופעה זו הובילה להבנה כי מתילציה של אתרי CpG בפרומוטורים יכולה להוביל להשתקה של ביטוי הגן. בגנים שמתבטאים - רוב המתילציות מתבצעות במרחק קצר מאיי ה-CpG (באזורים הנקראים "חופי CpG") ולא באיים עצמם.

הרצף CpG הוא רצף פלינדרום ולכן לאחר ההכפלה האנזימים שיוצרים את המתילצייה מזהים את ה-C הממותל מה-CpG בגדיל המקורי וממתלים את ה-C החדש, המשלים ל-G המקורי. הסיבה לנדירות היחסית של אתרי CpG בDNA של חולייתנים היא שציטוזין בסידור כזה נוטה לעבור מתילציה וC ממותל נוטה לעבור דה-אמינציה (הסרת קבוצת אמין) ספונטנית ולהפוך כתוצאה מכך לתימין. בבני אדם אמנם קיים אנזים בשם Thymine-DNA glycosylase היודע לתקן תימינים ממוטציות T/G אך הוא אינו יעיל מספיק כדי למנוע את קצב המוטציות הגבוה יחסית בדינוקלאוטיד CpG. כתוצאה מכך הדינוקלאוטיד CpG הולך ונעלם במהלך האבולוציה וקיומם של צברי CpG הוא לא דבר מובן מאליו. איי CpG לרוב נמצאים באזורי תחילת השעתוק של גנים (במיוחד ליד housekeeping genes, בחולייתנים). קיומם של איי CpG מוסבר לרוב על ידי כוחות סלקטיביים המובילים לרמות מתילציה נמוכות באזורים גנומיים אלו. היות שמתילציות באזור זה מעלות את ההסתברות לדה-אמינציות ספונטניות של הציטוזינים, שיכולות להוביל להרס הפונקציה או הבקרה של הגן קיימת סלקצייה אבולוציונית חזקה כנגד אותן מתילציות.