ניתוח העשרה של קבוצות גנים

מתוך ויקיפדיה, האנציקלופדיה החופשית

ניתוח העשרה של קבוצות גנים (GSEA) (נקרא גם ניתוח העשרה תפקודית או ניתוח העשרה של מסלולים ביולוגיים) הוא שיטה לזיהוי מחלקות של גנים או חלבונים שמיוצגים יתר על המידה בקבוצה גדולה של גנים או חלבונים, ועשוי להיות להם קשר עם פנוטיפים שונים (למשל דפוסי גדילה שונים של אורגניזם או מחלות). השיטה משתמשת בגישות סטטיסטיות כדי לזהות קבוצות גנים מועשרות או מדוללות באופן משמעותי סטטיסטית.

טכנולוגיות ריצוף רנ"א ותוצאות פרוטאומיקה מזהות לעיתים קרובות אלפי גנים.[1] חוקרים המבצעים ניסויים בתפוקה גבוהה שמניבים קבוצה של גנים (לדוגמה, גנים שמתבטאים בצורה דיפרנציאלית בתנאים שונים) רוצים לעיתים קרובות לקבל פרופיל תפקודי של אותה קבוצת גנים, על מנת להבין טוב יותר את התהליכים הביולוגיים הרלוונטיים (התהליכים המשתנים בין שני תנאי הניסוי). ניתן לעשות זאת על ידי השוואת קבוצת הגנים שהתקבלו בניסוי לכל אחת מקבוצות הגנים המקושרות למונחים באונטולוגיה של הגן. ההשוואה מתבצעת באמצעות בדיקה סטטיסטית, בדרך כלל מבחן היפרגאומטרי, שבודק האם קבוצת הגנים שהתקבלו בניסוי מועשרת יתר על המידה (באופן משמעותי סטטיסטית) בגנים המקושרים לכל אחד מהמונחים.

לדוגמה: חוקרת השוותה בניסוי בין רקמת לבלב סרטנית לבין רקמת לבלב בריאה. היא קיבלה רשימה של 100 גנים המתבטאים יותר ברקמה הסרטנית יחסית לבריאה (באופן משמעותי סטטיסטית). כעת היא רוצה לברר האם התהליך הביולוגי neurotrophin TRK receptor signaling pathway מקושר לסרטן הלבלב. לתהליך זה מקושרים 1294 גנים באונטולוגיה של הגן: GO:0048011. נניח שיש סה"כ 10000 גנים. אם אין שום קשר בין סרטן הלבלב לתהליך הביולוגי, נצפה שבקבוצת הגנים מהניסוי יהיו 1294/10000*100=~13 גנים המקושרים לתהליך הביולוגי. אם נקבל יותר מ-13 גנים, סימן שקבוצת הגנים מהניסוי מועשרת יתר על המידה בגנים המקושרים לתהליך הביולוגי. על מנת לבדוק אם העשרה זו היא משמעותית סטטיסטית, ניתן להשתמש במבחן ההיפרגאומטרי.

הערות שוליים[עריכת קוד מקור | עריכה]

  1. ^ Subramanian A, Tamayo P, Mootha VK, Mukherjee S, Ebert BL, Gillette MA, et al. (באוקטובר 2005). "Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles". Proceedings of the National Academy of Sciences of the United States of America. 102 (43): 15545–15550. doi:10.1073/pnas.0506580102. PMC 1239896. PMID 16199517. {{cite journal}}: (עזרה)