Практикум 6. Геномное окружение. База данных GO.

1. Получение информации о КОГе белка

Белок - хеликаза ddx3 (uniprot ID O00571)

EDDWSKPLPPSERLEQELFSGGNTGINFEKYDDIPVEATGNNCPPHIESFSDVEMGEIIMGNIELTRYTRPT PVQKHAIPIIKEKRDLMACAQTGSGKTAAFLLPILSQIYSDGPGEALRAMKENGRYGRRKQYPISLVLAPTR ELAVQIYEEARKFSYRSRVRPCVVYGGADIGQQIRDLERGCHLLVATPGRLVDMMERGKIGLDFCKYLVLDE ADRMLDMGFEPQIRRIVEQDTMPPKGVRHTMMFSATFPKEIQMLARDFLDEYIFLAVGRVGSTSENITQKVV WVEESDKRSFLLDLLNATGKDSLTLVFVETKKGADSLEDFLYHEGYACTSIHGDRSQRDREEALHQFRSGKS PILVATAVAARGLDISNVKHVINFDLPSDIEEYVHRIGRTGRVGNLGLATSFFNERNINITKDLLDLLVEAK QEVPSWLENMAYEHHYKGSSGN


Идентефикатор КОГа - COG0513
Величина E-value для отнесения белка к этому КОГу - 0e+00
КОГ в белке обнаруживается с 28 по 278 остаток
Название КОГа - Superfamily II DNA and RNA helicase (ДНК и РНК хеликазы суперсемейства 2)
Функциональная категория КОГа - L, Replication, recombination and repair (Репликация, рекомбинация и репарация)

2. Визуализация геномного окружения

Изображение, полученное программой COGNAT - Comparative Gene Neighborhood Analysis Tool

Параметры программы при запуске:
COG identifier - COG0513
Neighborhood size - 9
Occurence treshold - 20%
Taxonomy - да

На картинке покрашены цветом все гены, что встречаются в окружении заданного КОГа чаще, чем в 20% случаев. При этом все гены одного КОГа красятся одним цветом. Как видно, на рисунке покрашены только гены КОГа 0513, окружение которого мы ищем. При уменьшении occurence trechold до 10% и neighborhood size до 15, получается аналогичная картина: другие стрелочки-гены остаются непокрашенными. Из чего делаем вывод о том, что у COG0513 нет консервативного геномного окружения.

3. Отнесение белка DDX3 (homo sapiens) к терминам GO

Тот же самый белок из homo sapiens. P-value - 7.0e-244. Последовательности совпадают на 100%. Для DDX3 нашлось очень много терминов GO. В таблице ниже приведено несколько из них. Полный список можно найти по ссылке.

Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot O00571 (DDX3X_HUMAN)
Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс GO:0071243 Cellular response to arsenic-containing substance Клеточный ответ на мышьяксодержащее вещество IDA
Биологический процесс GO:0071470 Cellular response to osmotic stress Клеточный ответ на осмотический стресс IDA
Биологический процесс GO:0007059 Chromosome segregation Сегрегация хромосом IMP

Таблица 2. Описание кодов достоверности, использованных в Таблице 1.
Код типа достоверности Расшифровка кода типа достоверности Объяснение
IDA Inferred from Direct Assay Присваивается, если было проведено исследование, напрямую подтверждающее функцию белка: его локацию в клетке или роль в клеточном процессе.
IMP Inferred from Mutant Phenotype Присваивается, если вывод о той или иной функции белка был сделан на основе разницы в функционировании продукта двух разных аллелей