Занятие 11. Геномное окружение. База данных GO
1. Получение информации о КОГе, к которому относится ваш белок
Исследуемый белок (Carnobacterium sp. CP1):
Определение КОГа, к которому относится белок
Последовательность действий:
☆ Откройте сервис CDD (Conserved Domain Database);
☆ В поле поиска вставьте последовательность белка в FASTA-формате и нажмите клавишу Submit;
☆ В правом верхнем углу выберите в поле View режим Full Results;
☆ В списке хитов найдите хиты, относящие Ваш белок к тому или иному КОГу;
☆ С помощью последнего релиза базы данных посмотрите название данного КОГа и функциональную категорию, к которой он относится.
Информация о КОГе
Выдача программы:
Рис.1 Выдача сервиса CDD (1)
Рис.2 Выдача сервиса CDD (2)
Информация о КОГе:
Идентификатор КОГа | COG1185 |
E-value | 0e+00 |
Interval | 1-698 |
Количество белковых остатков | 702 |
Название КОГа (Перевод) | Polyribonucleotide nucleotidyltransferase (polynucleotide phosphorylase)
Полирибонуклеотид нуклеотидилтрансфераза (полинуклеотид фосфорилаза) |
Функциональной категория (Перевод) | J: Translation, ribosomal structure and biogenesis
Трансляция, структура рибосом и биогенезис |
2. Визуализация геномного окружения
Для определения геномного окружения использовалась программа COGNAT.
При запуске с параметрами по умолчанию (COG: COG1185; Neighborhood Size: 9; Occurrence Threshold (%): 20; Taxonomy: Нет), программа выдала следующее:
изображение в формате pdf
Далее приведены некотрые фрагменты файла:
Рис.3 Фрагмент 1
Рис.4 Фрагмент 2
Рис.5 Обозначения КОГов
Сиреневая стрелочка в центре - это наш КОГ (COG1185). В большинстве случаев он сопровождается другим КОГом, идущим до него.
Это COG0184 (Ribosomal protein S15P/S13E), который на картинке изображен в виде голубой стрелочки. Также довольно часто
с этими двумя КОГами встречаются еще два, идущих друг за другом: COG0130 (tRNAU55 pseudouridine synthase TruB, may also work on U342 of tmRNA)
и COG0858 (Ribosome-binding factorA). Они показаны как бирюзовая (цвета морской волны) и лиловая стрелочки, соответственно.
Консервативное геномное окружение данного КОГа можно предстваить так:
Рис.6 Консервативное окружение
Такая консервативность обусловлена тем, что фермент может нормально функционировать, только когда в нем присутствуют все 4 КОГа вместе. Без них
он не может обладать всем тем спектром функций, которые предполагаются для его работы.
Но вариации существуют. Если КОГ COG0184 (голубая стрелочка) есть практически всегда, то два других (бирюзовая и лиловая стрелочки)
могут отсутствовать по отдельности или оба сразу.
3. Отнесение вашего белка к терминам GO
Отнесение белка полирибонуклеотид нуклеотидилтрансфераза из бактерии Bacillus subtilis (strain 168) к терминам GO
Последовательнось действий:
☆ С помощью инструмента AmiGO поиском BLAST обнаружьте в БД GO белок, который наиболее похож на ваш.
☆ Посмотрите выравнивание (BLAST match),
сравните организм, к которому принадлежит находка, с организмом, к которому принадлежит Ваш белок.
☆ На страничке отчета укажите величину
P-value для наилучшей находки и скажите, является ли найденный в БД GO белок тем же самым, что и Ваш (если нет - то оцените меру их сходства).
☆ Перейдите на страничку белка-находки (view associations) и заполните Таблицу 1 в отчете. Чтобы узнать идентификатор Uniprot белка-находки,
перейдите на вкладку Gene product information, и ищите слово Uniprot.
Самый похожая находка - тот же белок, только из другой бактерии:
Рис.7 Выдача AmiGo
blast match:
Score = 2419 (856.6 bits), Expect = 3.4e-251, P = 3.4e-251
Identities = 476/700 (68%), Positives = 579/700 (82%)
Как видно из выравнивания, найденный белок обладает значительным сходством с изначальным, поэтому далее можно рассматривать его.
После того, как был найден подходящий белок, перходим по ссылке view associations
(ссылка)
для того,
чтобы узнать информацию про найденный белок. Там переходим по вкладке Gene product information
(ссылка)
за более подробной информацией. В самом низу страницы находится ссылка на Uniprot (которая, кстати, как-то очень странно работает).
Перемещаемся на главную страницу Uniprot, где вводим идентификатор белка - P50849. Он без проблем находится. Переходим на страницу, посвещенную белку
(ссылка).
Там мы ищем все, что находится под заголовком
"GO - ..." и смотрим, что там есть. Чтобы получить более подробную информацию, переходим по ссылке "View the complete GO annotation on QuickGO ..."
(ссылка).
Таблица 1. Термины GO, отнесенные к белку с идентификатором Uniprot P50849 (PNP_BACSU):
Аспект | Идентификатор GO | Название термина | Перевод названия термина | Код типа достоверности |
Биологический процесс (Biological process) | GO:0006396 | RNA processing | Процессинг РНК | IEA |
Биологический процесс (Biological process) | GO:0006402 | mRNA catabolic process | Катаболизм мРНК | IEA |
Биологический процесс (Biological process) | GO:0030420 |
establishment of competence for transformation | Установление готовности к трансформации | IEA |
Молекулярная функция (Molecular function) | GO:0003676 | nucleic acid binding | Связывание нуклеиновых кислот | IEA |
Молекулярная функция (Molecular function) | GO:0003723 | RNA binding | Связывание РНК | IEA |
Молекулярная функция (Molecular function) | GO:0004654 | polyribonucleotide nucleotidyltransferase activity | Полирибонуклеотид нуклеотидилтрансферазная активность | IEA |
Молекулярная функция (Molecular function) | GO:0005515 | protein binding | Связывание белков | IPI |
Молекулярная функция (Molecular function) | GO:0016740 | transferase activity | Трансферазная активность | IEA |
Молекулярная функция (Molecular function) | GO:0016779 | nucleotidyltransferase activity | Нуклеотидилтрансферазная активность | IEA |
Молекулярная функция (Molecular function) | GO:0046872 | metal ion binding | Связывание ионов металлов | IEA |
Клеточный компонент (Cellular component) | GO:0005737 | cytoplasm | Цитоплазма | IEA |
Про код типа достоверности можно почитать, если на странице Uniprot белка кликнуть еа заголовок "GO - ..." > "More ..."
Таблица 2. Описание кодов достоверности, использованных в Таблице 1:
Код типа достоверности | Расшифровка кода типа достоверности | Объяснение |
IEA | Inferred from Electronic Annotation | Данный код присваивается в случае, когда данные были получены
путем компьютерных вычислений и
загружены автоматически из базы данных. Вручную не проверялись. |
IPI | Inferred from Physical Interaction | Данный код нужен в том случае, когда нужно объяснить
физические взаимодействия между интересующим нас продуктом гена (белком, например) и другой молекулой (ионом, комплексом и др.) |
|