Ралдугина Василиса

Студентка Факультета биоинженерии и биоинформатики

МГУ имени М.В. Ломоносова

Обо мне

Главная

Сайт ФББ МГУ

Геномное окружение. База данных GO

Получение информации о КОГе белка

В первом семестре мне был выдан белок ANU26136.1. Белок является селеноцистеин-специфичным фактором элонгации трансляции из бактерии Planococcus versutus. Всего в нем 634 аминокислотных остатка.

С помощью сервиса CDD (Conserved Domain Database) для данного белка был получен список хитов (Рис. 1), из которого были выбраны те, которые относят белок к тому или иному КОГу.


Рисунок 1. Список хитов для белка ANU26136.1

Таких хитов, соответственно и КОГов, оказалось 15. Информация по каждому из КОГов была получена из последнего релиза базы данных и представлена в Таблице 1.


IDE-valueКоординаты НазваниеФункциональная категория
COG3276 2.34e-95 8-468 Selenocysteine-specific translation elongation factor
(Селеноцистеин-специфичный фактор элонгации трансляции)
J - Translation, ribosomal structure and biogenesis
(Трансляция, рибосомная структура и биогенез)
COG00501.74e-501-356 Translation elongation factor EF-Tu, a GTPase
(Фактор элонгации трансляции EF-Tu, ГТФаза)
J - Translation, ribosomal structure and biogenesis
(Трансляция, рибосомная структура и биогенез)
COG52562.11e-412-350 Translation elongation factor EF-1alpha (GTPase)
(Фактор элонгации трансляции EF-1alpha, ГТФаза)
J - Translation, ribosomal structure and biogenesis
(Трансляция, рибосомная структура и биогенез)
COG52589.30e-397-359 GTPase
(ГТФаза)
R - General function prediction only
(Предсказание только общей функции)
COG52574.76e-378-224 Translation initiation factor 2, gamma subunit (eIF-2gamma; GTPase)
(Фактор инициации трансляции 2, гамма-субьединица)
J - Translation, ribosomal structure and biogenesis
(Трансляция, рибосомная структура и биогенез)
COG28952.39e-2911-356 Sulfate adenylyltransferase subunit 1, EFTu-like GTPase family
(Сульфат аденилаттрансферазная субъединица 1, семейство EFTu-подобных ГТФаз)
P - Inorganic ion transport and metabolism
(Транспорт и обмен неорганических ионов)
COG04809.53e-213-139 Translation elongation factor EF-G, a GTPase
(Фактор элонгации трансляции EF-G, ГТФаза)
J - Translation, ribosomal structure and biogenesis
(Трансляция, рибосомная структура и биогенез)
COG12171.94e-128-134 Predicted membrane GTPase involved in stress response
(Мембранная ГТФаза, участвующая в ответе на стресс)
T - Signal transduction mechanisms
(Механизмы передачи сигнала)
COG22292.85e-081-120 Signal recognition particle receptor subunit beta, a GTPase
(Бета-субъединица рецептора распознавания сигнала, GTPase)
U - Intracellular trafficking, secretion, and vesicular transport
(Внутриклеточный обмен, секреция и везикулярный транспорт)
COG11594.51e-0861-170 GTPase Era, involved in 16S rRNA processing
(GTPase Era, вовлеченная в процессинг 16S рРНК)
J - Translation, ribosomal structure and biogenesis
(Трансляция, рибосомная структура и биогенез)
COG22623.74e-072-188 50S ribosomal subunit-associated GTPase HflX
(50S рибосомальная субъединица-ассоциированная ГТФаза HflX)
J - Translation, ribosomal structure and biogenesis
(Трансляция, рибосомная структура и биогенез)
COG02186.87e-0760-170 GTP-binding protein EngB required for normal cell division
(GTP-связывающий белок EngB, необходим для нормального деления клеток)
D - Cell cycle control, cell division, chromosome partitioning
(Контроль клеточного цикла, деление клеток, разделение хромосом)
COG41089.16e-0713-138 Peptide chain release factor RF-3
(Фактор высвобождения пептидной цепи RF-3)
J - Translation, ribosomal structure and biogenesis
(Трансляция, рибосомная структура и биогенез)
COG04819.29e-074-166 Translation elongation factor EF-4, membrane-bound GTPase
(Фактор элонгации трансляции EF-4, мембраносвязанная ГТФаза)
J - Translation, ribosomal structure and biogenesis
(Трансляция, рибосомная структура и биогенез)
COG05327.36e-2112-216 Translation initiation factor IF-2, a GTPase
(Фактор инициации трансляции IF-2, ГТФаза)
J - Translation, ribosomal structure and biogenesis
(Трансляция, рибосомная структура и биогенез)
Таблица 1. КОГи для белка ANU26136.1

Далее было необходимо получить изображение геномного окружения КОГа c помощью сервиса COGNAT. Из множества обнаруженных КОГов я выбрала один с наилучшим E-value, а именно COG3276.
Параметры запуска: Neighbourhood size - 9 (для отображения близких организмов), Occurence Threshold - 10%, Taxonomy - Нет.


Рисунок 2. Геномное окружение COG1560.

Для определенных групп организмов окружение достаточно консервативно. В этих группах, в встречается белок COG1921 (бирюзовый) - гSeryl-tRNA(Sec) selenium transferase, который катализирует реакцию L-seryl-tRNASec + selenophosphate = L-selenocysteinyl-tRNASec + phosphate. Он относится к той же функциональной группе, что и наш белок - функциональной группе трансляции, рибосомной структуры и биогенеза.
Также можно заметить, что консервативных позиций довольно много слева от нашего гена и гораздо меньше справа.
Достаточно часто встречаются белки COG0709 (светло-зеленый) - селенофосфатсинтаза, который относится к функциональной группе транспорта и метаболизма аминокислот, и COG3058 относящийся к группе посттрансляционной модификации, белкового обмена, шаперонов, однако встречаются они у произвольных организмов.

Отнесение селеноцистеин-специфичного фактора элонгации трансляции из бактерии Planococcus versutus к терминам GO

С помощью инструмента AmiGO поиком BLAST в базе данных GO был обнаружен белок, наиболее похожий на ANU26136.1. (UniProtKB - A0A1B1RYY2 (A0A1B1RYY2_9BACL)). Им оказался белок Q3AB62 - селеноцистеин-специфичный фактор элонгации трасляции из организма Carboxydothermus hydrogenoformans Z-2901 (P-value = 7.4e-98). Выданный мне белок выполняет ту же функцию, но принадлежит другому организму - Planococcus versutus. Тем не менее эти бактерии достаточно близки и обе относятся к кладе Firmicutes.

На странице белка Q3AB62 (CHY_1802) по ссылке N term associations была получена информация о терминах GO, отнесенных к данному белку. Их оказалось всего 3. Найденные термины представлены в таблице 3.

АспектИдентификатор GOНазвание терминаПеревод названия Код типа достоверности
Биологический процесс
(Biological process)
GO:0001514 Selenocysteine incorporationВключение селеноцистеина в пептид ISS
Биологический процесс
(Biological process)
GO:0006414 Translational elongation Элонгация трансляцииISS
Молекулярная функция
(Molecular function)
GO:0003746 Translation elongation factor activity Активность элонгации трансляцииISS
Таблица 3. Термины GO, отнесенные к белку с идентификатором Uniprot Q3AB62

Объяснения встречающихся в таблице 3 кодов достоверности представлены в таблице 4.


Код типа достоверностиРасшифровка кодаОбъяснение
ISSInferred from Sequence or Structural Similarity (основан на сходстве последовательностей или структурном сходстве) Используется, когда аннотация проводилась на основании анализа последовательностей и этот анализ был проверен вручную. Если же проводился только автоматический анализ, корректным является использование кода IEA.
Общий код ISS используется при применение комбинации инструментов и методов. Если был применен только один метод/инструмент используют одну из подкатегорий ISS: ISA (Inferred from Sequence Alignment) - заключение на основании парного или множественного выравнивания, ISO (Inferred from Sequence Orthology) - заключение на основании оценки ортологичности продуктов генов из разных организмов, ISM (Inferred from Sequence Model) - заключение на основании какого-либо метода моделирования (например Hidden Markov Models).
На практике код ISS крайне редко применяют для аннотации, основанной только на информации о структуре. ISS обычно основывается на нескольких типах доказательств на основе сходства последовательностей
Таблица 4. Описание кодов достоверности

© Raldugina Vasilisa 2016