Геномное окружение. База данных GO
Получение информации о КОГе белка
В первом семестре мне был выдан белок ANU26136.1. Белок является селеноцистеин-специфичным фактором элонгации трансляции из бактерии Planococcus versutus. Всего в нем 634 аминокислотных остатка.
С помощью сервиса CDD (Conserved Domain Database) для данного белка был получен список хитов (Рис. 1), из которого были выбраны те, которые относят белок к тому или иному КОГу.
![](pr6.1.png) Рисунок 1. Список хитов для белка ANU26136.1
Таких хитов, соответственно и КОГов, оказалось 15. Информация по каждому из КОГов была получена из последнего релиза базы данных и представлена в Таблице 1.
ID | E-value | Координаты |
Название | Функциональная категория |
COG3276 | 2.34e-95 | 8-468 |
Selenocysteine-specific translation elongation factor (Селеноцистеин-специфичный фактор элонгации трансляции) |
J - Translation, ribosomal structure and biogenesis (Трансляция, рибосомная структура и биогенез) |
COG0050 | 1.74e-50 | 1-356 |
Translation elongation factor EF-Tu, a GTPase
(Фактор элонгации трансляции EF-Tu, ГТФаза) |
J - Translation, ribosomal structure and biogenesis (Трансляция, рибосомная структура и биогенез) |
COG5256 | 2.11e-41 | 2-350 |
Translation elongation factor EF-1alpha (GTPase) (Фактор элонгации трансляции EF-1alpha, ГТФаза) |
J - Translation, ribosomal structure and biogenesis (Трансляция, рибосомная структура и биогенез) |
COG5258 | 9.30e-39 | 7-359 |
GTPase
(ГТФаза) |
R - General function prediction only
(Предсказание только общей функции) |
COG5257 | 4.76e-37 | 8-224 |
Translation initiation factor 2, gamma subunit (eIF-2gamma; GTPase)
(Фактор инициации трансляции 2, гамма-субьединица) |
J - Translation, ribosomal structure and biogenesis (Трансляция, рибосомная структура и биогенез) |
COG2895 | 2.39e-29 | 11-356 |
Sulfate adenylyltransferase subunit 1, EFTu-like GTPase family
(Сульфат аденилаттрансферазная субъединица 1, семейство EFTu-подобных ГТФаз) |
P - Inorganic ion transport and metabolism (Транспорт и обмен неорганических ионов) |
COG0480 | 9.53e-21 | 3-139 |
Translation elongation factor EF-G, a GTPase
(Фактор элонгации трансляции EF-G, ГТФаза) |
J - Translation, ribosomal structure and biogenesis (Трансляция, рибосомная структура и биогенез) |
COG1217 | 1.94e-12 | 8-134 |
Predicted membrane GTPase involved in stress response
(Мембранная ГТФаза, участвующая в ответе на стресс) |
T - Signal transduction mechanisms (Механизмы передачи сигнала) |
COG2229 | 2.85e-08 | 1-120 |
Signal recognition particle receptor subunit beta, a GTPase
(Бета-субъединица рецептора распознавания сигнала, GTPase) |
U - Intracellular trafficking, secretion, and vesicular transport (Внутриклеточный обмен, секреция и везикулярный транспорт) |
COG1159 | 4.51e-08 | 61-170 |
GTPase Era, involved in 16S rRNA processing
(GTPase Era, вовлеченная в процессинг 16S рРНК) |
J - Translation, ribosomal structure and biogenesis (Трансляция, рибосомная структура и биогенез) |
COG2262 | 3.74e-07 | 2-188 |
50S ribosomal subunit-associated GTPase HflX
(50S рибосомальная субъединица-ассоциированная ГТФаза HflX) |
J - Translation, ribosomal structure and biogenesis (Трансляция, рибосомная структура и биогенез) |
COG0218 | 6.87e-07 | 60-170 |
GTP-binding protein EngB required for normal cell division
(GTP-связывающий белок EngB, необходим для нормального деления клеток) |
D - Cell cycle control, cell division, chromosome partitioning (Контроль клеточного цикла, деление клеток, разделение хромосом) |
COG4108 | 9.16e-07 | 13-138 |
Peptide chain release factor RF-3
(Фактор высвобождения пептидной цепи RF-3) |
J - Translation, ribosomal structure and biogenesis (Трансляция, рибосомная структура и биогенез) |
COG0481 | 9.29e-07 | 4-166 |
Translation elongation factor EF-4, membrane-bound GTPase
(Фактор элонгации трансляции EF-4, мембраносвязанная ГТФаза) |
J - Translation, ribosomal structure and biogenesis (Трансляция, рибосомная структура и биогенез) |
COG0532 | 7.36e-21 | 12-216 |
Translation initiation factor IF-2, a GTPase
(Фактор инициации трансляции IF-2, ГТФаза) |
J - Translation, ribosomal structure and biogenesis (Трансляция, рибосомная структура и биогенез) |
Таблица 1. КОГи для белка ANU26136.1 |
Далее было необходимо получить изображение геномного окружения КОГа c помощью сервиса COGNAT.
Из множества обнаруженных КОГов я выбрала один с наилучшим E-value, а именно COG3276.
Параметры запуска: Neighbourhood size - 9 (для отображения близких организмов), Occurence Threshold - 10%, Taxonomy - Нет.
![](cog.png) Рисунок 2. Геномное окружение COG1560.
Для определенных групп организмов окружение достаточно консервативно. В этих группах, в встречается белок COG1921 (бирюзовый) - гSeryl-tRNA(Sec) selenium transferase, который катализирует реакцию L-seryl-tRNASec + selenophosphate = L-selenocysteinyl-tRNASec + phosphate. Он относится к той же функциональной группе, что и наш белок - функциональной группе трансляции, рибосомной структуры и биогенеза.
Также можно заметить, что консервативных позиций довольно много слева от нашего гена и гораздо меньше справа.
Достаточно часто встречаются белки COG0709 (светло-зеленый) - селенофосфатсинтаза, который относится к функциональной группе транспорта и метаболизма аминокислот, и COG3058 относящийся к группе посттрансляционной модификации, белкового обмена, шаперонов, однако встречаются они у произвольных организмов.
Отнесение селеноцистеин-специфичного фактора элонгации трансляции из бактерии Planococcus versutus к терминам GO
С помощью инструмента AmiGO поиком BLAST в базе данных GO был обнаружен белок, наиболее похожий на ANU26136.1. (UniProtKB - A0A1B1RYY2 (A0A1B1RYY2_9BACL)). Им оказался белок Q3AB62 - селеноцистеин-специфичный фактор элонгации трасляции из организма Carboxydothermus hydrogenoformans Z-2901 (P-value = 7.4e-98). Выданный мне белок выполняет ту же функцию, но принадлежит другому организму - Planococcus versutus. Тем не менее эти бактерии достаточно близки и обе относятся к кладе Firmicutes.
На
странице белка Q3AB62 (CHY_1802) по ссылке N term associations
была получена информация о терминах GO, отнесенных к данному белку.
Их оказалось всего 3. Найденные термины представлены в таблице 3.
Аспект | Идентификатор GO | Название термина | Перевод названия |
Код типа достоверности |
Биологический процесс (Biological process) | GO:0001514 |
Selenocysteine incorporation | Включение селеноцистеина в пептид |
ISS |
Биологический процесс (Biological process) | GO:0006414 |
Translational elongation |
Элонгация трансляции | ISS |
Молекулярная функция (Molecular function) | GO:0003746 |
Translation elongation factor activity |
Активность элонгации трансляции | ISS |
Таблица 3. Термины GO, отнесенные к белку с идентификатором Uniprot Q3AB62 |
Объяснения встречающихся в таблице 3 кодов достоверности представлены в таблице 4.
Код типа достоверности | Расшифровка кода | Объяснение |
ISS | Inferred from Sequence or Structural Similarity
(основан на сходстве последовательностей или структурном сходстве) |
Используется, когда аннотация проводилась на основании анализа последовательностей и этот анализ был проверен вручную. Если же проводился только автоматический анализ,
корректным является использование кода IEA. Общий код ISS используется при применение комбинации инструментов и методов. Если был применен только один
метод/инструмент используют одну из подкатегорий ISS: ISA (Inferred from Sequence Alignment)
- заключение на основании парного или множественного выравнивания, ISO
(Inferred from Sequence Orthology) - заключение на основании оценки ортологичности продуктов генов
из разных организмов, ISM (Inferred from Sequence Model) - заключение на основании какого-либо
метода моделирования (например Hidden Markov Models).
На практике код ISS крайне редко применяют для аннотации, основанной только на информации о структуре. ISS обычно основывается на нескольких типах доказательств на основе сходства последовательностей
|
Таблица 4. Описание кодов достоверности |
© Raldugina Vasilisa 2016 |