Геномное окружение. База данных GO


1. Получение информации о КОГе, к которому относится белок

Для работы использовался белок, выданный в I семестре. Это белок пилин pilA из генома бактерии Neisseria meningitidis. Последовательность этого белка в fasta-формате была вставлена в поле поиска сервиса CDD. Для получения результатов был выбран режим View>Full Results. Был найден только один КОГ, информация о нём приведена в таблице 1.

Таблица 1. Информация о найденном КОГе
COG ID Название e-value Остатки белка, соответствующие КОГу Функциональная категория
COG4969 Tfp pilus assembly protein, major pilin PilA 5.66e-20 3-92 Cell motility, Extracellular structures


2. Визуализация геномного окружения

Для КОГа COG4969 было получено геномное окружение с помощью сервиса COGNAT. При установке параметра Occurence threshold = 20% не был найден исходный ген. После понижения этого параметра до 10% Полученные результаты можно скачасть по ссылке: cognat.pdf . Часть полученной картины представлена на рис. 1.

Таким образом, параметры: Occurence threshold = 10%, Neighborhood size = 9, Taxonomy = "ДА"). Каждая стралка на рисунке соответствует 1-ому COG. Если cтрелка окрашена, значит соответсвующий COG, встречается более, чем в 10% находок. Искомый COG обозначен короткой красной стрелкой. Геномное окружение COG4969 в целом не очень консервативно. Возможно, это связано с тем, что исследуемый белок, видимо, встречается у небольшого числа таксонов. У многих видов имеются родственные белки (например, pilE). То, что геномное окружение пилина не консервативно - довольо ожидаемо, так как он редко входит в какие-либо сложные комплексы. Однако, можно заметить, что есть блок из нескольких видов, геномное окружение которых, консервативно. В нескольких местах я отметила дупликации исходного белка.

Рис. 1 Геномное окружение

3. Отнесение белка Pol protein (A0F4L9_9HIV1) из генома Human immunodeficiency virus 1 к терминам GO

С помощью инструмента AmiGO поиском BLAST в БД GO я искала белок, наиболее похожий на мой.
P-value = 2.4e-37
Identities = 73/96 (76%)
Positives = 83/96 (86%)
Организмы, которым принадлежат данные белки, совпадают В таблице 1 описаны все GO, отнесенные к исследуемому белку (Term Associations).

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Биологический процесс
(biological process)
GO:0005515 Protein binding Связывание белков IPI


Код типа достоверности Расшифровка кода типа достоверности Объяснение
IPI Inferred from Physical Interaction Используется для аннотации физических взаимодействий между белками и другими белками, или ионами.

Назад