Геномное окружение. База данных GO

Задание 1: Получение информации о КОГе, к которому относится ваш белок.

В данном практикуме необходимо было использовать белок, выданный в 1 семестре. В моем случае - это белок с ID: YP_005889234.1 организма Neisseria gonorrhoeae TCDC-NG08107.
Однако КОГ не был найден для данного белка, поэтому был взят белок организма того же вида с ID: OIA98365.1 (последовательность в формате fasta). Был найден 1 хит (RpsK), относящийся к КОГу. В таблице 1 содержится основная информация о КОГе, полученная с помощью сервиса CDD (Conserved Domain Database) - Submit-View-Full Results. А с помощью последнего релиза базы данных были найдены название данного КОГа и функциональная категория, к которой он относится.

Таблица 1 - Информация о КОГе

Параметр Значение
Идентификатор КОГа COG0100
Название КОГа (eng) Ribosomal protein S11
Название КОГа (rus) Рибосомальный белок S11
Функциональная категория (категории) (eng) J (Translation, ribosomal structure and biogenesis)
Функциональная категория (категории) (rus) J (Трансляция, рибосомальная структура и биогенезис)
Interval (с какого по какой остаток белка в нем обнаруживается КОГ) 1 - 131
Величина e-value для отнесения Вашего белка к данному КОГу 1.68e-61
Сколько всего остатков в белке 131

Задание 2: Визуализация геномного окружения.

С помощью STRING было получено изображение взаимодействий для данного КОГа (рис. 1). Поиск в программе был проведен с помощью поиска по последовательности белка в пределах вида Neisseria gonorrhoeae.

Рис. 1.1 - Соседство генов - увеличение при нажатии

Рис. 1 - Граф взаимодействий STRING

Как можно видеть, изображение представляет собой граф. Ребра представляют собой взаимодействия, узлы - белки, которые продуцируются одним и тем же белок-кодирующим геном. Узел большого размера изображает белки, пространственная структура которых известна или предсказана, узел малого размера - белки, пространственная структура которых неизвестна. На рис. 2 представлены виды взаимодействий.
Цвета: черный - ко-экспрессия; голубой - гомология белков; салатовый - совместное упоминание; зеленый - генное соседство; красный - слияние генов; синий - генная совместная встречаемость; лазурный - взаимодействия, полученные из курированных баз данных; фуксия - экспериментально доказанные взаимодействия.

Рис. 2 - Виды взаимодействий


На рис. 3 представлены белки геномного окружения с некоторой информацией по взаимодействиям. Наш белок имеет как экспериментально доказанные взаимодействия со всеми остальными белками, так и полученные из курированных баз данных, однако в графе "гомология" не показано, что белки являются гомологичными (скорее всего - белки не гомологичны). Отсюда можно сделать вывод, что консервативного окружения, скорее всего, нет.

Рис. 3 - Белки геномного окружения

Задание 3: Отнесение белка S11 из Neisseria gonorrhoeae к терминам GO.

С помощью поиска Blast AmiGO обнаружен белок, совпадающий с моим. Он имеет: P-value: 9.4e-66; High Score: 669; Expect = 9.4e-66; Identities = 129/129 (100%); Positives = 129/129 (100%). Выравнивание двух последовательностей + информация по белку (ссылка). Найденный белок относится к организму Escherichia coli K-12, а мой белок - к Neisseria gonorrhoeae MS11. Оба организма относятся к Протеобактериям. Далее необходимо было перейти со страницы найденного белка в раздел "Term Associations" и заполнить таблицу 2.

Таблица 2 - Термины GO, отнесенные к белку с идентификатором Uniprot P0A7R9 (RS11_ECOLI)

Аспект Идентификатор GO Название термина Перевод названия термина Код типа достоверности
Molecular function (молекулярная функция) GO:0003735 Structural constituent of ribosome Структурная составляющая рибосомы IDA
Molecular function (молекулярная функция) GO:0070181 Small ribosomal subunit rRNA binding Связывание малой рибосомальной субъединицы рРНК IDA
Cellular component (клеточный компонент) GO:0022627 Cytosolic small ribosomal subunit Цитозольная малая рибосомальная субъединица IDA
Cellular component (клеточный компонент) GO:0005829 Cytosol Цитозоль IDA

Далее необходимо было заполнить таблицу для всех кодов типов достоверности. В моем случае был найден всего один код (IDA), поэтому я решила не создавать таблицу, а описать все в текстовом формате.
Расшифровка кода типа достоверности: Inferred from Direct Assay (IDA).
Объяснение: Код присваивается в случае, когда был проведен прямой анализ (исследование), в результате которого были идентифицированы функции, процесс или компоненты, определенные GO термином.
Таким образом, данный код задает неплохой уровень достоверности.