Геномное окружение. Онтология GO


← Term 4

Задание 1 (Получение информации о КОГе)

Для большей информативности, ниже приведена последовательность моего белка NP_603408.1:

>gi|19703846|ref|NP_603408.1| D-lactate dehydrogenase
MQKTKIIFFDIKDYDKEFFKKYGADYNFEMTFLKVRLTEETANLTKGYDVVCGFANDNIN
KETIDIMAENGIKLLAMRCAGFNNVSLKDVNERFKVVRVPAYSPHAIAEYTVGLILAVNR
KINKAYVRTREGNFSINGLMGIDLYEKTAGIIGTGKIGQILIKILRGFDMKVIAYDLFPN
QKVADELGFEYVSLDELYANSDIISLNCPLTKDTKYMINRRSMLKMKDGVILVNTGRGML
IDSADLVEALKDKKIGAVALDVYEEEENYFFEDKSTQVIEDDILGRLLSFYNVLITSHQA
YFTKEAVGAITVTTLNNIKDFVEGRPLVNEVPQNQ

Результаты выполнения первого задания содержатся в Таблице 1.

Таблица 1. Характеристики КОГов из хитов поиска CDD
IDE-valueИнтервалНазваниеФункциональная
категория
COG10524.50e-1204-334 Lactate dehydrogenase or related 2-hydroxyacid dehydrogenase

(Лактат-дегидрогеназа или родственная 2-гидроксикислотная дегидрогеназа)
[Energy production and conversion]
Выработка и преобразование энергии

COG01113.49e-771-333 Phosphoglycerate dehydrogenase or related dehydrogenase

(Фосфоглицерин дегидрогеназа или родственная дегидрогеназа)
[Coenzyme transport and metabolism]
Коэнзимный транспорт и метаболизм

COG03732.56e-04143-204 Glutamyl-tRNA reductase

(Глутамил-тРНК редуктаза)
[Coenzyme transport and metabolism]
Коэнзимный транспорт и метаболизм

COG04992.01e-03147-254 S-adenosylhomocysteine hydrolase

(S-Аденозилгомоцистеин гидролаза)
[Coenzyme transport and metabolism]
Коэнзимный транспорт и метаболизм

Задание 2 ( Визуализация геномного окружения )

При помощи базы данных STRING я получила визуализацию геномного окружения для КОГа с лучшим e-value (COG1052). Для поиска были установлены следующие параметры: минимальная требуемая оценка взаимодействия - 4.000; максимальное число отображаемых взаимодействий со входной последовательностью - не более чем 10 взаимодействующих белков. На рисунке 1 представлен граф взаимодействий, на рисунке 2 расшифровка взаимодействий, а на рисунке 3 найденные КОГи и их взаимодействия.

Рис. 1. Граф взаимодействий
Рис. 2. Расшифровка взаимодействий
Рис. 3. Найденные КОГи и их взаимодействия

На рисунке один представлен граф, вершинами которого являются КОГи а ребра графа отражают наличие свидетельств о существовании связи между их белками. На рисунке 2 показано что обозначают разные цвета ребер графа. Голубой (Из курируемых баз данных) и розовый (Доказанные экспериментально) цвета обозначают известные взаимодействия. Зеленый (Соседство генов), красный (Слияние генов) и синий (Совместное нахождение генов) цвета для предсказанных взаимодействий. Оставшиеся цвета : желтый (Совместные упоминания), черный (Совместная экспрессия) и фиолетовый (Гомология белков) для остальных типов. Из таблицы на рисунке 3 видно, что экспериментально доказанных взаимодействий 3 из 10, но все 10 взяты из различных баз данных. Все находки подтверждены совместным упоминанием в литературе.

На рисунке 3 мы видим, что столбец Neighborhood тускло выражен, это первый сигнал что нет консервативного окружения. На 4 рисунке (ниже) мы не видим повторяющихся паттернов. Так что ответом на вопросы будет то, что консервативного окружения нет.

Рис. 4. Соседство генов
Рис. 5. Совместная встречаемость генов

Задание 3 ( отнесение белка FN0511 - D-lactate dehydrogenase из Fusobacterium к терминам GO )

Я использовала поиск по fasta-последовательности белка сервиса AmiGO. Лучшая находка - D-lactate dehydrogenase из Shewanella oneidensis MR-1 с e-value = 8.1e-76, identities = 150/328 (45%), positives = 217/328 (66%). Могу предположить что это очень близкий гомолог к нашему белку. Его идентификатор в Uniprot - Q8EI78. Он имеет две ассоциации. В таблице 2 указаны термины GO, отнесенные к нашему белку.

Таблица 2.
АспектИдентификатор GOНазвание терминаПеревод названия терминаКод типа достоверности
Biological processGO:0006113fermentation Ферментация ISS
Molecular functionGO:0008720D-lactate dehydrogenase activity Д-Лактат-дегидрогеназная активность ISS

Код типа достоверности ISS расшифровывается как Inferred from Sequence Similarity. Данный код присваевается если анализ был основан на последовательностях и обзор доказательств и аннотаций делается вручную. В итоге мы нашли ближайший гомолог нашего белка с терминами GO.

© Mishchenko Polina 2017