Практикум №11

1. Выбор семейства доменов

Семейство доменов с подходящими под ограничения параметрами было выбрано случайным образом.

2. Описание семейства доменов

- Название: MazG C-terminal domain (Домен имеет консервативный мотив DxYRxHDxxH, указывающий на каталитическую активность. Основываясь на более широком контексте модификации ДНК, предлагается функционировать как нуклеотидкиназа [1].)

- ID: MazG_C

- AC: PF18722

- Число последовательностей full: 150; Число последовательностей в выравнивании seed: 30

- Число доменных архитектур: 3

- Доменная архитектура Q82RC7_STRAW имеет 88 белков; Доменная архитектура T0GKB4_9SPHN имеет 59 белков

- 3D-структуры не представлены

- В Bacteria 150 белков

- Дата создания HMM-профиля: февраль, 2015 г.; Число позиций: 190

3. Построение карты локального сходства

Карта локального сходства двух белков с разной доменной архитектурой представлена ниже (ось Х - Q82RC7_STRAW, ось Y - A0A4Y9Q7R7_9ACTN):

1

По разрывам прямой графика можно сделать вывод о том, что был ряд небольших вставок, замен или делеций. Самый большой разрыв 10 нуклеотидов (участки карты: 50-60). Последовательность аминокислот с 1 по 130 первого белка (Q82RC7_STRAW) частично совпадает с последовательностью аминокислот второго белка (T0GKB4_9SPHN). Также совпадают участки с 45 по 130 1-ого белка и с 130 по 215 2-ого белка. Можно предположить, что в T0GKB4_9SPHN произошла дупликация участка аминокислот с 1 по 130.

4. Выделение двух подгрупп доменов на основании множественного выравнивания

Ссылка на проект Jalview

С помощью дерева были выделены две крупные подгруппы. В выравнивании они окрашены в желтый (1-ая подгруппа) и розовый (2-ая подгруппа) цвета.

Различия между двумя подгруппами:

2

5. Сохранение таблицы со всеми белками из UniProt, содержащими данный домен

Таблица с необходимыми колонками в формате Excel доступна для скачивания ниже:

Таблица с белками из Uniprot

В качестве уровня таксономии было выбрано царство (Kingdom).

Видно, что в записях семейства все имеют статус Unreviewed.

Ссылки на источники:

1. Iyer LM, Zhang D, Burroughs AM, Aravind L;, Nucleic Acids Res. 2013;41:7635-7655.: Computational identification of novel biochemical systems involved in oxidation, glycosylation and other complex modifications of bases in DNA. PUBMED:23814188 EPMC:23814188