Семейство доменов с подходящими под ограничения параметрами было выбрано случайным образом.
- Название: MazG C-terminal domain (Домен имеет консервативный мотив DxYRxHDxxH, указывающий на каталитическую активность. Основываясь на более широком контексте модификации ДНК, предлагается функционировать как нуклеотидкиназа [1].)
- ID: MazG_C
- AC: PF18722
- Число последовательностей full: 150; Число последовательностей в выравнивании seed: 30
- Число доменных архитектур: 3
- Доменная архитектура Q82RC7_STRAW имеет 88 белков; Доменная архитектура T0GKB4_9SPHN имеет 59 белков
- 3D-структуры не представлены
- В Bacteria 150 белков
- Дата создания HMM-профиля: февраль, 2015 г.; Число позиций: 190
Карта локального сходства двух белков с разной доменной архитектурой представлена ниже (ось Х - Q82RC7_STRAW, ось Y - A0A4Y9Q7R7_9ACTN):
По разрывам прямой графика можно сделать вывод о том, что был ряд небольших вставок, замен или делеций. Самый большой разрыв 10 нуклеотидов (участки карты: 50-60). Последовательность аминокислот с 1 по 130 первого белка (Q82RC7_STRAW) частично совпадает с последовательностью аминокислот второго белка (T0GKB4_9SPHN). Также совпадают участки с 45 по 130 1-ого белка и с 130 по 215 2-ого белка. Можно предположить, что в T0GKB4_9SPHN произошла дупликация участка аминокислот с 1 по 130.
С помощью дерева были выделены две крупные подгруппы. В выравнивании они окрашены в желтый (1-ая подгруппа) и розовый (2-ая подгруппа) цвета.
Различия между двумя подгруппами:
Таблица с необходимыми колонками в формате Excel доступна для скачивания ниже:
В качестве уровня таксономии было выбрано царство (Kingdom).
Видно, что в записях семейства все имеют статус Unreviewed.
1. Iyer LM, Zhang D, Burroughs AM, Aravind L;, Nucleic Acids Res. 2013;41:7635-7655.: Computational identification of novel biochemical systems involved in oxidation, glycosylation and other complex modifications of bases in DNA. PUBMED:23814188 EPMC:23814188