Выбранное семейство доменов - центральный АТФазный домен АВС-транспортеров бактерий или P-loop домен.
Name: P-loop domain
Индетификаторы
Число последовательностей в seed*: 30
Число последовательностей в full*: 1006
Число белков: 4k, из них 1 в Swiss-Prot
Число доменных архитектур*: 8
Про доменные архитектуры:
АВС-транспортеры бактерий имеют сходство (гомологичны) по последовательности и структуре с доменом основного белка (MRB1590) митохондриального РНК-связывающнго комплекса 1 (MRB1) кинетопластид. Поскольку информация о доменах в InterPro отсылается именно к данному белку, рассмотрим доменные архитектуры на его примере. MRB1590 является димерным белком, мономер которого состоит из N-концевого (ATPase of the ABC class N-terminal),
центрального АТФазого (P-loop domain) и С-концевого (MRB1590 C-terminal domain) доменов. В димере центральные домены образуют центральную ABC-АТФазную складку (central ABC-ATPase fold) [1].
Соответственно, большинство белков (в количестве 3229) с анализируемым доменом будут иметь доменную архитектуру, представленную на рис.1. Далее по распрастраненности следуют архитектуры,
в которых утрачен один или оба концевых участка.
Про функции:
(семейство) ABC транспортеры относятся к ATP-Binding Cassette (ABC) superfamily, это одно из самых больших белковых семейств с различными физиологическими функциями.
ABC транспортеры участвуют в экспорте или импорте широкого спектра субстратов, начиная от небольших ионов и заканчивая макромолекулами. Подробнее: IPR019195, ABC_ATPase_put
(домен) P-loop домен относится к клану P-loop_NTPase доменов. Данные домены являются каталитическими, используют энергию гидролиза АТФ для протекания сопряженных реакци, связывают натрий. Эти домены участвуют почти во всех биохимических и механических процессах в клетке [2].
Про структуры:
Исходя из упомянутой выше гомологии, 3 из 4 представленных структур являются MRB1590, но также есть структура, принадлежащая бактерии Vibrio vulnificus.
Рассмотрим мономер с выделенным анализируемым доменом. В структуре присутствуют как a-спирали, так и b-листы.
Таксономическая распрастраненность:
Семейство доменов наиболее широко распространено среди бактерий (2210 вида), обнаружено у архей (120 видов) и среди эукариот (352 вида), по большей части у протистов.
Из интересного, подобный домен нашли у шестилучевых кораллов.
Выравнивание seed, содержащее 28 последовательностей, было скачано в фрмате seed.gz, затем распаковано на kodomo и с помощью команды seqret переведено в fasta формат. Анализ выравнивания проводился в JalView. Ссылка на проект.
Максимальные достоверные блоки, включающие все последовательности. При пороге идентичности 100% наблюдается 21 абсолютно консервативная позиция. По данным позициям можно выделить максимальные достоверные блоки с абсолютной консервативностью: 121-123, 194-196. С функциональной консервативностью можно выделить участок 102-107.
Максимально достоверный блок, включающий не все последовательности. С абсолютной консервативностью: 170-176.
Участок без достоверных подблоков. 76-86
Гомология, по большей части функциональная консервативность, просматривается по всей длине выравнивания. Наибольшее количество консервативных участоков расположена ближе к середине выравнивания. Наблюдается сходство для отдельных последовательнотсей, то есть подмножеств, главным образом для участка 170-176 (отдельное окно). Для остальных участков группы мелчают, сложно говорить об общей гомологии. Пример концевого участвка, для которого маловероятно, что выравнивание отражает ход эволюции - 76-86, т.к. все последовательности разбиваются на группы по одному (отдельное окно). Также есть несколько последовательностей, которые выбиваются из общего выравнивания и обуславливают индели на концах.
Были выбраны доменные архитектуры PF20446-PF09818-PF09818-PF21117, включающий два концевых домена, исследуемый домен и его часть, и PF09818-PF09818, включающий только исследуемый домен и его часть. Ссылка на проект.
На всей длине выравнивания наблюдаются высоко консервативные участки, при чем как для белков с первой доменной структурой, так и для второй.
Общие максимальные достоверные блоки: 566, 594 абсолютно консервативны; 622 функционально консервативна.
В выравнивании наблюдается множество достоверных подблоков. Они включают белки и с первой архитектурой, и со второй. Например, на участках 456-458, 559-564, 589-594, 625-627, 810-815
наблюдается как абсолютная, так и функциональная консервативность подмножест (некоторые приведены в отдельном окне).
Таких участков, на которых можно говорить о консервативности белков из разных доменных архитектур, независимо друг от друга, я не увидела (так как они не выравниваются и содержат много гэпов). Вероятно, руководствуясь данным результатом, можно говорить о высокой степени гомологичности исследуемого домена, то есть его незначительную эволюции для большинства белков.
E-value 4e-56
Per. Ident. 39.06%
Наблюдаются участки локального сходства в первой половине последовательностей и один участок на конце последовательности.
На графике имеется много разрывов, линии не являются непрерывными, из чего можно сделать вывод, что данные области мало похожи друг друга и имеется много гэпов.
вероятно, чтобы получить более демонстративные результаты, необходимо сравнивать другие доменные архитектуры, а не данную пару.
* по данным таблицы, предложенной для выполнения задания. На InterPro цифры отличаются.
Источники: