практикум №11

Pfam, ...

Гомология и выравнивание доменов


1-2. Выбор и описание семейства доменов

Выбранное семейство доменов - центральный АТФазный домен АВС-транспортеров бактерий или P-loop домен.

Name: P-loop domain

Индетификаторы

Число последовательностей в seed*: 30

Число последовательностей в full*: 1006

Число белков: 4k, из них 1 в Swiss-Prot

Число доменных архитектур*: 8

Про доменные архитектуры:
АВС-транспортеры бактерий имеют сходство (гомологичны) по последовательности и структуре с доменом основного белка (MRB1590) митохондриального РНК-связывающнго комплекса 1 (MRB1) кинетопластид. Поскольку информация о доменах в InterPro отсылается именно к данному белку, рассмотрим доменные архитектуры на его примере. MRB1590 является димерным белком, мономер которого состоит из N-концевого (ATPase of the ABC class N-terminal), центрального АТФазого (P-loop domain) и С-концевого (MRB1590 C-terminal domain) доменов. В димере центральные домены образуют центральную ABC-АТФазную складку (central ABC-ATPase fold) [1]. Соответственно, большинство белков (в количестве 3229) с анализируемым доменом будут иметь доменную архитектуру, представленную на рис.1. Далее по распрастраненности следуют архитектуры, в которых утрачен один или оба концевых участка.

Рис. 1
Рис. 1. наиболее распрастраненная доменная архитектура.

Про функции:
(семейство) ABC транспортеры относятся к ATP-Binding Cassette (ABC) superfamily, это одно из самых больших белковых семейств с различными физиологическими функциями. ABC транспортеры участвуют в экспорте или импорте широкого спектра субстратов, начиная от небольших ионов и заканчивая макромолекулами. Подробнее: IPR019195, ABC_ATPase_put

(домен) P-loop домен относится к клану P-loop_NTPase доменов. Данные домены являются каталитическими, используют энергию гидролиза АТФ для протекания сопряженных реакци, связывают натрий. Эти домены участвуют почти во всех биохимических и механических процессах в клетке [2].

Про структуры:
Исходя из упомянутой выше гомологии, 3 из 4 представленных структур являются MRB1590, но также есть структура, принадлежащая бактерии Vibrio vulnificus. Рассмотрим мономер с выделенным анализируемым доменом. В структуре присутствуют как a-спирали, так и b-листы.

Рис. 2
Рис. 2. связывание АТФ в активном центре, АТФазном домене.
Рис. 3
Рис. 3. расположение АТФазного домена в структуре мономера.

Таксономическая распрастраненность:
Семейство доменов наиболее широко распространено среди бактерий (2210 вида), обнаружено у архей (120 видов) и среди эукариот (352 вида), по большей части у протистов. Из интересного, подобный домен нашли у шестилучевых кораллов.

3. Описание выравнивания seed с точки зрения гомологичности всех последовательностей или их подмножества

Выравнивание seed, содержащее 28 последовательностей, было скачано в фрмате seed.gz, затем распаковано на kodomo и с помощью команды seqret переведено в fasta формат. Анализ выравнивания проводился в JalView. Ссылка на проект.

Максимальные достоверные блоки, включающие все последовательности. При пороге идентичности 100% наблюдается 21 абсолютно консервативная позиция. По данным позициям можно выделить максимальные достоверные блоки с абсолютной консервативностью: 121-123, 194-196. С функциональной консервативностью можно выделить участок 102-107.

Максимально достоверный блок, включающий не все последовательности. С абсолютной консервативностью: 170-176.

Участок без достоверных подблоков. 76-86

Гомология, по большей части функциональная консервативность, просматривается по всей длине выравнивания. Наибольшее количество консервативных участоков расположена ближе к середине выравнивания. Наблюдается сходство для отдельных последовательнотсей, то есть подмножеств, главным образом для участка 170-176 (отдельное окно). Для остальных участков группы мелчают, сложно говорить об общей гомологии. Пример концевого участвка, для которого маловероятно, что выравнивание отражает ход эволюции - 76-86, т.к. все последовательности разбиваются на группы по одному (отдельное окно). Также есть несколько последовательностей, которые выбиваются из общего выравнивания и обуславливают индели на концах.

4. Доменные архитектуры

Были выбраны доменные архитектуры PF20446-PF09818-PF09818-PF21117, включающий два концевых домена, исследуемый домен и его часть, и PF09818-PF09818, включающий только исследуемый домен и его часть.

Рис. 4
Рис. 4. сравниваемые доменные архитектуры.
Ссылка на проект.

На всей длине выравнивания наблюдаются высоко консервативные участки, при чем как для белков с первой доменной структурой, так и для второй.
Общие максимальные достоверные блоки: 566, 594 абсолютно консервативны; 622 функционально консервативна.
В выравнивании наблюдается множество достоверных подблоков. Они включают белки и с первой архитектурой, и со второй. Например, на участках 456-458, 559-564, 589-594, 625-627, 810-815 наблюдается как абсолютная, так и функциональная консервативность подмножест (некоторые приведены в отдельном окне).
Таких участков, на которых можно говорить о консервативности белков из разных доменных архитектур, независимо друг от друга, я не увидела (так как они не выравниваются и содержат много гэпов). Вероятно, руководствуясь данным результатом, можно говорить о высокой степени гомологичности исследуемого домена, то есть его незначительную эволюции для большинства белков.

5. Карта локального сходства двух белков (dotplot) с разными доменными архитектурами

Рис. 5
Рис. 5. plot of B7FPW7 (oX) vs C1N3B2 (oY).

E-value 4e-56
Per. Ident. 39.06%
Наблюдаются участки локального сходства в первой половине последовательностей и один участок на конце последовательности. На графике имеется много разрывов, линии не являются непрерывными, из чего можно сделать вывод, что данные области мало похожи друг друга и имеется много гэпов.

вероятно, чтобы получить более демонстративные результаты, необходимо сравнивать другие доменные архитектуры, а не данную пару.

* по данным таблицы, предложенной для выполнения задания. На InterPro цифры отличаются.


Источники:

  1. Structures of the T. brucei kRNA editing factor MRB1590 reveal unique RNA-binding pore motif contained within an ABC-ATPase fold. Shaw PL, McAdams NM, Hast MA, Ammerman ML, Read LK, Schumacher MA. Nucleic Acids Res 43, 7096-109, (2015). PMID: 26117548
  2. Saraste M, Sibbald PR, Wittinghofer A: The P-loop - a common motif in ATP- and GTP-binding proteins. Trends Biochem Sci. 1990, 15: 430-434. 10.1016/0968-0004(90)90281-F.