Гомология и выравнивание
Выбор семейства доменов из Pfam для анализа
AC: PF02783 ID: MCR_beta_N Название: Methyl-coenzyme M reductase beta subunit, N-terminal domain Число последовательностей в seed - 34 Число последовательностей в full - 677 Число доменных архитектур: 4
Функция домена: Метил-кофермент М-редуктаза (MCR) участвует в образование метана микроорганизмами. 3D структура домена: Это гексамер, состоящий из 2 α-, 2 β- и 2 γ-субъединиц с двумя идентичными никель-порфиноидными активными центрами. Таксономическая распространенность: Данный домен встречается у архей (так как только они способны к метаногенезу), но также есть 6 последовательностей относящихся к 2м метагеномам.
Выравнивание seed
Результаты выравниванияПрисутствует 17 абсолютно консервативных позиций (100% identity) максимальный достоверный блок, включающий все последовательности: 161-162 максимальный достоверный блок, не включающий последние 5 последовательностей: 96-98 участок выравнивания, в котором нет никаких достоверных подблоков: 92-93 В выравнивании есть достаточно длинные достоверные блоки, включающие все последовательности, например: 38-45, 106-116, 156-162. Следовательно, данные блоки лучше всего отражают гомологию последовательностей.
Доменные архитектуры с выбранным доменом
A0A257ACF4 (12 белков) и Q647K3 (26 белков) - см. Таблицы 1,2.


Белки со второй доменной архитектурой сильно отличаются по длине, а также по организмам, к которым они принадлежат, что нельзя сказать о белках с первой доменной архитектурой.
Результаты выравниванияПоследовательности группы 1 длиннее, поэтому можно заметить, что в C-концевой части выравнивания присутствуют только последовательности белков с первой доменной архитектурой (в последовательностях группы 2 только гэпы). Это связано с тем, что на самом деле во второй группе отсутствует C-terminal domain, который мы видим в первой группе и который не рассматривается в данном задании (см. Рис. 1).

В выравнивании видно (см. Рис. 2), что рассматриваемый домен в группе 1 (белков с первой доменной архитектурой), “разделен” на 2 части фрагментом 69-90, который не выравнивается со второй группой последовательностей, что соответствует Рисунку 1. Так как до 69й и начиная с 91й позиции присутствуют консервативные участки, включающие последовательности обоих групп, можно сделать вывод, что в первой группе белков произошла инсерция достаточно большого фрагмента в рассматриваемый домен.

Возможно, присутствие данного фрагмента в белке незначительно, но ухудшает функционирование фермента, потому что упомянутая мутация не особо распространена: как видно из Таблиц 1, 2 белки со второй доменной архитектурой принадлежат большему числу разных организмов в отличие от белков с первой доменной архитектурой, и белков группы 2 в принципе больше. Абсолютно консервативные позиции отсутствуют в обоих группах (если рассматривать эти группы вместе).
Первая доменная архитектура (рассматривается только N-концевой домен, так как он выбран в задании)
Присутствует очень много абсолютно консервативных позиций (100% identity), также много длинных абсолютно идентичных блоков: 57-73, 210-233. Скорее выделяются участки с идентичностью меньше 100% и с гэпами: 92-97, 182-187.
Вторая доменная архитектура
Абсолютно консервативные позиции отсутствуют, максимальные достоверные блоки, включающие все последовательности группы, также отсутствуют.
Среди белков со второй доменной архитектурой есть 7 последовательностей, заметно отличающихся по длине от остальных. Можно заметить, что у них сохранился только один участок домена, если разделить домен на участки в соответствии с последовательностями первой группы (см. Рис.3): ближе к N-концу (A0A8T4DNB7, A0A7K3YIH8, A0A8T3Z597, A0A832WZ76 и A0A2P0QM43, A0A7C4D0S9 – также есть небольшая часть второго участка ) или ближе к C-концу (A0A328SNW9 – также есть небольшая часть первого участка).

Возможно, более показательно будет рассмотреть выравнивание без этих 7 последовательностей.
Результаты сравнения такого набора последовательностей: Абсолютно консервативных позиций 4. Достоверные блоки: 14-16, 33-37, 49-50, 124-126.
Две доменные архитектуры
Чтобы найти достоверные блоки среди белков обоих групп рассмотрим выравнивание без упомянутых 7 последовательностей. Абсолютно консервативных позиций 4. Достоверные блоки: 14-16, 34-35, 48-49, 110-111.
Dot Plot
Последовательности белков со второй доменной архитектурой достаточно сильно отличаются, поэтому я решила построить 2 карты dot plot.
1) Последовательности A0A257ACF4 и Q647K3 – ими представлены рассматриваемые доменные архитектуры в Pfam. В выравнивании BLAST было найдено значительное сходство только в первом участке домена (до 61й аминокислоты A0A257ACF4, что можно видеть на Рис. 4): Query Cover 12%, Percent Identity 42.11%. При указании в Query subrange только аминокислотные остатки начиная с 61го значительное сходство не было найдено.

2) Чтобы посмотреть карту dot plot на втором участке домена я выбрала последовательность со второй доменной архитектурой, у которой этот фрагмент имеет большую длину - A0A497PIR1. Между этими последовательностями были найдены значительные сходства и во втором участке домена (Query Cover 35%), однако Percent Identity 23.49%. На Рис. 5 можно снова наблюдать тот фрагмент, который разделяет последовательность белка с первой доменной архитектурой на 2 участка (на оси X примерно 61-97 остатки), хотя интересно, что в середине этого участка были найдены значительные совпадения со второй последовательностью.
