Гомология и выравнивание

Выбор семейства доменов из Pfam для анализа

AC: PF02783
ID: MCR_beta_N
Название: Methyl-coenzyme M reductase beta subunit, N-terminal domain
Число последовательностей в seed - 34
Число последовательностей в full - 677
Число доменных архитектур: 4

Функция домена:
Метил-кофермент М-редуктаза (MCR) участвует в образование метана микроорганизмами.
3D структура домена:
Это гексамер, состоящий из 2 α-, 2 β- и 2 γ-субъединиц с двумя идентичными никель-порфиноидными активными центрами.
Таксономическая распространенность:
Данный домен встречается у архей (так как только они способны к метаногенезу), но также есть 6 последовательностей относящихся к 2м метагеномам.

Выравнивание seed

Результаты выравнивания

Присутствует 17 абсолютно консервативных позиций (100% identity)
максимальный достоверный блок, включающий все последовательности: 161-162
максимальный достоверный блок, не включающий последние 5 последовательностей: 96-98
участок выравнивания, в котором нет никаких достоверных подблоков: 92-93
В выравнивании есть достаточно длинные достоверные блоки, включающие все последовательности, например: 38-45, 106-116, 156-162. Следовательно, данные блоки лучше всего отражают гомологию последовательностей.

Доменные архитектуры с выбранным доменом

A0A257ACF4 (12 белков) и Q647K3 (26 белков) - см. Таблицы 1,2.

Таблица 1. Список белков с первой доменной архитектурой (A0A257ACF4)
Таблица 1
Таблица 2. Список белков со второй доменной архитектурой (Q647K3)
Таблица 2

Белки со второй доменной архитектурой сильно отличаются по длине, а также по организмам, к которым они принадлежат, что нельзя сказать о белках с первой доменной архитектурой.

Результаты выравнивания

Последовательности группы 1 длиннее, поэтому можно заметить, что в C-концевой части выравнивания присутствуют только последовательности белков с первой доменной архитектурой (в последовательностях группы 2 только гэпы). Это связано с тем, что на самом деле во второй группе отсутствует C-terminal domain, который мы видим в первой группе и который не рассматривается в данном задании (см. Рис. 1).

Рисунок 1
Рис. 1. Сиреневым обозначен N-концевой домен (PF02783), салатовым обозначен C-концевой домен (PF02241), вторая доменная архитектура сверху.

В выравнивании видно (см. Рис. 2), что рассматриваемый домен в группе 1 (белков с первой доменной архитектурой), “разделен” на 2 части фрагментом 69-90, который не выравнивается со второй группой последовательностей, что соответствует Рисунку 1.
Так как до 69й и начиная с 91й позиции присутствуют консервативные участки, включающие последовательности обоих групп, можно сделать вывод, что в первой группе белков произошла инсерция достаточно большого фрагмента в рассматриваемый домен.

Рисунок 2
Рис. 2. Инсерция в последовательностях белков с первой доменной архитектурой.

Возможно, присутствие данного фрагмента в белке незначительно, но ухудшает функционирование фермента, потому что упомянутая мутация не особо распространена: как видно из Таблиц 1, 2 белки со второй доменной архитектурой принадлежат большему числу разных организмов в отличие от белков с первой доменной архитектурой, и белков группы 2 в принципе больше.
Абсолютно консервативные позиции отсутствуют в обоих группах (если рассматривать эти группы вместе).

Первая доменная архитектура (рассматривается только N-концевой домен, так как он выбран в задании)

Присутствует очень много абсолютно консервативных позиций (100% identity), также много длинных абсолютно идентичных блоков: 57-73, 210-233.
Скорее выделяются участки с идентичностью меньше 100% и с гэпами: 92-97, 182-187.

Вторая доменная архитектура

Абсолютно консервативные позиции отсутствуют, максимальные достоверные блоки, включающие все последовательности группы, также отсутствуют.

Среди белков со второй доменной архитектурой есть 7 последовательностей, заметно отличающихся по длине от остальных. Можно заметить, что у них сохранился только один участок домена, если разделить домен на участки в соответствии с последовательностями первой группы (см. Рис.3): ближе к N-концу (A0A8T4DNB7, A0A7K3YIH8, A0A8T3Z597, A0A832WZ76 и A0A2P0QM43, A0A7C4D0S9 – также есть небольшая часть второго участка ) или ближе к C-концу (A0A328SNW9 – также есть небольшая часть первого участка).

Рисунок 3
Рис. 3. Участок выравнивания белков со второй доменной архитектурой. Можно заметить 7 последовательностей, у которых сохранился в основном 1 из участков домена.

Возможно, более показательно будет рассмотреть выравнивание без этих 7 последовательностей.

Результаты сравнения такого набора последовательностей:
Абсолютно консервативных позиций 4.
Достоверные блоки: 14-16, 33-37, 49-50, 124-126.

Две доменные архитектуры

Чтобы найти достоверные блоки среди белков обоих групп рассмотрим выравнивание без упомянутых 7 последовательностей.
Абсолютно консервативных позиций 4.
Достоверные блоки: 14-16, 34-35, 48-49, 110-111.

Dot Plot

Последовательности белков со второй доменной архитектурой достаточно сильно отличаются, поэтому я решила построить 2 карты dot plot.

1) Последовательности A0A257ACF4 и Q647K3 – ими представлены рассматриваемые доменные архитектуры в Pfam. В выравнивании BLAST было найдено значительное сходство только в первом участке домена (до 61й аминокислоты A0A257ACF4, что можно видеть на Рис. 4): Query Cover 12%, Percent Identity 42.11%. При указании в Query subrange только аминокислотные остатки начиная с 61го значительное сходство не было найдено.

Рисунок 4
Рис. 4. Dot Plot карта A0A257ACF4 и Q647K3. Одна сплошная линия соответствует одному найденному BLAST выравниванию, что показывает достаточно большое сходство на этом участке домена.

2) Чтобы посмотреть карту dot plot на втором участке домена я выбрала последовательность со второй доменной архитектурой, у которой этот фрагмент имеет большую длину - A0A497PIR1. Между этими последовательностями были найдены значительные сходства и во втором участке домена (Query Cover 35%), однако Percent Identity 23.49%. На Рис. 5 можно снова наблюдать тот фрагмент, который разделяет последовательность белка с первой доменной архитектурой на 2 участка (на оси X примерно 61-97 остатки), хотя интересно, что в середине этого участка были найдены значительные совпадения со второй последовательностью.

Рисунок 5
Рис. 5. Dot Plot карта A0A257ACF4 и A0A497PIR1. Несколько линий соответствуют нескольким участкам, по которым были построены выравнивания.