Алгоритмы множественного выравнивания


1. Множественные выравнивания различных выравниваний


Было выбрано 4 белка различной степени гомологичности "моему" белку при помощи базы данных Pfam. Выравнивание было произведено при помощи 4 программ, представленных ниже. Более подробно будут описаны Tcoffee (поскольку я использую эту программу чаще всего) и Clustal (поскольку она отличается от предыдущей наиболее сильно).

Выравнивание TcoffeeWS:



Выравнивание MuscleWS:



Выравнивание MafftWS:



Выравнивание ClustalWS:



Различия между выравниваниями:

Alignment Length Indel Gap Gap,% Ident Ident,% Similar Similar,%
Tcoffee 251 15 37 14 49 19 83 33
Muscle 251 12 34 13 49 19 80 31
Mafft 251 13 35 13 49 19 83 33
Clustal 247 11 28 11 47 19 77 31


Как видно из таблицы, Clustal пожертвовал количеством консервативных и функционально консервативных последовательностей в пользу уменьшения числа гэпов. Таким образом, если известно, что произошла вставка или делеция, разумнее воспользоваться программой Tcoffee так как для неё количество консервативных и функционально консервативных последовательностей приоритетнее числа гэпов. Выравнивание по Tcoffee находится выше, по Clustal — ниже:

Три различия в выравнивании относительно самого нижнего белка:
1) Asp62 гомологичен в Toffee: Gly67, Asn67, Ser66, Asn65
в Clustal: Lys64, lys64, Lys63, Lys62
2) Thr64 гомологичен в Toffee: Thr69, Thr69, Thr68, Leu67
в Clustal: Tyr66, Tyr66, Asp65, Asn64
3) Ser121 гомологичен в Toffee: Lys119, Lys119, Thr118, Lys119
в Clustal: Tyr122, Tyr122, Tyr121, Tyr122

2. Доменные архитектуры


"Мой" белок содержит только один домен — Lactamase_B_3, поэтому я рассматривал содержащие его доменные архитектуры. Pfam обнаружил 20 различных типов архитектур с Lactamase_B_3, в 4182 белках, у 2825 организмов. Этот домен найден у бактерий, архей и эукариот. Опишу более детально простейшую архитектуру и три наиболее интересных.
Базовая архитектура.
{Lactamase_B_3}, обнаружена в 3967 белках, рассмотрена на примере металл-зависимой гидролазы:

Архитектура с удвоенным доменом, однако целых фрагментов не было обнаружено, вероятно имели место дупликации и рестрикции.
{Lactamase_B_3 x 2}, обнаружена в 3 белках, рассмотрена на примере предсказанной цинк-зависимой гидролазы:

Архитектура с различными видами Лактамазы, В3 и В2.
{Lactamase_B_3, Lactamase_B_2}, обнаружена в 5 белках, рассмотрена на примере неспецифического белка:

Архитектура с Coenzyme Q – cytochrome c reductase, играющим важную роль в синтезе АТФ. Имеется и обратная архитектура, однако у неё меньше белков.
{Lactamase_B_3, Rieske}, обнаружена в 131 белке, рассмотрена на примере железо-серного кластер-связывающего белка:

Источники:
NCBI
Pfam
UniProt


© Матвеев Андрей, 2017 AD