Алгоритмы множественного выравнивания
1. Множественные выравнивания различных выравниваний
Было выбрано 4 белка различной степени гомологичности "моему" белку
при помощи базы данных Pfam. Выравнивание было произведено при помощи 4 программ, представленных ниже.
Более подробно будут описаны Tcoffee (поскольку я использую эту программу чаще всего) и Clustal (поскольку она отличается от предыдущей
наиболее сильно).
Выравнивание TcoffeeWS:
Выравнивание MuscleWS:
Выравнивание MafftWS:
Выравнивание ClustalWS:
Различия между выравниваниями:
Alignment |
Length |
Indel |
Gap |
Gap,% |
Ident |
Ident,% |
Similar |
Similar,% |
Tcoffee |
251 |
15 |
37 |
14 |
49 |
19 |
83 |
33 |
Muscle |
251 |
12 |
34 |
13 |
49 |
19 |
80 |
31 |
Mafft |
251 |
13 |
35 |
13 |
49 |
19 |
83 |
33 |
Clustal |
247 |
11 |
28 |
11 |
47 |
19 |
77 |
31 |
Как видно из таблицы, Clustal пожертвовал количеством консервативных и функционально консервативных последовательностей
в пользу уменьшения числа гэпов. Таким образом, если известно, что произошла вставка или делеция, разумнее воспользоваться
программой Tcoffee так как для неё количество консервативных и функционально консервативных последовательностей приоритетнее
числа гэпов. Выравнивание по Tcoffee находится выше, по Clustal — ниже:
Три различия в выравнивании относительно самого нижнего белка:
1) Asp62 гомологичен в Toffee: Gly67, Asn67, Ser66, Asn65
в Clustal: Lys64, lys64, Lys63, Lys62
2) Thr64 гомологичен в Toffee: Thr69, Thr69, Thr68, Leu67
в Clustal: Tyr66, Tyr66, Asp65, Asn64
3) Ser121 гомологичен в Toffee: Lys119, Lys119, Thr118, Lys119
в Clustal: Tyr122, Tyr122, Tyr121, Tyr122
2. Доменные архитектуры
"Мой" белок содержит только один домен — Lactamase_B_3,
поэтому я рассматривал содержащие его доменные архитектуры. Pfam обнаружил 20 различных типов архитектур с Lactamase_B_3,
в 4182 белках, у 2825 организмов. Этот домен найден у бактерий, архей и эукариот. Опишу более детально простейшую
архитектуру и три наиболее интересных.
Базовая архитектура.
{Lactamase_B_3}, обнаружена в 3967 белках, рассмотрена на примере металл-зависимой гидролазы:
Архитектура с удвоенным доменом, однако целых фрагментов не было обнаружено, вероятно имели место дупликации и рестрикции.
{Lactamase_B_3 x 2}, обнаружена в 3 белках, рассмотрена на примере предсказанной цинк-зависимой гидролазы:
Архитектура с различными видами Лактамазы, В3 и В2.
{Lactamase_B_3, Lactamase_B_2}, обнаружена в 5 белках, рассмотрена на примере неспецифического белка:
Архитектура с Coenzyme Q – cytochrome c reductase, играющим важную роль в синтезе АТФ.
Имеется и обратная архитектура, однако у неё меньше белков.
{Lactamase_B_3, Rieske}, обнаружена в 131 белке, рассмотрена на примере железо-серного кластер-связывающего белка:
Источники:
NCBI
Pfam
UniProt
© Матвеев Андрей, 2017 AD