В данном задании было проведено сравнение множественных выравниваний белков с мнемоникой EFEB из практикума 9, выполненных разными программами.
Сравнение осуществлялось по идентичным блокам в разных выравниваниях. Полученные выравнивания можно посмотреть в проекте Jalview.
Попарная визуализация идентичных блоков доступна по ссылкам (программа VerAlign) :
Muscle+Mafft,
Mafft+T-Coffee
Далее представлено описание идентичных блоков в выравниваниях :
Блок | Mafft+Muscle | Mafft+T-Coffee |
---|---|---|
1 | (12-31)=(12-31) | (1-2)=(1-2) |
2 | (65-438)=(62-435) | (13-31)=(13-31) |
3 | - | (36-39)=(36-39) |
4 | - | (65-124)=(64-123) |
5 | - | (127-438)=(126-437) |
Процент выровненных колонок при использовании Mafft : 96.58%, длина выравнивания = 438
Процент выровненных колонок при использовании Muscle : 97.24%, длина выравнивания = 435
Процент выровненных колонок при использовании T-Coffee : 96.80%, длина выравнивания = 437
Для поиска идентичных блоков была использована программа за авторством Ксении Кирцовой.
Для проведения выравнивания путем совмещения пространственных структур было выбрано семейство PF00555 Endotoxin_M, а в нем белки с pdb-кодами 6lfp, 1dlc, 3eb7.
Выравнивание было выполнено на сайте PDB (Analyze -> Pairwise Structure Alignment), в качестве референсного белка был выбран 6lfp
В Jalview было произведено выравнивание этих же белков с помощью Mafft. При сравнении вышеупомянутых выравниваний с помощью программы из задания 2
был выявлен один идентичный блок (469-470) PDB (длина выравнивания - 600, процент выровненных колонок - 98.17%) и (485-486) Mafft (длина выравнивания
- 615, процент выровненных колонок - 95.77%)
Наиболее серьезное видимое отличие в совмещенных структурах - отсутсвие небольшого участка выравнивания с Nконца у белка 6lfb.
Полученные выравнивания можно посмотреть в проекте Jalview
Mafft - программа, используемая для создания множественных выравниваний аминокислотных или нуклеотидных последовательностей. Первая версия была создана Казутакой Като в 2002 году, последняя версия вышла в 2022 году.
Алгоритм :
Прогрессивная часть : составить приблизительную матрицу расстояний, предварительно составив парные выравнивания, построить направляющее дерево и
выровнять последовательности в соответствии с порядком ветвления.
Итеративная часть : Построить множественное выравнивание -> Разделить его на две группы -> Перевыровнять две группы. Повторить.
Точность прогрессивного выравнивания повышается с помощью метода итеративного уточнения. Итеративное уточнение повторяется
до тех пор, пока не перестанет улучшаться показатель WSP (сумма весов пар) или количество циклов не достигнет 1000.
Параметры : матрица замен аминокислот BLOSUM62, матрица нуклеотидов, штрафы за гэпы в белках, штрафы за гэпы в РНК