Практикум 12

Для выполнения второго задания я взял белки из практикума 9: HEMW_ECOLI, HEMW_SYNY3, HEMW_BACSU, HEMW_MYCTU, HEMW_BUCAI, HEMW_MYCTO, HEMW_BUCAP и провёл их множественные выравнивания с помощью программ MUSCLE, MAFFT и T-Coffee. Ссылка на проект в Jalview (сравнение MUSCLE и MAFFT) Ссылка на проект в Jalview (сравнение MUSCLE и T-Coffee) Выравнивания, полученные алгоритмами MUSCLE и MAFFT совпадают между собой полностью (SP score: 1.00, CS score: 1.00, avg_SPdist score: 1.00). Выравнивания, полученные алгоритмами MUSCLE и T-Coffee совпадают между собой неполностью (SP score: 0.93, CS score: 0.83, avg_SPdist score: 0.97). Совпадающие блоки: 20-39, 50-55. Остальные выравненные аминокислоты сдвинуты: 56-70 и 60-74 (сдвиг на 4 позиции), 71-323 и 73-325 (сдвиг на 2 позиции), 328-363 и 330-365 (сдвиг на 2 позиции), 406-426 и 408-428 (сдвиг на 2 позиции). Частично совпадающие блоки: 7-11, 324-327. Исходя из полученных результатов можно сделать вывод о том, что алгоритм выравнивания влияет на вид самого выравнивания. Также можно предположить, что, вероятно, алгоритмы MUSCLE и MAFFT ближе друг к другу, чем алгоритмы MUSCLE и T-Coffee.

Для выполнения третьего задания я выбрал семейство доменов ABC_tran (PF00005). Для выравниваний я взял три структуры из этого семейства: 1B0U, 1F3O, 1G29. Выравнивание структур было произведено на сайте PDB.

Ссылка на структурное выравнивание

Как видно из выравнивания, первые два домена похожи друг на друга больше, чем первый и третий между собой (полностью совпадающие между собой блоки имеют большую длину: 42-48, 155-167, 169-174, в то время как наибольший такой блок в выравнивании 1 и 3 последовательностей состоит из 3 аминокислот, например). Эту же мысль подтверждает выравнивание, произведённое алгоритмом MUSCLE. Выравнивание трёх структур в Jalview алгоритмом MUSCLE

Описание работы программы MUSCLE

Muscle - MUltiple Sequence Comparison by Log-Expectation (Множественное выравнивание последовательностей с помощью логарифмического ожидания). Программа может использоваться для выравнивания белков и нуклеиновых кислот. Впервые была опубликована Робертом С. Эдгаром в 2004 году.

Алгоритм состоит из нескольких этапов: прогрессивный этап (множественное выравнивание с упором на скорость, а не на точность, путём разбиения последовательностей на k-меры и выравнивания алгоритмом Нидлмана-Вунша для построения дерева), улучшенный прогрессивный этап (повторная оценка дерева с помощью расстояния Кимуры и создание дерева на основании множественного выравнивания), уточнение (выбор ребра из дерева, полученного на втором этапе, вычисление профиля множественного выравнивания каждого поддерева, получившегося путем удаления ребра из дерева, построение нового множественного выравнивания на основании выравнивания двух профилей, сохранение выравнивания в случае улучшения оценки SP (sum of pair)). Операции выполняются до тех пор, пока не будет достигнута сходимость.