Множетсвенное выравнивание

Для этого задания я выбрала белки с ID BLA34_ECOLX, BLAC_BACLI, BLAC_STRBA, BLA1_STRCI. Я решила сравнивать выравнивание Jalview, Muscle и выравнивание Align на сайте Uniprot. Ссылка на проект с этими двумя выравниваниями (d_align.fasta - выравнивание с сайта Uniprot, нижнее окно - Jalview).

Совпадающие позиции выравнивания - 52-83 (координаты по верхнему выравниваню Uniprot), 52-83, 86-110, 121-175, 178-233, 239-335.

compare
Рис 1. Координаты по верхнему выравниванию - 52-83
compare
Рис 2. Координаты по верхнему выравниванию - 86-110
compare
Рис 3. Координаты по верхнему выравниванию - 121-175
compare
Рис 4. Координаты по верхнему выравниванию - 178-233
compare
Рис 5. Координаты по верхнему выравниванию - 239-335

В целом все выравнивание совпадает, длина выравнивания с сайта Uniprot - 335, выравнивания программой Jalview - 332, отличия появляются из-за сдвига гэпов на 1-2 позиции, которые не должны сильноменять вес выравниваний. Единственным исключением являются первые 85 позиций верхнего и первые 84 позиции нижнего выравниваний, так как они очень сильно отличаются.

compare
Рис 6. Несовпадающий блок
3LEZ
Рис.1 Домен

3D структуры

Я выбрала белки домена RuvA_N (ID:PF01330) с ID 1BDX, 7OA5 и 2H5X. Я выравнивала белки в pymol с помощью команды align. Ссылка на выравнивание (1BDX относится к RUVA_ECOLI, 7OA5 к RUVA_MYCLE, 2H5X к RUVA_MYCTU). На выравнивании видно чередование совпадающих и несовпадающих блоков, что заметно и на выравнивании в pymol.

3LEZ
Рис.7 Выравнивание белков, 1BDX - желтый/оранжевый, 7OA5 - зеленый, 2H5X - синий

Mufft

MAFFT - Multiple Alignment using Fast Fourier Transform (множественное выравнивание с использованием быстрого преобразования Фурье). Это программа для мноежственных выравниваний нуклеотидныйх и аминокислотных последовательностей, первую версию создал в 2002 Казутака Като. Алгорит состоит из 5 этапов:

  1. Попарное выравнивание - для каждой пары последовательностей определяются совпадающие участки.
  2. Матрица расстояний - на основе первого этапа рассчитываются "расстояния" между последовательностями и создается их матрица.
  3. Генеалогическое древо - на основе матрица расстояний создается древо, в котором отображается родство между организмами.
  4. Прогрессивное выравнивание - по методу прогрессивного выравнивания обрабатываюся все последовательности в древе по направлению от "корней" к "листьям".
  5. Итеративное выравнивание - процесс коректировки получившегося выравнивая для увеличения точности.
Список литературы:
  1. https://en.wikipedia.org/wiki/MAFFT
  2. https://en.wikipedia.org/wiki/Multiple_sequence_alignment#Progressive_alignment_construction
  3. Kazutaka Katoh, Kazuharu Misawa, Kei-ichi Kuma, Takashi Miyataa MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform Nucleic Acids Res. 2002 Jul 15; 30(14): 3059–3066. doi: 10.1093/nar/gkf436