Практикум 11

Алгоритмы выравнивания.

Задание 1. Сравнение выравнивания гомологичных белков и негомологичных белков

В ходе практикума были выбраны по пять пар гомологичных и негомологичных белков из протеомов штамма K12 кишечной палочки (*_ECOLI) и штамма 168 сенной палочки (*_BACSU). Гомологичные белки с одинаковыми мнемониками были выбраны с помощью фильтрации списка белков из двух протеомов в таблице Excel. Негомологичне белки - с разными мнемониками выбирались в достаточно хаотичном порядке, правда ради интереса взялась пара белков с мнемониками, отличающимися одной цифрой (Очень надеюсь, это не будет считаться ошибкой).
Глобальные выравнивания были получены с помощью команды "needle sw:*_ecoli sw:*_bacsu *.needle -auto", локальные выравнивания получались командой "water sw:*_bacsu sw:*_ecoli *.water -auto". По данным, полученным из этих выравниваний, была составлена отчетная таблица.
Проанализировав таблицу, можно заметить, что выравнивания гомологов и негомологов отличаются по некоторым параметрам. Во-первых, локальные выравнивания гомологов имеют покрытия более чем 95%, а негомологов - это значение гораздо ниже, редко превосходит 50% (исключение - более 90% у близких белков ALR1_BACSU и ALR2_ECOLI).
Во-вторых, судя по таблице, о гомологичности белков можно судить по проценту идентичности глобального выравнивания (При локальном выравнивании идентичность имеет уже гораздо меньшее значение). Так, для гомологов значение идентичности глобального выравнивания колеблется от 34% до 61%, а для негомологов, в среднем, это значение не превышает 30%.
Кроме того, о гомологичности можно так же судить и по весу выравнивания (колонка Score в таблице). Чем больше вес, тем "качественней" выравнивание, поэтому для гомологичных последовательностей вес составляет более 200, а для негомологичных, редко превышает 50 (как исключение - опять ALR1_BACSU и ALR2_ECOLI).
Другие показатели, приведенные в таблице, например индели, могут мало что сказать о гомологичности отдельных пар последовательностей, особенно при локальном выравнивании.

Задание 2. Множественное выравнивание нескольких белков.

Для этого задания были выбраны белки с мнемоникой ACCA из 6 организмов: Xylella fastidiosa (strain M23), Xanthobacter autotrophicus (strain ATCC BAA-1158 / Py2), Sorangium cellulosum (strain So ce56), Salmonella typhimurium (strain LT2), Prochlorococcus marinus (strain MIT 9211), Escherichia coli O6:K15:H31 (strain 536 / UPEC) Табличка на листе "proteins for 2" отчетной таблицы была создана с использованием команды "infoseq 'sw:acca_*' -only -name -length -out acca.txt"
Командой "seqret @acca.txt acca.fasta" был создан файл с последовательностями для выравнивания.
Далее в Jalview в программе 'Tcoffee without default' было построено множественное выравнивание.
pic of multiply aligment
Рис.1 Множественное выравнивание шести белков.
HELP aaaaaa
Для сравнения выравниваний были выбраны два гомологичных белка ACCA_XANP2 (Xanthobacter autotrophicus) и ACCA_PROM4 (Prochlorococcus marinus). Множественное выравнивание этих двух последовательностей было выравнено с глобальным и локальным выравниваниями с помощью команд muscle: "muscle -profile -in1 x_p_m-n.fasta -in2 xan_prom_w.fasta -out x_p_m-n-w.fasta" "muscle -profile -in1 xan_pr.fa -in2 xan_prom_n.fasta -out x_p_m-n.fasta" Далее в Jalview было визуализировано это выравнивание выравниваний (проект Jalview).
pic of  aligment
Рис.2 Изображение сравнения выравниваний ACCA_XANP2 и ACCA_PROM4. Красной рамкой выделен фрагмент множественного выравнивания, зеленой - глобальное, синей - локальное.
В целом, множественное, глобальное и локальное выравнивания мало чем отличаются друг от друга, но между ними все же можно найти отличия. Ниже разобраны некоторые такия отличия.
1-ый франмент выравнивания
Рассмотрим остаток E (Glu 31) из ACCA_PROM4, который во множественном выравнивании находится в одной колонке с G ACCA_XANP2 (Gly 30), в то время как в глобальном и локальном выравниваниях этот же E находится напротив D (Asp).
2-ый франмент выравнивания
После 278 Leu ACCA_PROM4 и 277 Glu ACCA_XANP2 множественное выравнивание начинает сильно отличаться от двух других. Различия начинаются с K (Lys 279) ACCA_PROM4, который во множественном выравнивании находится в одной колонке с A (Ala) 278 ACCA_XANP2. В глобальном и локальном выравнивании K (Lys 279) ACCA_PROM4 находится уже в колонке с A (Ala) 282 ACCA_XANP2
3-ый франмент выравнивания
На 299 и 302 позициях выравнивания находятся две колонки лейцинов (L). Однако лейцины первого выравнивания в этих колонках - это не те же лейцины, что в других выравниваниях. Во множественном выравнивании в этих двух колонках расположены Leu 291 и 294 ACCA_XANP2 и Leu 292, 295 ACCA_PROM4, а в локальном Leu 294 и 297 ACCA_XANP2 и 292, 295 ACCA_PROM4.
4-ый франмент выравнивания
3 гэпа 310-312 позиций локального и глобального выравниваний возвращают соответствие всех трех выравниваний.
Таким образом, несмотря на то, что между разными выравниваниями могут быть некоторые различия, множественное выравнивание все же отражает гомологию последовательностей, о которой можно судить даже по фрагменту выравнивания.