Практикум 13. Алгоритмы и программы множественного выравнивания

2. Сравнение выравниваний разными программами.

🌸 Выбор алгоритмов и создание выравниваний

Семейство белков для выравниваний: PF00072. Выбранные программы:

При выборе алгоритмов я придерживалась двух критериев: представленность большего разнообразия методов и наличие программы в Jalview. В качестве инструмента сравнения трех программ я использовала скрипт на питоне (Copyright by Дмитрий Липченчук).

Чтобы открыть изначальное выравнивание seed в Jalview и запустить алгоритмы трёх выравниваний, я выполнила следующую последовательность действий:

В главном окне JalView выполнить File → Fetch sequences → в меню Select Database выбрать PFAM (Seed) → ввести в окошко AC домена (PF15005) → OK.

в меню окна Web Service → Alignment → выбрать нужный [METHOD] with defaults.

🌸 Сравнение выравниваний друг с другом и выводы

🌸🌸 MSAPROBS VS MAFFT

Скачав файлы выравниваний в формате фаста с Jalview (File → Save As → ...) и закинув их на сервер кодомо вместе со скриптом для анализа, я выполнила файл следующей командой:

python aligncomp.py -b MSAprobs_alig.fa Mafft_alig.fa
Скрипт был запущен с опцией -b, чтобы увидеть блоки идентичных колонок в более наглядном формате. Получена следующая выдача:
MSAprobs_alig.fa blocks:
1: 1 - 18
2: 22 - 23
3: 56 - 56
4: 72 - 79
5: 84 - 84
6: 87 - 89
7: 112 - 116
8: 121 - 121
9: 139 - 144
Mafft_alig.fa blocks:
1: 1 - 18
2: 22 - 23
3: 51 - 51
4: 69 - 76
5: 79 - 79
6: 82 - 84
7: 112 - 116
8: 120 - 120
9: 144 - 149
Согласно этому мы получили следующие результаты сравнения двух выравниваний:

🌸🌸 MSAPROBS VS PROBCONS

Соответственно, для MSAProbs и Probcons:

Команда:

python aligncomp.py -b MSAprobs_alig.fa Probcons_alig.fa

Выдача команды bash:

MSAprobs_alig.fa blocks:
1: 1 - 20
2: 22 - 25
3: 42 - 48
4: 53 - 59
5: 62 - 65
6: 67 - 79
7: 83 - 98
8: 104 - 104
9: 107 - 109
10: 115 - 117
11: 125 - 125
12: 127 - 129
13: 133 - 144
14: 148 - 156
Probcons_alig.fa blocks:
1: 1 - 20
2: 22 - 25
3: 42 - 48
4: 53 - 59
5: 64 - 67
6: 69 - 81
7: 86 - 101
8: 107 - 107
9: 110 - 112
10: 118 - 120
11: 127 - 127
12: 129 - 131
13: 135 - 146
14: 151 - 159

Результаты согласно полученным данным:

🌸🌸 ВЫВОДЫ

Количество совпадающих блоков в случае Probcons vs MSAProbs больше (14 против 9), общая длина идентичных блоков так же больше: в то время как в сравнении с Probcons самый длинный совпадающий блок из 16 колонок, а так же есть много блоков средней длины, в сравнении с Mafft самый длинный блок состоит из 6 колонок, и преобладают, как правило, короткие блоки (1-3 колонки). Оба метода хорошо сохранили начальный регион (1-18(20) колонки) и центральные консервативные участки. Однако для подтверждения того, что Probcons значительно ближе к референсному выравниванию MSAProbs, стоит узнать точный процент идентичных колонок с помощью опции -p. Команды:
python aligncomp.py -p MSAprobs_alig.fa Mafft_alig.fa
python aligncomp.py -p MSAprobs_alig.fa Probcons_alig.fa
Выдача:
Percentage of columns in MSAprobs_alig.fa identical to those of the second alignment: 66.03%
Percentage of columns in Probcons_alig.fa identical to those of the second alignment: 64.78%

Percentage of columns in MSAprobs_alig.fa identical to those of the second alignment: 28.85% Percentage of columns in Mafft_alig.fa identical to those of the second alignment: 27.61%

В то время как средний процент идентичных колонок Probcons и MSAProbs равен 65.4%, тот же самый показатель для Mafft и MSAProbs равен 28.2%. Из всего выше сказаного можно сделать вывод, что Probcons в 2.3 раза больше соответствует референсному выравниванию.

гипер-ссылка на проект в JalView

3. Сравнение выравнивания по совмещению структур и по MSA.

гипер-ссылка на проект в JalView c двумя выравниваниями

4. Описание программы MSAProbs.

Программа MSAProbs — это инструмент для построния множественных выравниваний белковых последовательностей, сочетающий высокую точность и поддержку многопоточных вычислений.

🔬Основные особенности программы:

📚Список источников

  1. PubMed
  2. Bioinformatics Home
  3. PubMed
  4. PubMed
  5. Debian Manpages