Выравнивание последовательностей

Парное глобальное выранивание гомологичных белков

Скачаем из Swiss-Prot идентификаторы записей Escherichia coli (strain K12) (TaxID:83333) и Bacillus subtilis (strain 168) (TaxID:224308) и с помощью конвейра команд выберем пары с совпадающими мнемониками функции:
infoseq 'sw:*_ecoli' -only -name -nohead -out ecoli.txt
infoseq 'sw:*_bacsu' -only -name -nohead -out bacsu.txt
cut -f1 -d_ ecoli.txt bacsu.txt | sort | uniq -d > common_mnems.txt


Проведём парное глобальное выранивание трёх пар белков с одинаковыми мнемониками. Результаты представим в виде таблицы (Табл.1). По полученным данным можно сделать вывод, что рассматриваемые белки гомологичны.
table1

Табл. 1. Характеристики глобального парного выравнивания трёх пар белков

Локальное парное выравнивание гомологичных белков

Для тех же белков проведём парное локальное выравнивание с помощью программы water. Получаем следующие результаты (Табл.2):
table2

Табл. 2. Характеристики локального парного выравнивания трёх пар белков

Выравнивание негомологичных белков

Выберём пару белков с разными мнемониками функции и попробуем применить к ним глобальное и локальное парные выранивания. Результаты занесём в таблицы (Табл. 3-4). Представленные результаты работы программ needle и water подтверждают, что взятые для анализа белки негомологичны, так как процент схожести очень мал.
table3

Табл. 3. Характеристики глобального парного выравнивания пары негомологичных белков
table4
Табл. 4. Характеристики локального парного выравнивания пары негомологичных белков

Множественное выравнивание белков

Для анализа возьмём белки с мнемоникой функции MIND. В Swiss-Prot находится 20 таких записей, включая уже расcмотренные. Выберем записи следующих организмов: Escherichia coli (strain K12), Bacillus subtilis (strain 168), Helicobacter pylori (strain ATCC 700392 / 26695) (Campylobacter pylori), Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8), Shigella flexneri, Nephroselmis olivacea (Green alga), Tupiella akineta (Green alga) (Pseudendoclonium akinetum). С результатами множественного вырвнивания можно ознакомиться по ссылке (выравнивание было выполнено в Jalview с помощью программы Muscle with Defaults). Из полученных результатов можно сделать вывод, что белки гомологичны. Выранивание имеет определённую структуру: среди наиболее консервативных участков можно выделить участки, находящиеся в колонках 47-57, 79-86. В них происходит всего по одной замене на остаток, близкий по свойствам. Наименее консервативными оказались участки, расположенные в колонках 135-148, 201-217, 267-278. Самые серьёзные отклонения наблюдались у Nephroselmis olivacea, Tupiella akineta. Думаю, это можно объяснить тем, что они относятся к эукариотам (зелёные водоросли), в то время как все остальные рассматриваемые оргазмы являются бактериями.