Скачаем из Swiss-Prot идентификаторы записей Escherichia coli (strain K12) (TaxID:83333) и Bacillus subtilis (strain 168) (TaxID:224308) и с помощью конвейра команд выберем пары с совпадающими мнемониками функции:
infoseq 'sw:*_ecoli' -only -name -nohead -out ecoli.txt
infoseq 'sw:*_bacsu' -only -name -nohead -out bacsu.txt
cut -f1 -d_ ecoli.txt bacsu.txt | sort | uniq -d > common_mnems.txt
Проведём парное глобальное выранивание трёх пар белков с одинаковыми мнемониками. Результаты представим в виде таблицы (Табл.1). По полученным данным можно сделать вывод, что рассматриваемые белки гомологичны.
Для тех же белков проведём парное локальное выравнивание с помощью программы water. Получаем следующие результаты (Табл.2):
Выберём пару белков с разными мнемониками функции и попробуем применить к ним глобальное и локальное парные выранивания. Результаты занесём в таблицы (Табл. 3-4). Представленные результаты работы программ needle и water подтверждают, что взятые для анализа белки негомологичны, так как процент схожести очень мал.
Для анализа возьмём белки с мнемоникой функции MIND. В Swiss-Prot находится 20 таких записей, включая уже расcмотренные. Выберем записи следующих организмов: Escherichia coli (strain K12), Bacillus subtilis (strain 168), Helicobacter pylori (strain ATCC 700392 / 26695) (Campylobacter pylori), Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8), Shigella flexneri, Nephroselmis olivacea (Green alga), Tupiella akineta (Green alga) (Pseudendoclonium akinetum). С результатами множественного вырвнивания можно ознакомиться по ссылке (выравнивание было выполнено в Jalview с помощью программы Muscle with Defaults). Из полученных результатов можно сделать вывод, что белки гомологичны. Выранивание имеет определённую структуру: среди наиболее консервативных участков можно выделить участки, находящиеся в колонках 47-57, 79-86. В них происходит всего по одной замене на остаток, близкий по свойствам. Наименее консервативными оказались участки, расположенные в колонках 135-148, 201-217, 267-278. Самые серьёзные отклонения наблюдались у Nephroselmis olivacea, Tupiella akineta. Думаю, это можно объяснить тем, что они относятся к эукариотам (зелёные водоросли), в то время как все остальные рассматриваемые оргазмы являются бактериями.