Для выбора гомологов моего белка - угеловод содержащего белка из бактерии Flavobacterium johnsoniae использовалась программа Blast. Необходимыми условиями хорошей выборки были: гомология почти по всей длине (coverage = 70-90%), отсутствие "почти идентичных" белков (ID = 50-60%), достоверность гомологов (E-value < 1e-5). Для поиска гомологов использовался банк SwissProt. С помощью программы muscle на сервере kodomo было простроено выравнивание последовательностей, это выравнивание вы можете скачать здесь. Оно представлено на рис. 1.

BLOSUM62
Рис. 1. Выравнивание последовательностей, сделанного с помощью программы muscle.

С помощью программы mafft на сервере kodomo было простроено второе выравнивание последовательностей, это выравнивание вы можете скачать здесь. Оно представлено на рис. 2.
Для построения выравнивания использовалась команда: muscle -in aligment_1.txt -out aligment_mus.fa -diags -maxiters 32 -maxhours 0.5 -log lof_alig_1.txt

BLOSUM62
Рис. 2. Фрагмент выравнивания последовательностей, сделанного с помощью программы mafft.

Далее было проведено сравнение выравниваний, сделанных с помощью muscle и mafft. Наглядный фрагмент показан на рис. 4. Прект с выравниваниями и их сравнением в формате jar можно скачать здесь. Если на участках с малой консервативностью выравнивания и отличаются, то на участках с высокой степенью сходства, выравнивания абсолютно идентичны. Это объясняется тем, что последовательности очень похожи.

BLOSUM62
Рис. 3. Фрагмент сравнения выравниваний по muscle (сверху) и mafft (снизу).

Наконец, был проведен поиск доменов Pfam-семейств в исходной последовательности, с использованием сервиса Pfam. В результате поиска было найдено следующее совпадение, показанное на рисунке 4. Seed выравнивание можно скачать здесь.

Рис. 4. Выходные данные для поиска по последовательности в Pfam.