1. Ознакомление с программой Muscle.
Получу выравнивание вирусных белков, называемых "дельта-антигенами". Для этого найду последовательности этих белков в банке Swiss-Prot и сохраню их в формате fasta (delta.fasta). C помощью программы muscle, выполнив команду:
muscle -in delta.fasta -out delta_aligned.fasta
получу выравнивание данных последовательностей (delta_aligned.fasta). Импортирую его в GeneDoc:

Из выравнивания видно, что последовательности почти полностью совпадают, за исключением концевого участка выравнивания. Отсюда напрашивается вывод: данные белки являются гомологами.
2. Выравнивание набора гомологов своего белка.
С помощью BLAST в банкеSwiss-Prot были найдены гомологи белка MOEB_ECOLI. Ограничения на выдачу следующие: таксон Bacteria, порог на E-value 0.001 (тем самым эти белки являются достоверными гомологами), выравнивания имеют процент идентичности не более 90 (то есть белки не слишком близки к MOEB_ECOLI).
Список идентификаторов отобранных гомологов (включая MOEB_ECOLI):
sw:moeb_ecoli
sw:moeb_salty
sw:moeb_haein
sw:thif_ecoli
sw:hesa_plebo
sw:hesa_anasp
sw:ygdl_ecoli
sw:y118_haein
sw:y40a_rhisn
С помощь программы seqret был получен файл с последовательностями этих белков в fasta-формате (myproteins.fasta), после чего с помощью программы muscle был получен файл с их выравниванием (myproteins_aligned.fasta).
Импортирую его в GeneDoc:

Есть участки с повышенной долей консервативных позиций:
36-43 по столбцам выравнивания, 36-43 а.о. белка MOEB_ECOLI,
54-56 по столбцам выравнивания, 54-56 а.о. белка MOEB_ECOLI,
97-99 по столбцам выравнивания, 97-99 а.о. белка MOEB_ECOLI.
Первый а.о. каждого белка - метионин, но в YGDL_ECOLI, HESA_ANASP и THIF_ECOLI первый метионин стоит не в первой колонке с первыми метионинами остальных белков, а в других колонках, тем самым увеличивая вес выравнивания (т.к. в перечисленных трех белках имеем гэпы в начале выравнивания, то есть штраф за них получился меньше, чем если бы они стояли после первого метионина). Поэтому участок 1-16 выравнивания (1-16 в MOEB_ECOLI) скорее всего не имеет биологического смысла.
Есть повод считать, что участок 258-289 выравнивания скорее всего также не имеет биологического смысла, так как консервативных (и даже сходных) одновременно для всех белков колонок на данном участке нет.