Выравнивание последовательностей белков Escherichia coli K12 и Bacillus subtilis 168 выполнено программой needle (глобальное парное выравнивание), параметры по умолчанию.
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
| Flagellar motor switch protein | FLIM_ECOLI | FLIM_BACSU | 369.0 | 28.8% | 50.9% | 14 | 8 |
| Acetylglutamate kinase | PROB_ECOLI | PROB_BACSU | 661.5 | 39.1% | 57.1% | 10 | 6 |
| Translation initiation factor IF-1 | IF1_ECOLI | IF1_BACSU | 272.0 | 68.1% | 88.9% | 0 | 0 |
Выравнивание последовательностей белков E. coli K12 и B. subtilis 168 выполнено программой water (локальное парное выравнивание), параметры по умолчанию.
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
| Flagellar motor switch protein | FLIM_ECOLI | FLIM_BACSU | 374.5 | 29.4% | 52.0% | 9 | 6 | 94.9% | 96.9% |
| Acetylglutamate kinase | PROB_ECOLI | PROB_BACSU | 666.5 | 39.9% | 58.4% | 7 | 4 | 98.4% | 98.1% |
| Translation initiation factor IF-1 | IF1_ECOLI | IF1_BACSU | 272.0 | 70.0% | 90.0% | 0 | 0 | 97.22% | 97.22% |
Глобальное выравнивание. Исходя из результатов глобального выравнивания последовательностей выбранных белков E. coli K12 и B. subtilis 168, можно сделать вывод, что они все гомологичны, так как процент их идентичности больше 25% (28.8%, 39.1%, 68.1%). У Translation initiation factor IF-1 (IF1) процент идентичности более чем в 2 раза выше чем у Flagellar motor switch protein (FMSP) и Acetylglutamate kinase (AK) и в отличие от них (14 и 8, 10 и 6) полностью отсутствуют гэпы и индели, что свидетельствует о его значительной консервативности, связанной с участием IF1 в трансляции. Вес выравнивания IF1 (272.0) ниже чем у FMSP (369.0) и AK (661.5) в связи с его меньшими размерами.
Локальное выравнивание. Для всех трех белков (FMSP, AK и IF1) локальное выравнивание показало схожий процент идентичности (29.4%, 94.9% и 70.0%) и большой процент покрытия обоих белков (94.9% и 96.9%, 98.4% и 98.1%, 97.22% и 97.22%), что свидетельствует о том, что данные белки гомологичны почти по всей длине.
Выводы. FMSP гомологичен по всей длине, локальное выравнивание в его случае немного более информативно по сравнению с глобальным, так как дало лучший процент идентичности, обрезав концевые гэпы. AK также гомологичен по всей длине и его локальное выравние более информативно, так как дало больший процент идентичности, удалив концевые гэпы. IF1 гомологичен по всей длине, локальное выравнивание в его случае немного более информативно по сравнению с глобальным, так как дало незначительно лучший процент идентичности.
Были выбраны белки AAT_ECOLI и DHA_BACSU.
| Protein Name 1 | Protein Name 2 | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
| N-acetyl-gamma-glutamyl-phosphate reductase | Tryptophan synthase alpha chain | ARGC_ECOLI | TRPA_BACSU | 36.0 | 13.9% | 24.2% | 217 | 20 |
| Protein Name 1 | Protein Name 2 | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
| N-acetyl-gamma-glutamyl-phosphate reductase | Tryptophan synthase alpha chain | ARGC_ECOLI | TRPA_BACSU | 43.5 | 22.5% | 40.5% | 28 | 7 | 28.14% | 37.45% |
Белки не являются гомологичными в связи с их низким процентом идентичности (глобальное: 13,9%, локальное: 22,5%) и большим количество гэпов (глобальное: 217, локальное: 28) и инделей (глобальное: 20, локальное: 7). Оба типа выравнивания не выявили значимого эволюционного сходства между последовательностями, также в данном случае они оба не будут информативными.
Выбор. Для множественного выравнивания с помощью команды muscle были выбраны белки с мнемоникой IF1_, рекомендованное
полное имя - Translation initiation factor IF-1.
В результате выполнения команды infoseq 'sw:IF1*' -only -name -nohead -auto | wc -l было найдено 477 белков с
мнемоникой IF1_. Использованы следующие белки: IF1_NOSS1, IF1_UREPA, IF1_DESPS, IF1_FRATT, IF1_PSEF5, IF1_ECOLI, IF1_BACSU.
Выполнение. Сначала с помощью команды seqret были загружены последовательности из Swiss-Prot: seqret @178.txt FASTA::file.fasta -auto,
178.txt - название файла с идентификаторами данных белков. Затем выполнено выравнивание командой muscle:
muscle -align file.fasta -output align.fasta. Дальше множественное выравнивание было открыто с помощью программы
Jalview, где колонки выравнивания были раскрашены по проценту идентичности, файл.
Обсуждение. Последовательности являются гомологичными по всей длине за исключением C-концевой инсерции IF1_DESPS (72-77 столбцы). Качество выравниваний можно оценить как хорошее в связи с маленьким числом инделей, примерно равной длиной большинства последовательностей и большим процентом идентичности. Большая часть последовательности белков является консервативной, однако присутствуют полиморфные позиции, где у большинства разные аминокислоты (6, 30, 31, 42, 54, 71 и др.)