Дано 6 идентификаторов Uniprot. Последовательности сохранены в формате FASTA и открыты в программе JalView. Построено множественное выравнивание 6 последовательностей программой Muscle (параметры по умолчанию).
Лишней будем считать последовательность, сильно отличающуюся от остальных. Найдем и удалим ее из выравнивания. Для этого раскрасим имеющееся выравнивание с помощью BLOSUM62 (рис.1). В глаза бросается третья последовательность: она имеет кодирующие участки в местах, где у всех остальных гэпы, и меет гэпы, где у всех остальных кодирующие участки (на рисунке выделены красными прямоугольниками). Предположим, что это и есть та самая лишняя последовательность, для проверки будем удалять последовательности по одной и смотреть результат. После проверки подтвердили, что третья последовательность с идентификатором G0A1T5_METMM является лишней. Можно предположить, что этот белок имеет совершенно иную функцию, нежели остальные. Действительно, лишняя последовательность кодирует белок, регулирующий азот, а остальные - глицин расщепляющие системы.
Удалим негомологичные участки на N- и C- концевых участках оставшихся 5 последовательностей. Покрасим это выравнивание BLOSUM62, порог консервативности 30% (рис.2).