1)Скачиваем последовательности белков в формате FASTA из UNIPROT.
2)Строим множественное выравнивание 6 белков с помощью программы Muscle с параметрами по умолчанию.
3)Раскрашиваем выравнивание по схеме BLOSUM62 с порогом по консервативности 30%.
4)Поочередно удаляем из выравнивания каждую последовательность. Можно заметить, что при удалении последовательности C4Z3Y7_EUBE2 число консервативных колонок резко возрастает. Можно сделать вывод, что C4Z3Y7_EUBE2 - лишняя последовательность.
Идентификатор лишней последовательности C4Z3Y7_EUBE2.
Изображение выравнивания без лишней последовательности в раскраске BLOSUM62 с порогом по консервативности 30%.
Выравнивание в формате FASTA
Выравнивание в формате MSF
Ссылка на весь проект
pr9.1.jvp