Для работы бласта я использовала стандартные параметры. В поле для последовательностей я вставила fasta-файл с последовательностью белка, полученный на сайте UniProtKB. Выбрала Swiss-Prot в качестве базы поиска. В списке дополнительных параметров изменила количество выдаваемых последовательностей до 500. Было найдено 489 совпадений. Остальные значения оставила стандартными.
В выравнивании много консервативных колонок - значит все исследуемые белки гомологичны
В базе данных Swiss-Prot я выбрала белок Glycoprotein N:
ID: GP-SEOU8
AC: P33455
OS: Seoul virus (strain 80-39)
Был выбран белок /note="Glycoprotein N", имеющий координаты 18-646. С помощью программы seqret я вырезала последовательность этого белка в файл fasta
Аналогично предыдущему упражнению я запустила Blast для этого белка и сделала выравнивание.
В параметрах Blast я ограничела организмы только вирусами. С ограничением Viruses программа выдыла 19 последовательностей, без - 18. Все значения E-value = 0.0, кроме этой новой последовательности, там 0.023. Напрашивается вывод, что анатированных вирусов более 100%...