описание параметров, использованных при запуске BLAST

Для поиска гомологов были использованы параметры по умолчанию (Стандартная бд, максимум 100 находок, длина слова 5, матица BLOSUM62, штраф 11 за открытие гэпа и 1 за продолжение, автоматическое регулирование параметров для запросов с короткой последовательностью и тд).



гомологи биотин-синтазы

В данном случае был выбран поиск по таксону Eykaria, тк иначе первые 500 находок имеют E-value = 0. Из результата запроса были выбраны 5 последовательностей для множественного выравнивания.

Вирусный белок

Для данного задания я выбрал белочек с ID R1AB_BCHK5 из вируса Короновируса Летучих мышей HKU5 (самый длинный из аннотированных в выдаче UniProt), AC - P0C6W4, A3EXC9. Для выравниваия я взял Ингибитор трансляции хозяина nsp1 (1-195 a/к). Из выдачи сайта я взял несколько последовательностей для выравнивания. Несложно заметить, что белочки почти идентичны, что связанно с большим количеством последовательностей белков коронавирусов в бд (MERS, в частности). Если поиск проводить только по вирусам, то E-value уменьшается на 1 порядок для каждой находки (файл). Это означает, что суммарная длина последовательности бд сократилась в 10 раз, т.е. вирусы составляют 10 % от всех в базе данных.