Работа с программой BLAST

Гомологи белка Lon protease

Я изменила два параметра: выбрала для "Database" опцию "UniProtKB/Swiss-Prot(swissprot)", максимальное число выдаваемых находок в "Algorithm parameters" поменяла на 500 (поскольку при настройках по умолчанию находок ровно 100, аналогично при выборе 250).

Остальные параметры оставила по умолчанию (рис. 1, 2).

param1
Рис. 1 параметры BLAST общие
param2
Рис. 2 параметры BLAST дополнительные

Общее количество находок при данных параметрах составило 271 последовательность.

Текстовая выдача программы BLAST для A0A0B5HZC1 (Lon protease)

Для выравнивания были выбраны первые 7 последовательностей: ссылка на файл с множественным выравниванием.


Гомологи зрелого вирусного белка, вырезанного из полипротеина

По запросу "(taxonomy_id:11118) AND (protein_name:polyprotein)" среди аннотированных белков я нашла полипротеин, для которого

Из белков, на которые разрезается полипротеин я выбрала Papain-like protease nsp3, координаты которого 819..2734.

Ссылка на fasta-файл
Текстовая выдача программы BLAST для зрелого вирусного белка (без применения фильтра по организмам)
Выравнивание

Исследование зависимости E-value от объёма банка


Текстовая выдача программы BLAST для зрелого вирусного белка (был применен фильтр по организмам)<

При применении фильтра по организмам количество находок уменьшилось до 63 (было 73).

Для белка с P0C6W8.1 E-value стал равен 6e-149, до применения фильтра был равен 1e-147. Найдем долю белков вирусов в Swiss-Prot: 6e-149 / 1e-147 = 0,06.