Параметры, которые были использованы при запуске BLAST:
Выдача содержит всего 2 находки, включая исходный белок. Даже при изменении параметра Word size число находок не меняется.
Я думаю, что эти два белка нельзя назвать гомологичными. У них достаточно мало совпадающих участков (1-3, 33-35, 88-90, 382-386, 440-444, 464-470). Если провести парное выравнивание, то значения Identity(26.2%) и Similarity(37.1%) также достаточно низкие.
ID выбранного полипротеина: POLN_SAGV; AC: Q9JGL0; Q9JGK9; название вируса: Sagiyama virus (SAGV).
Я выбрала белок Protease nsP2 (Протеаза nsP2). Его координаты в полипротеине 535-1332. Файл в fasta-формате с последовательностью зрелого белка доступен по ссылке.
Я выбрала 6 находок и создала множественное выравнивание, доступное по ссылке. Белок P89659.2 я удалила, так как он, вероятно, не гомологичен исходному зрелому белку: имеется очень мало консервативных участков, и длина белка P89659.2 намного меньше исходного. Оставшиеся белки, скорее всего, гомологичны: имеют довольно много консервативных участков (83-99, 251-269, 276-290, 358-405), особенно в середине.
После применения фильтра по организмам (Viruses) число находок увеличилось на 2 : была 31 находка, стало – 33. Добавились находки с высоким значением E-value: 0.025.
Для сравнения значений E-value я использовала белок P89659.2. В первом случае его E-value равен 6e-13, а во втором - 3e-14. Значения отличаются в 0,05 раз, а значит доля вирусных белков в Swissprot тоже равна 0,05, или 5%.