Параметры при запуске BLAST:
Результат: 4 находки (при изменении word size на 5 и более, находок становится 3 штуки).
Текстовая выдача программы: K6UNZ7-Alignment.txt
Найденные блеки:
Для множественного выравнивания использовалась программа Mafft.
Ссылка на проект в Jalview: K6UNZ7_blast.jvp
Все найденные через BLAST белки являются гомологами исходного белка K6UNZ7, так как в выровненных последовательностях имеются большие консервативные участки.
Выбранный белок:
В записи Swiss-Prot полипротеина GP_BUNL8 в поле FT и ключе CHAIN выбрана следующий белок (на его и другие разрезается полипротеин):
Ссылка на последовательность зрелого белка с этими характеристиками: segment_Q8JPR1.fasta
Результат программы BLAST для этого белка (сегмента последовательности полипротеина GP_BUNL8): segment_Q8JPR1-Alignment.txt
Количество находок: 11
Отобранные белки:
Для множественного выравнивания использовалась программа Mafft. Полученное выравнивание было отредактировано: все буквы находок, которые в выравнивании оказались левее первой или правее последней буквы, выровненной с какой-либо буквой исходного зрелого белка, были удалены
Ссылка на проект в Jalview: segment_Q8JPR1_blast.jvp
При повторе предыдущего поиска через BLAST (с теми же параметрами) с добавлением Viruses (taxid:10239) в графу Organism получено также 11 находок. Результат не изменился.
Текстовая выдача программы: segment_Q8JPR1-Alignment(+viruses).txt
Значение E-value изменилось, например, у белка P36291.1 с 7е-08 (без добавления графы с вирусами) до 3е-09 (с добавлением графы с вирусами).
При сокращении поиска (при добавлении условия с вирусами мы ограничили базу данных, по которой проводился поиск) E-value уменьшилось (на 4,29%), то есть находка стала более значимой.
При сокращении базы данных мы ограничили ее только белками вирусов, то есть отношение исходной и полученной E-value показывает процентное содержание вирусных белков в Swiss-Prot от всех записей. Итого, в Swiss-Prot около 4,29% записей, соответствующих вирусным белкам.