10 практикум (Программа BLAST)

Ложкина Мария

Гомологи белка K6UNZ7 (взятого из бактерии ustwickia chelonae), найденные в Swiss-Prot

Параметры при запуске BLAST:

Результат: 4 находки (при изменении word size на 5 и более, находок становится 3 штуки).

Текстовая выдача программы: K6UNZ7-Alignment.txt

Найденные блеки:

Для множественного выравнивания использовалась программа Mafft.

Ссылка на проект в Jalview: K6UNZ7_blast.jvp

Все найденные через BLAST белки являются гомологами исходного белка K6UNZ7, так как в выровненных последовательностях имеются большие консервативные участки.

Гомологи зрелого вирусного белка, вырезанного из полипротеина

Выбранный белок:

В записи Swiss-Prot полипротеина GP_BUNL8 в поле FT и ключе CHAIN выбрана следующий белок (на его и другие разрезается полипротеин):

Ссылка на последовательность зрелого белка с этими характеристиками: segment_Q8JPR1.fasta

Результат программы BLAST для этого белка (сегмента последовательности полипротеина GP_BUNL8): segment_Q8JPR1-Alignment.txt

Количество находок: 11

Отобранные белки:

Для множественного выравнивания использовалась программа Mafft. Полученное выравнивание было отредактировано: все буквы находок, которые в выравнивании оказались левее первой или правее последней буквы, выровненной с какой-либо буквой исходного зрелого белка, были удалены

Ссылка на проект в Jalview: segment_Q8JPR1_blast.jvp

Исследование зависимости E-value от объёма банка

При повторе предыдущего поиска через BLAST (с теми же параметрами) с добавлением Viruses (taxid:10239) в графу Organism получено также 11 находок. Результат не изменился.

Текстовая выдача программы: segment_Q8JPR1-Alignment(+viruses).txt

Значение E-value изменилось, например, у белка P36291.1 с 7е-08 (без добавления графы с вирусами) до 3е-09 (с добавлением графы с вирусами).

При сокращении поиска (при добавлении условия с вирусами мы ограничили базу данных, по которой проводился поиск) E-value уменьшилось (на 4,29%), то есть находка стала более значимой.

При сокращении базы данных мы ограничили ее только белками вирусов, то есть отношение исходной и полученной E-value показывает процентное содержание вирусных белков в Swiss-Prot от всех записей. Итого, в Swiss-Prot около 4,29% записей, соответствующих вирусным белкам.