Практикум 10. Программа BLAST

Поиск в Swiss-Prot гомологов моего белка

Из практикума 7 был взят белок Polyketide synthase, далее в окно Enter query sequence была введена его последовательность в формате FASTA. Остальные параметры при заупске BLAST можно увидеть ниже.

Рисунок 1. Параметры поиска(1)
Рисунок 2. Параметры поиска(2)

Текстовая выдача программы доступна по ссылке ниже:

Текстовая выдача программы

Всего нашлось 465 находок. 6 из них я случайным образом выбрала. Их общее скачивание доступно ниже:

Общее скачивание выбранных 6 находок

Далее этот документ был загружен в Jalview, а исходный белок был добавлен вручную, поскольку моего исходного белка не было в Swiss-Prot. Использовала Muscle with defaults, а затем сделала окрашивание по проценту идентичности. Множественное выравнивание доступно по ссылке ниже:

Рисунок 3. Множественное выравнивание
Проект в Jalview по множественному выравниванию

Исходя из результатов выравнивания можно сделать вывод, что в общем и целом белки являются гомологами. Такой результат можно объяснить тем, что выделяют 3 типа поликетидсинтаз, которые являются гомологами, однако все равно имеют те или иные отличия.

Поиск в Swiss-Prot гомологов зрелого вирусного белка, вырезанного из полипротеина

В даном задании с помощью SwissProt был выбран полипротеин по следующим параметрам: taxonomy_id:10239 AND protein_name:polyprotein. Нашлось 533924 результата.

Рисунок 4. Выбор полипротеина(1)
Рисунок 5. Выбор полипротеина(2)

Был выбран полипротеин P33455, ID:GP_SEOU8, AC:P33455, OS:Seoul virus (strain 80-39) при помощи команды:

entret sw:GP_SEOU8 -filter |grep '^OS'

entret sw:GP_SEOU8 -filter |grep '^FT'|grep 'CHAIN'> polyprotein.txt - при помощи этой команды искались координаты белков в полипротеине

Полученный текстовый файл

Вырезание белка было произведено при помощи команды:

descseq 'sw:GP_SEOU8[18:646]' -outseq polyprotein.fasta

Документ в формате FASTA

Для работы в BLAST использовались следующие параметры:

Рисунок 6. Параметры в BLAST(1)
Рисунок 7. Параметры в BLAST(2)

Выдача в программе BLAST представлена ниже:

Выдача BLAST

Я выбрала 7 из полученных 18 находок случайным образом. Их общее скачивание доступно ниже:

Общее скачивание выбранных 7 находок

Со всеми этими находками и нашим вырезанным зрелым белком (GP_SEOU8 P33455 (Glycoprotein N {ECO:0000250|UniProtKB:P08668})) было произведено множественное выравнивание. Буквы до и после нашего зрелого белка были удалены:

Получившееся множественное выравнивание в Jalview

Все белки имеют довольно высокую степень идентичности, что указывает на их гомологичность.

Исследование зависимости E-value от объёма банка

При исследование показателя E-value от объема банка в BLAST был применён фильтр по организмам (Viruses). Выдача получилась следующим образом:

Новая выдача

Изменились значения E-value для следующих 4 белков: 1) у Puumala virus strain berkel: 2*10^(-122)/4*10^(-121) = 0,05; 2) у Puumala virus udmurtia/894cg/91: 5*10^(-95)/10^(-93) = 0,05; 3) у Hazara virus (isolate JC280): 10^(-5)/3*10^(-4) = 0,0(3); 4) у Crimean-Congo hemorrhagic fever virus strain IbAr10200: 3*10^(-4)/0,008 = 0,0375. Полученные значения - доли вирусных белков в SwissProt.