Из практикума 7 был взят белок Polyketide synthase, далее в окно Enter query sequence была введена его последовательность в формате FASTA. Остальные параметры при заупске BLAST можно увидеть ниже.
Текстовая выдача программы доступна по ссылке ниже:
Текстовая выдача программыВсего нашлось 465 находок. 6 из них я случайным образом выбрала. Их общее скачивание доступно ниже:
Общее скачивание выбранных 6 находокДалее этот документ был загружен в Jalview, а исходный белок был добавлен вручную, поскольку моего исходного белка не было в Swiss-Prot. Использовала Muscle with defaults, а затем сделала окрашивание по проценту идентичности. Множественное выравнивание доступно по ссылке ниже:
Исходя из результатов выравнивания можно сделать вывод, что в общем и целом белки являются гомологами. Такой результат можно объяснить тем, что выделяют 3 типа поликетидсинтаз, которые являются гомологами, однако все равно имеют те или иные отличия.
В даном задании с помощью SwissProt был выбран полипротеин по следующим параметрам: taxonomy_id:10239 AND protein_name:polyprotein. Нашлось 533924 результата.
Был выбран полипротеин P33455, ID:GP_SEOU8, AC:P33455, OS:Seoul virus (strain 80-39) при помощи команды:
entret sw:GP_SEOU8 -filter |grep '^OS'
entret sw:GP_SEOU8 -filter |grep '^FT'|grep 'CHAIN'> polyprotein.txt - при помощи этой команды искались координаты белков в полипротеине
Полученный текстовый файлВырезание белка было произведено при помощи команды:
descseq 'sw:GP_SEOU8[18:646]' -outseq polyprotein.fasta
Документ в формате FASTAДля работы в BLAST использовались следующие параметры:
Выдача в программе BLAST представлена ниже:
Выдача BLASTЯ выбрала 7 из полученных 18 находок случайным образом. Их общее скачивание доступно ниже:
Общее скачивание выбранных 7 находокСо всеми этими находками и нашим вырезанным зрелым белком (GP_SEOU8 P33455 (Glycoprotein N {ECO:0000250|UniProtKB:P08668})) было произведено множественное выравнивание. Буквы до и после нашего зрелого белка были удалены:
Получившееся множественное выравнивание в JalviewВсе белки имеют довольно высокую степень идентичности, что указывает на их гомологичность.
При исследование показателя E-value от объема банка в BLAST был применён фильтр по организмам (Viruses). Выдача получилась следующим образом:
Новая выдачаИзменились значения E-value для следующих 4 белков: 1) у Puumala virus strain berkel: 2*10^(-122)/4*10^(-121) = 0,05; 2) у Puumala virus udmurtia/894cg/91: 5*10^(-95)/10^(-93) = 0,05; 3) у Hazara virus (isolate JC280): 10^(-5)/3*10^(-4) = 0,0(3); 4) у Crimean-Congo hemorrhagic fever virus strain IbAr10200: 3*10^(-4)/0,008 = 0,0375. Полученные значения - доли вирусных белков в SwissProt.