Белок, выбранный в 7 практикуме, является ферментм СТР-синтазой. Для поиска гомологичных последовательностей были выставлены следующие параметры:(см. рис 1,2). В поле Max target sequences была выбрана 1000, тк при 250 и 500 количество находок было равно 250 и 500 соответственно. Всего было найдено 568 последовательностей.
Пять выбранных последовательность и одна исходная были выровнены с помощью программы Mafft и визуализированы в Jalview. Ссылка на файл с проектом Jalview Jalview. Белки гомологичны между собой. Наиболее консервативные участки 6-85, 105-124, 140-163, 189-219, 297-315.
По запросу (taxonomy_id:10239) AND (protein_name:polyprotein) в UniProt нашлось 533,924 записей, я выбрала полипротеин из Hazara virus
ID GP_HAZVJ
AC A6XIP3
OS Hazara virus (isolate JC280)
Из зрелых белков я выбрала Glycoprotein N с координатами 308..596. Далее я его вырезала с помощью команды seqret 'sw:GP_HAZVJ[308:596]' segment.fasta. Ссылка на файл. Далее с помощью программы BLAST я нашла 3 последовательности. Затем с помошью программы Mafft выровняла и визуализировала в Jalview. Ссылка на файл с проектом Jalview Jalview. Белки гомологичны между собой, наиболее консервативный участок 237-265.
При поиске последовательностей с ограничением по организмам нашлось на 1 последовательность больше, чем без ограничения. E-value имевшихся ранее находок изменился 2e-82 - 9e-84; 2e-72- 8e-74. То есть E-value уменьшился в 22 и 25 раз соответственно, следовательно вирусные белки занимают около 4,255 % всех последовательностей в Swiss-Prot.