Практикум 10


Задание 1

В практикуме 7 я выбрал ЦТФ-синтазу (AC:A0A151A1A2). Для поиска я ввёл последовательность моего белка в fasta-формате. В качестве базы данных была выбрана база UniProtKB/Swiss-Prot(swissprot). Остальные параметры были оставлены по умолчанию: алгоритм blastp, количество находок 100, E-value порог 0,05, матрица замен EBLOSUM62, размер слова 5, штраф за открытие гэпа 11, за удлинение гэпа 1

Ссылка на файл с текстовой выдачей
Ссылка на файл с пятью гомологичными послдеовательностями
Ссылка на файл с проектом Jalview

Выбранные мной белки оказались гомологичны, так как их выравнивание показало большую идентичность и лишь два гэпа, также мы отчетливо видим участки консервативности, одинаковые у последовательностей

Задание 2

Поисковый запрос: (taxonomy_id:10239) AND (reviewed:true) AND (protein_name:polyprotein)

(AC:P16853, ID:GP_HANTL, OS:Hantaan virus (strain Lee) (Lee virus) (Korean hemorrhagic fever virus))

Необходимый белок был получен с помощью команды descseq 'sw:GP_HANTL[19:648]' -outseq hanguk.fasta

Ссылка на файл с белковой последовательностью выбранного белка из полипротеина

Я ввел полученную последовательность белка в blast

Ссылка на файл с текстовой выдачей
Ссылка на файл с гомологичными последовательностями
Ссылка на файл с проектом Jalview

Белки показались мне гомологичными, так как есть много участков консервативности и отсутствуют гэпы

Задание 3

Я изменил запрос с обозначением таксона вирусов. Изменился E-value для пары белков: 0,011 и 0,26. Соотношение вирусов в базе примерно равно отношению E-value. 0,011/0,26 = 0,042. То есть доля вирусных белков в SwissProt примерно равно 4,2 процентам.

Ссылка на файл с выдачей при изменении запроса