Задание 10

Работа с BLAST

UniProt AC = M4ZSF8

Гомологи моего белка:

Параметры BLAST

Parameter Value
Program blastp
Word size 5
Expect value 0.05
Hitlist size 100
Gapcosts 11,1
Matrix BLOSUM62
Filter string F
Genetic Code 1
Window Size 40
Threshold 0
Composition-based stats 2
Database UniProtKB/Swiss-Prot

Выдача BLAST:2PDBJW8T013-Alignment.txt

Выдача JalView:ProjBLAST.jvp

Для множественого выравнивания было отобрано 6 белков, которые были сопоставлены при помощь Muscle. Из результатов становится ясно, что все выбранные белки гоиологичны. Однако последовательности похожи только где-то с середины выравнивания. До этого момента одинаковых мест практически нет.

Гомологи вирусного белка:

Запрос в UniProtKB: (taxonomy_id:463676) AND (protein_name:polyprotein)

taxonomy_id:463676 указывает на Rhinovirus C, организм из риновирусов, возбудителей обыкновенной простуды.

По этому запросу был найден 1 Reviewed полипротеин.AC = E5D8F2. ID = POLG_HRV15. Human rhinovirus C (strain C15) (HRV-C15)

В строчках FT была найдена цепь для Protein 2B. Она кодируется на участке 989..1087

Выдача BLAST:3F9TDSFG013-Alignment.txt

Выдача JalView:ProjBLAST2.jvp

E-value:

Так как нам известна формула для нахождения E-value, нам остаётся только подстваить цифры. Ни один параметр кроме размера базы данных не изменился, следовательно обращаем внимание на изменение в E-value, как на изменение размера базы данных.

Таким образом, возьмём три совпадения, у которых изменилось E-value. 1e-62/3e-61 1e-27/3e-26 7e-27/2e-25

В результате получилось примерно 2.4% базы данных заняты вирусами