Задание 10
Работа с BLAST
Гомологи моего белка:
Параметры BLAST
Parameter | Value |
---|---|
Program | blastp |
Word size | 5 |
Expect value | 0.05 |
Hitlist size | 100 |
Gapcosts | 11,1 |
Matrix | BLOSUM62 |
Filter string | F |
Genetic Code | 1 |
Window Size | 40 |
Threshold | 0 |
Composition-based stats | 2 |
Database | UniProtKB/Swiss-Prot |
Выдача BLAST:2PDBJW8T013-Alignment.txt
Выдача JalView:ProjBLAST.jvp
Для множественого выравнивания было отобрано 6 белков, которые были сопоставлены при помощь Muscle. Из результатов становится ясно, что все выбранные белки гоиологичны. Однако последовательности похожи только где-то с середины выравнивания. До этого момента одинаковых мест практически нет.
Гомологи вирусного белка:
Запрос в UniProtKB: (taxonomy_id:463676) AND (protein_name:polyprotein)
taxonomy_id:463676 указывает на Rhinovirus C, организм из риновирусов, возбудителей обыкновенной простуды.
По этому запросу был найден 1 Reviewed полипротеин.AC = E5D8F2. ID = POLG_HRV15. Human rhinovirus C (strain C15) (HRV-C15)
В строчках FT была найдена цепь для Protein 2B. Она кодируется на участке 989..1087
Выдача BLAST:3F9TDSFG013-Alignment.txt
Выдача JalView:ProjBLAST2.jvp
E-value:
Так как нам известна формула для нахождения E-value, нам остаётся только подстваить цифры. Ни один параметр кроме размера базы данных не изменился, следовательно обращаем внимание на изменение в E-value, как на изменение размера базы данных.
Таким образом, возьмём три совпадения, у которых изменилось E-value. 1e-62/3e-61 1e-27/3e-26 7e-27/2e-25
В результате получилось примерно 2.4% базы данных заняты вирусами