Практикум №10

Задание №1

При запуске BLAST я использовала такие параметры:

"Enter query sequence" - CAM64556.1; "Database" - UniProtKB/Swiss-Prot; "Algorithm" - blastp

Algorithm parameters: "Max target sequences" - 100; "Expect threshold" - 0.05; "Word size" - 6; "Matrix" - BLOSUM62; "Gap costs" - Existence: 11 Extension: 1; "Compositional adjustment" - Conditional compositional score matrix adjustment

Текстовая выдача программы

Я выбрала 5 белков. Сделала множественное выравнивание 6-ти белков, с идентификаторами: B1MK49.1; A0A2C9EVE6.1; Q4K423.1; F7J5X9.1; A0A2K9M484.1; Q715L4.1. Множественное выравнивание

Из 6-ти белков мне показались гомологичными лишь пять. Я удалила белок с идентификатором Q715L4.1, потому что его последовательность сильнее всего отличалась от других. К примеру, в столбцах 292-298 последовательности всех белков консервативны, кроме Q715L4.1.

Множественное выравнивание измененное

Задание №2

Для этого задания я выбрала следующий аннотированный полипротеин:

Я выбрала один белок из тех, на которые разрезается полипротеин. Название:RNA-directed RNA polymerase Координаты: 1144..1842 Последовательность зрелого белка

Получив последовательность в формате fasta, я выполнила те же действия, что и в задании №1. Я сделала запрос в BLAST с теми же параметрами.Текстовая выдача запроса

Я выполнила множественное выравнивание. Множественное выравнивание

Задание №3

Повторила предыдущий поиск, оставив те же параметры BLAST, но теперь применила фильтр по организмам, ограничив поиск вирусами (Viruses). Количество находок не изменилось.

Я нашла находку, у которой поменялось значение E-value. ID: P35930.1.

E-value вычисляется по формуле:

photo

Изменяется лишь значение E-value c 3e-161 на 1e-162. Значит могу оценить долю вирусных белков в Swiss-Prot, поделив значение E-value с фильтром на значение E-value без фильтра. Она равна примерно 3,33%