Практикум 10.

Поиск гомологов с помощью BLAST.

При запуске BLAST были использованы следующие параметры:

Database: UniProtKB/Swiss-Prot (swissprot)

Algorithm: blastp (protein-protein BLAST)

Max target sequences: 100

Expect treshold: 0,05

Wordsize: 6

Matrix: BLOSUM62

Gap Costs: Existence: 11 Extension: 1

Compositional adjustments: Conditional compositional score matrix

По ссылке можно скачать файл с текстовой выдачей ответа на запрос.

Выбранные мной пять белков почти точно гомологичны моему (много консервативных участков). Скачать выравнивание можно по По ссылке.

Полипротеин вируса.

Выбрынный полипротеин - вируса клещевого энцефалита (Tick-borne encephalitis virus (strain Hypr) (TBEV) [70733])

ID: POLG_TBEVH

AC: Q01299

Название белка: Capsid protein C

Локация в полипротеине: 1-96

Текстовая выдача (11 находок).

Выравнивание с 6-тью находками.

Думаю, все находки в выравнивании гомологичны заданному белку (все, кроме последней, имеют очень много одинаковых участков, про последний - непонятно: с одной стороны сходных участков мало, с другой явно видны два консервативных дуплета аргинина (17-18 и 102-103) и консервативный мотив LRK (81 - 83), а также мало гэпов, что скорее свидетельствует в пользу гомологии).

Исследование зависимости E-value от объёма базы данных.

Количество находок не поменялось (вполне ожидаемо, что белки капсида характерны только для вирусов :)). Для всех находок E-value уменьшилось от 25 до 30 раз. Поскольку это значение прямо пропорционально размеру базы, можно сделать вывод, что вирусы сотавляют около 3,6 % всей базы данных.