Практикум 10. BLAST

1. Поиск гомологов GlmU в Swiss-Prot

Белок: Bifunctional protein GlmU (A0A2R4MWP3) из Carboxydocella thermautotrophica (462 а.о.).

Параметры BLAST

ПараметрЗначение
ПрограммаBLASTP (Protein BLAST)
Банк данныхSwiss-Prot (swissprot)
Матрица заменBLOSUM62
Штраф за гэпExistence: 11, Extension: 1
Word size6
E-value порог10
Max target sequences250

Текстовая выдача BLAST: GlmU_blast.txt

Для множественного выравнивания отобраны 6 находок из разных таксонов: GLMU_ECOLI (E. coli), GLMU_BACSU (B. subtilis), GLMU_HAEIN (H. influenzae), GLMU_MYCTO (M. tuberculosis CDC1551), GLMU_MYCTU (M. tuberculosis H37Rv), GLMU_MICAN (M. canettii).

Все отобранные белки гомологичны GlmU, что подтверждается высоким процентом идентичности и наличием общих консервативных участков. Ни один белок не был удалён из выравнивания.

Проект Jalview: GlmU_alignment.jvp

2. Поиск гомологов вирусного зрелого белка

Выбор полипротеина и зрелого белка

В Swiss-Prot найден аннотированный полипротеин вируса Ла-Кросс: RPOA_LDVP (Replicase polyprotein 1ab).

Из поля FT выбран зрелый белок: 3C-like serine proteinase (координаты 1513–1714, 202 а.о.).

Последовательность вырезана с помощью seqret и сохранена в файл: lavirus_protease.fasta.

BLAST зрелого белка

Параметры BLAST: банк Swiss-Prot, без фильтра по организмам, остальные параметры по умолчанию для BLASTP.

Текстовая выдача BLAST: virus_blast.txt

Для множественного выравнивания отобрано 5 находок из родственных вирусов (Lactate dehydrogenase elevating virus, PRRSV, Simian hemorrhagic fever virus).

В Jalview из выравнивания удалены столбцы, выходящие за пределы исходного зрелого белка (левее первой и правее последней буквы 3C-like serine proteinase).

Проект Jalview: lavirus_alignment.jvp

3. Зависимость E-value от объёма банка

Поиск повторён с фильтром по организмам: Viruses (taxid:10239). Параметры BLAST те же.

Для сравнения выбрана находка Q06502 (Replicase polyprotein 1ab, Lactate dehydrogenase elevating virus C):

ПоискE-valueРазмер банка
Без фильтра2e-111Весь Swiss-Prot (~486 626 записей)
С фильтром Viruses7e-113Только вирусные белки

Оценка доли вирусных белков в Swiss-Prot:

E-value пропорционально размеру банка. Отношение E1/E2 = 2e-111 / 7e-113 ≈ 28.6. Следовательно, вирусные белки составляют примерно 1/29 ≈ 3.4% от Swiss-Prot.

При фильтрации банк уменьшается (остаются только вирусные белки), поэтому E-value становится меньше — снижается вероятность случайной находки.