Практикум 10. BLAST
1. Поиск гомологов GlmU в Swiss-Prot
Белок: Bifunctional protein GlmU (A0A2R4MWP3) из Carboxydocella thermautotrophica (462 а.о.).
Параметры BLAST
| Параметр | Значение |
|---|---|
| Программа | BLASTP (Protein BLAST) |
| Банк данных | Swiss-Prot (swissprot) |
| Матрица замен | BLOSUM62 |
| Штраф за гэп | Existence: 11, Extension: 1 |
| Word size | 6 |
| E-value порог | 10 |
| Max target sequences | 250 |
Текстовая выдача BLAST: GlmU_blast.txt
Для множественного выравнивания отобраны 6 находок из разных таксонов: GLMU_ECOLI (E. coli), GLMU_BACSU (B. subtilis), GLMU_HAEIN (H. influenzae), GLMU_MYCTO (M. tuberculosis CDC1551), GLMU_MYCTU (M. tuberculosis H37Rv), GLMU_MICAN (M. canettii).
Все отобранные белки гомологичны GlmU, что подтверждается высоким процентом идентичности и наличием общих консервативных участков. Ни один белок не был удалён из выравнивания.
Проект Jalview: GlmU_alignment.jvp
2. Поиск гомологов вирусного зрелого белка
Выбор полипротеина и зрелого белка
В Swiss-Prot найден аннотированный полипротеин вируса Ла-Кросс: RPOA_LDVP (Replicase polyprotein 1ab).
Из поля FT выбран зрелый белок: 3C-like serine proteinase (координаты 1513–1714, 202 а.о.).
Последовательность вырезана с помощью seqret и сохранена в файл: lavirus_protease.fasta.
BLAST зрелого белка
Параметры BLAST: банк Swiss-Prot, без фильтра по организмам, остальные параметры по умолчанию для BLASTP.
Текстовая выдача BLAST: virus_blast.txt
Для множественного выравнивания отобрано 5 находок из родственных вирусов (Lactate dehydrogenase elevating virus, PRRSV, Simian hemorrhagic fever virus).
В Jalview из выравнивания удалены столбцы, выходящие за пределы исходного зрелого белка (левее первой и правее последней буквы 3C-like serine proteinase).
Проект Jalview: lavirus_alignment.jvp
3. Зависимость E-value от объёма банка
Поиск повторён с фильтром по организмам: Viruses (taxid:10239). Параметры BLAST те же.
Для сравнения выбрана находка Q06502 (Replicase polyprotein 1ab, Lactate dehydrogenase elevating virus C):
| Поиск | E-value | Размер банка |
|---|---|---|
| Без фильтра | 2e-111 | Весь Swiss-Prot (~486 626 записей) |
| С фильтром Viruses | 7e-113 | Только вирусные белки |
Оценка доли вирусных белков в Swiss-Prot:
E-value пропорционально размеру банка. Отношение E1/E2 = 2e-111 / 7e-113 ≈ 28.6. Следовательно, вирусные белки составляют примерно 1/29 ≈ 3.4% от Swiss-Prot.
При фильтрации банк уменьшается (остаются только вирусные белки), поэтому E-value становится меньше — снижается вероятность случайной находки.