Практикум 10. Поиск гомологов (BLAST)
Задание 1. Поиск гомологов белка MSL7_MYCMM (B2HIL7)
Белок: B2HIL7 (MSL7_MYCMM) — Phenolphthiocerol synthesis polyketide synthase type I Pks15/1 из Mycobacterium marinum
Параметры BLAST:
- Program: blastp
- Database: swissprot
- Word size: 3
- Matrix: BLOSUM62
- Gap costs: 11, 1
- E-value threshold: 10
Результаты:
- Текстовая выдача BLAST (скачать)
- FASTA-файл с последовательностями (6 белков)
- Множественное выравнивание (FASTA)
- Скачать проект Jalview (MSL7_alignment.jvp)
Комментарии:
Выбраны 5 гомологов из разных видов микобактерий и стрептомицетов с идентичностью 49-82%. Все белки имеют E-value = 0.0, что подтверждает их гомологичность. Белки из Streptomyces имеют более низкую идентичность (~50%), но сохраняют консервативные домены поликетидсинтаз. В Jalview удаление белков не потребовалось.
Задание 2. Вирусный полипротеин (New York virus)
Полипротеин: GP_NYV (Q83887) — Envelopment polyprotein из New York virus
Выбранный зрелый белок: Glycoprotein N (Gn), координаты 18-652
Файлы:
- Вырезанная последовательность зрелого белка (FASTA)
- Текстовая выдача BLAST (без фильтра)
- FASTA-файл с последовательностями (6 белков)
- Множественное выравнивание (FASTA)
- Скачать проект Jalview (NYV_alignment.jvp)
Комментарии:
Выбраны 5 гомологов из различных хантавирусов с идентичностью 51-94%. Все белки имеют E-value = 0.0. В выравнивании все последовательности хорошо выровнялись, удаление белков не потребовалось.
Задание 3. Зависимость E-value от объёма банка
Параметры BLAST с фильтром: blastp, database = swissprot, organism = Viruses
Сравнение E-value:
Для белка Q89905.1 (Orthohantavirus sinnombreense):
- Поиск без фильтра: E-value = 0.0
- Поиск с фильтром (только вирусы): E-value = 0.0
Вывод:
Все найденные белки имеют E-value = 0.0 в обоих поисках, что свидетельствует о высокой степени гомологии. Оценить долю вирусных белков по E-value не представляется возможным из-за экстремально низких значений.