Практикум 10. Поиск гомологов (BLAST)

Задание 1. Поиск гомологов белка MSL7_MYCMM (B2HIL7)

Белок: B2HIL7 (MSL7_MYCMM) — Phenolphthiocerol synthesis polyketide synthase type I Pks15/1 из Mycobacterium marinum

Параметры BLAST:
  • Program: blastp
  • Database: swissprot
  • Word size: 3
  • Matrix: BLOSUM62
  • Gap costs: 11, 1
  • E-value threshold: 10
Результаты:
Комментарии:

Выбраны 5 гомологов из разных видов микобактерий и стрептомицетов с идентичностью 49-82%. Все белки имеют E-value = 0.0, что подтверждает их гомологичность. Белки из Streptomyces имеют более низкую идентичность (~50%), но сохраняют консервативные домены поликетидсинтаз. В Jalview удаление белков не потребовалось.

Задание 2. Вирусный полипротеин (New York virus)

Полипротеин: GP_NYV (Q83887) — Envelopment polyprotein из New York virus

Выбранный зрелый белок: Glycoprotein N (Gn), координаты 18-652

Файлы:
Комментарии:

Выбраны 5 гомологов из различных хантавирусов с идентичностью 51-94%. Все белки имеют E-value = 0.0. В выравнивании все последовательности хорошо выровнялись, удаление белков не потребовалось.

Задание 3. Зависимость E-value от объёма банка

Параметры BLAST с фильтром: blastp, database = swissprot, organism = Viruses

Сравнение E-value:

Для белка Q89905.1 (Orthohantavirus sinnombreense):

  • Поиск без фильтра: E-value = 0.0
  • Поиск с фильтром (только вирусы): E-value = 0.0
Вывод:

Все найденные белки имеют E-value = 0.0 в обоих поисках, что свидетельствует о высокой степени гомологии. Оценить долю вирусных белков по E-value не представляется возможным из-за экстремально низких значений.