Практикум 10

Поиск гомологов белка в Swiss-Prot

Для выполнения задания практикума был выбран белок B0LIU0. Параметры программы были выбраны следующие:

Для поиска голомов в BLAST были использованы следующие параметры:

  • Датабаза: Swiss-Prot
  • Ввод последовательности: B0LIU0
  • Алгоритм: blastp

Algorithm parameters

  • Максимальный размер выдачи: 1000
  • Word size: 5
  • Порог на E-value: 0,05
  • Матрица: BLOSUM62
  • Штрафы за открытие и закрытие гэпов: открытие 11, закратие 1
  • Композиционные корректировки: условная компазиционная корректировка матрицы счета

Fasta-файл с последовательностью можно найти по ссылке.

При заданных параметров текстовая выдача программы следующая текстовая выдача.

Все белки гомологичны друг другу так как наблюдаются участки с высокой гомологией. Например участки 12-36, 92-131, 190-257. Выравнивание в Jalview.

Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина в Swiss-Prot.

Выбранный полипротеин:

  • ID: POLN_WEEV
  • AC: P13896; Q9J1K2
  • OS: Western equine encephalitis virus (WEEV)

Выбранный участок зрелого белка

  • Участок: [1-533]
  • Название: mRNA-capping enzyme nsP1

Fasta-файл с последовательностью mRNA-capping enzyme nsP1 можно найти по ссылке.

При заданных параметров текстовая выдача программы следующая текстовая выдача.

В Jalview было сделано множественное выравнивание. У белков довольно много похожих участков, они гомологичны, наблюдается много высоконсервативных участков.

Исследование зависимости E-value от объёма банка

Был проведен аналогичный поиск, однако теперь бал дополнительно задан параметр Organism, заданное значение которого "Viruses (taxid:10239)". Число находок изменилось, поиск выдает 57 находок (без ограничения поиска вирусами - 85).

Protein AC E-value 1 E-value 2
Q9IVZ9.1 4e-05 2e-06
P18339.2 8e-08 3e-09
Q6X2U4.1 0.004 2e-04
Таблица 1. E-value

C помощью формулы С.Карлина E-value=Kmn·e^-λS, где n - размер базы. Из формулы видно, что E-value изменяется прямопропорциально размеру базы. Можно посчитать какую долю вирусные составляют в базе Swiss-Prot. Например для белка с AC: Q6X2U4.1 E-value2/E-value1 * 100% = 5%. Следовательно доля вирусных белков: 5%.