Работа в BLASTP

Гомологи белка K7QWT7_THEOS

С помощью BLAST были найдены гомологи в базе Swiss-Prot для белка K7QWT7_THEOS из организма Thermus oshimai JL-2. Сам этот белок находится в базе TrEMBL, поэтому в BLAST я подала белковую последовательность из UniProt.

Из параметров я поменяла лишь банк поиска на Swiss-Prot, параметры алгоритма oстались по умолчанию:

Текстовая выдача BLAST для K7QWT7_THEOS
Множественное выравнивание в Jalview для K7QWT7

Первые три находки принадлежат роду Neisseria, следующие белки принадлежат другим родам. Для множественного выравнивания возьмем наш белок и первые четыре находки.

Как мы видим наши находки достаточно далеки от K7QWT7_THEOS (неудивительно, ведь идендичность с находками в BLAST около 30%), но есть и некоторые короткие консервативные участки (117-118, 123-130, 148-150, 164-165, 172-174, 182-185, 268-271, 299-300, 367-371).

Гомологи зрелого вирусного белка, вырезанного из полипротеина

Replicase polyprotein 1ab

ID: R1AB_BCHK3
AC: P0C6W2; Q3LZX2
OS: Bat coronavirus HKU3 (BtCoV) (SARS-like coronavirus HKU3)

Оценка доли вирусных белков в Swiss-Prot

При применении в BLAST фильт по вирусам для этого белка список находок не изменился. Для белка с Accession P0C6V1.1 E-value поменялся с 3e-94 на 1e-95. По теореме С.Карлина, мы можем найти долю вирусных белков (точнее долю длины белков вирусов от суммарной длины всех последовательностей). Делим второе значение E-value на второе и получаем, что вирусные белки составляют 1/30 от всех белков.