Выравнивания последовательностей 2

Белок из 7-ого практикума - А-субъединица ДНК-топоизомеразы 4 - очень консервативен: у последних 10 белков (при выдаче 5000 последовательностей) E-value равен 0.0. Я выбрала белок "DNA-binding protein H-NS"(ДНК-связывающий белок H-NS).

Все параметры выставлены по умолчанию, кроме database - UniprotKB/Swiss-Prot.

Текстовая выдача blast

Проект Jalview

Выравнивание Jalview

Скорей всего, белки гомологичны.

Вирусные белки

ID R1A_MERS1
AC K9N638
Название вируса Middle East respiratory syndrome-related coronavirus
Вирусные белки
  • Host translation inhibitor nsp1
  • Non-structural protein 2
  • Papain-like protease nsp3
  • Non-structural protein 4
  • 3C-like proteinase nsp5
  • Non-structural protein 6
  • Non-structural protein 7
  • Non-structural protein 8
  • RNA-capping enzyme subunit nsp9
  • Non-structural protein 10
  • Non-structural protein 11

Текстовая выдача Uniprot

В blast все параметры, кроме database(Swiss-Prot), по умолчанию.

Текстовая выдача Blast

Выбранные последовательности:

Проект Jalview

Итоговое выравнивание

Скорей всего, белки гомологичны.

Исследование зависимости E-value от объёма банка

Поисковый запрос без ограничения по таксонам

Поисковый запрос среди вирусов

Выбрана находка в конце списков(AC ASU90702.1). Score в обоих случаях - 343, E-value по всей базе - 2e-68, среди вирусов - 2e-69.

Расчет

\[E\text{-}value = Kmne^{-\lambda S}\] \[n = {E\text{-}value \over {Kme^{-\lambda S}}}.\] $$\omega = {n\text{-}vir \over n\text{-}total} = {E\text{-}value(vir)Kmne^{-\lambda S(total)} \over E\text{-}value(total)Kmne^{-\lambda S(vir)}} = {{E\text{-}value(vir) \over E\text{-}value(total)}*{e^{-\lambda (S(total) - S(vir))}}} = {{E\text{-}value(vir) \over E\text{-}value(total)} * e^0}$$ $$\omega = {E\text{-}value(vir) \over E\text{-}value(total)}$$ $$\omega = {2*10^{-69} \over 2*10^{-68}} = {0.1}$$

Доля вирусных белков - примерно 10%