Поиск схожих белков с помощью BLAST
Parameter Value
AC B5EJE8
Algorithm blastp
Max target sequences 500
Expect threshold 0.05
Word size 5
Max matches in a query range 0
Matrix BLOSUM62
Gap Costs Existence: 11 Extension: 2
Compositional adjustments Conditional compositional score matrix adjustment

По приведенным выше параметрам, поиск дал следующий результат.

Множественное попарное выравнивание

Для выравнивания я выбрал 6 записей, помимо B5EJE8, из организмов, в том числе принадлежащих к разным крупным систематическим группам (животные, растения, грибы, γ-протеобактерии, термодесульфобактерии). Выровняв последовательности с помощью EMBOSS команды muscle и загрузив получившийся файл в jalview, я получил следующую картину. По выравниванию видно что у всех этих белков есть схожие домены, что может быть свидетельством их гомоллогии, и, следовательно, древности данного белка его функции.

Работа с полипротеином

Для исследования я выбрал полипротеин вируса гепатита C(ID:POLG_HCVJ1; AC:Q03463; OS:Hepatitis C virus genotype 1b (isolate HC-J1) (HCV)).

В качестве исследуемого я выбрал белок Protease NS2 с координатами 810-1026. Далее я вырезал последовательность этого белка и выполнил поиск похожих белков с помощью BLAST в NCBI. Отобрав 7 находок с довольно различающимися счетами выравнивания, я сделал множественное выравнивание программой muscle, затем импортировал его в jalview и там удалил все аминкислоты до и после выровненных с исходным белком в каждой последовательности. На выходе получилось это. Несмотря на то что всё это - белки вирусов гепатита C, их последовательность несколько различается, в особенности ближе к N-концу.

Изменение E-Value

Для AC P26662 E-Value был равен 2e-120 при поиске по всем организмам и стал равен 7e-122 при поиске только среди вирусов, это означает что вирусных белков в swiss-prot 3,5%.