Parameter | Value |
---|---|
AC | B5EJE8 |
Algorithm | blastp |
Max target sequences | 500 |
Expect threshold | 0.05 |
Word size | 5 |
Max matches in a query range | 0 |
Matrix | BLOSUM62 |
Gap Costs | Existence: 11 Extension: 2 |
Compositional adjustments | Conditional compositional score matrix adjustment |
По приведенным выше параметрам, поиск дал следующий результат.
Для выравнивания я выбрал 6 записей, помимо B5EJE8, из организмов, в том числе принадлежащих к разным крупным систематическим группам (животные, растения, грибы, γ-протеобактерии, термодесульфобактерии). Выровняв последовательности с помощью EMBOSS команды muscle и загрузив получившийся файл в jalview, я получил следующую картину. По выравниванию видно что у всех этих белков есть схожие домены, что может быть свидетельством их гомоллогии, и, следовательно, древности данного белка его функции.
Для исследования я выбрал полипротеин вируса гепатита C(ID:POLG_HCVJ1; AC:Q03463; OS:Hepatitis C virus genotype 1b (isolate HC-J1) (HCV)).
В качестве исследуемого я выбрал белок Protease NS2 с координатами 810-1026. Далее я вырезал последовательность этого белка и выполнил поиск похожих белков с помощью BLAST в NCBI. Отобрав 7 находок с довольно различающимися счетами выравнивания, я сделал множественное выравнивание программой muscle, затем импортировал его в jalview и там удалил все аминкислоты до и после выровненных с исходным белком в каждой последовательности. На выходе получилось это. Несмотря на то что всё это - белки вирусов гепатита C, их последовательность несколько различается, в особенности ближе к N-концу.
Для AC P26662 E-Value был равен 2e-120 при поиске по всем организмам и стал равен 7e-122 при поиске только среди вирусов, это означает что вирусных белков в swiss-prot 3,5%.