1. Поиск гомологов белка в Swiss-Prot

Поиск осуществлялся для белка beta-phosphoglucomutase (INSDC CDS CAA94734.1)

Параметры:
Database: UniProtKB/Swiss-Prot (swissprot)
Algorithm: blastp (protein-protein BLAST)

Max target sequences: 100
Expect treshold: 0.05
Wordsize: 6

Параметры выравнивания
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension: 1

Борьба с участками малой сложности
Compositional adjustments: Conditional compositional score matrix
Filter: Low complexity regions

Текстовая выдача программы

Далее помимо исходного были выбраны 6 белков с наиболее низким E-value и создано множественное выравнивание.

Результаты выравнивания

Белки Q9X0Y1 и Q49741 отличаются от остальных в некоторых консервативных участках, но структура выравнивания сохраняется, поэтому мне кажется, что все белки гомологичны.

2. Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина

Был выбран полипротеин вируса Radiation murine leukemia virus с ID: GAG_MLVRD, AC: P11269.
Белок RNA-binding phosphoprotein p12 с координатами [215:477], его последовательность.

Далее была запущена программа BLAST, выбрано 5 белков помимо исходного и проведено множественное выравнивание.

Текстовая выдача программы

Результаты выравнивания

Последовательности почти полностью совпали, белки гомологичны.

3. Исследование зависимости E-value от объёма банка

После ограничения поиска количество находок не изменилось, видимо данный белок характерен только для вирусов. E-value белка Q27ID9.1 изменилось с 4e-147 до 2е-148, то есть уменьшилось в 20 раз. Значит доля вирусных белков в Swiss-Prot равна 5%.