Мой белок: Bifunctional protein GlmU; AC = Q5M0U2; organism = Streptococcus thermophilus (strain CNRZ 1066)
Параметры при запуске:
Поле Query Sequence: Q5M0U2
Поле Organism: исключил из поиска вид своей бактерии S. thermophilus (taxid:1308)
Поле Database: UniProtKB
Поле Word size: 2
Неупомянутые поля - по умолчанию
Множественное выравнивание
Все последовательности гомологичны, удалять ничего не нужно. Хороший процент покрытия, и у всех семи последовательностей совпадают консервативные и неконсервативные участки
Вирусный полипротеин:
ID: CAPSD_HASVA
AC: C7BG48
Organism: Human astrovirus VA1 (HAstV-VA1) (Mamastrovirus 9)
Зрелый белок:
Имя: Core protein VP33
Координаты: 1..298
Вырезанный зрелый белок в fasta-формате
Параметры при запуске BLAST:
Поле Query Sequence - встевил fasta файл зрелого белка
Поле Database: UniProtKB
Поле Word size: 2
Неупомянутые поля - по умолчанию
Т.к два поиска гомологов отличались только размерами базы данных, отношение размера баз данных равно отношению e-value у одинаковых белков. Для пяти одинаковых белков из только вирусных последовательностей и всей базы UniProt получились следующие отношения:
3/8 * 10^-1; 1/2 * 10^-1; 3/8 * 10^-1; 1/2 * 10^-1; 2/5 * 10^-1. Среднее значение 4.3 * 10^-2, следовательно вирусные белки составляют около 4.3% от всей базы UniProtKB
На этом все