В практикуме 7 я выбрала белок PYRG_PHEZH (CTP - синтаза) бактерии Phenylobacterium zucineum (strain HLK1).
Параметры, которые были установлены:
Database: UniProtKB/Swiss-Prot(swissprot)
Organism: exclude: Phenylobacterium zucineum HLK1 (taxid:450851).
Max target sequences: 1000, так как при меньшем количестве E-value везде 0.0
Word size: изменение длины слова не влияло на выдачу (583 результата), поэтому я взяла 5
Остальные параметры были оставлены без изменения.
Так как на протяжении всей длины последовательности есть консервативные участки, можно сделать вывод, что белки гомологичны.
ID вируса: GP_SEOU8
AC вируса: P33455
Название: Seoul virus (strain 80-39)
Была выбрана цепь Glycoprotein N с кооринатами 18..646
Файл с последовательностью зрелого белка
BLAST выдал 18 находок, при изменении Word size их количество не менялось. Для выравнивания было выбрано шесть, помимо исходного: P33455.1, P17880.1, P28729.1, P16853.1, Q806Y7.1, P08668.1, P41265.1
Файл с множественным выравниванием
По выравниванию видно, что у белков большой процент идентичности, поэтому можно с уверенностью сказать, что они являются гомологами.
Сильнее всего отличается полипротеин GP_PUUMK (AC:P41265). Он длиннее остальных (1148) и у него чаще встречаются замены.
Для предыдущего белка все 18 находок имели E-value 0.0, поэтому было принято решение выбрать другой белок: POLN_ABPVR. При первой выдаче BLAST было получено 115 гомологов, а при дополнительном поиске по таксону Viruses - 119.
Учитывая, что длина и вес (S) исходной последовательности не менялась, можно оценить размеры баз данных, найдя их соотношение. В числителе находится размер базы данных Вирусов в Swiss-Prot, а в знаменателе размер всей базы данных Swiss-Prot. При этом, это оотношение будет равно отношению E-value в соответствующих запросах. Так, приблизительная оценка равна 0.05