Практикум 10.
Всего находок в базе Swissprot оказалось 3, даже после изменения параметра "word size". Но стоит заметить, что в базе RefSeq находок было 340. Следовательно, такое малое количество находок в Swissprot связано не с особенностью белка.
Все эти белки гомологичны, т.к. у них присутствует большое количество консервативных участков.
Был выбран белок Glycoprotein С с координатами [653-1140].
Ссылка на последовательность белка в формате fasta.
Было выбрано 6 находок из общего списка. После выравнивания оказалось, что они все гомологичны т.к. имеют общие косервативные участки.
После повторного поиска с фильтром по организмам список и число находок не изменилось (16 штук). Это скорее всего связано с тем, что выбранный белок(Glycoprotein С)встречается только в вирусах.
E-value белка Puumala virus strain berkel изменилось с 1е-152 на 5е-154, т.е. уменьшилсь в 20 раз. Следовательно доля вирусных белков в Swissprot составляет 5%.