Задание 1
Мой белок в седьмом практикуме: Шикимат-дегидрогеназа(Shikimate dehydrogenase (NADP(+))), A0A832T1A5_9EURY. С помощью BLAST Protein было найдено 100 последовательностей, семь из них были множественно выровнены, и можно предположить, что все они гомологичны, так как низкий процент несовпадений и гэпов
Задание 2
Я выбрал полипротеин PP62 вируса африканской чумы свиней, который был предварительно вырезан средствами командной строки, а далее вырезанный зрелый белок был также исследован при помощи BLAST, с таксономическим фильтром и без него. Было также проведено множественное выравнивание четырех полученных последовательностей, которое позволяет предположить, что все они гомологичны, так как практически не несовпадений и низкое число гэпов.
ID: PP62_ASFB7 AC: Q65179,Q86851 Name: Polyprotein pp62 {ECO:0000303|PubMed:30185597} Alternative name: 60 kDa polyprotein, 62 kDa polyprotein; Organism: African swine fever virus (strain Badajoz 1971 Vero-adapted) Taxonomy: Viruses; Varidnaviria; Bamfordvirae; Nucleocytoviricota; Pokkesviricetes; Asfuvirales; Asfarviridae; Asfivirus; African swine fever virus.
Задание 3
Так как с полипротеином из прошлого задания были проблемы с E-value, я выбрал другой полипротеин, Replicase polyprotein Q9DSN9 POLN_ABPVR. При добавлении таксономического фильтра Viruses, значения E-value изменились. Для находки Q9DSN9.1 значение E-value в поиске без таксономического фильтра составило 4e-122, а в поиске с ним 2e-123. Тем самым можно сказать, что список находок изменился, и доля вирусных белков составляет порядка 5 процентов от общего числа.