В практикуме 7 я выбрал белок A0A4P7J1X1, по нему я совершил поиск в BLAST, использовав следующие параметры: databases: standart databases; database: UniProtKB/Swiss-Prot; algorithm: blastp, также дополнительные параметры Algorithm parameters: Max target sequences: 5000; Expect threshold 0.1; word size: 5; filter: low complexity regions, остальные параметры были установлены по умолчанию по умолчанию. По запросу было получено 644 находки и отобрано 5 из них и выровнены вместе с исходным выбранным белком. Выравнивание белков было проведено с помощью команды muscle на kodomo.
Я выбрал полипротеин MAT_INCTA, O39842, который принадлежит вирусу гриппа типа С - Influenza C virus, он вызывает у людей легкие заболевания и случаи заражения этим типом встречаются реже по сравнению с другими типами. Из полипротеина был выбран зрелый белок: с 260 по 374 аминокислоту - Protein CM2 из выравнивания можно сказать о том, что все белки гомологичны и практически нет неконсервативных участков. Параметры запроса остались те же, что и в пункте 1, кроме Expect threshold: 0.05, а также отключен фильтр Low complexity regions, по запросу было обнаружено всего 5 белков.
После применения фильтра по организмам Viruses (taxid:10239) список находок не изменился, организм Influenza C virus был найден в обоих запросах (пункт 2-без фильтра по рганизмам), но у белка AC:O39842 изменился E. Value с 2e-80 на 8e-82, то есть значение уменьшилось в 25 раз, что говорит о том, что примерная доля вирусных белков в Swiss-Prot равна 4%