1. Гомологи исходного белка
Для выполнения задания я взяла белок, с которым уже работала ранее в 7 практикуме.
Для поиска гомологов фермента сирогемсинтазы (A0A3R8W1N3_PRORE) из бактерии Providencia rettgeri были использованы следующие параметры запуска BLAST:
Для множественного выравнивания были выбраны следующие 7 гомологов:
Ссылка на скачивание множественного выравнивания гомологов с исходной последовательностью A0A3R8W1N3_PRORE Providencia rettgeri.
Выравнивание имеет достаточно высокий вес, а последовательности содержат внушительное количество общих консервативных участков, поэтому можно смело говорить о гомологичности выбранных белков.
2. Гомологи вирусного белка
Вирусный полипротеин:
Зрелый белок:
После запуска поиска в BLAST получила 3 последовательности, изменение параметра 'Word size' на результат не повлияло.
Полученное выравнивание можно скачать по ссылке.
Все последовательности скорее всего являются гомологами, поскольку по всей их длине расположено большое количество консервативных участков.
3. Исследование E-value
Поскольку я выбрала белок слишком малоизвестного вируса, то находок в NCBI было всего три и каждая вирусного происхождения, поэтому при применении фильтра по организмам ничего не меняется. Могу предположить, что при использовании фильтра количество находок должно было бы сократиться.
Чтобы оценить долю вирусных белков в Swiss-Prot путём сравнения значений E-value, можно вспомнить, что суммарная длина последовательностей базы данных ~ Е-value, следовательно:
E-valuе (вирусы)/E-valuе (без учёта таксона) = доля вирусных последовательностей в Swiss-Prot.