Программа BLAST

Гомологи белка TcdB в Swiss-Prot

Параметры, которые были использованы при запуске BLAST:

Было найдено 100 последовательностей (с текстовой выдачей программы можно ознакомиться по ссылке)

Было отобрано 5 находок, затем проведено множественное выравнивание (ознакомиться с ним можно по ссылке), белков, не гомологичных моему, не оказалось. Гомологичность этих пяти белков можно обосновать наличием заметных консервативных участков.


Гомологи зрелого вирусного белка, вырезанного из полипротеина

Я нашла в Swiss-Prot полипротеин с ID – POLN_EEEV1; AC – Q306W6; OS – Eastern equine encephalitis virus (strain PE-0.0155) (EEEV) (Eastern equine encephalomyelitis virus), затем выбрала зрелый белок mRNA-capping enzyme nsP1, его координаты: 1..533. Последовательность белка в формате FASTA можно найти по ссылке

Параметры, которые были использованы при запуске BLAST:

Было найдено 100 последовательностей (с текстовой выдачей программы можно ознакомиться по ссылке)

Было отобрано 5 находок, затем проведено множественное выравнивание (ознакомиться с ним можно по ссылке). В выравнивании полностью отсутствуют инсерции и делеции (гэпы), также есть протяженные участки абсолютной консервативности (например, 330-379 колонки) - это демонстрирует консервативность данных белков. Полноразмерные края всех находок идеально совпали с границами исходного белка, поэтому ручное удаление концевых фрагментов не потребовалось.

Исследование зависимости E-value от объёма банка

Я повторила предыдущий поиск, оставив те же параметры BLAST, но ограничила поиск вирусами. Список находок изменился, так как исчезли невирусные белки. Затем для исследования зависимости E-value от объема базы данных я выбрала гомологичную последовательность белка с AC Q8QL53.1, получила такие данные:

Видно, что значение E-value во втором поиске уменьшилось. Рассчитав соотношение E(2)/E(1), я оценила долю вирусных белков в Swiss-Prot, которая для данной находки составила 6% от общего объема банка данных.