Практикум 10

1. Поиск гомологов белка в Swiss-Prot

Для белка с идентификатором INSDC CDS CAC41944.1 (АДФ-полифосфат фосфотрансфераза 1) я по AC Swiss-Prot (Q92SA6) запустил программу BLAST для поиска гомологичных белков.

Параметры BLAST, которые были использованы:

  • Database - UniProtKB/Swiss-Prot(swissprot) (Поиск только в базе данных Swiss-Prot)
  • Algorithm - blastp (protein-protein BLAST) (алгоритм по умолчанию)
  • Максимальный размер выдачи - 100
  • Порог на E-value - 0.05
  • Длина слова - 6 (работает быстро, но с потерей чувствительности)
  • Параметры выравнивания: BLOSUM62, Existance: 11, Extension: 1
  • Борьба с "участками малой сложности" по умолчанию
  • Ссылка на текстовую выдачу программы

    Далее я выбрал 5 находок с наименьшим E-value (за исключением самого белка) и сделал множественное выравнивание.

    Ссылка на проект Jalview

    Я думаю, что все выровненные белки гомологичны, т.к. у них есть участки очень большого сходства (например, участок 125-135, полносью одинаковый у всех 6 организмов).

    2. Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина в Swiss-Prot

    Я выбрал полипротеин с ID POLN_SFV и AC P08411 организма Semliki forest virus (SFV).

    Далее я выбрал белок RNA-directed RNA polymerase nsP4 (РНК-зависимая РНК-полимераза nsP4), с координатами 1819-2431.

    Ссылка на последовательность белка в формате fasta

    После этого я сделал то же самое, что и в задании 1 (BLAST, отобрал 5 наилучших находок, множественное выравнивание).

    Ссылка на текстовую выдачу программы

    Ссылка на проект Jalview

    3. Исследование зависимости E-value от объёма банка

    После повторного поиска было найдено столько же белков (35), это связано с тем, что РНК-зависимые РНК-полимеразы встречаются только у вирусов, а также с тем, что они высококонсервативны (уменьшение размера базы даных не добавило новых белков, для который E-value по всему Swiss-Prot был больше 0.05).

    Белок Replicase large subunit (большая субъединица репликазы) организма Youcai mosaic virus изменил свой E-value с 1e-12 до 6e-14, то есть, E-value уменьшился в 16,67 раз. Т.к. E-value находится в прямой линейной зависимости от размера базы данных, база данных тоже уменьшилась в 16,67 раз, значит вирусных белков в Swiss-Prot 6%.