Практикум 10

1 Поиск гомологов белка в Swiss-Prot

В окошке "Enter query sequnce" ввел код доступа Swiss-prot своего белка.

Параметры BLAST:

  • Database: UniProtKB/Swiss-Prot
  • Organism: -
  • Algorithm: blastp (protein-protein BLAST)
  • Max target sequences: 100
  • Expect threshold: 0,05
  • Word size: 6
  • Matrix: BLOSUM62
  • Gap Costs: Existence: 11 Extension: 1
  • Compositional adjustments: Conditional compositional score matrix adjustment
  • Filter: Low complexity regions
  • Ссылка на текстовую выдачу программы

    Белки гомологичны, так как последовательности имеют очень много сходных участков.

    Ссылка на проект Jalview

    2 Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина, в Swissprot

    Для данного задания я выбрал вирус Sindbis virus с ID:POLN_SINDV и AC:P03317

    Дальше я выбрал один из зрелых белков, на которые разрезается полипротеин. Его название:mRNA-capping enzyme nsP1; c координатами:1..540

    Ссылка на последовательность белка в формате fasta

    Проделываем то же самое, что и в первом задании.

    Ссылка на текстовую выдачу программы

    Ссылка на проект Jalview

    3 Исследование зависимости E-value от объёма банка

    Добавив в фильтр значение "Viruses", список находок уменьшился с 87 до 58. Это говорит нам о том, что этот белок есть не только у вирусов. Для последовательности с кодом доступа Q83265.1 значение E-value также уменьшилось с 0.041 до 0.002. Так как отношение находок прямо пропорционально отношению их E-value, то можно расчитать общее колличество белков в исходнуй базе данных. Далее делим колличество вирусных белков на общее колличество белков. В итоге получаем, что доля вирусных белков равна 4.88%.