Отчет за практикум 10

1. Гомологи белка в Swissprot

Параметры, использованные при запуске BLAST:

- База данных: UniProtKB/Swiss-Prot(swissprot)

- Организм: -

- Алгоритм: blastp (protein-protein BLAST)

- Максимальный размер выдачи: 100

- Ожидаемый порог: 0.05

- Длина слова: 6

- Матрица: BLOSUM62

- Стоимость гэпа: Existance: 11, Extension: 1

- Фильтры для участков малой сложности: Low complexity regions

Текстовая выдача BLAST

Всего находок - 36. Из них для выравнивания было выбрано 6.

Ссылка на выравнивание

По выравниванию можно сказать, что выбранные белки гомологичны, т.к. содержат много совпадающих участков.

2. Гомологи зрелого вирусного белка в Swissprot, вырезанного из полипротеина

Был выбран полипротеин с ID POL1_CPMVS и AC P03600 вируса Cowpea mosaic virus (strain SB) (CPMV). Из него вырезан белок с названием Protease cofactor и координатами 2..326

Ссылка на последовательность белка

Для выравнивания выбраны все 5 из 5 находок.

Текстовая выдача BLAST
Ссылка на выравнивание

3. Исследование зависимости E-value от объёма банка

После добавления параметра Organism: Viruses (taxid:10239) количество находок увеличилось на 1. Добавилась находка с E-value = 0.006.

Значение E-value изменилось для всех находок. Для сравнения возьмем белок P35930.1. E-value изменилось с 1е-145 на 4e-147, то есть уменьшилась в 25 раз. Тогда доля вирусных белков в Swissprot равна 0,04 или 4%.