Практикум 10

Программа BLAST

1. Поиск в Swiss-Prot гомологов белка IDH_COXBU

Параметры, которые были использованы при запуске BLAST:

Enter Query Sequence: файл в fasta формате, скачанный с сайти UniProt

Databases: Stabdart databases(nt etc.)

Database: UniProtKB/Swiss-Prot(swissprot)

Algorithm: blastp(protein-protein BLAST)

Algorithm parameters

Max target sequences: 250

Short queries: Automatically adjust parameters for short input sequences

Expect treshold: 0.05

Word size: 5

Matrix: BLOSUM62

Gap Costs: Existence:11 Extension:1

Вывод:

Текстовая выдача программы: ссылка

Находки: ссылка

Множественное выравнивание: ссылка

По итогам множественного выравнивания можно сделать вывод, что все выбранные белки гомологичны

2. Поиск в Swiss-Prot гомологов зрелого вирусного белка, вырезанного из полипротеина

Выбор полипротеина:

OS: Bunyamwera virus (BUNV)

ID: GP_BUNYW

AC: P04505

FT CHAIN: Glycoprotein N 17..302

Параметры, которые были использованы при запуске BLAST:

Enter Query Sequence: файл в fasta формате, скачанный с сайти UniProt

Databases: Stabdart databases(nt etc.)

Database: UniProtKB/Swiss-Prot(swissprot)

Algorithm: blastp(protein-protein BLAST)

Algorithm parameters

Max target sequences: 250

Short queries: Automatically adjust parameters for short input sequences

Expect treshold: 0.05

Word size: 5

Matrix: BLOSUM62

Gap Costs: Existence:11 Extension:1

Вывод:

Вырезанная последовательность белка: ссылка

Текстовая выдача программы: ссылка

Находки с ненулевым E-value: ссылка

Проект множественного выравнивания: ссылка

Всего по данному запросу нашлось 5 белков с ненулевым E-value, их все можно считать гомологичными.

3. Исследование зависимости E-value от объёма банка

Таблица 1. Сравнение E-value находок по разным запросам

AC E-value 1 E-value 2
P12430 2e-150 8e-152
P04875 1e-121 4e-123
Q8JPR1 8e-120 3e-121
P09612 2e-119 7e-121
H2AM12 5e-73 2e-74

Таблица составлена по результатам выдачи из предыдущего задания (E-value 1) и результатам, полученным при добавлении параметра Organism: Viruses (результат по ссылке). По данным таблицы, мы можем сделать вывод, что E-value 1 > E-value 2 в 25 раз. Поэтому предполагаемое количество вирусных белков в Swiss-Prot можно рассчитать по формуле: 569213/25 = 22769. И это составляет 22 769/569 213 = 0,04 (4%)