Практикум 10

В этом практикуме была изучена работа програмы BLAST.

Для выполнения заданий была использована киназа реакции на стресс А (AC: A0A1Q9HL01.1) из практикума 7 (семестр 2).

Гомологии белка в Swiss-Prot

Параметры при запуске BLAST

Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no

Выдача программы: 044HN9H9013_Alignment.txt
Всего находок: 6

Были отобраны 5 находок: два белка E.coli (AC: P0C0K3.1; Q8X8H9.1), два белка Salmonella enterica subsp (AC: Q57HL7.1; Q5PKB8.1) и один белок Shigella flexneri (AC: Q83IV7.1).

Комада для выравнивания: Muscle with Defaults
Гиперссылка на файл с проектом Jalview: Jalview

По выравниванию видно, что все выбранные белки гомологичны друг другу (никакой белок не скрывался).

Гомологи зрелого вирусного белка, вырезанного из полипротеина

Для выполнения задания был выбран вирус в Swiss-Prot.

ID: CAPSD_HASV3
AC: Q9WFZ0
Название вируса: Human astrovirus-3 (HAstV-3)

В поле FT был найден ключ CHAIN зрелого белка со следующими характеристикиками:
Название: Spike protein VP27
Координаты в полипротеине: 396-649

Последовательнось зрелого белка: hastv3_vp27.fasta

Параметры при запуске BLAST

Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no

Выдача программы: 075JJ7Y5016-Alignment.txt
Всего находок: 9

Были отобраны 5 находок: четыре вируса Human astrovirus 7/1/6/8/5 (AC: Q96818.2; O12792.1; Q9IFX1.2; Q67815.1; Q4TWH7.1).

Комада для выравнивания: Muscle with Defaults
Гиперссылка на файл с проектом Jalview: Jalview

По выравниванию видно, что все выбранные вирусы гомологичны друг другу по зрелому белку (никакой белок не скрывался).

Исследование зависимости E-value от объёма банка

Параметры при запуске BLAST

Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Organism: Viruses (taxid:10239)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no

Выдача программы: 077DWD05016-Alignment.txt
Всего находок: 9

Количество находок не измнилось, однако значение E-value притерпело измение. Например:

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Scientific Name Total Score Query Cover E-value Per. Ident Accession
Без ограничений по организмам Human astrovirus 4 256 98% 2e-80 50.60% Q3ZN05.1
С ограничением по организмам Human astrovirus 4 256 98% 4e-79 50.60% Q3ZN05.1

Как видно из таблицы при поиске с фильтром по вирусам E-value уменьшился (улучшился). Это обьясняется тем, что E-value зависит от размера базы, а значит при уменьшении базы E-value будет улудшаться.