Практикум 10

В этом практикуме была изучена работа програмы BLAST.

Для выполнения заданий была использована киназа реакции на стресс А (AC: A0A1Q9HL01.1) из практикума 7 (семестр 2).

Гомологии белка в Swiss-Prot

Параметры при запуске BLAST

Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no

Выдача программы: 044HN9H9013_Alignment.txt
Всего находок: 6

Были отобраны 5 находок: два белка E.coli (AC: P0C0K3.1; Q8X8H9.1), два белка Salmonella enterica subsp (AC: Q57HL7.1; Q5PKB8.1) и один белок Shigella flexneri (AC: Q83IV7.1).

Комада для выравнивания: Muscle with Defaults
Гиперссылка на файл с проектом Jalview: Jalview

По выравниванию видно, что все выбранные белки гомологичны друг другу (никакой белок не скрывался).

Гомологи зрелого вирусного белка, вырезанного из полипротеина

Для выполнения задания был выбран вирус в Swiss-Prot.

ID: CAPSD_HASV3
AC: Q9WFZ0
Название вируса: Human astrovirus-3 (HAstV-3)

В поле FT был найден ключ CHAIN зрелого белка со следующими характеристикиками:
Название: Spike protein VP27
Координаты в полипротеине: 396-649

Последовательнось зрелого белка: hastv3_vp27.fasta

Параметры при запуске BLAST

Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no

Выдача программы: 075JJ7Y5016-Alignment.txt
Всего находок: 9

Были отобраны 5 находок: пять вирусов Human astrovirus 7/1/6/8/5 (AC: Q96818.2; O12792.1; Q9IFX1.2; Q67815.1; Q4TWH7.1).

Комада для выравнивания: Muscle with Defaults
Гиперссылка на файл с проектом Jalview: Jalview

По выравниванию видно, что все выбранные последовательности гомологичны исходной, это подтвержддает их родство. Также результат выравнивания демонстрирует высокую степень консервативности среди гомологичных белков, что характерно для функцианально важных белков вирусных полипротеинов

Исследование зависимости E-value от объёма банка

Параметры при запуске BLAST

Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Organism: Viruses (taxid:10239)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no

Выдача программы: 077DWD05016-Alignment.txt
Всего находок: 9

Количество находок не измнилось, однако значение E-value притерпело измение. Например:

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Scientific Name Total Score Query Cover E-value Per. Ident Accession
Без ограничений по организмам Human astrovirus 4 256 98% 2e-80 50.60% Q3ZN05.1
С ограничением по организмам Human astrovirus 4 256 98% 4e-79 50.60% Q3ZN05.1

Как видно из таблицы при поиске с фильтром по вирусам E-value уменьшился (улучшился). Используя формулу для рассчёта Е-value можно определить, что в базе Swiss-Prot вирусные белки занимают около 5% от всей базы данных (5% от суммы длин всех последовательностей).