Практикум 10
В этом практикуме была изучена работа програмы BLAST.
Для выполнения заданий была использована киназа реакции на стресс А (AC: A0A1Q9HL01.1) из практикума 7 (семестр 2).
Гомологии белка в Swiss-Prot
Параметры при запуске BLAST
Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no
Выдача программы: 044HN9H9013_Alignment.txt
Всего находок: 6
Были отобраны 5 находок: два белка E.coli (AC: P0C0K3.1; Q8X8H9.1), два белка Salmonella enterica subsp (AC: Q57HL7.1; Q5PKB8.1) и один белок Shigella flexneri (AC: Q83IV7.1).
Комада для выравнивания: Muscle with Defaults
Гиперссылка на файл с проектом Jalview: Jalview
По выравниванию видно, что все выбранные белки гомологичны друг другу (никакой белок не скрывался).
Гомологи зрелого вирусного белка, вырезанного из полипротеина
Для выполнения задания был выбран вирус в Swiss-Prot.
ID: CAPSD_HASV3
AC: Q9WFZ0
Название вируса: Human astrovirus-3 (HAstV-3)
В поле FT был найден ключ CHAIN зрелого белка со следующими характеристикиками:
Название: Spike protein VP27
Координаты в полипротеине: 396-649
Последовательнось зрелого белка: hastv3_vp27.fasta
Параметры при запуске BLAST
Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no
Выдача программы: 075JJ7Y5016-Alignment.txt
Всего находок: 9
Были отобраны 5 находок: пять вирусов Human astrovirus 7/1/6/8/5 (AC: Q96818.2; O12792.1; Q9IFX1.2; Q67815.1; Q4TWH7.1).
Комада для выравнивания: Muscle with Defaults
Гиперссылка на файл с проектом Jalview: Jalview
По выравниванию видно, что все выбранные последовательности гомологичны исходной, это подтвержддает их родство. Также результат выравнивания демонстрирует высокую степень консервативности среди гомологичных белков, что характерно для функцианально важных белков вирусных полипротеинов
Исследование зависимости E-value от объёма банка
Параметры при запуске BLAST
Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Organism: Viruses (taxid:10239)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no
Выдача программы: 077DWD05016-Alignment.txt
Всего находок: 9
Количество находок не измнилось, однако значение E-value притерпело измение. Например:
Scientific Name | Total Score | Query Cover | E-value | Per. Ident | Accession | |
---|---|---|---|---|---|---|
Без ограничений по организмам | Human astrovirus 4 | 256 | 98% | 2e-80 | 50.60% | Q3ZN05.1 |
С ограничением по организмам | Human astrovirus 4 | 256 | 98% | 4e-79 | 50.60% | Q3ZN05.1 |
Как видно из таблицы при поиске с фильтром по вирусам E-value уменьшился (улучшился). Используя формулу для рассчёта Е-value можно определить, что в базе Swiss-Prot вирусные белки занимают около 5% от всей базы данных (5% от суммы длин всех последовательностей).