Практикум 10
В этом практикуме была изучена работа програмы BLAST.
Для выполнения заданий была использована киназа реакции на стресс А (AC: A0A1Q9HL01.1) из практикума 7 (семестр 2).
Гомологии белка в Swiss-Prot
Параметры при запуске BLAST
Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no
Выдача программы: 044HN9H9013_Alignment.txt
Всего находок: 6
Были отобраны 5 находок: два белка E.coli (AC: P0C0K3.1; Q8X8H9.1), два белка Salmonella enterica subsp (AC: Q57HL7.1; Q5PKB8.1) и один белок Shigella flexneri (AC: Q83IV7.1).
Комада для выравнивания: Muscle with Defaults
Гиперссылка на файл с проектом Jalview: Jalview
По выравниванию видно, что все выбранные белки гомологичны друг другу (никакой белок не скрывался).
Гомологи зрелого вирусного белка, вырезанного из полипротеина
Для выполнения задания был выбран вирус в Swiss-Prot.
ID: CAPSD_HASV3
AC: Q9WFZ0
Название вируса: Human astrovirus-3 (HAstV-3)
В поле FT был найден ключ CHAIN зрелого белка со следующими характеристикиками:
Название: Spike protein VP27
Координаты в полипротеине: 396-649
Последовательнось зрелого белка: hastv3_vp27.fasta
Параметры при запуске BLAST
Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no
Выдача программы: 075JJ7Y5016-Alignment.txt
Всего находок: 9
Были отобраны 5 находок: четыре вируса Human astrovirus 7/1/6/8/5 (AC: Q96818.2; O12792.1; Q9IFX1.2; Q67815.1; Q4TWH7.1).
Комада для выравнивания: Muscle with Defaults
Гиперссылка на файл с проектом Jalview: Jalview
По выравниванию видно, что все выбранные вирусы гомологичны друг другу по зрелому белку (никакой белок не скрывался).
Исследование зависимости E-value от объёма банка
Параметры при запуске BLAST
Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Organism: Viruses (taxid:10239)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no
Выдача программы: 077DWD05016-Alignment.txt
Всего находок: 9
Количество находок не измнилось, однако значение E-value притерпело измение. Например:
Scientific Name | Total Score | Query Cover | E-value | Per. Ident | Accession | |
---|---|---|---|---|---|---|
Без ограничений по организмам | Human astrovirus 4 | 256 | 98% | 2e-80 | 50.60% | Q3ZN05.1 |
С ограничением по организмам | Human astrovirus 4 | 256 | 98% | 4e-79 | 50.60% | Q3ZN05.1 |
Как видно из таблицы при поиске с фильтром по вирусам E-value уменьшился (улучшился). Это обьясняется тем, что E-value зависит от размера базы, а значит при уменьшении базы E-value будет улудшаться.