Практикум 10

Для выполнения практикума был использован белок АТФ-зависимая 6-фосфофруктокиназа (AC:Q92BE4) из практикума 7.

Гомологи белка в Swiss-prot

Параметры при запуске BLAST:

Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 1000
Short queries: yes
Expect threshold: 0.05
Word size: 5
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no

Выдача программы: XX5Y0TZW014-Alignment.txt
Всего находок: 240

Было отобрано 6 белков:

Для множественного выравнивания использовалась команда:

muscle -align homologs.fasta -output homologs_alignment.fasta

Ссылка на проект Jalview

Все 6 последовательностей, отобранных по результатам BLAST-поиска, являются гомологами исходного белка, так как в выравнивании присутствуют протяжённые консервативные участки, количество гэпов минимальное.

Гомологи зрелого вирусного белка, вырезанного из полипротеина

В Swiss-prot был выбран вирус:

ID: POLG_ASGVP
AC: P36309
Название вируса: Apple stem grooving virus (strain P-209)

В поле FT был найден ключ CHAIN зрелого белка со следующими характеристикиками:

Название: Coat protein
Координаты в полипротеине: 1869-2105

Последовательность зрелого белка

Параметры при запуске BLAST:

Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Organism: Viruses (taxid:10239)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 1000
Short queries: yes
Expect threshold: 0.05
Word size: 2
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no

Выдача программы: XX5DZSTT016-Alignment.txt
Всего находок: 5

Было отобрано дополнительно 3 белка:

Для множественного выравнивания использовалась команда:

muscle -align viruses.fasta -output viruses_alignment.fasta

Ссылка на проект Jalview

Исходя из выравнивания видно, что найденные белки гомологичны друг другу, так как в выравнивании присутсвуют досаточно продолжительные консервативные участки. Однако данные белки не являются гомологичными по всей длине, поскольку в выравнивании присутсвуют участки с большим количеством гэпов, что возможно свидетельствует о вставке/делеции определенных фрагментов в эволюции.

Исследование зависимости E-value от объёма банка

Параметры при запуске BLAST:

Enter accession number(s), gi(s), or FASTA sequence(s): последовательность белка
Database: UniProtKB/Swiss-Prot(swissprot)
Organism: Viruses (taxid:10239)
Algorithm: blastp (protein-protein BLAST)
Max target sequences: 100
Short queries: yes
Expect threshold: 0.05
Word size: 2
Max matches in a query range: 0
Matrix: BLOSUM62
Gap Costs: Existence: 11 Extension:1
Compositional adjustments: Conditional compositional score matrix adjustment
Filters and Masking: no

Выдача программы: XYCZ810U014-Alignment.txt
Всего находок: 5

Количество находок не измнилось, однако значение E-value поменялось во всех выдаваемых белках.

Например, у белка Q67707.1 значение E-value без ограничений по организмам составило 3e-22, а с ограничением - 1e-23. То есть при поиске с фильтром по вирусам E-value уменьшился (улучшился). Поскольку при смене базы данных из формулы E-value меняется только размер банка (n), отношение E-value равно отношению размеров баз данных. Таким образом, вирусные белки составляют приблизительно 3,3% от всех белков в Swiss-Prot.