Практикум 10

Программа BLAST

Поиск гомологов белка BioU

Исследовался белок (S)-8-амино-7-оксононаноатсинтаза BioU Natronococcus occultus SP4. Поиск гомологов проводился с помощью программы BLASTP на сайте NCBI по базе данных Swiss-Prot.

Параметры BLAST:
Database: Swiss-Prot
Program: blastp
Max target sequences: 100
E-value threshold: 0.05
Matrix: BLOSUM62
Gap costs: existence 11, extension 1
Compositional adjustments: Conditional compositional score matrix adjustment
Word size: 5

Результаты поиска: blast_biou.txt

В выдаче присутствовало 2 белка, при изменении параметра "Word size" количество находок не увеличилось.

Последовательности найденных белков были импортированы в Jalview. В результате множественного выравнивания было выявлено, что все исследуемые белки гомологичны, так как имеют сходную длину, консервативные участки.

Файл проекта Jalview: biou_alignment.jvp

2. Гомологи зрелого вирусного белка

В качестве вирусного полипротеина был выбран белок:

Зрелый белок:

Glycoprotein N
Координаты: 18–513

Для извлечения последовательности использовалась программа seqret:

seqret 'sw:P0DTC2[14:685]' spike_S1.fasta

Файл с последовательностью: glycoproteinN.fasta

Далее был выполнен поиск гомологов BLASTP по базе Swiss-Prot, параметры поиска такие же, как ранее представленные.

Текстовая выдача BLAST (6 результатов поиска): Uukuniemi_hom.txt

На основе найденных последовательностей построено множественное выравнивание. В Jalview удалены участки, расположенные левее первой и правее последней позиции, выровненной с исходным зрелым белком.

Файл проекта Jalview: alignment_vir1.jvp

3. Зависимость E-value от объема базы

Поиск был повторен с теми же параметрами, однако дополнительно использовался фильтр по организмам:

Organism: Viruses

После применения фильтра список находок не изменился, так как все белки, найденные при использовании предыдущего запроса, были вирусными; значение E-value изменилось для всех находок. Например, для белка, принадлежащего вирусу, что возбуждает лихорадку Рифтовой долины, характерны следующие значения:

Поиск E-value
Без фильтра 3e-21
Viruses 1e-22

Поскольку все параметры, кроме размера базы данных, оставались неизменными, E-value зависит в том числе от размера поисковго пространства, и отношение полученных значений позволит приблизительно оценить долю вирусных белков в Swiss-Prot. Так как значения отличаются примерно в 0,0333 раза, то доля вирусных белков в Swiss-Prot составляет приблизительно 3,33 %.