Поиск гомологов белка BioU
Исследовался белок (S)-8-амино-7-оксононаноатсинтаза BioU Natronococcus occultus SP4. Поиск гомологов проводился с помощью программы BLASTP на сайте NCBI по базе данных Swiss-Prot.
Database: Swiss-Prot
Program: blastp
Max target sequences: 100
E-value threshold: 0.05
Matrix: BLOSUM62
Gap costs: existence 11, extension 1
Compositional adjustments: Conditional compositional score matrix adjustment
Word size: 5
Результаты поиска: blast_biou.txt
В выдаче присутствовало 2 белка, при изменении параметра "Word size" количество находок не увеличилось.
Последовательности найденных белков были импортированы в Jalview. В результате множественного выравнивания было выявлено, что все исследуемые белки гомологичны, так как имеют сходную длину, консервативные участки.
Файл проекта Jalview: biou_alignment.jvp
2. Гомологи зрелого вирусного белка
В качестве вирусного полипротеина был выбран белок:
- ID: P09613
- AC: GP_UUKS
- Организм: Uukuniemi virus (strain S23)
Зрелый белок:
Координаты: 18–513
Для извлечения последовательности использовалась программа seqret:
seqret 'sw:P0DTC2[14:685]' spike_S1.fasta
Файл с последовательностью: glycoproteinN.fasta
Далее был выполнен поиск гомологов BLASTP по базе Swiss-Prot, параметры поиска такие же, как ранее представленные.
Текстовая выдача BLAST (6 результатов поиска): Uukuniemi_hom.txt
На основе найденных последовательностей построено множественное выравнивание. В Jalview удалены участки, расположенные левее первой и правее последней позиции, выровненной с исходным зрелым белком.
Файл проекта Jalview: alignment_vir1.jvp
3. Зависимость E-value от объема базы
Поиск был повторен с теми же параметрами, однако дополнительно использовался фильтр по организмам:
После применения фильтра список находок не изменился, так как все белки, найденные при использовании предыдущего запроса, были вирусными; значение E-value изменилось для всех находок. Например, для белка, принадлежащего вирусу, что возбуждает лихорадку Рифтовой долины, характерны следующие значения:
| Поиск | E-value |
|---|---|
| Без фильтра | 3e-21 |
| Viruses | 1e-22 |
Поскольку все параметры, кроме размера базы данных, оставались неизменными, E-value зависит в том числе от размера поисковго пространства, и отношение полученных значений позволит приблизительно оценить долю вирусных белков в Swiss-Prot. Так как значения отличаются примерно в 0,0333 раза, то доля вирусных белков в Swiss-Prot составляет приблизительно 3,33 %.