Программа BLAST


Для поисков гомологов Q0P9D1 использован BLAST, с параметрами, приведенными в таблице 1.

Текстовая выдача BLAST

Были отобраны 5 находок с наименьшими значениями E-value, с которыми произведено множественнное выравнивание в Jalview.

В белках есть только отдельные гомологичные аминокислоты и короткие гомологичные участки, такие как 76, 81, 135-136, 149, 155-156,173-174, и другие. Для белка Q5UR11.1 возможно наличие инсерции, которая значительно увеличивает его длину.

Таблица 1.Параметры для BLAST
Параметр Значение
AC Q0P9D1
Database UniprotKB/Swiss-Prot
Organism Campylobacter jejuni subsp. jejuni serotype O:2 (strain ATCC 700819 / NCTC 11168)
Exclude -
BLAST algorithm blastp
Algorithm parameters
General parameters
Max target sequences 100
Expect treshold 0.05
Word size 2
Scoring parameters
Matrix BLOSUM62
Gap Costs Existence: 11 Extension: 1
Filters & masking
Filter -
Mask -


Гомологи зрелого вирусного белка, вырезанного из полипротеина.


По результатам поиска вирусных белков в Swiss-Prot, был выбран полипротеин Western equine encephalitis virus (WEEV). Данный вирус принадлежит к роду Alphavirus, семейству Togaviridae. В поле FT (ключ CHAIN) был выбран мРНК-кэпирующий фермент nsP1 (табл. 2). Он был вырезан из полипротеина и переведён в fasta-файл.
На вход в BLAST была подана последовательность данного белка (параметры те же, что в упр.1). Из всех найденных белков было только два с E-value отличным от нуля, с ними проведено выравнивание в Jalview. Удаление негомологичных участков в выравнивание не производилось.
Файлы:
По результатам выравнивания было обнаружено, что основной белок имеет очень большое количество гомологичных участков с другими белками из выравнивания, которые между собой почти полностью совпадают. 23 из 25 находок с E-value = 0 в сочетании с таким результатом могут свидетельствовать о том, что мРНК-кэпирующий фермент nsP1 является очень консервативным и с малым количеством изменений(или вообще без них) в аминокислотной последовательности встречается у нескольких разных вирусов.

Таблица 2.Информация о полипротеине WEEV и выбранном из него белке.
Полипротеин Western equine encephalitis virus
Раздел UniProt KB Swiss-Prot
UniProt ID POLN_WEEV
UniProt AC P13896; Q9J1K2
Organism Western equine encephalitis virus (WEEV)
Выбранный белок
RecName mRNA-capping enzyme nsP1
Начало 1
Конец 533


Исследование зависимости E-value от объёма банка.

Здесь параметры BLAST остаются без изменений, за исключением фильтра по организмам, который здесь применяется (в данном случае - по вирусам). Список находок увеличился с 25 до 33. Была выбрана находка с АС Q8QL53.1 . E-value в первом поиске был равен 1e-125, а во втором - 6e-127.
Путём сравнения этих значений считаем долю вирусных белков. По теореме С. Карлина E-value прямо пропорционально зависит от размера базы данных, в которой производится поиск, следовательно n(вирусных)/n(общих) = E-value(вирусных)/E-value(общих) = 6e-127/1e-125 = 0.06 (или 6%).