Программа BLAST
Для поисков гомологов Q0P9D1 использован BLAST, с параметрами, приведенными в таблице 1.
Текстовая выдача BLAST
Были отобраны 5 находок с наименьшими значениями E-value, с которыми произведено
множественнное выравнивание в Jalview.
В белках есть только отдельные гомологичные аминокислоты и короткие гомологичные участки, такие как 76, 81, 135-136, 149, 155-156,173-174, и другие. Для белка Q5UR11.1 возможно наличие инсерции, которая значительно увеличивает его длину.
Таблица 1.Параметры для BLAST
Параметр |
Значение |
AC |
Q0P9D1 |
Database |
UniprotKB/Swiss-Prot |
Organism |
Campylobacter jejuni subsp. jejuni serotype O:2 (strain ATCC 700819 / NCTC 11168) |
Exclude |
- |
BLAST algorithm |
blastp |
Algorithm parameters |
General parameters |
Max target sequences |
100 |
Expect treshold |
0.05 |
Word size |
2 |
Scoring parameters |
Matrix |
BLOSUM62 |
Gap Costs |
Existence: 11 Extension: 1 |
Filters & masking |
Filter |
- |
Mask |
- |
Гомологи зрелого вирусного белка, вырезанного из полипротеина.
По результатам поиска вирусных белков в Swiss-Prot, был выбран полипротеин Western equine encephalitis virus (WEEV). Данный вирус принадлежит к роду Alphavirus, семейству Togaviridae. В поле FT (ключ CHAIN) был выбран мРНК-кэпирующий фермент nsP1 (табл. 2). Он был вырезан из полипротеина и переведён в fasta-файл.
На вход в BLAST была подана последовательность данного белка (параметры те же, что в упр.1). Из всех найденных белков было только два с E-value отличным от нуля, с ними проведено выравнивание в Jalview. Удаление негомологичных участков в выравнивание не производилось.
Файлы:
По результатам выравнивания было обнаружено, что основной белок имеет очень большое количество гомологичных участков с другими белками из выравнивания, которые между собой почти полностью совпадают. 23 из 25 находок с E-value = 0 в сочетании с таким результатом могут свидетельствовать о том, что мРНК-кэпирующий фермент nsP1 является очень консервативным и с малым количеством изменений(или вообще без них) в аминокислотной последовательности встречается у нескольких разных вирусов.
Таблица 2.Информация о полипротеине WEEV и выбранном из него белке.
Полипротеин Western equine encephalitis virus |
Раздел UniProt KB |
Swiss-Prot |
UniProt ID |
POLN_WEEV |
UniProt AC |
P13896; Q9J1K2 |
Organism |
Western equine encephalitis virus (WEEV) |
Выбранный белок |
RecName |
mRNA-capping enzyme nsP1 |
Начало |
1 |
Конец |
533 |
Исследование зависимости E-value от объёма банка.
Здесь параметры BLAST остаются без изменений, за исключением фильтра по организмам, который здесь применяется (в данном случае - по вирусам). Список находок увеличился с 25 до 33.
Была выбрана находка с АС Q8QL53.1 . E-value в первом поиске был равен 1e-125, а во втором - 6e-127.
Путём сравнения этих значений считаем долю вирусных белков. По теореме С. Карлина E-value прямо пропорционально зависит от размера базы данных, в которой производится поиск, следовательно n(вирусных)/n(общих) = E-value(вирусных)/E-value(общих) = 6e-127/1e-125 = 0.06 (или 6%).