| Категория | Параметр | Значение |
|---|---|---|
| General parameters | Database | Swiss-Prot |
| AC (accession) | Q21V39 | |
| Max target sequences | 5000 | |
| Short queries | включено (auto-adjust parameters for short sequences) | |
| Expect threshold (E-value) | 0.1 | |
| Word size | 3 | |
| Max matches in a query range | 0 | |
| Scoring parameters | Substitution matrix | BLOSUM62 |
| Gap costs | Existence: 11, Extension: 1 | |
| Compositional adjustments | Conditional compositional score matrix adjustment | |
| Filters and masking | Low complexity filter | выключен |
| Masking | не применялось | |
| Mask for lookup table only | не использовалось | |
| Mask lower case letters | не использовалось |
С помощью программ EMBOSS был создан файл с 8 последовательностями белков. Было выполнено множественное выравнивание с помощью программы MUSCLE и загружено в Jalview для дальнейшего анализа.
По результатам анализа стоит отметить, что длины исследуемых белков различались: Большинство последовательностей содержали около 160–210 аминокислотных остатков, тогда как длина исходного белка составляла 555 аминокислот, а ещё одной последовательности - 501 аминокислотный остаток.
Несмотря на различия в длине, белки содержали общие консервативные и функционально сходные участки, что позволяет предположить их гомологичность.
Однако белок YRAA_BACSU, вероятно, является более удалённым гомологом, поскольку его последовательность заметно выпадала из одного из консервативных участков выравнивания (колонки 558–562).
| Параметр | Значение |
|---|---|
| ID | SPIKE_BCHK4 |
| AC | A3EX94 |
| OS (Организм) | Bat coronavirus HKU4 (BtCoV/HKU4/2004) |
| CHAIN | Spike protein S2 |
| Координаты | 750–1235 |
Последовательность зрелого белка
Выравнивание гомологов зрелого вирусного белка
В множественном выравнивании наблюдаются консервативные участки, что указывает на гомологичность рассматриваемых последовательностей.
В целом результаты BLAST и характер выравнивания подтверждают, что белки являются гомологами, но c разной степенью эволюционного родства
Я повторила BLAST-поиск с теми же параметрами, но ограничила базу только вирусными последовательностями, чтобы сравнить изменения E-value.
В качестве примера взяла один и тот же белок Q6Q1S2 : в полной базе его E-value было 1e-79, после фильтра стало 5e-81. Так как изменение E-value пропорциональной изменению размера баз, можно оценить, какую долю базы занимают вирусы - у меня получилось значение около 5%