На главную

Карта локального сходства двух полипротеинов

Рис1. Карта локального сходства полипротеинов P03300 и P49303

Выравнивание I

AC Organism Identities Positives Gaps Score Bits Length Coords
P03300 Poliovirus type 1 (strain Mahoney) 29% 49% 8% 647 253 615 1594-2208
P49303 Foot-and-mouth disease virus (isolate -/Azerbaijan/A22-550/1965 serotype A) (FMDV) 644 1685-2328
Белки полиовируса Белки вируса ящура Координаты выровнявшихся участков у полиовируса Координаты белков в полипротеине полиовируса Координаты выровнявшихся участков у вируса ящура Координаты белков в полипротеине вируса ящура
RNA-directed RNA polymerase RNA-directed RNA polymerase 3D-POL 1594-2208 1748-2209 1685-2328 1864-2336
Protease 3C Picornain 3C 1566-1747 1651-1863

Этот хорошо выровнявшийся участок двух полипротеинов соответствует сразу двум белкам, которые получаются в результате процессинга: РНК зависимой РНК полимеразе и протеазе (которая и осуществляет этот процессинг). В полиовирусе эти два белка имеют названия RNA-directed RNA polymerase и Protease 3C соответственно, а в вирусе ящура RNA-directed RNA polymerase 3D-POL и Picornain 3C соответственно.

Выравнивание II

AC Organism Identities Positives Gaps Score Bits Length Coords
P03300 Poliovirus type 1 (strain Mahoney) 47% 61% 2% 394 156 177 1243-1419
P49303 Foot-and-mouth disease virus (isolate -/Azerbaijan/A22-550/1965 serotype A) (FMDV) 180 1205-1384
Белки полиовируса Белки вируса ящура Координаты выровнявшихся участков у полиовируса Координаты белков в полипротеине полиовируса Координаты выровнявшихся участков у вируса ящура Координаты белков в полипротеине вируса ящура
Protein 2C Protein 2C 1243-1419 1128-1456 1205-1384 1109-1426

Данный участок соответствует высококонсервативному белку 2С пикорнавирусов, к которым и относятся оба предложенных нам вирусных таксона. Функция этого белка плохо изучена, он не имеет выраженной структуры, и обладает АТФазной активностью.

Сравнение веса выравнивания со случайным

Сравнение гомологичных белков пары UVRA_ECOLI UVRA_BACSU

ID_1 ID_2 Вес выравнивания Медиана Верхний квартиль Вес в битах Вероятность случайного получения
UVRA_ECOLI UVRA_BACSU 2964.5 88.5 100.25 245.766 1.04009951876e-74

Так как это выравниванивание гомологичных белков, его вес оказывается значительно больше веса выравнивания случайно перемешанных последовательностей, что и определяет большой вес данного локального выравнивания в битах.

Сравнение негомологичных белков пары IDH_ECOLI MAO1_BACSU

ID_1 ID_2 Вес выравнивания Медиана Верхний квартиль Вес в битах Вероятность случайного получения
IDH_ECOLI MAO1_BACSU 77.0 54.25 60.0 4.957 0.0322061107735

Так как это выравнивание негомологичных белков, то его вес несильно отличается от веса медианы и верхнего квартиля для выравниваний ста перемешанных последовательностей, что сказывается на незначительном весе данного локального выравнивания в битах.

Выравнивание пары гомологичных белков с увеличенным штрафом за удлиннение инделя (4.0)

ID_1 ID_2 Вес выравнивания Медиана Верхний квартиль Вес в битах Вероятность случайного получения
UVRA_ECOLI UVRA_BACSU 2954.0 41.0 45.0 729.250 2.97766380602e-220

В данном случае белки имели довольно высокую степень родства и малое число гэпов и инделей в первоначальном выравнивании (8 и 5 соответственно -> максимум было возможно получить три штрафа за удлиннение инделя), в выравнивании с увеличенным штрафом количество гэпов сократилось до 6 а количество инделей до 4, что уменьшило и без того небольшое возможное снижение веса выравнивания (относительно выравнивания без увеличенного штафа вес снижается на 10 единиц). Однако за счет увеличения штрафа значительно снижается вес выравниваний перемешанных последовательностей, которые имеют довольно длинные индели. В таком случае вес выравнивания еще больше отличается от веса выравниваний случайно перемешанных последовательностей (~ в 2 раза снижается вес медианы и верхнего квартиля -> напрямую из формулы расчета веса выравнивания в битах следует то что он вырастет) и снижается вероятность того, что такой большой вес выравнивания может являться случайностью -> увеличивается вес в битах (почти в 3 раза).

Выравнивание пары негомологичных белков с увеличенным штрафом за удлиннение инделя (4.0)

ID_1 ID_2 Вес выравнивания Медиана Верхний квартиль Вес в битах Вероятность случайного получения
IDH_ECOLI MAO1_BACSU 48.0 35.0 38.0 5.333 0.024803141437

В данном случае белки изначально выравнивались не очень хорошо и имели 118 гэпов и 20 инделей (то есть 98 возможных штрафов за удлиннение инделя). При этом в выравнивании с увеличенным штрафом вообще пропадают все участки, с большим количеством инделей и остается хорошо выравнивающийся участок в 30 аминокислот с одним гэпом. При этом, конечно, уменьшается общее количество совпадающих и похожих букв и уменьшается вес выравнивания с 77.0 до 48.0. Однако увеличение штрафа за удлиннение инделя снижает также и веса выравниваний перемешанных последовательностей, при этом снижается значение медианы и верхнего квартиля, причес это снижение примерно того же порядка, что и снижение веса самого выравнивания. Это означает, что вероятность случайного появления выравнивания с таким же или большим весом среди выравниваний перемешанных последовательностей не должно сильно меняться (как и происходит), при этом значение веса в битах также остается примерно в тех же границах (немного повышается).

Проверка формулы для перевода в биты

Проверка проводилась на выравнивании последовательностей белков UVRA_ECOLI и UVRA_BACSU, при этом тысячекратно перемешивалась вторая из них. Скрипт показал, что вес медианы:89.0; верхнего квартиля:100.0; верхней 1/8: 108.25. Все эти данные при подстановке в формулу дают значение 2.75, что приближенно равно 3.

BLAST:поиск гомологов в банке

AC ID Organism Identities Length Positives Gaps Score Bits Expect Coverage
A0A0U2PLK5 A0A0U2PLK5_9BACL Planococcus kocurii 283 65% 80% 0% 996 388 1e-135 95,6%
Q9KC32.1 DAPA1_BACHD Bacillus halodurans (strain ATCC BAA-125 / DSM 18197 / FERM 7344 / JCM9153 / C-125) 283
AC ID Organism Identities Length Positives Gaps Score Bits Expect Coverage
A0A0U2PLK5 A0A0U2PLK5_9BACL Planococcus kocurii 289 63% 78% 0% 991 386 6e-135 97,6%
A7Z4U8.1 DAPA_BACVZ Bacillus velezensis (strain DSM 23117 / BGSC 10A6 / FZB42) (Bacillus amyloliquefaciens subsp. plantarum). 289

© Кристина Перевощикова, 2017