На главную |
Карта локального сходства двух полипротеинов
![]() |
Рис1. Карта локального сходства полипротеинов P03300 и P49303
Выравнивание I
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Этот хорошо выровнявшийся участок двух полипротеинов соответствует сразу двум белкам, которые получаются в результате процессинга: РНК зависимой РНК полимеразе и протеазе (которая и осуществляет этот процессинг). В полиовирусе эти два белка имеют названия RNA-directed RNA polymerase и Protease 3C соответственно, а в вирусе ящура RNA-directed RNA polymerase 3D-POL и Picornain 3C соответственно.
Выравнивание II
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Данный участок соответствует высококонсервативному белку 2С пикорнавирусов, к которым и относятся оба предложенных нам вирусных таксона. Функция этого белка плохо изучена, он не имеет выраженной структуры, и обладает АТФазной активностью.
Сравнение веса выравнивания со случайным
Сравнение гомологичных белков пары UVRA_ECOLI UVRA_BACSU
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Так как это выравниванивание гомологичных белков, его вес оказывается значительно больше веса выравнивания случайно перемешанных последовательностей, что и определяет большой вес данного локального выравнивания в битах.
Сравнение негомологичных белков пары IDH_ECOLI MAO1_BACSU
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Так как это выравнивание негомологичных белков, то его вес несильно отличается от веса медианы и верхнего квартиля для выравниваний ста перемешанных последовательностей, что сказывается на незначительном весе данного локального выравнивания в битах.
Выравнивание пары гомологичных белков с увеличенным штрафом за удлиннение инделя (4.0)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В данном случае белки имели довольно высокую степень родства и малое число гэпов и инделей в первоначальном выравнивании (8 и 5 соответственно -> максимум было возможно получить три штрафа за удлиннение инделя), в выравнивании с увеличенным штрафом количество гэпов сократилось до 6 а количество инделей до 4, что уменьшило и без того небольшое возможное снижение веса выравнивания (относительно выравнивания без увеличенного штафа вес снижается на 10 единиц). Однако за счет увеличения штрафа значительно снижается вес выравниваний перемешанных последовательностей, которые имеют довольно длинные индели. В таком случае вес выравнивания еще больше отличается от веса выравниваний случайно перемешанных последовательностей (~ в 2 раза снижается вес медианы и верхнего квартиля -> напрямую из формулы расчета веса выравнивания в битах следует то что он вырастет) и снижается вероятность того, что такой большой вес выравнивания может являться случайностью -> увеличивается вес в битах (почти в 3 раза).
Выравнивание пары негомологичных белков с увеличенным штрафом за удлиннение инделя (4.0)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В данном случае белки изначально выравнивались не очень хорошо и имели 118 гэпов и 20 инделей (то есть 98 возможных штрафов за удлиннение инделя). При этом в выравнивании с увеличенным штрафом вообще пропадают все участки, с большим количеством инделей и остается хорошо выравнивающийся участок в 30 аминокислот с одним гэпом. При этом, конечно, уменьшается общее количество совпадающих и похожих букв и уменьшается вес выравнивания с 77.0 до 48.0. Однако увеличение штрафа за удлиннение инделя снижает также и веса выравниваний перемешанных последовательностей, при этом снижается значение медианы и верхнего квартиля, причес это снижение примерно того же порядка, что и снижение веса самого выравнивания. Это означает, что вероятность случайного появления выравнивания с таким же или большим весом среди выравниваний перемешанных последовательностей не должно сильно меняться (как и происходит), при этом значение веса в битах также остается примерно в тех же границах (немного повышается).
Проверка формулы для перевода в биты
Проверка проводилась на выравнивании последовательностей белков UVRA_ECOLI и UVRA_BACSU, при этом тысячекратно перемешивалась вторая из них. Скрипт показал, что вес медианы:89.0; верхнего квартиля:100.0; верхней 1/8: 108.25. Все эти данные при подстановке в формулу дают значение 2.75, что приближенно равно 3.
BLAST:поиск гомологов в банке
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
© Кристина Перевощикова, 2017