Навигация по сайту: |
Практикум 10. Матрицы аминокислотных замен. Карта локального сходства1. Карта локальноо сходства двух полипротеиновПрограммой BLASTP было произведено выравнивание полипротеинов (АС=P03301.3) из полиовируса первого типа и (АС=P03307.2) из вируса ящура штамма А5. ![]() Для двух лучших выравниваний построили таблицу.
Для двух наилучших выравниваний были найдены соответствующие гомологичные белки (или их окрестности). Для выравнивания №2 это оказался белок 2С — весьма консервативный среди всех пикорнавирусов, играющий важную роль в репликации вирусной РНК, по-видимому, путем реорганизации мембранных структур клетки хозяина для создания специальных везикул, на которых происходит репликация вирусного генома[1].
2. Сравнение веса выравнивания со случайнымВ качестве гомологичных белков выбрали PARC_ECOLI и 100 перемешанных последовательностей PARC_BACSU, в качестве негомологичных — EPTA_ECOLI и 100 перемешанных последовательностей BLYA_BACSU. Для выравнивания и перемешивания использовали water и shuffleseq из EMBOSS.
Для анализа результатов случайного выравнивания использовался конвейер bash-команд:
Из таблицы видно, что вероятность получить выравнивание лучше или такое же в случае гомологичных белков крайне мала. Для пары негомологичных белков p>1, следовательно, такое выравнивание является случайным. Медианное значение Score для случайных последовательностей даже является большим по сравнению с весом выравнивания негомологичных белков. Изменение параметров waterБыло проведено выравнивание со штрафом за продолжение инделя 4, что больше страндартного для water значения(0.5). Ожидаемо, из выравнивания исчез кусок после 582 остатка в PARC_ECOLI, где начинается большая индель в 49 гэпов. Суммарный штраф за эту индель составил 10 + 48*4 = 202, что оказалось больше, чем возможный Score при продолжении выравнивания. В районе 290 остатка PARC_ECOLI также можно наблюдать стремление алгоритма сократить количество гэпов: вес участка выравнивания соответствующий 290-297 а.о. в PARC_ECOLI со стандартными параметрами равен -14 (-21 за гэпы, -2 за непохожие аминокислоты, +9 за идентичные), с новыми параметрами добавляется еще -7 за гэпы; итого штраф -21. Конфигурация, которую выбрал алгоритм для выравнивания с новыми параметрами дает штраф в -17 (-20 за гэпы, -2 за непохожие аминокислоты, +5 за идентичные). ![]() Для water со штрафом за продолжение инделя = 4 таблица из предыдущего упражнения выглядит следующим образом (выравниваются те же белки).
С большим штрафом за продолжение инделя Score случайных последовательностей снизился, соответственно возрос Score неслучайного выравнивания в битах и уменьшился p-value. Вес выравнивания негомологичных белков не изменился, так как он не содержит инделей: EPTA_ECOLI 352 NGECYDEVLFHGLEEYINNLQGDGV 376 |...|.||::.|...||:...|..: BLYA_BACSU 343 NSNGYWEVIYKGKRGYISGQFGSTI 367 Проверка формулы для перевода в битыДля проверки формулы (1) выравняли PARC_ECOLI и 1000 перемешанных PARC_BACSU. Для уровней верхних 1⁄8 и 1⁄4 весов Score составил 97 и 90 соответственно. Медиана получилась равной 80.5. После пересчета в биты уровня 1⁄8 получили значение в 2.74 бита, что, конечно не совсем равно 3 битам, но достаточно близко. 3. BLAST: поиск гомологов в банкеВ выдаче BLAST для нашего белка (ALV08439.1)содержалось всего два белка. Данные по ним и их выравниваниям приведены в таблицах ниже.
Если первый найденный белок принадлежит бактерии (а наш ALV08439.1 — это белок прокариота), покрывает значительную часть нашего белка и функционально похож на него(оба участвуют в транспорте веществ через мембрану, связывая их и доставляя к каналу), то второй принадлежит эукариотическому организму, имеет малый процент покрытия и функционально не похож на ALV08439.1(является дегидрогеназой и участвует в биосинтезе грибного меротерпеноида андитомина). Скорее всего HMUT_YERPE является гомологом ALV08439.1, а ANDI_EMEVA нет. Информация о функциях белков взята из их страниц в UniProt. Использованная литература
|
© Пушкарев Сергей, 2018