Поиск мотивов среди гомологов белка YojM_BACSU

На сервере kodomo программой ememe был осуществлён поиск мотивов среди гомологов белка YojM_BACSU, взятых из репрезентативной выборки с практикума 8. Результат работы программы представлен на отдельной странице.

В связи с ограничением поиска в 3 мотива, программой ememe и было найдено 3 мотива. Информация о них содержится в таблице 1.

Таблица 1. Характеристика мотивов белка YojM_BACSU.
Число последова- тельностей в нём Длина мотива E-value LOGO
1 56 (все) 21 4,4*10-496
2 56 (все) 21 8.0*10-477
3 47 22 1.1*10-441


Сравнение блоков, найденных MEME, c полным выравниванием, выданным muscle

В целом, выравнивания MEME и Muscle различаюся между собой (см. проект JalView ). Подробнее на конкретных мотивах:

1. Сравнение первого мотива и глобального выравнивания продемонстрировано на рисунке 1.

Рисунок 1. Сравнение глобального (слева) и локального (справа) выравниваний (мотив №1)
Выравнивания совпадают по количеству последовательностей, но различаются по длине: 25 и 21 соответственно для глобального и локального. Такая разница достигается за счёт вставки ровно 4 гэпов (что весьма приятно). Помимо наличия гэпов принципиальных различий больше нет. В обоих выравниваях прослеживаются высоко консервативные полосы гистидина (связывают лиганд - Cu/Zn) и менее - глицина (видимо, участвует в бета-поворотах и координирует гистидины). Для обоих случаев также нельзя исключать подгонку в работе программ.

2. Сравнение второго блока и общего выравнивания осуществлялось с помощью рисунка 2.

Рисунок 2. Сравнение глобального (слева) и локального (справа) выравниваний (мотив №2)
Мотивы выравнивания опять же различаются по длине: 24 для Muscle и 21 для MEME. Различие заключается во вставке в 3 аминокислоты между первыми двумя глицинами у Caenorhabditis elegans (-нематода) На этот раз ситуация с гэпами ещё хуже, но Muscle вполне убедительно определяет инсерцию/делецию после первой аминокислоты мотива (характерна для большинства и не варьирует по размерам). MEME же, как мне кажется, просто заполнил эти гэпы аминокислотами, стоящими ранее этого мотива. Поэтому MEME, на мой взгляд, в этом случае проигрывает. Особых других различий отметить нельзя. По количеству последовательностей выравнивания совпадают.

3. Сравнение третьего мотива и глобального выравнивания произведено посредством рисунка 3.

Рисунок 3. Сравнение глобального (слева) и локального (справа) выравниваний (мотив №3)
Самый сложный случай.. По длине сравнивать мотивы не имеет смысла (помимо инсерции у Pseudanabaena biceps (-цианобактерия) имеются разбросанные мелкие гэпы). MEME не включает в блок 9 последовательностей. Однако общая картина выравнивания не меняется - выделяются всё те же консервативные полосы (в этом мотиве расположено 4 лиганд-связывающих аминокислотных остатка).

Поиск найденных мотивов в других последовательностях

На сервере kodomo программой emast был проведён поиск мотивов, найденных MEME, в последовательностях выравнивания домена Pfam PF00080 белка YojM_BACSU (см. Описание домена SOD_Cu (PF00080)); параметры устанавливались по умолчанию. С результатом её работы можно ознакомиться на отдельной странице.

Краткое описание результатов:


Таблица 2. Встречаемость мотивов в последовательностях домена PF00080
Номер мотива Последовательность Количество последовательностей, в которых содержится
1 GLPPGYHGFHIHEFGDCTNPC 119 (93.7%)
2 GDDYESQPTGNAGARWACGVI 109 (85.8%)
3 FNPFNKKHGYPWDEERHWGDLG 92 (72.4%)

Выравнивание домена PF00080 полностью соответсвует найденным ранее мотивам (визуально). Единственным замечанием может быть лишь то, что доля аргинина в третьем мотиве уменьшается с ростом количества последовательностей (и не окрашивается в JalView в выравнивании Pfam). Ознакомиться с выравниваниями можно с помощью проекта JalView .