Поиск мотивов, программы MEME и MAST

Поиск мотивов среди гомологов белка YXIM_BACSU

Программа MEME осуществляет множественное локальное выравнивание, что позволяет выявлять мотивы (консервативные участки без гэпов) в нескольких последовательностях. Алгоритм MEME осуществляет программа ememe из пакета EMBOSS. Подадим на вход файл с последовательностями гомологов в формате fasta. На выходе получим несколько локальных выравниваний и соответствующих им мотивов, информация о которых представлена в таблице 1.

Таблица 1. Мотивы, полученные в результате множественного локального выравнивания гомологов белка YXIM_BACSU

Число последов. Длина E-value LOGO
1 21 29 1.6e-242
2 24 24 (все) 3.4e-168
3 36 23 5.0e-177

Сравнение блоков, найденных MEME, c полным выравниванием

Создав три файла с блоками выравнивания в формате fasta для каждого мотива, откроем их в JalView сравним с полным выравниванием.

Мотив 1. Блок локального выравнивания не совпадает полностью с соответствующим участком полного выравнивания (см. рисунки 1 и 2). Три последовательности (WP_002648236.1, YP_004272342.1, ZP_09594401.1) отсутствуют; на 298 и 299 позициях полного выравнивания в них были гэпы, поэтому MEME не включила их в блок. Отличается также строка последовательности YP_006882151.1. Она сдвинута на одну позицию влево, благодаря чему была закрыта колонка гэпов на 291 позиции.

 
Рис.1. Участок полного выравнивания, соответствующий мотиву 1, выданому MEME. Отличающиеся строки выделены.   Рис.2. Блок выравнивания, выданный MEME.

Мотив 2. Блоки полного выравнивания и MEME совпадают (см. рисунки 3 и 4).

 
Рис.3. Участок полного выравнивания, соответствующий мотиву 2, выданому MEME.   Рис.4. Блок выравнивания, выданный MEME.

Мотив 3. Блок локального выравнивания не совпадает полностью с соответствующим участком полного выравнивания (см. рисунки 5 и 6). Последовательность YP_003386080.1 не включена в блок, потому что это убирает колонку гэпов на позициях 459-463. Последовательности WP_002704685.1, YP_006882151.1, YP_004272342.1 сдвинуты влево, потому что это убирает колонки гэпов 441-445, 430-437 и 417-428 соответственно. Последовательности YP_001818241.1, NP_813084.1 и YP_001196553.1 сдвинуты вправо, потому что это убирает гэпы на позициях 457-458.

Рис.5. Участок полного выравнивания, соответствующий мотиву 3, выданому MEME. Отличающиеся строки выделены.
Рис.6. Блок выравнивания, выданный MEME.

Поиск найденных мотивов в других последовательностях

Проведём программой MAST поиск мотивов, найденных программой MEME, в последовательностях, из которых составлено выравнивание (seed) одного из доменов белка YXIM, взятое из Pfam. На вход подадим fasta-файл с последовательностями, параметры установим по умолчанию.

Результат поиска можно увидеть, перейдя по сслыке. Первый мотив нашёлся в 112 последовательностях 41 раз, второй - 36, третий - 38 раз. Однако, все три мотива нашлись только в 7 последовательностях. В 28 последовательностях не было найдено ни одного мотива. Это может связано с тем, что найденные мотивы находятся не в домене, а в другой части белка.