Лого сайта
Поиск мотивов, программы MEME и MAST

1.Поиск мотивов среди гомологов белка CLPQ_BACSU

Мотив - блок достоверного выравнивания.
Для поисков блоков совпадений по всей длинне выравнивания применяется программа MEME (Multiple Em for Motif Elicitation) выполняющая, по сути, множественное локальное выравнивание.
Характеристики найденных мотивов при помощи программы MEME среди 27 посдедовательностей предпологаемых гомологов белка CLPQ_BACSU и самого белка представлены в Таблице 1.

Таблица 1. Найденные мотивы среди 26 гомологов белка CLPQ_BACSU и самого белка по средствам программы MEME при стандартных настройках.

мотив число последовательностейдлина мотиваE-valueLOGO
1 все501.9e-865

2.Сравнение блоков, найденных MEME, c полным выравниванием, выданным программой muscle.

Из выдачи программы MEME был извлечен мотив в формате блокс: мотив 1.
После этого файл был переведен в формат FASTA при помощи программы seqret. Файл в формате FASTA:мотив 1. Далее было проведено визуальное сравнение мотивa и тотального выравнивания при помощи Jalwiev.
Сравнение проводилось при помощи проведения множественного выравнивания Результаты этго сравнения доспупны в виде проекта Jalwiev . Совпадение с блоком идет с позиции 97 по позицию 147. Так же визульное сравнение представлено на Иллюстрации 1.

Иллюстрация 1. Визульное сравнение множественного выравнивания гомологов и найденного программой MEME мотива.


3. Поиск найденого мотива в других последовательностях.

Поиск мотивов осуществлялся программой MAST при стандартных настройках.
Поиск проходил среди выравнивания фрагментов белков, соответствующих домену pfam: Proteasome. Фаил с выравниваниями в формате MSF. Фаил с выравниванием в формате FASTA (был сконвертирован программой degapseq).
После этого при помощи программы MAST (Motif Alignment & Search Tool) был осуществлен поиск мотива (из пункта 1) среди белков домена Proteasome.

В результате работы программы получен html-фаил

В 20 из имевшихся в seed.fasta 41 последовательности нашёлся искомый мотивов.
В 1-й последовательности (PSA1_ORYSJ) мотив встретился дважды.
Таким образом не все элементы выравнивания из Pfam содержат искомый мотив(фактически мотив содержат только около половина последовательностей.)
НА основании этого можно заключить, что выравнивание взятое из Pfam достаточно сильно коррелирует с мотивами найденными в выборке белков, гомологичных белку CLPQ_BACSU.

4. Испытание сервиса MEME Suite на идентичной выборке гомологов.

Для испытания сервиса, ему на вход был подан набор гомологичных последовательностей. Результат представлен на Иллюстрации 2.

Иллюстрация 2. Информация о запуске MEME Suite.

Результаты оказались поразительны, т.к. сервис MEME Suite смог найти 3 мотива (в отличие от 1 найденного мотива через консольную программу).
Результаты работы MEME, результаты работв MAST.
Кроме этого очень удобно сделано оформлени самого web-интерфейса: все (или почти все) нюансы объяснены справончным и поясняющим материалом.
Так же хорошо, что автометизирован вывод программы MEME сразу на MAST, что позволяет получить более подробную информацию, а кроме этого возможен экспорт результатов в различных форматах.

5. Анализ карты локального сходства белка TALe.

Для анализа рассмотрим карту локального сходства белка TALe (Иллюстрация 3 и 4), полученную при помощи сервиса DotHelix на сайте genebee .

Иллюстрация 3. Карта локального сходства белка TALe. При пороге сходства 0,01

Иллюстрация 4. Карта локального сходства белка TALe. При пороге сходства 0,5

Как явно видно из иллючтраций 3 и 4, данный белок сам себе гомологичен во многих участках полностью, что может говорить о существовании некой периодичности в последовательности белка. Кроме того, на основании существования многих дублирующих линий, можно предполагать сложную структуру периодичности:переод в периоде.

Для анализа был задействован сервис RADAR (Rapid Automatic Detection and Alignment of Repeats in protein sequences) европейского биоинформатического центра. Результат зауска сервиса представлен на Иллстрации 5. А так же в текстовом файле .

Иллюстрация 5. Результат работы RADAR применительно к TALe.

Как видно из Иллюстрации 5, теория подтвердилась, т.к. налось достаточное колличество повторов в белке.