2013-2014

Последовательность Шайна-Дальгарно в геноме Chlorobium tepidum TLS

Последовательность Шайна-Дальгарно - это сайт связывания рибосом на мРНК прокариот, расположенное обычно на расстоянии около 10ти нуклеотидов от старт-кодона. Она определяет эффективность трансляции, консенсус для неё - AGGAGG. Последовательность Шайна-Дальгарно высоко консервативна.

Для того, чтобы найти её в геноме Chlorobium tepidum TLS, был скачан полный геном бактерии с ftp-сервера NCBI, а также gbk-файл. Затем с помощью скрипта Димы были получены участки [-35;-1] от начала трансляции. Из них было отобрано около трети последовательностей из разных участков генома для создания PWM с помощью MEME. Далее была запущена программа MEME на кодомо с ограничением на размер сайта: от 6 до 10 нуклеотидов. Это ограничение обусловлено тем, что последовательность Шайна-Дальгарно не бывает больше по размеру. Найденный сайт можно увидеть на рисунке 1. Выдача MEME находится здесь

Рис.1. LOGO последовательности Шайна-Дальгарно Chlorobium tepidum TLS.

То, что последовательность так сильно отличается от консенсуса, может быть объяснено тем, что поиск осуществлялся по комплементарной цепи.

Также было проверено ещё 2 ограничения на длину последовательности: от 6 до 20 и от 6 до 34. В случае ограничения от 6 до 20 найденный мотив был такой же, как и при ограничении 6-10. При ограничении от 6 до 34 в качестве мотив определяется по всей длине (см. рисунок 2).

Рис.1. Неправильное определение мотива по всей длине последовательности (с помощью MEME).

Далее был запущен MAST (команда: emast meme.html -dfile promotors_all.fasta mast.html) на сервере кодомо. Поиск по выдаче MEME не дал результатов, что странно. Возможно, это обусловлено тем, что MAST работает некорректно на кодомо.

Далее была взята другая обучающая выборка (предыдущая была уменьшена примерно в 4 раза). Это было сделано командой: ememe motifs_study. fasta -maxw 10 -minw 6. Был найден другой, более длинный мотив, LOGO которого представлено на рисунке 2.

Рис.2. Определение последовательности Шайна-Дальгарно, попытка №2.

Затем был проведён MAST (та же команда) со стандартными параметрами (результат выдачи), однако из-за низкого порога e-value было найдено очень мало хитов. MAST с увеличенным в 5 раз e-value выдал больше результатов (посмотреть)