Поиск последовательностей Шайна-Дальгарно

Задание выполнялось на примере бактерии Thermotoga neapolitana штамма DSM 4359.
Последовательность Шайна-Дальгарно - это сайт связывания рибосом на молекуле мРНК прокариот, расположенный на некотором расстоянии (обычно около 10 нуклеотидов) до стартового кодона. Для поиска этих последовательностей с FTP-сервера NCBI был скачан файл с геномом исследуемой бактерии и хромосомная таблица, содержащая координаты различных кодирующих участков генома. По этой таблице были определены координаты участков, на которых могут располагаться последовательности Шайна-Дальгарно. Это участки на расстоянии до 35 нуклеотидов перед началом каждого гена. Для этих участков был составлен список координат, который дальше подавался программе seqret:

seqret @coord.txt seq.fasta
В выходном файле последовательности были переименованы в соответсвии с их порядком в хромосомной таблице. В результате был получен список с нужными последовательностями. Для первых 250 последовательностей из 1988 была запущена программа meme:
ememe seq_r250.fasta -mod zoops -minw 6 -maxw 14
В результате был найден мотив длиной в 14 нуклеотидов, лого которого представлено на рисунке 1. Выдача программы: meme.html.


Рисунок 1. Лого мотива, найденного программой MEME. E-value = 4.0e-033.

В найденном мотиве четко выделяется участок AGGAGG (3-8 нуклеотиды), который и является консенсусом для последовательности Шайна-Дальгарно. Интересно, что у исследуемой бактерии очень консервативным оказывается 10 положение в этом мотиве. Если запустить программу MEME для последних 1000 последовательностей из списка, то наблюдается такая же картина. Поэтому, вероятно, у исследуемой бактерии последовательность Шайна-Дальгарно включает в себя это основание.


© Наталья Ланина
e-mail: n.lanina@fbb.msu.ru

последний раз обновлялось: 26.11.15