A picture of DNA should be here

Поиск последовательностей Шайна-Дальгарно в геноме археи Pyrobaculum aerophilum

Последовательность Шайна-Дальгарно - это сайт связывания рибосом на молекуле мРНК прокариот, она располагается за несколько нуклеотидов до стартового кодона.

Для того, чтобы выявить мотив последовательности Шайна-Дальгарно в геноме археи Pyrobaculum aerophilum, с FTP-сервера NCBI был скачан файл с геномом этой бактери и хромосомная таблица, содержащая координаты различных кодирующих участков генома. По этой таблице были определены координаты участков, которые могут содержать последовательности Шайна-Дальгарно. Это участки с координатами [-35;0] от начала каждого гена. Для них был составлен файл-список, содержащий соответствующие координаты (без координат для последовательносей, кодирующих гипотетические белки), для последующего использование программой seqret.

Данный файл был подан на вход программе seqret (seqret @coordinates_all.txt seqs_all.fasta). В результате получен файл, содержащий последовательности, пронумерованные в соответствии с его позицией в хромосомной таблице.

Далее был запущен MEME на сервере kodomo (ememe -dataset seqs_all_1.fasta -outdir meme_out -mod zoops -minw 6 -maxw 10). В результате был найден мотив длиной 10 нуклеотидов и E-value = 1.5e-140. Лого мотива можно увидеть на рис. 1. HTML-выдача программы MEME - здесь.

Рис. 1. Лого мотива, найденного программой MEME.

Далее файл из выдачи MEME вместе с фаста файлом с исходными последовательностями, был подан на вход программе MAST для того, чтобы найти полученный мотив в геноме бактерии. Было найдено 223 последовательности, содержащих достоверные совпадения с найденным мотивом. Отчет MAST