Учебный сайт Ксении Худяковой

Главная > Семестры > Семестр 4 > Практикум 10

Занятие 10. Поиск последовательностей Шайна-Дальгарно в геноме Thermococcus barophilus MP

Последовательность Шайна-Дальгарно находится на сайтах посадки рибосом мРНК прокариот, она располагается за несколько нуклеотидов до стартового кодона.

C FTP-сервера NCBI был скачан файл с геномом этой бактерии и хромосомная таблица, содержащая координаты различных кодирующих участков генома. По этой таблице были определены координаты участков, которые могут содержать последовательности Шайна-Дальгарно. Это участки с координатами [-17;0] от начала каждого гена.

Из координат таких участков я составила список, который можно подавать на вход программе seqret для получения последовательностей этих участков. Файл с последовательностями.

Далее использовались онлайн версии программ MEME и MAST. Для создания PWM первые 1000 последовательностей (из 2257 полученных) были поданы на вход программе MEME. В результате был найден мотив длиной 8 нуклеотидов и E-value 2.4e-306 (который, вероятно, и является последовательностью Шайн-Дальгарно). Лого мотива можно увидеть на рис. 1. HTML-выдача программы MEME - здесь.

img1

Рис. 1. Лого мотива, найденного программой MEME.

Далее файл из выдачи MEME вместе с файлом, содержащим все 2257 анализируемые последовательности, был подан на вход программе MAST для того, чтобы найти полученный мотив в геноме бактерии. HTML-выдача MAST - здесь. Было найдено 95 последовательностей, содержащих достоверные совпадения с найденным мотивом. Номера этих последовательностей сохранены в файл, и с использованием этих номеров последовательности сохранены в отдельный файл.