Главная
Семестр 1
Семестр 2
Семестр 3
Семестр 4
О себе
Ссылки

Поиск сигналов. Последовательности Шайна-Дальгарно

Задание 1.
Я нашла данные по геному моей бактерии (Cytophaga hutchinsonii, штамм ATCC 33406) с помощью FTP-сервиса NCBI. Из предложенных файлов нужны с расширением .fna (полный геном) и с расширением .gff (хромосомная таблица).

Дальше мне нужно было создать файл с участками [-35;0] для каждого гена. Для этого я написала два скрипта. Первый выбирает номера нужных участков из хромосомной таблице в новый файл. Затем с помощью команды:
seqret @NC_008255_num_list seqlist.fasta
я получила файл с нужными последовательностями, которые я переименовала с помощью второго скрипта в порядковые номера. (файл.) Всего получилось 3785 последовательностей.

Так как программа MEME не принимает на вход больше 1000 последовательностей, я взяла первую тысячу генов. Последовательность Шайна-Дальгарно короткая и сигнал не очень сильный. Сначала я запустила без ограничений, нашлась длинная последовательность, в которой ничего похожего на консенсус Шайна-Дальгарно, что меня удивило, так как этот мотив занимает почти всю длиу участков. Лого последовательности на рис 1. (Результат работы MEME.)

Поэтому я запустила MEME еще раз с ограничением по длине 6-10 нуклеотидов в сигнале.




Рис 1. Лого мотива, найденного программой MEME без ограничений.



Программа MEME нашла совершенно иной сигнал длинной в 8 нуклеотидов (рис 2). Результат работы программы. Видно, что это GC-богатый участок, что часто несет сигнальную функцию, но на консенсус Шайна-Дальгарно все еще не похож. Однако в статье сказано, что у бактерий группы, в которую входит и моя, наблюдается замена последовательности ШД на GC-богатый участок, который у меня и нашелся.


Рис 2. Лого мотива, найденного программой MEME с ограничением в 6-10 нуклеотидов.



Найденный мотив и файл со всеми последовательностями был подан на вход программе MAST. В результате было найдено 52 последовательности с достоверным совпадением с найденным мотивом (для первого мотива). Результат работы программы MAST тут. А для второго мотива - 17. Результат работы программы MAST тут.