~nikitka1369
Главная
Обо мне
Семестры
Первый семестр
Второй семестр
ФББ МГУ
Практикум 9
В данном практикуме я искал последовательность SD в геноме Acinetobacter calcoaceticus. Для необходимого анализа понадобятся файлы с последовательностями в форматах fasta и gff3, которые можно скачать по ссылкам:
fasta
,
gff3
. Анализ произведён с помощью
скрипта.
В результате я получил три файла:
последовательности длиной 25 нуклеотидов перед старт-кодоном
,
последовательности длиной 25 нуклеотидов после старт-кодона
и
наиболее консервативная часть последовательностей из первого файла.
Далее, я последовательности из последнего файла анализировал с помощью MEME (команда для анализа:
meme BEST.fasta -dna -nmotifs 1 -minw 6 -maxw 10
). Длина SD, как правило, составляет от 6 до 10 нуклеотидов, я искал 1 мотив. Ниже представлена лого-диаграмма для найденного мотива:
Рис. 1. Последовательность TTTTTAGGAG соотвествует консенсусу последовательности SD.
Также я провёл поиск в файле с последовательностями длиной 25 нуклеотидов перед старт-кодоном с помощью FIMO, поставив порог значимости в 0.0001:
fimo --oc FIMO -thresh 0.0001 meme_out/meme.txt POSITIVE.fasta
.
С результатами выдачи можно ознакомиться по ссылке.
Ту же процедуру проделал с файлом с последовательностями длиной 25 нуклеотидов после старт-кодона.
С результатами выдачи можно ознакомиться по ссылке.
В результате поисков, можно сделать вывод, что для SD моей бактерии характерен паттерн YDKTWAGGAG.