Файл с результатом
Для выполнения данного задания На странице Genome NCBI (https://www.ncbi.nlm.nih.gov/genome/browse#!/overview/) я запустила поиск по организмам из сем. Coronaviridae
Мною был выбран Betacoronavirus HKU24
В информации по сборке генома я нашла координаты начала и конца генов, чтобы оценить где расположены координаты upstream областей.
(upstream область = 100 нуклеотидов до начала самого гены). Исключение - upstream orf1ab - от 1 нукл до -1 относительно старта трансляции (> 100 п.о.).
Таким образом, я создала файл, содержащий таблицу с координатами upstream областей перед геном полипротеина (orf1ab) и перед каждым поздним геном.
С помощью команды seqret @upstreams -out upstreams.fasta я получила последовательности upstream областей.
Далее я использовала MEME, установленный на kodomo.
Команда meme upstreams.fasta -oc meme_dir -dna -snucleotide -nmotifs 3 -minw 6 -maxw 50 осуществляет поиск сайтов разрывной транскрипции в upstream областях.
MEME, как и просили нашёл три мотива, второй из них показался мне наиболее правдоподобным из всех, он встретился в 5 последовательностях из 10. (Ниже картинка с генами, перед которыми есть данный мотив и LOGO мотива.)