матрица.
4. sgmRNA
В данном практикуме необходимо было найти сигнал в лидерной последовательности, называемый TRS-L и сигналы
TRS-B перед кодирующей последовательностью каждого позднего гена, либо только сигналы CS.
Я выбрала вирус BtMr-AlphaCoV/SAX2011; AC NC_028811
Всего в геноме вируса закодированно 6 белков(полипротеин и поздние белки). Список белков и координаты их генов
находятся в FEATURES.
Из генома вируса были вырезаны upstream области "sequence.gb[1:298]" и создан файл с объяединенными fasta
последовательностями(seqret @list2.txt pomog.fasta).fasta
upstream orf1ab - от 1 нукл до -1 относительно старта трансляции; позднего гена от -100 до -1.
Дальше я воспользовалась сервисом meme и указанными параметрами. Аналогичный результат я бы получила введя строку:
"meme cr.fasta -dna -oc . -nostatus -time 18000 -mod zoops -nmotifs 3 -minw 5 -maxw 20 -objfun classic -minsites 2
-maxsites 7 -markov_order 0."
С помощью статьи, указанной в презентации и первой выдачи удалось понять, что нужная мне последователльность CS выглядит так:
5′‐AACTAAA‐3′.
Данная CS имеет лучшее E-value 3.9e-002 и находка наиболее правдоподобна. Все 6 областей содержат ее.
*В статье TRS отличалась на один нуклеотид 5′‐AACTAAAС‐3′.
Номерами в выдаче отмечены upstream области в порядке располжения генов в последовательности.
logo
Найденные последовательности (красными блоками выделены нужные)
Вся выдача meme: meme