матрица.

4. sgmRNA

В данном практикуме необходимо было найти сигнал в лидерной последовательности, называемый TRS-L и сигналы TRS-B перед кодирующей последовательностью каждого позднего гена, либо только сигналы CS.

Я выбрала вирус BtMr-AlphaCoV/SAX2011; AC NC_028811

Всего в геноме вируса закодированно 6 белков(полипротеин и поздние белки). Список белков и координаты их генов находятся в FEATURES.

Из генома вируса были вырезаны upstream области "sequence.gb[1:298]" и создан файл с объяединенными fasta последовательностями(seqret @list2.txt pomog.fasta).fasta
upstream orf1ab - от 1 нукл до -1 относительно старта трансляции; позднего гена от -100 до -1.

Дальше я воспользовалась сервисом meme и указанными параметрами. Аналогичный результат я бы получила введя строку:
"meme cr.fasta -dna -oc . -nostatus -time 18000 -mod zoops -nmotifs 3 -minw 5 -maxw 20 -objfun classic -minsites 2 -maxsites 7 -markov_order 0."
С помощью статьи, указанной в презентации и первой выдачи удалось понять, что нужная мне последователльность CS выглядит так:
5′‐AACTAAA‐3′.
Данная CS имеет лучшее E-value 3.9e-002 и находка наиболее правдоподобна. Все 6 областей содержат ее. *В статье TRS отличалась на один нуклеотид 5′‐AACTAAAС‐3′. Номерами в выдаче отмечены upstream области в порядке располжения генов в последовательности.

logo

Oops

Найденные последовательности (красными блоками выделены нужные)

Oops Вся выдача meme: meme