Главная | Семестры | Четвертый семестр |
Excel - файл с построенной матрицей PWM. Организм - Homo sapiens.
Для выполнения задания по поиску сигналов я выбрал Bat Hp-betacoronavirus/Zhejiang2013 (NC_025217.1). Из генома вируса были вырезаны upstream последовательности для 9 генов - координаты. Последовательности этих участков были переданы программе MEME.
seqret @coords.txt -out upstream.fasta meme upstream.fasta -oc result -dna -mod zoops -nmotifs 5 -minw 6 -maxw 50 -minsites 2
Результат работы программы.
Лучший найденный мотив (Рисунок 1) с наименьшим p-value. Он найден во всех 9 кодирующих последовательностях вируса. Согласно статье,
для такого коронавируса типичным TRS мотивом является 5' - CUAAAC - 3', показан также альтернативный 5' - AACUAA - 3'. Первый мотив лучше угадывается в предсказании на Рисунке 1, однако он присутствует в явном виде
лишь у верхних 4 последовательностей. Возможно, для данного вируса правдоподобным является мотив ACGAAC.
Рисунок 2. Первая находка.