Практикум 6. Сигналы и мотивы.
Создание позиционной весовой матрицы (PWM) для последовательностей Козак одного из организмов.
Ссылка на таблицу.
Поиск сайтов регуляции разрывной транскрипции у коронавируса
Для выполнения данного практикума был выбран геном вируса Human coronavirus HKU1.
С помощью программы seqret создан файл с последовательностями длины 100, лежащими перед генами (8 штук), аннотированными у данного вируса (upstream sequences).
Затем на kodomo была запущена программа MEME со следующими параметрами:
meme upstream.fasta -oc result -dna -mod zoops -nmotifs 3 -minsites 2 -maxsites 600 -minw 6 -maxw 50
Таблица областей перед генами.
Координаты |
Ген |
1-205 |
orf1ab |
21672-21772 |
HE |
22841-22941 |
S |
26950-27050 |
orf4 |
27272-27372 |
E |
27532-27632 |
M |
28219-28319 |
N |
28241-28341 |
N2 |
Самым убедительным результатом была первая находка, оказавшаяся в 6 рассматриваемых последовательностях.
![мое фото](pr6_res1.PNG)
![мое фото](pr6_res2.PNG)
![мое фото](pr6_res3.PNG)
Вообще HCoV‐HKU1 относится ко второй группе вирусов по классификации в обзоре, CS для них: 5′‐AAUCUAAAC‐3′.
Я предполагаю, что консенсусной последовательностью найденного мотива является 5′-TTAAATCTAAAC‐3′(содержит CS и ещё несколько нуклеотидов с 5'-конца).
Ссылка на статью