Полученный мотив (YTMAACTAAAC) из практикума 6 был проверен при помощи программы FIMO.
Поиск при помощи этой программы был осуществлен в геноме самого вируса Rhinolophus bat coronavirus HKU2 и Bat coronavirus CDPHE15/USA/2006 из того же семейства Alphacoronavirus.
Выходы FIMO:
Rhinolophus bat coronavirus HKU2
Bat coronavirus CDPHE15/USA/2006
Как и ожидалось в обоих случаях p-value порядка e-05 - e-06. В геноме вируса откуда "родом" мотив, однозначно нашлись все 7 последовательностей. В геноме родственного вируса порядок p-value такой же, возможно этот мотив выполняет какие-то важные функции.
Для получения последовательности Козака для вируса Rhinolophus bat coronavirus HKU2 из каждого гена был вырезан участок -9..4, где 0- начало рамки считывания гена.
Для получения адекватной выдачи MEME пришлось настроить некоторые параметры:
meme result_2.fasta -dna -oc . -nostatus -time 18000 -mod oops -nmotifs 1 -minw 6 -maxw 13 -objfun classic -markov_order 0
Сама последовательность напоминает отдаленно человеческую на позициях -2 и -3 от ATG.