Практикум 7. Сигналы и мотивы II
В этом практикуме мы проверяем правдивость найденных программой meme мотивов.
Программа запускалась через консоль на сервере kodomo с помощью следующей команды:
Скачать полную выдачу fimo можно по ссылке.
На рис. 1 представлена таблица выдачи fimo. В прошлом практикуме я предположила, что первая находка MEME более убедительна, хотя второй найденный мотив с ним сравним. FIMO несколько перевернул данные и не дал ни одной строчки с первым мотивом MEME. Зато в списке оказаллось 9 потенциальных позиций мотива 2 и даже несколько совпадений с 3. Напомню, что исходных последовательностей 5.
Я попыталась поиграть с параметрами FIMO, чтобы выловить меньше, но лучше, однако при попытке изменить --thresh или указать --qv-thresh возникает ошибка "is not a valid option". На рисунке 3 представлен результат "оценки глазами", фиолетовым подчеркнуты находки, которые ставят под вопрос достоверность мотива (остальные просто попадают сильно внутрь генов). Получается, что непосредтсвенно в 100-нуклеотидной зоне перед последним геном (nucleocapsid protein) нет мотива 2, зато представлен мотив 3. При этом мотив 2 есть несколько раньше. Повторюсь, менять параметры FIMO я не мочь.
Интересно также взглянуть на следующий фрагмент выдачи:
В общем, высоко оцененный FIMO мотив далек от идеала.
Я вообще скорее склоняюсь к тому, что мотив мы не нашли, ибо требования из упомянутой в подсказках статьи не выполняются ¯\_(ツ)_/¯
Хотя бы полученный LOGO похож на выдачу MEME (рис. 3)
Учитывая все вышесказанное, я переделала MEME и запустила FIMO в браузерной версии.
Ура! Тот же 2 мотив (который в консольной выдаче 2, а в выдаче сайта 1)! Но - буквально тот же самый результат и то же logo.
Чуть смягченные параметры дали ОЧЕНь большую табличку. И все еще нет. Возможно, тут есть какая-то биологическая хитрость, возможно это не мотив, а возможно я чего-то не понимаю. В любом случае можно попробовать сравнить полученный LOGO с родственными вирусами (и теперь я точно знаю, что консольные версии хуже).
Мой короновирус принадлежит роду Alphacoronavirus, и безранговой группе unclassified Alphacoronavirus. Для дальнейшего рассмотрения я взяла BtRf-AlphaCoV/YN2012, потому что геномов того же вида нет. Для него мотив получился таким:
Другой вирус - Coronavirus AcCoV-JC34. Его мотив:
Если считать найденный мной мотив верным, можно сделать вывод, что эти мотивы - специфическая черта вируса, по крайней мере в рамках рода. Хотя можно заметить, что мотивы двух случайно выбранных вирусов близких родов вложены друг в друга, т е мотив вируса 2 является подпоследовательностью мотива вируса 1 - это прозрачный намек на то, что внутриродовое сходство все-таки имеется, а мотив вируса Wencheng Sm shrew coronavirus из моего практикума недостоверен.
Заглянула в предыдущий практикум. Первый мотив из консольной выдачи MEME = второй из выдачи на сайте очень похож на ACTAAA. А возможно я тронулась головой и вижу призраки мотивов.
fimo --oc fimo1 --verbosity 1 --norc meme.txt sequence.fasta
MOTIF WIDTH BEST POSSIBLE MATCH
1 6 CTAAAC
2 9 GAGCCTGTG
3 10 CCGTCTATAG
MOTIF WIDTH BEST POSSIBLE MATCH
2 9 GAGCCTGTG
CTCAACTAAAC
ACTAAA