Практикум 7. Сигналы и мотивы II

В этом практикуме мы проверяем правдивость найденных программой meme мотивов.

Программа запускалась через консоль на сервере kodomo с помощью следующей команды:

fimo --oc fimo1 --verbosity 1 --norc meme.txt sequence.fasta

Скачать полную выдачу fimo можно по ссылке.

На рис. 1 представлена таблица выдачи fimo. В прошлом практикуме я предположила, что первая находка MEME более убедительна, хотя второй найденный мотив с ним сравним. FIMO несколько перевернул данные и не дал ни одной строчки с первым мотивом MEME. Зато в списке оказаллось 9 потенциальных позиций мотива 2 и даже несколько совпадений с 3. Напомню, что исходных последовательностей 5.

бла

Рисунок 1. Выдача FIMO.

Я попыталась поиграть с параметрами FIMO, чтобы выловить меньше, но лучше, однако при попытке изменить --thresh или указать --qv-thresh возникает ошибка "is not a valid option". На рисунке 3 представлен результат "оценки глазами", фиолетовым подчеркнуты находки, которые ставят под вопрос достоверность мотива (остальные просто попадают сильно внутрь генов). Получается, что непосредтсвенно в 100-нуклеотидной зоне перед последним геном (nucleocapsid protein) нет мотива 2, зато представлен мотив 3. При этом мотив 2 есть несколько раньше. Повторюсь, менять параметры FIMO я не мочь.

бла

Рисунок 2. Анализ выдачи FIMO.

Интересно также взглянуть на следующий фрагмент выдачи:

MOTIF	WIDTH	BEST POSSIBLE MATCH
1	6	CTAAAC
2	9	GAGCCTGTG
3	10	CCGTCTATAG

В общем, высоко оцененный FIMO мотив далек от идеала. Я вообще скорее склоняюсь к тому, что мотив мы не нашли, ибо требования из упомянутой в подсказках статьи не выполняются ¯\_(ツ)_/¯

Хотя бы полученный LOGO похож на выдачу MEME (рис. 3)

бла

Рисунок 3. LOGO 2 мотива.

Учитывая все вышесказанное, я переделала MEME и запустила FIMO в браузерной версии.

бла

Рисунок 4. Новая версия результатов FIMO.

Ура! Тот же 2 мотив (который в консольной выдаче 2, а в выдаче сайта 1)! Но - буквально тот же самый результат и то же logo.

MOTIF	WIDTH	BEST POSSIBLE MATCH
2	9	GAGCCTGTG

Чуть смягченные параметры дали ОЧЕНь большую табличку. И все еще нет. Возможно, тут есть какая-то биологическая хитрость, возможно это не мотив, а возможно я чего-то не понимаю. В любом случае можно попробовать сравнить полученный LOGO с родственными вирусами (и теперь я точно знаю, что консольные версии хуже).

бла

Рисунок 5. Новая-новая версия результатов FIMO.

Мой короновирус принадлежит роду Alphacoronavirus, и безранговой группе unclassified Alphacoronavirus. Для дальнейшего рассмотрения я взяла BtRf-AlphaCoV/YN2012, потому что геномов того же вида нет. Для него мотив получился таким:

CTCAACTAAAC

Другой вирус - Coronavirus AcCoV-JC34. Его мотив:

ACTAAA

Если считать найденный мной мотив верным, можно сделать вывод, что эти мотивы - специфическая черта вируса, по крайней мере в рамках рода. Хотя можно заметить, что мотивы двух случайно выбранных вирусов близких родов вложены друг в друга, т е мотив вируса 2 является подпоследовательностью мотива вируса 1 - это прозрачный намек на то, что внутриродовое сходство все-таки имеется, а мотив вируса Wencheng Sm shrew coronavirus из моего практикума недостоверен.

Заглянула в предыдущий практикум. Первый мотив из консольной выдачи MEME = второй из выдачи на сайте очень похож на ACTAAA. А возможно я тронулась головой и вижу призраки мотивов.