Для этого задания я выбрала
вариант 4
. Результат - матрица с информационными содержаниями отдельных букв и колонок,
итоговое информационное содержание сигнала, формула для вычисления элемента матрицы в
Таблице с IC.
При помощи сервиса
LOGO была получена картинка, на которой сигнала буквы
имеют высоту, равную информационному содержанию букв.
К сожалению, я не смогла разобраться, почему третья колонка картинки оказалась пустой.
Чтобы построить LOGO последовательность Козак выбранного мной вируса в
прошлом практикуме (Sparrow coronavirus HKU17), я получила участки последовательностей генов вируса с координатами -9..4 (см. Табл.1).
Далее с помощью сервиса LOGO я получила иллюстрацию консенсусной последовательности Козак (рис.2). Её я сравнила с известной из
Википедии последовательностью Козак человека (рис.3). Эти два LOGO, как можно заметить,
имеют не много общего. Я полагаю, что это связано, что хозяином для моего вируса является воробей (Козак которого мне не удалось найти), а не в человек.
Однако нуклеотиды в некоторых позициях все же немного совпадают с Козак для человека: A/G В в позиции -3, G в позиции 4.
С помощью FIMO был произведен поиск по найденному в MEME мотиву. В геноме нашлось 10 мотивов. В большинстве из них
обнаруживалось консервативное "ACACCA" (рис. 4).
Немного классификации. Выбранный мной короновирус
Sparrow coronavirus HKU17 относится к роду Дельтакороновирусов (Deltacoronavirus),
однако его подрод и вид неопределен (unclassified Deltacoronavirus). Согласно
ncbi
в той же группе unclassified Deltacoronavirus находится Sparrow deltacoronavirus, но, к сожалению, не понятно являются ли они штаммами одного вида.
Чтобы описать находки сигнала с помощью программы FIMO, я нашла полные геномы воробьиного дельтакороновируса
(
Sparrow deltacoronavirus strain ISU73347 -
предполагаемый штамм того же вида) и короновирус китайского бюльбюля (
Bulbul coronavirus HKU11-796 из того же рода)
Результат FIMO получился довольно интересный (рис. 5). Согласно выдаче FIMO после поиска по фаста-файлу с геномами обоих вирусов, было 14 находок с p-value менее 0,0001: 9 находок
в геноме
Sparrow deltacoronavirus и 5 в геноме
Bulbul coronavirus. Кроме того, координаты мотивов не совпадали с с координатами в геноме
Sparrow coronavirus HKU17
(ближе всего были координаты первого мотива из генома
Sparrow deltacoronavirus).
Сами мотивы были примерно одинаковые для всех троих геномов.