Практикум 7.

Сигналы и мотивы

Информационное содержание (IC) последовательностей Козак в геноме данио рерио и построение LOGO этого сигнала

Для этого задания я выбрала вариант 4 . Результат - матрица с информационными содержаниями отдельных букв и колонок, итоговое информационное содержание сигнала, формула для вычисления элемента матрицы в Таблице с IC. При помощи сервиса LOGO была получена картинка, на которой сигнала буквы имеют высоту, равную информационному содержанию букв.
К сожалению, я не смогла разобраться, почему третья колонка картинки оказалась пустой.
LOGO
Рис.1 LOGO

Проверка PWM для сайтов регуляции разрывной транскрипции sgmRNA

Чтобы построить LOGO последовательность Козак выбранного мной вируса в прошлом практикуме (Sparrow coronavirus HKU17), я получила участки последовательностей генов вируса с координатами -9..4 (см. Табл.1). Далее с помощью сервиса LOGO я получила иллюстрацию консенсусной последовательности Козак (рис.2). Её я сравнила с известной из Википедии последовательностью Козак человека (рис.3). Эти два LOGO, как можно заметить, имеют не много общего. Я полагаю, что это связано, что хозяином для моего вируса является воробей (Козак которого мне не удалось найти), а не в человек. Однако нуклеотиды в некоторых позициях все же немного совпадают с Козак для человека: A/G В в позиции -3, G в позиции 4.
Таблица 1. Координаты участков -9..4
Ген Координата начала Координата -9 Координата 4
orf1ab 520 511 523
S 19334 19325 19337
E 22948 22939 22951
M 23189 23180 23192
NS6 23842 23833 23845
N 24150 24141 24153
NS7a 24244 24235 24247
NS7b 25189 25180 25192
NS7c 25539 25530 25542
LOGO
Рис.2 LOGO Kozak
LOGO
Рис.3 Последовательность Козак для человека из Википедии
С помощью FIMO был произведен поиск по найденному в MEME мотиву. В геноме нашлось 10 мотивов. В большинстве из них обнаруживалось консервативное "ACACCA" (рис. 4).
Немного классификации. Выбранный мной короновирус Sparrow coronavirus HKU17 относится к роду Дельтакороновирусов (Deltacoronavirus), однако его подрод и вид неопределен (unclassified Deltacoronavirus). Согласно ncbi в той же группе unclassified Deltacoronavirus находится Sparrow deltacoronavirus, но, к сожалению, не понятно являются ли они штаммами одного вида.
Чтобы описать находки сигнала с помощью программы FIMO, я нашла полные геномы воробьиного дельтакороновируса (Sparrow deltacoronavirus strain ISU73347 - предполагаемый штамм того же вида) и короновирус китайского бюльбюля (Bulbul coronavirus HKU11-796 из того же рода)
Результат FIMO получился довольно интересный (рис. 5). Согласно выдаче FIMO после поиска по фаста-файлу с геномами обоих вирусов, было 14 находок с p-value менее 0,0001: 9 находок в геноме Sparrow deltacoronavirus и 5 в геноме Bulbul coronavirus. Кроме того, координаты мотивов не совпадали с с координатами в геноме Sparrow coronavirus HKU17 (ближе всего были координаты первого мотива из генома Sparrow deltacoronavirus). Сами мотивы были примерно одинаковые для всех троих геномов.
FIMO
Рис.4 Результат FIMO: при поиске в геноме Sparrow coronavirus HKU17
FIMO
Рис.5 Результат FIMO: FJ376620.1 - геном Bulbul coronavirus, MG812378.1 - Sparrow deltacoronavirus
sparrow
Домовый воробей
bulbul
Китайский настоящий бюльбюль