Вычисление информационного содержания(IC) последовательностей Козак в геноме D.rerio

Использовалось выравнивание из 4 варианта.
По результатам вычислений IC=10,47576447. Матрицу с информационными содержаниями отдельных букв и колонок, итоговое информационное содержание сигнала можно посмотреть тут
Алгоритм вычисления инфорационного содержания:
1.Подсчёт числа букв для каждой позиции
2.Вычисление частоты букв в каждой позиции f(b,j)=(кол-во данной буквы в данной позиции/общее число букв в данной позиции)
3.Информационное содержание конкретной буквы в данной позиции: IC(b,j)=f(b,j)*log2[f(b,j)/p(b)]; если f(b,j)=0, то IC =0
4.Информационное содержание колонки: IC(j)=Σ IC(b,j)
5.Информационное содержание выравнивания: IC=Σ IC(j)
GC состав- 38,6%

LOGO сигнала

logo

Поиск мотива в геноме Night-heron coronavirus HKU19 с помощью программы FIMO

Напоминаю, какой мотив ищем: [TA][GT]CAG[AT]G[TG]G
посмтореть на мотив в выдаче meme (motif 1)

С помощь программы FIMO было получено 7 находок, с p-value < 0,0001. Также, что очень важно, мотив был найден перед геном лидерного пептида orf1ab. Но что не очень ожидаемо, мотив нашёлся дважды перед геном NS6 и ни разу не нашёлся в upstreamах двух генов Е и М. Находки FIMO приведены ниже.

logo

Далее предполагалось искать мотив в геномах другого штамма Night-heron coronavirus HKU19 и близкородственного вида. Но к сожалению, геном Night-heron coronavirus HKU19 единственный в базе данных. Поэтому я взяла геномы вирусов из того же рода Deltacoronavirus из разных подродов. Результаты работы FIMO приведены ниже.

подрод Buldecovirus, штамм White-eye coronavirus HKU16

logo

подрод Moordecovirus, штамм Common moorhen coronavirus HKU21

logo

В этих геномах мотив найден по 3 раза, но ни разу перед геном лидерного пептида orf1ab. Поэтому полученные находки не имеют никакого биологического смысла.

LOGO последовательности Козак из генома Night-heron coronavirus HKU19

Ниже преведены LOGO последовательностей Козак исследуемого коронавируса и человека. Видно, что последовательности не похожи, что нормально,т.к. это коронавирус не человека, а ночной цапли. Но в задании просили сравнить, я сравнила(. К сожалению, у меня не получилось найти последовательность Козак ночной цапли.

logo

logo