Сигналы и мотивы 2

Задание 1: Вычисление информационного содержания (IC) последовательности Козак в геноме данио рерио и построение LOGO этого сигнала


Для выполнения задания был выбран вариант 7. При помощи ресурса WebLogo было построено LOGO. В каждой позиции
каждая буква изображается прямоугольником высоты, равной её информационному содержанию. Но на моем рисунке позиции три и четыре пустуют.
Наверно LOGO не любит колонки с низким IC, ситуации когда в одной позиции разные буквы имеют примерно равное информационное содержание.


Также была построена матрица информационного содержания для отдельных букв и колонок. Частоты букв GC у данио-рерио (38.6%).Итоговое информационное содержание получилось равным 10.13.

СКАЧАТЬ МАТРИЦУ


Задание 2: Проверка находок MEME для сайтов регуляции разрывной транскрипции sgmRNA

Для выполнения этого задания была использована программа FIMO из MEME Suite. В неё был подан выбранный в предыдущем практикуме мотив и геном коронавируса Human Coronavirus NL63. Выдачу FIMO можно посмотреть здесь .
При помощи ресурса ресурса WebLogo было построено LOGO последовательностей Козак поздних генов выбранного короновируса, оно представлено на рисунке ниже.


При сравнении с LOGO последовательностей Козак человеческих генов, представленных на рисунке ниже, видно, что совпадает A в позиции -3, G и A как самые представленные в позиции -1, C как самый представленный в позиции +5.


Был выполнен поиск кандидатного мотива TRS из Human Coronavirus NL63 в вирусе другого штамма и другого вида . Выдача FIMO для другого штамма представлена здесь, для другого вида - здесь, результаты позволяют предположить, что мотив специфичен для вида, поскольку в геноме оригинального вируса и другого штамма q-value находок значительно ниже, чем для другого вида, однако в последовательностях, найденных в геноме вируса другого вида есть нечно похожее на core sequence.


© Борис Бостан
На страницу семестра
На главную