Сигналы и мотивы
IC
Я выбрал выравнивание под номером 1. Вычисление информационного содержания я сделал с помощью скрипта на python (Скачать скрипт). Таблица IC и LOGO представлены ниже:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
---|---|---|---|---|---|---|---|---|---|---|---|
A | 0.039576 | -0.103608 | 0.237229 | 0.475385 | 0.237229 | 0.237229 | 0.237229 | 0.039576 | -0.103608 | -0.103608 | 0.475385 |
G | -0.088511 | -0.088511 | 0.045200 | 0.045200 | 0.045200 | 0.045200 | 0.262788 | 0.262788 | 0.534845 | 0.045200 | 0.045200 |
T | -0.162915 | 0.039576 | -0.103608 | -0.162915 | -0.103608 | -0.162915 | -0.162915 | -0.162915 | -0.162915 | -0.162915 | -0.162915 |
C | 0.534845 | 0.262788 | -0.088511 | -0.088511 | -0.088511 | 0.045200 | -0.088511 | 0.045200 | 0.045200 | 0.534845 | -0.088511 |
Проверка PWM для сайтов регуляции разрывной транскрипции sgmRNA
Я попытался проверить достоверность найденного мной мотива из предыдущего практикума.
Я использовал программу FIMO для того, чтобы заново найти этот мотив в геноме Bulbul coronavirus HKU11 и родственного Magpie-robin coronavirus HKU18. Мотив был найден в обоих геномах, несколько раз.
Находки в геноме Bulbul coronavirus HKU11
Находки в геноме Magpie-robin coronavirus HKU18
Находки сделаны с очень маленьким p-value в двух разных штаммах – это может служить основанием для того, чтобы предположить, что у мотива есть какое-то функциональное значение.
Также для того, чтобы оценить эффективность своего подхода я попытался найти известный мотив в геноме вируса – последовательность Козака. Для этого я взял -9..4 фрагмент каждой рамки считывания и попытался найти в них мотив.
Последовательность похожа на человеческий вариант только в позициях инициаторного кодона.
©Бакулин Артемий, 2018