Сигналы в геноме





Задание 1. Последовательность Шайна-Дальгарно.

Последовательность Шайна-Дальгарно (SD) встречается у бактерий и участвует в регуляции трансляции. Эта последовательность находится ниже старт кодона (-10 элемент), чтобы связывать рибосому в месте начала трансляции. На рисунке 1 представлена схема работы сигнала: SD комплиментарно связывается с последовательность anti-SD 16S rRNA (30S субъединица рибосомы), что вызывает инициацию трансляции. [1] [2]. Сила сигнала зависит от консервативности самой последоватльности, за счет чего происходит регуляция трансляции [3], например, фаг Т4 обладает SD сильнее, чем в мРНК E. coli, благодаря чему успешно синтезирует свои белки в клетке хозяине. На рисунке 2 приведены примеры последовательности Шайна-Дальгарно у E. coli и бактериофагов.






Задание 2. PWM для SD

В этом задании я выбрал геном Escherichia coli O157 штамм 644-PT8 для анализа. В качестве материала обучения и материала тестирования я выбрал по 50 промоторов генов на прямой цепи (20 оснований до старт-кодона ATG, плюс сам старт-кодон). Для материала контроля я взял 50 генов на обратной цепи и взял участки такой же длины по координате, которая указана как start в feature table (т.е я взял участки не с начала, а с конца гена). Для вычисления PWM и порога я использовал код Лизы Плешко. Результат выполнения консенсус - AATTTAAGAGGAAATGATTATG, порог - 3,187. Файл PWM, а также рисунки LOGO и гисторгамма весов последовательностей представлены. Как мы видим, сигнал составляет 6-7 оснований, причем они имеют вес pwm значительно ниже, чем старт-кодон ATG. Это показывает, что последовательность Шайно-Дальгарно не является высоко консервативной, а отличия от консенсуса по видимому регулируют экспрессию генов. Также видно, что в материале контроля сигнал отсутствует, то есть эта последовательность не является часто встречающимся повтором. Также из выводов можно добавить, что материал теста и обучения имеет в большинстве последовательностей сигнал, то есть консенсус предсказанный на части последовательностей подходть под другую часть.


Таблица результатов

обучение тест контроль
сигнал(+) 48 39 0
сигнал(-) 2 11 50