Учебный Сайт Николая Николаева

Назад на страницу семестра

Сигналы и мотивы.

1. Описание сигнала полиаденилирования человека.

2. Построение и проверка позиционной весовой матрицы (PWM) для последовательности Козак человека.

Python-скрипт для данного задания любезно предоставлен Дмитрием Звездиным (с изменениями).

Для построения матрицы было получено 100 фрагментов генов человека из предложенной в задании таблицы (только с '+'-цепей), сожержащих стартовый ATG. Для проверки матрицы было скачано ещё 100 других фрагментов со стартовым ATG (положительный контроль) и 100 фрагментов с ATG, расположенным более чем в 200 нуклеотидах от начала гена (нестартовые ATG; отрицательный контроль).

Ожидаемые частоты встречаемости нуклеотидов рассчитывались, исходя из среднего содержания GC в человеческом геноме 41%3.

Полученная PWM доступна по ссылке.

Позитивные контроли имеют средний вес 5.25; отрицательные - 4.34. Тест Манна-Уитни показывает наличие статистически достоверной разницы (p-value=0.01). Значит, в точке начала трансляции действительно имеет место сигнал.

Вычисление информационного содержания и построение LOGO.

Матрица информационного содержания доступна по ссылке.

LOGO было построено с учётом содержания GC 41%.

Рис. 1. LOGO последовательности Козак, полученное из тех же данных, что и матрица PMW.

Источники:

  1. Б. Альбертс, А. Джонсон, Д. Льюис и др. Молекулярная биология клетки: в 3-х томах. Т. 1. М.-Ижевск: НИЦ "Регулярная и хаотическая динамика", Институт компьютерных исследований. 2013, 808.
  2. C. Lutz. Alternative Polyadenylation: A Twist on mRNA 3′ End Formation. ACS Chem. Biol. 2008, 3, 10, 609–617.
  3. International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome. Nature 2001, 409, 860–921.