Сигнал полиаденилирования (AAUAAA для человека) - сайт связывания белка CPSF, который разрезает 3'-конец транскрипта для его дальнейшего полиаденилирования. Специфичность связывания с РНК значимо увеличивается благодаря белкам CstF и CFI. CstF связывается с GU-богатым участком РНК ниже сайта связывания CPSF, а CFI с другим специальным сайтом на РНК (UGUAA для млекопитающих). Сигнал полиаденилирования высокоэффективен, поскольку необходим для начала трансляции большинства мРНК.
1.Beaudoing E., Freier S., Wyatt J. R., Claverie J. M., Gautheret D. Patterns of variant polyadenylation signal usage in human genes. (англ.) // Genome research. — 2000. — Vol. 10, no. 7. — P. 1001—1010.
2.Brown K. M., Gilmartin G. M. A mechanism for the regulation of pre-mRNA 3' processing by human cleavage factor Im.// Molecular cell. — 2003. — Vol. 12, no. 6. — P. 1467—1476.
Для выполнения задания 2 был использованскриптМаксима Смирнова для выбора генов из человеческого генома и построения PWM. Для построения позиционной матрицы использовались участки хромосом длиной 13 нуклеотидов - 7 нуклеотидов до ATG, сама ATG и 3 нуклеотида после старт-кодона. Среднее значение веса для положительного контроля равняется 5.242721611434907, для отрицательного - 1.490001599219049, при этом они достовено отличаются (p-value = 8.70161332031355e-12)
letter | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A | -2.29 | -0.37 | -0.65 | 0.11 | -0.82 | -0.5 | -0.82 | 1.22 | -4.08 | -4.08 | -0.37 | -0.5 | -1.31 |
T | 0.37 | -0.5 | -1.31 | -0.37 | -1.31 | -0.82 | -1.68 | -4.08 | 1.22 | -4.08 | -1.04 | -1.04 | -0.82 |
G | 0.31 | 0.31 | 0.74 | 0.11 | 0.85 | 0.54 | 0.11 | -3.72 | -3.72 | 1.58 | 0.99 | 0.39 | 0.94 |
C | 0.31 | 0.54 | 0.54 | 0.21 | 0.47 | 0.54 | 1.08 | -3.72 | -3.72 | -3.72 | -0.28 | 0.74 | 0.31 |
Для построения матрицы информационного содержания IC(b,j) пользовались формулой N(b,j)/Nw(b,j), где w(b,j)=ln(N(b,j)/p(b)) это значение PWM без учета псевдоотсчетов.
letter | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A | -0.09 | -0.11 | -0.15 | 0.04 | -0.15 | -0.13 | -0.15 | 1.76 | 0 | 0 | -0.11 | -0.13 | -0.15 |
T | 0.22 | -0.13 | -0.15 | -0.11 | -0.15 | -0.15 | -0.13 | 0 | 1.76 | 0 | -0.16 | -0.16 | -0.15 |
G | 0.12 | 0.12 | 0.45 | 0.03 | 0.58 | 0.27 | 0.03 | 0 | 0 | 2.29 | 0.78 | 0.16 | 0.71 |
C | 0.12 | 0.27 | 0.27 | 0.07 | 0.22 | 0.27 | 0.93 | 0 | 0 | 0 | -0.07 | 0.45 | 0.12 |
Как видно на графике, значимого сигнала у последовательности ATG не наблюдается