Селеноцистеин распологается в белках с антиоксидантной активностью. В начале к специальной селенцистеиновой тРНК присоединяется цистеин. затем цистеин меняется на селеноцистеин с помощью селенцистеинсинтазы. Sec-тРНК не распознается фактором элонгации EF-Tu (eEF1). Ее кодон - это стоп кодон, но если в мРНК есть специальная шпилька SECIS-элемент, то этот кодон можно перекодировать а селенцистеин. В бактериях Sec-тРНК связывается с UGA кодоном и селенцистеин встраивается в пептидную цепь. У эукариот белок называетсяя eEFsec, a SECIS-элемент распологается в 3' нетранслируемой области, что позволяет вводить несколько селенцистеинов в белок, синтезируемый одной мРНК.
Для выполнения данного задания использовался скрипт Максима Смирнова, за что ему огромное Спасибо. Данный скрипт выбирает 100 случайных геннов человека и вырезает 7 нуклеотидов до старта трансляции ATG + ATG + 3 нук. после ATG. Результат: обучение (40), тест (60)
N | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
A | -2,29 | -0,37 | -0,65 | 0,11 | -0,82 | -0,50 | -0,82 | 1,22 | -4,08 | -4,08 | -0,37 | -0,50 | -1,31 |
T | 0,37 | -0,50 | -1,31 | -0,37 | -1,31 | -0,82 | -1,68 | -4,08 | 1,22 | -4,08 | -1,04 | -1,04 | -0,82 |
G | 0,31 | 0,31 | 0,74 | 0,11 | 0,85 | 0,54 | 0,11 | -3,72 | -3,72 | 1,58 | 0,99 | 0,39 | 0,94 |
C | 0,31 | 0,54 | 0,54 | 0,21 | 0,47 | 0,54 | 1,08 | -3,72 | -3,72 | -3,72 | -0,28 | 0,74 | 0,31 |
Последовательности из тестового файла использовались для положительного тык контроля, а для отрицательного содержащие ATG. Также с помощью скрипта были получены positive control mean score: 5.242721611434907, negative control mean score: 1.8018855083930998, p-value: 6.763492270192289e-10 и ic:9.784051189548972. Их з этих данных можно сделать вывод о специфичности стартового кодона Козак, т.к. positive control больше чем negative control.
Для вычисления информационного содержания последовательности Козак была построена матрица информационного содержания.
N | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
A | -0.10 | -0.11 | -0.14 | 0.05 | -0.15 | -0.13 | -0.15 | 1.78 | 0 | 0 | -0.11 | -0.13 | -0.15 |
T | 0.23 | -0.13 | -0.15 | -0.11 | -0.15 | -0.15 | -0.13 | 0 | 1.78 | 0 | -0.16 | -0.16 | -0.15 |
G | 0.13 | 0.13 | 0.46 | 0.04 | 0.59 | 0.28 | 0.04 | 0 | 0 | 2.30 | 0.80 | 0.17 | 0.73 |
C | 0.13 | 0.28 | 0.28 | 0.08 | 0.23 | 0.28 | 0.94 | 0 | 0 | 0 | -0.06 | 0.46 | 0.13 |
После чего ИС было визуализированно с помощью программы WebLOGO 3