Для исселдования выбрала сайт инициации трансляции в mRNA у эукариот (последовательность Козак).
a. Название сигнала: последовательность Козак
b. Носитель сигнала: молекула мРНК
с. Кому адресован: 43S преинициаторный комплекс трансляции эукариот
d. Предназначение — как должен реагировать адресат: при нахождении комплексом последовательности Козак образуется 48S-комплекс; далее eIF2 гидролизует ГТФ, что приводит к диссоциации 48S-комплекса и присоединению 60S-субъединицы рибосомы.
e. Сила сигнала: зависит от нуклеотидного окружения AUG и оценивается по двум ключевым позициям: -3 (пурин, особенно G) и +4 (G).
f. Примеры сигнала: GCCGCCGCCAUGG (G (‑3), G (+4)) – максимальная эффективность инициации; GCCACCACCAUGG (A (‑3), G (+4)) – ответ 80–90%; GCCACCACCAUGA (A (‑3), A (+4)) – ответ 40–50%.
g. Ссылки на литературу:
1) Kozak, M. (1991). An analysis of vertebrate mRNA sequences: Intramolecular base pairing and proximity of the AUG initiator codon to the 5′ end. The Journal of Cell Biology, 115(4), 887–896. DOI: 10.1083/jcb.115.4.887.
2) Pestova, T. V., & Kolupaeva, V. G. (2002). The roles of individual eukaryotic translation initiation factors in ribosomal scanning and initiation codon selection. Gene, 299(1-2), 1–34.DOI: 10.1016/S0378-1119(02)01057-4.
Далее нашла сервисы для поиска этого сигнала:
1) EMBOSS Explorer: подаем последовательность мРНК и шаблон, который мы ищем (в нем можно указывать неоднозначности, нуклеотиды по IUPAC); итог: таблица нацденных последовательностей. Этим способом можно найти последовательности Козак, написав ее как шаблон для поиска.
2) ATGpr (Prediction of Translation Initiation ATG): подаем последовательность ДНК/мРНК и программа оценивает окружение AUG (позиция -3 (предпочтительно A/G), позиция +4 (предпочтительно G), вторичная структура мРНК вокруг AUG (например, отсутствие стеблей-петель, которые могут блокировать рибосому).
Программа также использует машинное обучение. Итог работы: найденные последовательности Козак, их надежность, координаты, найден ли стоп-кодон и так далее. У программы есть минусы: может предсказывать AUG в некодирующих регионах, если контекст похож на Козак, модель работает лучше на данных, похожих на те, на которых она обучалась, не учитывает альтернативные механизмы инициации.