Интересным для меня сигналом, закодированным в геноме, является последовательность вставки селеноцистеина SECIS (selenocysteine insertion sequence).
Все живые организмы обладают способностью преобразовывать кодоны UGA из сигнала о прекращении трансляции в кодон селеноцистеина (Sec). Белки, в которые успешно включается Sec, называются селенопротеинами и выполняют функции оксидоредуктаз [1].
Система декодирования сигнала у эукариот включает как минимум два белка: фактор элонгации, специфичный для селеноцистеин-тРНК (eEFSec) и SECIS-связывающий белок 2 (SBP2), взаимодействующий с последовательностью SECIS в 3'-нетранслируемой области (3'-НТО) транскрипта мРНК селенопротеинов (рис. 3, 4) [2]. SECIS имеет минимальный функциональный размер 50–60 нуклеотидов, представляет собой структуру стебль-петля (шпильку) с тремя консервативными последовательностями: AUGА, (A)AA, GA (рис. 1, 2). Консервативные остатки (А)AA находятся на 5'-стороне апикальной петли, а основания AUGA и GA расположены близко друг к другу на противоположных сторонах спирального стебля [3]. Существует два типа эукариотических SECIS: тип I и тип II, которые отличаются наличием дополнительной спирали 3 в типе II. На рис. 2 приведены примеры сигнала SECIS эукариот, а именно консенсусные последовательности обоих типов [9].
SECIS, должно быть, является эффективным и важным сигналом для включения селеноцистеина в эукариотические клетки, поскольку поддерживает биосинтез селенопротеинов, играющих особую биологическую роль и обладающих важными каталитическими функциями. То есть, не будь сигнал эффективным, селенопротеины лишились бы функционального активного центра. Также приведу примеры селенопротеинов:
Для правильной аннотации селенопротеинов (чтобы избежать интерпретации UGA как сигнала остановки трансляции) разработаны специальные инструменты, например SECISearch3 [9]. SECISearch3 — это усовершенствованный конвейер для прогнозирования SECIS-элементов, развивший подходы оригинального SECISearch.
SECISearch использует PatScan для поиска по рукописным шаблонам последовательности, моделирующим спирали, петли и консервативное ядро SECIS. Результаты фильтруются по термодинамической стабильности (RNAfold) и структурным характеристикам. Ограничением метода является зависимость от шаблонов, требующих адаптации для новых видов. SECISearch3 объединяет несколько методов: Infernal (на основе ковариационных моделей) стал центральным методом прогнозирования и для оценки структур, предсказанных Covels и SECISearch. Конвейер обработки состоит из таких этапов, как объединение прогнозов от всех трёх методов, удаление избыточных кандидатов, структурное уточнение и оценка термодинамической стабильности (RNAeval), фильтрация по ключевым признакам. Ранжирование итоговых структур основано на важных структурных параметрах.
Примером для проверки работоспособности сервиса будет ген упоминавшегося раннее DIO1 (п-ти транскриптов с NCBI). Допустим, попробуем первый транскрипт (NM_000792.7). Сервисом предсказан один элемент SECIS в районе 1745-1815 нуклеотидов положительной цепи. Шпилька имеет оценку «А», принадлежит к типу I.