Для исследования я выбрала сайт инициации трансляции в mRNA у эукариот (последовательность Козак).
Краткое описание выбранного сигнала
Примеры сигнала:
Ссылки на литературу:
Выбранный сервис - EMBOSS: patmatmotifs (входит в пакет программ EMBOSS).
Принцип работы
Сервис принимает на вход нуклеотидную последовательность в формате FASTA. В своей базе данных он хранит шаблоны (motifs) для распознавания, в том числе и консенсусную последовательность Козак. Программа patmatmotifs сканирует входную последовательность и ищет участки, которые соответствуют сохранённым шаблонам.
На выходе программа предоставляет отчёт, в котором указаны:
Этот инструмент доступен через множество онлайн-порталов биоинформатических сервисов, но я буду использовать его через командную строку.
Шаг 1. В качестве примера будем использовать искусственную последовательность длиной 100 нуклеотидов, которая содержит:
Шаг 2. Создадим файл с последовательностью в формате FASTA
Шаг 3. Запуск patmatmotifs в Bash
patmatmotifs -sequence my_sequence.fasta -outfile kozak_results.txt
Вывод
Сервис работает корректно. Он нашёл оба сайта, которые мы задумали: и идеальный (score=16.00), и слабый (score=11.00). Также он корректно проигнорировал третий AUG (cugaauguc), так как его окружающие нуклеотиды не соответствуют шаблону "Kozak" в базе данных программы.
Результат полностью соответствует ожиданиям: более сильный сигнал (идеальный консенсус) получил более высокий балл (score), чем слабый. Это подтверждает гипотезу о "силе" сигнала.