Предсказание генов у прокариот

СеместрыТретий семестр • Предсказание генов у прокариот

1

Мне был дан контиг микробиома кардиального отдела желудка валлаби. С помощью программы ORF Finder я нашел открытые рамки считывания длиной 60 триплетов (180 нуклеотидов) и более, используя бактериальный генетический код. Выдача программы показана на рис.1.

Рисунок 1. Выдача программы ORF Finder.

Первые три рамки соответствуют требованиям, наложенным на длину. При этом третья рамка целиком входит в первую, из-за очевидной невозможности сменить старт трансляции таким образом, чтобы избежать перекрывания, я далее не рассматривал третью рамку.

Я провел поиск гомологов транскриптов первой и второй рамок в BLAST (транскрипты получил с помощью ORF Finder). Для первой рамки было найдено 209 белков с e-value меньшим 0,001 (минимальный e-value оказался 3e-110, для многих находок он принят 0.0). Все находки являются последовательностями фосфоенолпируват карбоксикиназ, минимальная длина выравнивания - 80% (430 аминокислотных остатков) у одной находки, у остальных больше или равна 86%.

Поиск BLAST по второй рамке не выдал находок.

Данные о рамках, прошедших фильтр, приведены в таблице 1.

Таблица 1. Данные о рамке, прошедшей фильтр.

Начало

Конец

Длина в а.о.

Цепь

Описание

986 2596 537 - Фосфоенолпируват-карбоксикиназа: катализирует реакцию гликолиза PEP+ADP=ATP+PYR

2,3,4

С помощью программы GeneMark я получил аннотации рамок. Я использовал параметры по умолчанию. Программа выдает два файла: краткая информация о результатах и графики кодирующего потенциала (см. рис.2).

Рисунок 2. График кодирующей плотности.

На приведенном выше графике жирным выделен предположительный ген. Его координаты абсолютно точно совпадают с координатами рамки из задания 1.

В GeneMark можно изменить эвристические параметры. Я запустил GeneMark с альтернативными эвристическими параметрами. Сравнение результатов представлено в таблице 2.

Таблица 2. Сравнение выдачи GeneMark с разными параметрами.

Эвристические параметры

Начало

Конец

Длина в а.о.

Цепь

1993 986 2596 527 -
2010 986 2596 527 -
2733 2816 28 +

Как видно, использование альтернативных параметров привело к обнаружению рамки, не аннотированной ORF Finder. Можно скачать график и выдачу.