Учебный сайт Валяевой Анны

Предсказание генов у прокариот

Задача этого практикума - проаннотировать контиг микробиома кардиального отдела желудка валлаби.

Задание 1

Вначале с помощью программы ORF Finder на сайте NCBI, используя бактериальный генетический код (11), были найдены открытые рамки считывания, результат изображен на рисунке 1. Похожие результаты выдала программа getorf из пакета EMBOSS.

Открытые рамки считывания, предсказанные ORF Finder

Рис. 1. Открытые рамки считывания, предсказанные ORF Finder.

Из найденных аминокислотных последовательностей для последующего поиска гомологов были исключены последовательности с длиной менее 180 пн (60 ао). Из перекрывающихся предпочтение отдавалось более длинным последовательностям. Таким образом, с помощью программы BLASTP для первых трех рамок был проведен поиск близких последовательностей в банке Swiss-Prot. Были учтены следующие параметры: E-value находки меньше 0,001 и не менее 80% банковской последовательности покрыто выравниванием. Результаты представлены в таблице 1.

Таблица 1. Открытые рамки, найденные ORF Finder, и их предполагаемые гомологи.

НачалоКонецДлина в а.о.ЦепьОписаниеОрганизмПокрытиеE-value
2241777518+Эндонуклеаза RecJ, специфичная к одноцепочечной ДНКBacillus subtilis subsp. subtilis str. 16889%7e-54
18262356177+Адениновая фосфорибозилтрансферазаLactococcus lactis subsp. cremoris MG136394%6e-64
23812774131+ГТФ пирофосфокиназаBacillus subtilis subsp. subtilis str. 16882%4e-26

Для остальных последователностей ОРС гомологов, отвечающих заданным требованиям, найдено не было. Итак, по полученным результатам можно предположить, что в данном контиге 3 гена.

Задание 2

Далее для предсказания генов в данном контиге была использована программа GeneMark. Для поиска генов были выбраны эвристические параметры 1999 года. Информация о предсказанных генах представлена в таблице 2. График кодирующего потенциала можно посмотреть здесь. Фрагмент графика на рисунке 2.

Таблица 2. Открытые рамки, найденные GeneMark.

НачалоКонецДлина генаЦепь
<2127126+
22417771554+
18262356531+
2382>2774393+
Фрагмент графика расшифровки контига

Рис. 2. Фрагмент графика расшифровки контига. На оси абсцисс обозначены координаты нуклеотидов, на оси ординат - кодирующий потенциал. Жирными черными прямыми обозначены предсказанные гены.

Задание 3

С помощью GeneMark был предсказан дополнительный ген с координатами (<2…127). Предсказания других трех генов практически идентичны.

Дата последнего обновления: 28.12.14
©Валяева Анна