Учебный сайт Полины Байкузиной

Главная Семестры О себе Ссылки

Предсказание генов прокариот

Задание 1.

В данном задании требовалось аннотировать последовательность и сравнить с аннотацией генов в записи GenBank.

Для работы я выбрала архею Desulfurococcus kamchatkensis 1221n.Таксономия организма представлена на рис.1. Геном археи представлен одной кольцевой молекулой ДНК (CP001140.1). Длина 1365223 п.н. Нуклеотидная последовательность приведена в формате fasta.

Рис.1. Таксономия Desulfurococcus kamchatkensis 1221n.

Для получения аннотации последовательности использовался сервер RAST. При помощи RAST была получена исходная таблица аннотаций. Также из NCBI Gene была скачана уже существующая таблица аннотаций. Таблица аннотаций, полученная из NCBI Gene.

Всего аннотировано генов в GenBank 1471, в RAST 1563:

  • число одинаково аннотированных генов (совпадают и старт-, и стоп-кодоны): 1074;
  • число генов с одинаковым стоп-кодоном, но разными старт-кодонами: 180;
  • число генов, аннотированных RAST и не аннотированных в записи GenBank: 103.

Таблица с результатами сравнения аннотаций (желтым выделены аннотации, полученные из GenBank; голубым - при помощи RAST).


Примеры генов с несовпадающими аннотациями.

Для выбранных генов нужно было проверить аннотацию с помощью blast.

1. Ген уридинмонофосфат-киназы: несовпадение старт-кодонов в аннотациях RAST и GenBank.

Рис.2. Аннотации гена уридинмонофосфат-киназы (голубым цветом выделена аннотация, полученная при помощи RAST, желтым - из GenBank).

Рис.3. Некоторые результаты выдачи blastp (по Swiss-Prot).

На рис.4 изображено выравнивание последовательности из RAST (лучшая находка), полученное при помощи алгоритма blastp (поиск по Swiss-Prot). Как видно из изображения, старт-кодоны совпадают. Эти данные получены исходя из гомологии, экспериментально подтверждены не были. При запуске blastp для последовательности из GenBank результаты получились хуже. Поэтому можно судить, что аннотация RAST наиболее верна, но все же нельзя говорить об этом с полной уверенностью.

Рис.4. Лучшая находка blastp.

2. Ген фактора инициации трансляции 2: несовпадение старт-кодонов в аннотациях RAST и Genbank.

Рис.5. Аннотации гена фактора инициации трансляции 2 (голубым цветом выделена аннотация, полученная при помощи RAST, желтым - из GenBank).

Рис.6. Некоторые результаты выдачи blastp (по Swiss-Prot).

На рис.7 приведено выравнивание последовательности из RAST (лучшая находка), полученное при помощи blastp (поиск по Swiss-Prot). Старт-кодоны совпадают. Данные так же получены исходя из гомологии, экспериментально подтверждены не были. При проверке для последовательности из GenBank результаты получились хуже. Заключить с уверенностью, что аннотация RAST наиболее верна, нельзя.

Рис.7.Лучшая находка blastp.

3. Расхождение в аннотациях белка.

Рис.8. Аннотации гена (голубым цветом выделена аннотация, полученная при помощи RAST, желтым - из GenBank).

Как видно из рис. продукт последовательности с одинаковыми старт- и стоп-кодонами аннотирован по-разному. Для проверки я запустила blastp. Из результатов выдачи алгоритма видно, что лучшие находки являются дезоксирибонуклеазой. Поиск с помощью blast свидетельствует в пользу большей правильности аннотации GenBank.

Рис.9. Результаты работы алгоритма blastp. Красным выделены лучшие находки.

© Полина Байкузина, 2014