Гены прокариот

Задание 1. Аннотировать последовательность и сравнить с аннотацией генов в записи GenBank

Для выполнения задания был выбран вирус иммунодефицита человека 1 - Human immunodeficiency virus 1 (семейство Retroviridae, подсемейство Orthoretrovirinae, род Lentivirus, AC AF158101).

Геном вируса был аннотирован в RAST; полученный .gbk-файл был переведен в табличный формат программой featcopy. В табличный формат также был переведен файл с записью Genbank, после чего обе таблицы были сравнены с помощью Excel.

  • Четыре гена были динаково аннотированы - совпали и стоп-, и старт-кодоны (страница "совпавшие полностью" в таблице).
  • Два гена имели одинаковый стоп-кодон, но разные старт-кодоны; при этом в записи, аннотированной Genbank, кодирующая последовательность начинается раньше (страница "различия по старт-кодону" в таблице).
  • Генов, аннотированных RAST, и не аннотированных в записи GenBank найдено не было; при этом 5 кодирующих последовательности RAST не нашел (страница "не найденные" в таблице).

Оба гена с не совпавшими старт-кодонами были проверены с помощью blastp, который показал, что различия в аннотациях (длинные участки в начале генов из записей Genbank) являются некодирующими; возможно, несут регуляторный смысл.

Аннотировано в GbАннотировано Rast

Суммируя полученные результаты, можно сказать, что RAST, в целом, является хорошим сервисом по аннотации кодирующих последовательностей, пусть иногда и пропуская часть из них; при этом аннотируются только имеющие смысл участки, нетранслируемые области же игнорируются.

Таблица результатов.

© Andrew Sigorskih,2015.