Предсказание генов эукариот

Мне был выдан контиг в геномном браузере на сайте NCBI NW_014545459.

Он принадлежит очень интересному организму Alligator mississippiensis.

Классификация:

Перед нами один из двух самых известных видов аллигаторов. Обитает в Северной Америке и считается эндемичным для юго-восточной части США.

Это животное представляет собой крупную крокодилоподобную рептилию, обитающую в пресноводных водоемах, таких как озера, реки и кипарисовые болота от Техаса до Северной Каролины. По сравнению со вторым представителем рода — китайским аллигатором, миссисипский аллигатор значительно крупнее.

Аллигаторы — хищники, поедающие рыбу, амфибий, рептилий, птиц и мелких млекопитающих. Новорожденные особи питаются в основном беспозвоночными. Недавно (в 2013 году) было показано, что миссисипские аллигаторы едят такие плоды, как дикий виноград, бузины и цитрусовые прямо с деревьев. Открытие этой неожиданной части диеты аллигаторов показывает, что аллигаторы могут быть ответственны за распространение семян из переваренных плодов в местах своего обитания.

Эти животные играют важную роль в экосистеме заболоченных территорий, вырывая специальные ямы, которые становятся домом для других организмов во время сухого сезона.

В течение всего года, но особенно во время сезона размножения, аллигаторы издают звуки чтобы обозначить территорию и найти подходящих партнеров. Самцы используют инфразвук, чтобы привлечь самок. Яйца откладываются в гнезде, сделанном из опавшей растительности, палочек и грязи в защищенном месте вблизи водоема. Молодые аллигаторы рождаются с желтыми полосами вокруг их тела и попадают под защиту матери на срок до одного года.

Взрослые аллигаторы вполне способны нападать на людей, но, как правило, не видят в них источника потенциальной пищи. Чаще всего к атаке приводит ошибочная идентификация, особенно в пасмурные дни или вблизи воды, когда достаточно крупный аллигатор принимает человека за подошедшее к воде животное средних размеров, вроде оленя или дикой свиньи. Укусы аллигаторов могут быть чреваты серьезными травмами и инфекцией. Даже с медицинским лечением, укус аллигатора может привести к фатальной инфекции

Аллигаторов сейчас разводят на фермах ради их шкуры и мяса. Это животное является официальной государственной рептилией трех Американских штатов: Флориды, Луизианы и Миссисипи.

  • Ссылка на источник информации: Миссисипский аллигатор
  • Cсылка на источник картинки: Alligator mississippiensis
  • Размер контига составляет 2955657 пар оснований, он содержит 28 генов и кодирует 40 различных белков и 42 РНК.

    Мой выбор — ген СЕР57, кодирующий 5 различных вариантов центромерных белков.

    Данный ген кодирует 5 различных мРНК, которые продуцируют 5 различных вариантов центромерного белка 57 (изоформы Х1-Х5). Они различаются по размеру. Их функция - связывание с микротрубочками во время митоза и мейоза.

    В базе данных PDB я нашел аналогичный продукт гена СЕР57, поэтому я приведу его изображения с разных ракурсов.

    Можно заметить, что этот белок содержит 2 альфа-спирали и группируется по две субъединицы для выполнения своих задач.

    Предсказание генов и белок-кодирующих областей в выданном контиге с помощью web-сервера AUGUSTUS

    Я использовал алгоритм web-сервера AUGUSTUS в режиме prediction. На картинке внизу представлены входные параметры.

    Результат — predictions.tar.gz, содержащий сжатые файлы с полученной в ходе работы программы информации.

    Распаковка возможна только в ЛИНУКС, для этого нужно применить команду tar -xzvf *.tar.gz.

    Таким образом я получил архив с 6 файлами.

    РасширениеСодержимое
    *.gffпредсказание генов в формате gff - General Feature Format
    *.gtfпредсказание генов в формате gft - 2-ой версии gff
    *.gbrowseтрек-файл предсказания для GBrowse
    *.aaпредсказание генов в виде fasta-последовательности белков
    *.cdsexonsпредсказание экзонов в виде fasta-последовательности ДНК
    *.codingseqпредсказание генов в виде fasta-последовательности кодирующих участков ДНК

    Чтобы сравнить качество предсказания, я воспользовался тем же спсобом, что и в практикуме 11

    A вот и результат:

    Предсказание AUGUSTUS получилось совсем некачественным. Ни одного гена не было предсказано полностью правильно, 1 ген был предсказан с ошибкой c N-конца, и 1 с ошибкой с С-конца. Также было предсказано 26 лишних генов.

    Такую неудачу можно объяснить тем, что я неправильно выбрал модельный организм сравнения или не "натренировал" программу в режиме training submission.

    Все гены предсказаны неверно, поэтому сравнивать нечего.


    © Борисов Евгений 2016