Мне был выдан контиг в геномном браузере на сайте NCBI NW_014545459.
Он принадлежит очень интересному организму Alligator mississippiensis.
Классификация:
Перед нами один из двух самых известных видов аллигаторов. Обитает в Северной Америке и считается эндемичным для юго-восточной части США.
Это животное представляет собой крупную крокодилоподобную рептилию, обитающую в пресноводных водоемах, таких как озера, реки и кипарисовые болота от Техаса до Северной Каролины. По сравнению со вторым представителем рода — китайским аллигатором, миссисипский аллигатор значительно крупнее.
Аллигаторы — хищники, поедающие рыбу, амфибий, рептилий, птиц и мелких млекопитающих. Новорожденные особи питаются в основном беспозвоночными. Недавно (в 2013 году) было показано, что миссисипские аллигаторы едят такие плоды, как дикий виноград, бузины и цитрусовые прямо с деревьев. Открытие этой неожиданной части диеты аллигаторов показывает, что аллигаторы могут быть ответственны за распространение семян из переваренных плодов в местах своего обитания.
Эти животные играют важную роль в экосистеме заболоченных территорий, вырывая специальные ямы, которые становятся домом для других организмов во время сухого сезона.
В течение всего года, но особенно во время сезона размножения, аллигаторы издают звуки чтобы обозначить территорию и найти подходящих партнеров. Самцы используют инфразвук, чтобы привлечь самок. Яйца откладываются в гнезде, сделанном из опавшей растительности, палочек и грязи в защищенном месте вблизи водоема. Молодые аллигаторы рождаются с желтыми полосами вокруг их тела и попадают под защиту матери на срок до одного года.
Взрослые аллигаторы вполне способны нападать на людей, но, как правило, не видят в них источника потенциальной пищи. Чаще всего к атаке приводит ошибочная идентификация, особенно в пасмурные дни или вблизи воды, когда достаточно крупный аллигатор принимает человека за подошедшее к воде животное средних размеров, вроде оленя или дикой свиньи. Укусы аллигаторов могут быть чреваты серьезными травмами и инфекцией. Даже с медицинским лечением, укус аллигатора может привести к фатальной инфекции
Аллигаторов сейчас разводят на фермах ради их шкуры и мяса. Это животное является официальной государственной рептилией трех Американских штатов: Флориды, Луизианы и Миссисипи.
Размер контига составляет 2955657 пар оснований, он содержит 28 генов и кодирует 40 различных белков и 42 РНК.
Мой выбор — ген СЕР57, кодирующий 5 различных вариантов центромерных белков.
Данный ген кодирует 5 различных мРНК, которые продуцируют 5 различных вариантов центромерного белка 57 (изоформы Х1-Х5). Они различаются по размеру. Их функция - связывание с микротрубочками во время митоза и мейоза.
В базе данных PDB я нашел аналогичный продукт гена СЕР57, поэтому я приведу его изображения с разных ракурсов.
Можно заметить, что этот белок содержит 2 альфа-спирали и группируется по две субъединицы для выполнения своих задач.
Я использовал алгоритм web-сервера AUGUSTUS в режиме prediction. На картинке внизу представлены входные параметры.
Результат — predictions.tar.gz, содержащий сжатые файлы с полученной в ходе работы программы информации.
Распаковка возможна только в ЛИНУКС, для этого нужно применить команду tar -xzvf *.tar.gz.
Таким образом я получил архив с 6 файлами.
Расширение | Содержимое |
---|---|
*.gff | предсказание генов в формате gff - General Feature Format |
*.gtf | предсказание генов в формате gft - 2-ой версии gff |
*.gbrowse | трек-файл предсказания для GBrowse |
*.aa | предсказание генов в виде fasta-последовательности белков |
*.cdsexons | предсказание экзонов в виде fasta-последовательности ДНК |
*.codingseq | предсказание генов в виде fasta-последовательности кодирующих участков ДНК |
Чтобы сравнить качество предсказания, я воспользовался тем же спсобом, что и в практикуме 11
A вот и результат:
Предсказание AUGUSTUS получилось совсем некачественным. Ни одного гена не было предсказано полностью правильно, 1 ген был предсказан с ошибкой c N-конца, и 1 с ошибкой с С-конца. Также было предсказано 26 лишних генов.
Такую неудачу можно объяснить тем, что я неправильно выбрал модельный организм сравнения или не "натренировал" программу в режиме training submission.
Все гены предсказаны неверно, поэтому сравнивать нечего.
© Борисов Евгений 2016