Kodomo

Пользователь

Практикум 14

Эт я

Это страница с отчётом по заданиям практикума 14. В ходе практикума я исследовал аннотированные геномы бактерий Bacillus subtilis, Peptoclostridium acidaminophilum, Ureaplasma urealyticum parvum. Лучшим способом оценить данную работу считаю просмотр моего Google Colab.

Ссылка на Google Colab.

Приложенные материалы (выдача скриптов, a.k.a. результаты)

1. Задание 1.

Получил старт-кодоны для каждой бактерии. Приведены как в колабе, так и в приложенных материалах.

Из исследования старт-кодонов N.halophilus (есть в мини-обзоре [6]) известно, что редкие старт-кодоны встречаются, например, у псевдогенов.

Но это не единственная причина, так как у бактерии есть и нормальные гены со старт-кодонами, отличными от ATG (они даже подписаны в соответствующих таблицах ген. кода, на что было заданее ранее и что затрагивалось в миниревью). Эти кодоны у бактерий следующие: ATG, GTG, TTG, CTG, ATA, ATC, ATT

И здесь отчётливо видна низкая селективность либо по первой, либо по последней позициям. Это может быть связано, например, с меньшей селективностью белков прокариот, которая может быть следствием относительной простоты их генетического аппарата в сравнении с эукариотами, имеющими один старт-кодон (ATG).

Важно отметить, что для разных бактерий в выдаче отсутствовали некоторые старт-кодоны. Например, у *P.acidaminophilum* и *U.urealyticum parvum* отсутствует CTG, а у *B.subtilis* - ATA. Это может быть вероятностным явлением, так как у прочих бактерий выборки эти кодоны встречаются относительно редко.

Какие-то гены могут быть не аннотированы должным образом, или их важность для бактерии относительно низкая, поэтому такие мутации могут появляться и оставаться в популяции.

2. Задание 2.

Получил стоп-кодоны не в конце последовательностей для P.acidaminophilum. Приведены в колабе и приложенных материалах.

Интересной находкой стало, что не все гены, имеющие стоп-кодон (в рамке считывания) не в конце последовательности, являются псевдогенами, таких оказалось всего 10 из 24.

Тем не менее, было найдено, что эти гены имеют нетранслируемые участки, кодирующие аминокислоту селеноцистеин. И именно эти участки содержат стоп-кодон TGA [1]. Таких было 14 из 24.

3. Задание 3.

Получил стоп-кодоны для всех бактерий в различных сочетаниях: во всех позициях всех последовательностей, псевдогенов, а также нормальных последовательностей. Кроме того получил стоп-кодоны в конце нормальных последовательностей.

В случае Ureaplasma urealyticum parvum один из кодонов (TAG) как стоп-кодон не появляется. Возможно, он теперь кодирует какую-то аминокислоту [2].

Было найдено, что эта аминокислота - триптофан [3].

Важно упомянуть, что мой код ищет все стоп-кодоны. Со второй версией ищет только в конце последовательностей. Вывод: некоторые геномы (P.acidaminophilum), для которых стоп-кодоны нашлись в рамке считывания, но не в конце последовательности нормальной CDS либо неправильно аннотированы, либо недостаточно точно аннотированы, либо требуют изучения.

4. Задание 4.

Получил все гены с join в аннотации. Рассмотрел возможные причины такой подписи.

У бактерий описан сплайсинг [4]. В том числе самовырезающиеся последовательности[5]. Важно упомянуть, что это собственный механизм и он не тот же, что у эукариот. В таком случае можно предположить, что join и правда будет описывать некое "склеивание" последовательностей.

Но при более близком рассмотрении у P.acidaminophilum и у B.subtilis можно увидеть "exception=ribosomal slippage", что может говорить о проскальзывании рибосомы по множеству одинаковых нуклеотидов.

В случае, где не указан проскок, можно увидеть "location=complement(1406334..1407269)". Это может говорить о некой вторичной структуре (шпильке?) в мРНК этого гена, которая, например, может быть нужна для правильной трансляции.

5. Источники

  1. - Stadtman T. C. Selenocysteine //Annual review of biochemistry. – 1996. – Т. 65. – №. 1. – С. 83-100.(https://www.annualreviews.org/content/journals/10.1146/annurev.bi.65.070196.000503)

  2. - Korkmaz G. et al. Comprehensive analysis of stop codon usage in bacteria and its correlation with release factor abundance //Journal of Biological Chemistry. – 2014. – Т. 289. – №. 44. – С. 30334-30342.(https://www.jbc.org/article/S0021-9258(20)37244-6/fulltext)

  3. - Lin J. Enzymes in thymidylate synthesis in Ureaplasma parvum as medical targets. – 2009. (https://publications.slu.se/?file=publ/show&id=25998)

  4. - Woodson S. A. Ironing out the kinks: splicing and translation in bacteria //Genes & development. – 1998. – Т. 12. – №. 9. – С. 1243-1247. (https://genesdev.cshlp.org/content/12/9/1243.short)

  5. - Ferat J. L., Michel F. Group II self-splicing introns in bacteria //Nature. – 1993. – Т. 364. – №. 6435. – С. 358-361. (https://www.nature.com/articles/364358a0) Archive: https://web.archive.org/web/20180110040746/https://genesdev.cshlp.org/content/12/9/1243.short

  6. - Mini-review of the genome of N.halophilus https://www.google.com/url?q=https%3A%2F%2Fdrive.google.com%2Ffile%2Fd%2F15AaVo6ev9ZJVF93-Y8aYmtx5cE_ZR0m7%2Fview%3Fusp%3Dsharing

- А. Смирнов

Users/cmaskr/pr14 (последним исправлял пользователь cmaskr 2025-12-18 06:13:37)