Kodomo

Пользователь

Задание 1

Escherichia coli

Итак, для Escherichia coli были получены следующие результаты: ATG 3890 ATT 4 CTG 2 GTG 338 TTC 1 TTG 80 Как мы можем видеть основным кодоном всё таки является ATG и кодоны которые можно получить из АTG в результате точечной нуклеотидной замены. Исключением является кодон TTC, при модификации кода на поиск стоп-кодонов последовательностей только со значением pseudogene=true программа выдала следующие результаты: ATG 16 TTC 1 Из чего заключаем что TTС является старт кодоном нефункционального гена. По всей видимости именно подобная мутация и могла стать причиной потери его функции.

Candidatus Gracilibacteria bacterium

Для Gracilibacteria были получены следующие результаты: ACA 1 ATG 1129 GTG 41 TCA 1 TCT 1 TTG 23 Аналогичная ситуация как и с Эшерихией, TCA, TCT, ACA-старт кодоны псевдогенов.

Mycoplasma pneumoniae M29

AAA 1 ACA 1 ACT 1 ATA 3 ATC 1 ATG 626 ATT 7 CAA 1 CAC 1 CTA 1 CTC 3 CTG 2 GAA 1 GTG 60 GTT 1 TCC 2 TCT 1 TGA 1 TTA 2 TTC 1 TTG 49 При использовании модификации на поиск псевдогенов: AAA 1 ACA 1 ACT 1 ATA 3 ATG 14 ATT 1 CAA 1 CAC 1 CTA 1 CTC 3 GAA 1 GTG 5 GTT 1 TCC 2 TCT 1 TGA 1 TTC 1 TTG 2 Ситуация аналогична таковой у Эшерихии и Грацилибактерии.

Задание 2

>lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

>lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

>lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

>lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

Как мы можем видеть первая последовательность это псевдоген. Остальные три последовательности представляют собой субьединицы (или целый фермент) Формиат дегидрогеназ. По найденной мной информации похоже что в данном ферменте имеется селеноцистеин, как известно у бактерий селеноцистеин кодируется стоп-кодоном ассоциированным со специальной шпилькой. Похоже это справедливо для этих двух последовательностей.

Задание 3

Стоп кодоны у Escherichia: ATA 1 GAA 1 TAA 2761 TAG 306 TGA 1246 Стоп кодоны у Gracilibacteria: AAA 1 ACA 1 CTT 1 GAA 1 TAA 1000 TAG 188 TCT 2 TGA 1 TTA 1 Стоп кодоны у Mycoplasma: AAA 1 AAT 1 ACT 1 ATA 1 CCC 1 CGG 1 CTA 1 GAT 1 GGC 1 GGG 5 GGT 3 TAA 526 TAC 1 TAG 220 TAT 1 TTA 1 Выводы: В результатах мы рассматриваем все не классические стоп-кодоны мы не рассматриваем, эти последовательности вероятно являются псевдогенами и нам не интересны. У Gracilibacteria и Mycoplasm мы наблюдаем почти полное отсутствие использования стоп кодона TGA вероятно у данных бактерий он вовсе не является стоп кодоном. https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi В соответствии с таблицами генетических кодов у многих организмов TGA/UGA отвечает за кодирование триптофана. По всей видимости для Микоплазмы и Грацилибактерии это также справедливо.

Задание 4

Встречаемость Лейциновых кодонов: у Эшерихии: CTA 0.036386142075891297 CTC 0.1045638278529169 CTG 0.49865728631970574 CTT 0.10299732855924025 TTA 0.12941102423877926 TTG 0.1279843909534666 у Грацилибактерии: CTA 0.10880318732233588 CTC 0.10052152114063165 CTG 0.09282180987980393 CTT 0.18024934530071401 TTA 0.33746670546366137 TTG 0.18013743089285314 у Микоплазмы: CTA 0.12013710368466153 CTC 0.07516709511568123 CTG 0.10467866323907456 CTT 0.15845758354755785 TTA 0.3169151670951157 TTG 0.22464438731790917 Разницу в использовании кодонов в пределах одной бактерии можно объяснить механизмами регуляции трансляции, G-C составом, экологией и метаболическими предпочтениями бактерии и.т.д. по имеющейся информации однозначно объяснить различие во встречаемости сложно. Возможно так просто сложилось вероятностно случайно. Необходимы дополнительные исследования. Аналогично и для различия во встречаемости для других бактерий.

Задание 5

По полученному графику минимум GC-skew составляет около -28,3 (соответствует OriC), максимум около 47,8 (соответствует Ter)

Users/bubylda/pr13 (последним исправлял пользователь bubylda 2022-12-22 22:56:12)