Kodomo

Пользователь

Практимум 13


Задание 1


E.Coli

СТАРТ_КОДОН

ВСТРЕЧАЕМОСТЬ

ПРИМЕЧАНИЕ

ATG

3890

Самый распространённый старт-кодон

ATT

4

Нетипичный старт-кодон, кодирует изолейцин

CTG

2

Нетипичный старт-кодон, кодирует лейцин

GTG

338

Менее типичный старт-кодон, кодирует валин

TTC

1

Псевдоген

TTG

80

Менее типичный старт-кодон, кодирует лейцин

Candidatus Gracilibacteria bacterium

СТАРТ_КОДОН

ВСТРЕЧАЕМОСТЬ

ПРИМЕЧАНИЕ

ACA

1

Псевдоген

ATG

1129

Самый распространённый старт-кодон

GTG

41

Менее типичный старт-кодон, кодирует валин

TCA

1

Псевдоген

TCT

1

Псевдоген

TTG

23

Менее типичный старт-кодон, кодирует лейцин

Mycoplasma pneumoniae

СТАРТ_КОДОН

ВСТРЕЧАЕМОСТЬ

ПРИМЕЧАНИЕ

ACT

1

Псевдоген

ATA

4

Вероятно, псевдоген

ATC

1

Псевдоген

ATG

629

Самый распространённый старт-кодон

ATT

8

Нетипичный старт-кодон, кодирует изолейцин

CAA

2

Псевдоген

CTC

2

Псевдоген

CTG

1

Псевдоген

GAA

1

Псевдоген

GGA

1

Псевдоген

GTG

60

Менее типичный старт-кодон, кодирует валин

GTT

1

Псевдоген

TCT

1

Псевдоген

TTA

3

Вероятно, псевдоген

TTG

53

Менее типичный старт-кодон, кодирует лейцин

Ссылка на код для всех заданий: https://docs.google.com/document/d/1JcfxJsyCO8G2YcapfLRYDZLXY21zVI57wWvUtfxBCGg/edit?usp=share_link

Несколько вероятных причин, по которым в геноме организмов встречается не только ATG в качестве старт-кодона:
- Старт-кодоны GTG и TTG также широко распространены в геноме. Они отличаются от стандартного ATG всего лишь одним нуклеотидом. Такие старт-кодоны, вероятно, выполняют схожие функции. Появились они, скорее всего, из-за мутации, которая закрепилась в следующих поколениях, потому что старт-кодон был удобен для кодировки определённых типов белков. 
- В геноме встречается также много совсем атипичных старт-кодонов. Такие триплеты, вероятнее всего, появились из-за мутации и встречаются в псевдогенах, которые более не способны кодировать белковые последовательности. Некоторые атипичные кодоны, скорее всего, могут играть роль в механизме отключения генов. Малая часть нетипичных кодонов, например, ATT, вероятно, до сих пор способны выполнять свою функцию, так как встречаются чаще остальных.
- Нетипичные колоны могут возникнуть из-за ошибок секвенирования. 


Задание 2


lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

На выходе имеем 4 последовательности, кодирующие белок. 
Фрагмент регуляторного белка IS911A [protein=IS911A regulator fragment] содержит стоп-кодон, так как он утратил свои функции (псевдоген). 
Три остальные последовательности являются альфа-субъединицами (subunit alpha) формиат-дегидрогеназы N, формиат-дегидрогеназы O и формиат-дегидрогеназы. Изучив научную литературу, можно предположить, что TGA считывается как триплет, отвечающий за синтез селеноцистеина, и не является стоп-кодоном. Специальная вторичная структура мРНК вокруг триплета позволяет ему не идентифицироваться как стоп-кодон[1].


Задание 3


E.Coli

TGA

1246

TAA

2761

TAG

306

Candidatus Gracilibacteria bacterium

TGA

1

TAA

1000

TAG

188

Mycoplasma pneumoniae

TGA

0

TAA

533

TAG

221

Особенностью последних двух организмов является то, что для второй бактерии частота встречаемости стоп-кодона TGA составляет всего лишь единицу, а у третьей бактерии он совсем не встречается в качестве стоп-кодона. Это наталкивает на мысль, что TGA в геноме этих бактерий выполняет несколько иную функцию, то есть кодирует определённую аминокислоту. В ходе изучения источников, было выяснено, что TGA в геноме Candidatus Gracilibacteria bacterium кодирует глицин[2], а у последней бактерии - триптофан[3]. 


Задание 4


CODON

E.Coli

Candidatus Gracilibacteria bacterium

Mycoplasma pneumoniae

TTA

18505

14767

10308

TTG

18301

3237

5572

CTT

14728

9333

2789

CTC

14952

3968

3139

CTA

5203

3357

852

CTG

71305

1714

2474

Отличия между частотой встречаемости кодонов в пределах одного организма зависит от особенности строения организма и от особенностей экспрессии её генов. Образ жизни бактерии диктует то, какие кодоны и в каком количестве будут участвовать в формировании белковых структур. Помимо этого частота встречаемости кодонов зависит от мутаций, в том числе от передавшихся бактерии по наследству.  

Разная частота встречаемости кодонов, кодирующих лейцин, у разных бактерий зависит от количества G и C нуклеотидов, встречающихся в геноме. 


Задание 5


GC-skew (cumulative) имеет максимальное значение 47.7 и минимальное значение -28.3. Точка максимума в геноме обозначается ter (termination), а точка минимума - oriC (origin).

Ссылка на построенные в Google Sheets графики: https://drive.google.com/file/d/1eS16QJ4iQFdG6QzgPgGjq1QRYRd6SUpf/view?usp=share_link https://drive.google.com/file/d/14pMpmAqA9GMfriuES2t8jrW1_GnY1LYw/view?usp=share_link

Ссылка на output: https://drive.google.com/file/d/1-s9UzD2YKZVR5p2_yIqjJyYjJMsJrEQj/view?usp=sharing

Источники информации:

1. James D. Watson, Tania A. Baker, Stephen P. Bell, Alexander Gann, Michael Levine, Richard Losick Molecular Biology Of The Gene ( International Ed.) Pearson (2004) https://archive.org/details/james-d.-watson-tania-a.-baker-stephen-p.-bell-alexander-gann-michael-levine-ric/page/n5/mode/2up

2. Anna Hanke, Emmo Hamann , Ritin Sharma, Jeanine S. Geelhoed, Theresa Hargesheimer, Beate Kraft, Volker Meyer, Sabine Lenk, Harald Osmers, Rong Wu, Kofi Makinwa, Robert L. Hettich, Jillian F. Banfield, Halina E. Tegetmeyer and Marc Strous (16 May 2014). https://www.researchgate.net/publication/262930208_Recoding_of_the_stop_codon_UGA_to_glycine_by_a_BD1-5SN-2_bacterium_and_niche_partitioning_between_Alpha_and_Gammaproteobacteria_in_a_tidal_sediment_microbial_community_naturally_selected_in_a_laborat

3. J.B. Baseman, V.V. Tryon, C.J. Su. Cloning and sequence analysis of cytadhesin P1 gene from Mycoplasma pneumoniae. (1987 Dec). https://pubmed.ncbi.nlm.nih.gov/3119495/

Users/geonosianin/pr12 (последним исправлял пользователь geonosianin 2023-12-21 19:03:48)