Практимум 13
Задание 1
E.Coli
СТАРТ_КОДОН |
ВСТРЕЧАЕМОСТЬ |
ПРИМЕЧАНИЕ |
ATG |
3890 |
Самый распространённый старт-кодон |
ATT |
4 |
Нетипичный старт-кодон, кодирует изолейцин |
CTG |
2 |
Нетипичный старт-кодон, кодирует лейцин |
GTG |
338 |
Менее типичный старт-кодон, кодирует валин |
TTC |
1 |
Псевдоген |
TTG |
80 |
Менее типичный старт-кодон, кодирует лейцин |
Candidatus Gracilibacteria bacterium
СТАРТ_КОДОН |
ВСТРЕЧАЕМОСТЬ |
ПРИМЕЧАНИЕ |
ACA |
1 |
Псевдоген |
ATG |
1129 |
Самый распространённый старт-кодон |
GTG |
41 |
Менее типичный старт-кодон, кодирует валин |
TCA |
1 |
Псевдоген |
TCT |
1 |
Псевдоген |
TTG |
23 |
Менее типичный старт-кодон, кодирует лейцин |
Mycoplasma pneumoniae
СТАРТ_КОДОН |
ВСТРЕЧАЕМОСТЬ |
ПРИМЕЧАНИЕ |
ACT |
1 |
Псевдоген |
ATA |
4 |
Вероятно, псевдоген |
ATC |
1 |
Псевдоген |
ATG |
629 |
Самый распространённый старт-кодон |
ATT |
8 |
Нетипичный старт-кодон, кодирует изолейцин |
CAA |
2 |
Псевдоген |
CTC |
2 |
Псевдоген |
CTG |
1 |
Псевдоген |
GAA |
1 |
Псевдоген |
GGA |
1 |
Псевдоген |
GTG |
60 |
Менее типичный старт-кодон, кодирует валин |
GTT |
1 |
Псевдоген |
TCT |
1 |
Псевдоген |
TTA |
3 |
Вероятно, псевдоген |
TTG |
53 |
Менее типичный старт-кодон, кодирует лейцин |
Ссылка на код для всех заданий: https://docs.google.com/document/d/1JcfxJsyCO8G2YcapfLRYDZLXY21zVI57wWvUtfxBCGg/edit?usp=share_link
Несколько вероятных причин, по которым в геноме организмов встречается не только ATG в качестве старт-кодона: - Старт-кодоны GTG и TTG также широко распространены в геноме. Они отличаются от стандартного ATG всего лишь одним нуклеотидом. Такие старт-кодоны, вероятно, выполняют схожие функции. Появились они, скорее всего, из-за мутации, которая закрепилась в следующих поколениях, потому что старт-кодон был удобен для кодировки определённых типов белков. - В геноме встречается также много совсем атипичных старт-кодонов. Такие триплеты, вероятнее всего, появились из-за мутации и встречаются в псевдогенах, которые более не способны кодировать белковые последовательности. Некоторые атипичные кодоны, скорее всего, могут играть роль в механизме отключения генов. Малая часть нетипичных кодонов, например, ATT, вероятно, до сих пор способны выполнять свою функцию, так как встречаются чаще остальных. - Нетипичные колоны могут возникнуть из-за ошибок секвенирования.
Задание 2
lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
На выходе имеем 4 последовательности, кодирующие белок. Фрагмент регуляторного белка IS911A [protein=IS911A regulator fragment] содержит стоп-кодон, так как он утратил свои функции (псевдоген). Три остальные последовательности являются альфа-субъединицами (subunit alpha) формиат-дегидрогеназы N, формиат-дегидрогеназы O и формиат-дегидрогеназы. Изучив научную литературу, можно предположить, что TGA считывается как триплет, отвечающий за синтез селеноцистеина, и не является стоп-кодоном. Специальная вторичная структура мРНК вокруг триплета позволяет ему не идентифицироваться как стоп-кодон[1].
Задание 3
E.Coli
TGA |
1246 |
TAA |
2761 |
TAG |
306 |
Candidatus Gracilibacteria bacterium
TGA |
1 |
TAA |
1000 |
TAG |
188 |
Mycoplasma pneumoniae
TGA |
0 |
TAA |
533 |
TAG |
221 |
Особенностью последних двух организмов является то, что для второй бактерии частота встречаемости стоп-кодона TGA составляет всего лишь единицу, а у третьей бактерии он совсем не встречается в качестве стоп-кодона. Это наталкивает на мысль, что TGA в геноме этих бактерий выполняет несколько иную функцию, то есть кодирует определённую аминокислоту. В ходе изучения источников, было выяснено, что TGA в геноме Candidatus Gracilibacteria bacterium кодирует глицин[2], а у последней бактерии - триптофан[3].
Задание 4
CODON |
E.Coli |
Candidatus Gracilibacteria bacterium |
Mycoplasma pneumoniae |
TTA |
18505 |
14767 |
10308 |
TTG |
18301 |
3237 |
5572 |
CTT |
14728 |
9333 |
2789 |
CTC |
14952 |
3968 |
3139 |
CTA |
5203 |
3357 |
852 |
CTG |
71305 |
1714 |
2474 |
Отличия между частотой встречаемости кодонов в пределах одного организма зависит от особенности строения организма и от особенностей экспрессии её генов. Образ жизни бактерии диктует то, какие кодоны и в каком количестве будут участвовать в формировании белковых структур. Помимо этого частота встречаемости кодонов зависит от мутаций, в том числе от передавшихся бактерии по наследству.
Разная частота встречаемости кодонов, кодирующих лейцин, у разных бактерий зависит от количества G и C нуклеотидов, встречающихся в геноме.
Задание 5
GC-skew (cumulative) имеет максимальное значение 47.7 и минимальное значение -28.3. Точка максимума в геноме обозначается ter (termination), а точка минимума - oriC (origin).
Ссылка на построенные в Google Sheets графики: https://drive.google.com/file/d/1eS16QJ4iQFdG6QzgPgGjq1QRYRd6SUpf/view?usp=share_link https://drive.google.com/file/d/14pMpmAqA9GMfriuES2t8jrW1_GnY1LYw/view?usp=share_link
Ссылка на output: https://drive.google.com/file/d/1-s9UzD2YKZVR5p2_yIqjJyYjJMsJrEQj/view?usp=sharing
Источники информации:
1. James D. Watson, Tania A. Baker, Stephen P. Bell, Alexander Gann, Michael Levine, Richard Losick Molecular Biology Of The Gene ( International Ed.) Pearson (2004) https://archive.org/details/james-d.-watson-tania-a.-baker-stephen-p.-bell-alexander-gann-michael-levine-ric/page/n5/mode/2up
2. Anna Hanke, Emmo Hamann , Ritin Sharma, Jeanine S. Geelhoed, Theresa Hargesheimer, Beate Kraft, Volker Meyer, Sabine Lenk, Harald Osmers, Rong Wu, Kofi Makinwa, Robert L. Hettich, Jillian F. Banfield, Halina E. Tegetmeyer and Marc Strous (16 May 2014). https://www.researchgate.net/publication/262930208_Recoding_of_the_stop_codon_UGA_to_glycine_by_a_BD1-5SN-2_bacterium_and_niche_partitioning_between_Alpha_and_Gammaproteobacteria_in_a_tidal_sediment_microbial_community_naturally_selected_in_a_laborat
3. J.B. Baseman, V.V. Tryon, C.J. Su. Cloning and sequence analysis of cytadhesin P1 gene from Mycoplasma pneumoniae. (1987 Dec). https://pubmed.ncbi.nlm.nih.gov/3119495/