Практикум 12
Задание 1
Escherichia coli
ATG 3883
ATT 4
CTG 2
GTG 334
TTC 1
TTG 78
Candidatus Gracilibacteria bacterium
ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 23
Mycoplasma pneumoniae
ACC 2
ATA 2
ATC 3
ATG 634
ATT 4
CTG 4
GTG 62
GTT 1
TTA 2
TTG 40
Можно заметить, что кодон ATG является самым популярным старт-кодоном во всех последовательностях. Второй по частоте кодон во всех последовательностях - GTG, отличающийся от ATG только первым нуклеотидом. И A, и G являются пуриновыми нуклеотидами, то есть весьма схожи по строению, и полимераза может часто совершать ошибку, "путая" их друг с другом. Также встречаются старт-кодоны вида NTG, где N - любой нуклеотид. Можно сделать вывод о том, что для выбора места посадки полимеразы ключевую роль играют второй и третий нуклеотид триплета. Остальные старт-кодоны единичны, их можно признать результатом случайных ошибок в работе ферментов. Можно заметить, что у Микоплазмы разнообразие старт-кодонов наибольшее. Это может быть вызвано тем, что её геном – один из самых маленьких прокариотических геномов, и в нём меньше ферментов, способствующих исправлению ошибок при репликации генома и посадке полимеразы
Задание 2
1. U00096.3_cds_249 – псевдоген, геном фага, интегрированный в хромосомную ДНК бактерии. Его генетический код не соответствует генетическом коду бактерий, поэтому стопкодон появляется не в конце
2.U00096.3_cds_AAD13438.1_1457
3.U00096.3_cds_AAD13456.1_3815
4.U00096.3_cds_AAD13462.1_3987
2, 3, 4 – кодируют субъединицы формиатдегидрогеназы, в описании генов указано, что найденный стопкодон кодирует неканоническую аминокислоту селеноцистеин
Задание 3
Escherichia coli TGA - 1241
TAA - 2756
TAG - 303
Candidatus Gracilibacteria
TGA - 1
TAA - 1000
TAG - 188
Mycoplasma pneumoniae
TGA - 0
TAA - 531
TAG - 210
В двух последних бактериях стопкодон TGA встречается единично и не встречается. Однако его можно найти 13688 раз во второй бактерии и 19869 раз в третьей. Значит, TGA в этих бактериях не выполняет функцию старткодона, а кодирует аминокислоту
TGA у второй бактерии кодирует глицин [1], а у третьей – триптофан [2]
Задание 4
Escherichia coli
TTA 18484
TTG 18283
CTA 5201
CTG 71198
CTC 14926
CTT 14719
Candidatus Gracilibacteria bacterium
TTA 15077
TTG 8048
CTA 4861
CTG 4147
CTC 4491
CTT 8053
Mycoplasma pneumoniae
TTA 8959
TTG 6679
CTA 3619
CTG 3220
CTC 2168
CTT 5267
Отсутствие разницы в частоте использований наблюдается в кодонах, содержащих на конце другой пурин или пиримидин. Разница в частоте использования кодонов может быть объяснена разным GC-составом белков (если речь идёт об одной бактерии), что может способствовать разнообразию устойчивости этих белков к повышению температуры, и ДНК (если речь идёт о сравнении трёх бактерий), что способствует разнообразию приспособленности к повышению температур целой бактерии.
Задание 5
Таблица с графиком: https://docs.google.com/spreadsheets/d/1eWgcwyvNmWyfPLxN2untqi0Td-Bwlmzp9bVFratRNEM/edit?usp=sharing
Точка минимума – ориджин репликации. Точка максимума – точка терминации репликации
Задание 6
AAGGAG 330
TAAGGA 282
CAGGAG 257
AGGAGA 256
AAGGAA 223
AAAGGA 223
AGGAGT 215
GGAGAA 203
AGGAAA 187
ACAGGA 179
GAGGAA 169
Эти последовательности называются последовательностями Шайна-Дальгарно, они являются сайтами связывания рибосом на молекуле мРНК бактерий
1. Sieber, C. M. K., Paul, B. G., Castelle, C. J., Hu, P., Tringe, S. G., Valentine, D. L., … Banfield, J. F. (2019). Unusual Metabolism and Hypervariation in the Genome of a Gracilibacterium (BD1-5) from an Oil-Degrading Community. mBio, 10(6). doi:10.1128/mbio.02128-19
2. Inamine, J. M., Ho, K. C., Loechel, S., & Hu, P. C. (1990). Evidence that UGA is read as a tryptophan codon rather than as a stop codon by Mycoplasma pneumoniae, Mycoplasma genitalium, and Mycoplasma gallisepticum. Journal of Bacteriology, 172(1), 504–506. doi:10.1128/jb.172.1.504-506.1990