Практикум 13
Ссылка на colab с кодами к заданиям
Задание 1
Escherichia coli
ATG 3890
ATT 4
CTG 2
GTG 338
TTC 1
TTG 80
Candidatus Gracilibacteria
ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 23
Mycoplasma pneumoniae
AAA 1
ACA 1
ACT 1
ATA 3
ATC 1
ATG 627
ATT 7
CAA 1
CAC 1
CTA 1
CTC 3
CTG 2
GAA 1
GTG 60
GTT 1
TCC 2
TCT 1
TGA 1
TTA 1
TTC 1
TTG 49
Больше всех встречается старт-кодон ATG. Следующими по популярности идут GTG и TTG, которые скорее всего возникают в результате ошибки полимеразы. В статье [1] описана эволюция ATG в эти кодоны у прокариот. У Mycoplasma pneumoniae наибольшее разнообразие кодонов, скорее всего из-за маленького размера генома, что может влиять на количество белков в системе репарации, то есть на ее качество.
Задание 2
U00096.3_cds_250 - в описании сказано, что этот ген является псевдогеном.
U00096.3_cds_AAD13438.1_1459, U00096.3_cds_AAD13456.1_3824, U00096.3_cds_AAD13462.1_3997 - в описании сказано, что эти белки являются субъединицами формиат дегидрогеназы, у которых TGA является кодоном селеноцистеина.
Задание 3
Escherichia coli
TGA 1246
TAA 2761
TAG 306
Candidatus Gracilibacteria
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae
TGA 0
TAA 526
TAG 220
У Candidatus Gracilibacteria и Mycoplasma pneumoniae TGA встречается 1 или 0 раз, как стоп-кодон, хотя в геноме появляется 15446 и 1663 раза, соответственно. Это объясняется тем, что у Candidatus Gracilibacteria TGA кодирует глицин [2], а у Mycoplasma pneumoniae триптофан [3].
Задание 4
Escherichia coli
TTA 18505
TTG 18301
CTT 14728
CTC 14952
CTA 5203
CTG 71305
Candidatus Gracilibacteria
TTA 15077
TTG 8048
CTT 8053
CTC 4491
CTA 4861
CTG 4147
Mycoplasma pneumoniae
TTA 9246
TTG 6554
CTT 4623
CTC 2193
CTA 3505
CTG 3054
Внутри бактерии частоты встречаемости кодонов, оканчивающихся на пурины или пиримидины, сходны. Скорее всего это из-за сходного соотношения GC и AT пар в генах белков, что обуславливает их одинаковую устойчивость к температурным изменениям. Различия в частотах встречаемости кодонов в геномах разных бактерий обуславливают их устойчивость ДНК в целом к температурным изменениям: чем больше G и C, тем более она устойчива.
Задание 5
Максимум - ter (конец репликации), минимум - oriC (начало репликации).
Задание 6
AAGGAG 328
TAAGGA 283
AGGAGA 255
CAGGAG 255
AAAGGA 224
AAGGAA 223
AGGAGT 214
GGAGAA 205
AGGAAA 189
ACAGGA 179
Это последовательности Шайна-Дальгарно у Escherichia coli, которые являются сайтами связывания рибосом на молекуле мРНК.
[1] Belinky, F., Rogozin, I.B. & Koonin, E.V. Selection on start codons in prokaryotes and potential compensatory nucleotide substitutions. Sci Rep 7, 12422 (2017).
[2] Sieber CMK, Paul BG, Castelle CJ, Hu P, Tringe SG, Valentine DL, Andersen GL, Banfield JF. Unusual Metabolism and Hypervariation in the Genome of a Gracilibacterium (BD1-5) from an Oil-Degrading Community. mBio. 2019 Nov 12;10(6):e02128-19.
[3] Inamine JM, Ho KC, Loechel S, Hu PC. Evidence that UGA is read as a tryptophan codon rather than as a stop codon by Mycoplasma pneumoniae, Mycoplasma genitalium, and Mycoplasma gallisepticum. J Bacteriol. 1990 Jan;172(1):504-6.