Задание 1
Escherichia coli str. K-12 substr. MG1655
ATG 3883
GTG 334
TTG 78
ATT 4
CTG 2
TTC 1
Candidatus Gracilibacteria bacterium 28_42_T64
ATG 1129
GTG 41
TTG 23
ACA 1
TCA 1
TCT 1
Mycoplasma pneumoniae M29
ATG 634
GTG 62
TTG 40
ATT 4
CTG 4
ATC 3
ACC 2
ATA 2
TTA 2
GTT 1
Возможные причины
1. Скорее всего первый нуклеотид не так важен в узнавании старт-кодона, поэтому довольно распространены старт-кодоны GTG и TTG (CTG намного реже является старт-кодоном, однако кодируемые им белки функциональны). Замена А на G это замена пурина на пурин, они происходят чаще, поэтому GTG встречается чаще.
2. Старт - кодоны ATT и ATC редко, но встречаются, и кодируют функциональные белки, возможно такая мутация является нейтральной из-за того, что пиримидин меняется на пиримидин и геометрия таких кодонов похожа.
3. В остальных случаях данные старт-кодоны содержатся в последовательностях, которые являются псевдогенами (не экспрессируются в клетке) и на мутации в старт-кодоне не действует отбор, или являются гипотетическими белками, т. е. их реальная экспрессия в клетке еще не доказана.
Задание 2
1. lcl|U00096.3_cds_249 [pseudo=true]
Псевдоген, не экспрессируются, стоп-кодон скорее всего возник в результате мутации.
2. lcl|U00096.3_cds_AAD13438.1_1457 [protein=formate dehydrogenase N subunit alpha]
3. lcl|U00096.3_cds_AAD13456.1_3815 [protein=formate dehydrogenase O subunit alpha]
4. lcl|U00096.3_cds_AAD13462.1_3987 [protein=formate dehydrogenase H]
Остальные три последовательности являются генами дегидрогеназы, там TGA кодирует аминокислоту селеноцистеин, необходимую для функционирования этого фермента
Задание 3
Escherichia coli str. K-12 substr. MG1655
TGA 1241
TAA 2756
TAG 303
Candidatus Gracilibacteria bacterium 28_42_T64
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae M29
TGA 0
TAA 531
TAG 210
Возможные причины
У второй и третьей бактерии TGA кодирует кодирует какую-то распространенную аминокислоту, так как в последовательностях встречается очень часто, в статьях есть данные, что TGA может кодировать глицин, видимо здесь так и происходит. Ссылка на статью:
Campbell JH, O'Donoghue P, Campbell AG, Schwientek P, Sczyrba A, Woyke T, Söll D, Podar M. UGA is an additional glycine codon in uncultured SR1 bacteria from the human microbiota. Proc Natl Acad Sci U S A. 2013 Apr 2;110(14):5540-5. doi: 10.1073/pnas.1303090110. Epub 2013 Mar 18. PMID: 23509275; PMCID: PMC3619370.
Задание 4
Escherichia coli str. K-12 substr. MG1655
TTA 18484
TTG 18283
CTT 14719
CTC 14926
CTA 5201
CTG 71198
Candidatus Gracilibacteria bacterium 28_42_T64
TTA 14767
TTG 3237
CTT 9333
CTC 3968
CTA 3357
CTG 1714
Mycoplasma pneumoniae M29
TTA 10302
TTG 5601
CTT 2798
CTC 3161
CTA 2848
CTG 2473
В пределах одной бактерии какие-то кодоны оказываются предпочтительнее, возможно это происходит потому, что бактерии не выгодно в полном объеме синтезировать все типы тРНК. Также в зависимости от используемых кодонов у бактерии будет меняться GC состав, который является важной характеристикой.
Задание 5
Результаты:
Минимальный cumulative GC-skew соответствует точке начала репликации
Максимальный cumulative GC-skew соответствует участку терминации репликации