1 задание: Старт кодоны
E.coli
Кодон |
ATG |
ATT |
CTG |
GTG |
TTC |
TTG |
Количество |
3890 |
4 |
2 |
338 |
1 |
80 |
Candidatus Gracilibacteria bacterium
Кодон |
ACA |
ATG |
GTG |
TCA |
TCT |
TTG |
Количество |
1 |
1129 |
41 |
1 |
1 |
23 |
Mycoplasma pneumoniae
Кодон |
AAA |
ACA |
ACT |
ATA |
ATC |
ATG |
ATT |
CAA |
CAC |
CTA |
CTC |
CTG |
GAA |
GTG |
GTT |
TCC |
TCT |
TGA |
TTA |
TTC |
TTG |
Количество |
1 |
1 |
1 |
3 |
1 |
627 |
7 |
1 |
1 |
1 |
3 |
2 |
1 |
60 |
1 |
2 |
1 |
1 |
1 |
1 |
49 |
Чаще всего встречается старт-кодон ATG, за ним идет GTG и TTG, которые отличаются от стандартного кодона одним нуклеотидом. Скорей всего такие кодоны возникли в результате нуклеотидной замены. Остальные кодоны могли возникнуть также в результате мутации или из-за сдвига рамки считывания. Чаще всего с таких кодонов начинаются последовательности, кодирующие гипотетические белки или же псевдогены. Раз старт-кодонов, отличающихся от стандартного, достаточно много рибосома должна уметь читать последовательность, начиная не только с кодона ATG.
2 задание
E.coli
У E.coli есть 4 последовательности, которые не оканчиваются на стоп-кодоны, но имеют их в середине последовательности. 3 из них кодирую белки формиатдегидрогеназы N, O и H. В этих последовательностях встречается кодон TGA. Скорей всего, он кодирует не стоп-кодон, а аминокислоту селеноцистеин, которая встречается у формиатдегидрогеназы. Последняя же - участок-регулятор. Так как он служит не для синтеза белка, у него могли накапливаться мутации или сбиться рамка считывания.
3 задание: Стоп-кодоны
E.coli
Кодон |
TAA |
TAG |
TGA |
Количество |
2761 |
306 |
1246 |
Candidatus Gracilibacteria bacterium
Кодон |
TAA |
TAG |
TGA |
Количество |
1000 |
188 |
1 |
Mycoplasma pneumoniae
Кодон |
TAA |
TAG |
TGA |
Количество |
526 |
220 |
0 |
У Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae на концах теряется стоп-кодон TGA. Однако он встречается в середине последовательностей, что значит, что этот кодон потерял свою функцию стоп-кодоны и, скорей всего, кодирует какую-то аминокислоту. В статье Host translation machinery is not a barrier to phages that infect both CPR and non-CPR bacteria описано, что у Candidatus Gracilibacteria bacterium этот кодон кодирует глицин. В статье High co-expression of TNF-α and CARDS toxin is a good predictor for refractory Mycoplasma pneumoniae pneumonia говориться, что у Mycoplasma pneumoniae TGA кодирует триптофан.
4 задание
E.coli
Кодон |
CTT |
CTC |
CTA |
CTG |
TTG |
TTA |
Количество |
14728 |
14952 |
5203 |
71305 |
18301 |
18505 |
Candidatus Gracilibacteria bacterium
Кодон |
CTT |
CTC |
CTA |
CTG |
TTG |
TTA |
Количество |
9333 |
3968 |
3357 |
1714 |
3237 |
14767 |
Mycoplasma pneumoniae
Кодон |
CTT |
CTC |
CTA |
CTG |
TTG |
TTA |
Количество |
2782 |
3158 |
2826 |
2470 |
5571 |
10295 |
У E.coli чаще всего встречается кодон CTG, у Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae - TTA. Это значит, что по сравнению с другими кодонами они работают более эффективно, то есть они лучше распознаются тРНК бактерий. Возможно, что общий GC-состав генома влияет на частоту встречаемости кодонов, поэтому у разных бактерий разная частота встречаемости кодонов лейцина.
5 задание
Максимум GC-skew соответствует месту конца репликации (ter), а минимум - точке начала (oriC). График У E.coli наименьший cumulative GC-skew - -28.328 на позициях 3870000-3871000. oriC располагается на участке 3925000-326000, что достаточно близко к расчетному месту. Максимальный cumulative GC-skew - 47,733 на позициях 1513000-1514000.
6 задание
E.coli
|| Кодон || Количество||
AAGGAG |
1092 |
TAAGGA |
960 |
AGGAGA |
768 |
AAGGAA |
727 |
AAAGGA |
721 |
CAGGAG |
708 |
AGGAGT |
678 |
GGAGAA |
624 |
AGGAAA |
595 |
ACAGGA |
559 |
Candidatus Gracilibacteria bacterium
Кодон |
Количество |
AAATAA |
91 |
AATAAA |
86 |
AAAAAA |
86 |
AATAAA |
86 |
AAAAAA |
86 |
TAAAAA |
85 |
ATAAAA |
81 |
TAATAA |
73 |
TAAATA |
69 |
AAAAAT |
68 |
AATAAT |
66 |
TTTTAA |
64 |
Mycoplasma pneumoniae
Кодон |
Количество |
AATTAA |
42 |
AAAGGA |
39 |
TTTAAA |
38 |
ATTTAA |
31 |
AATTTA |
30 |
ATTAAA |
30 |
AGAAAG |
30 |
AATTTA |
30 |
ATTAAA |
30 |
AGAAAG |
30 |
Последовательность Шайна-Дальгарно - участок связывания рибосом перед старт-кодоном. Возможно состав этой последовательности зависит от общего GC-состава бактерии, так как для E.coli, у которой GC-состав выше, больше последовательностей с гуанином и цитозином, а для Mycoplasma pneumoniae иCandidatus Gracilibacteria bacterium преобладают аденин и тимин.
Коды для заданий