Задание 1.
Escherichia coli str. K-12 substr. MG1655 |
|
старт кодоны |
их количество |
ATG |
3883 |
ATT |
4 |
в каких последовательностях встретились |
фактор инициации трансляции (IF-3), поли-А полимераза I, белок YmcF, белок YnfQ профага |
CTG |
2 |
|
кодируют: ингибитор реиинициации репликации ДНК, белок YfjD семейства UPF0053 внутренних мембранных белков |
GTG |
334 |
TTC |
1 |
в каких последовательностях встретились |
белок LomR_1 псевдогена lomR(белок профага) |
TTG |
78 |
что касается кодона ATT: YmcF, YnfQ- белки теплового шока, мутация старт кодона (ATG->ATT)не помешала экспрессии гена. Более того, при обратной замене (ATT->ATG)→ экспрессия YnfQ была прекращена; для поли-А полимеразы I (PAP I) "нетипичный" старт-кодон - механизм регуляции синтеза. PAP I - токсична для клетки в больших количествах, а данный кодон - позволяет регулировать ее синтез, изначально продуцировать PAP I в малых количествах. Аналогичный механизм работает и для синтеза IF3.[1]
Candidatus Gracilibacteria bacterium 28_42_T64 |
|
старт кодоны |
их количество |
ACA |
1 |
в каких последовательностях встретились |
гипотетический белок псевдогена |
ATG |
1129 |
GTG |
41 |
TCA |
1 |
в каких последовательностях встретились |
серин-треониновая киназу, белок псевдогена |
TCT |
1 |
TTG |
23 |
в каких последовательностях встретились |
в основном - гипотетический протеин |
в основном последовательности с редкими старт-кодонами кодируют псевдогены и гипотетические белки.
Mycoplasma pneumoniae M29 |
|
старт кодоны |
их количество |
ACC |
2 |
в каких последовательностях встретились |
белки клеточной адгезии семейства MgpС (белки псевдогена) |
ATA |
2 |
в каких последовательностях встретились |
белки клеточной адгезии семейства MgpС (белки псевдогена) |
ATC |
3 |
в каких последовательностях встретились |
белок, содержащий домен DUF16; гипотетический протеин; белок, содержащий домен DUF237 |
ATG |
634 |
ATT |
4 |
в каких последовательностях встретились |
белок P80 семейства липопротеинов; белок R-субъединицы рестрикции эндонуклеазы; белок, содержащий домен DUF240; белок MPN647 семейства липопротеинов |
CTG |
4 |
в каких последовательностях встретились |
белок S-субъединицы рестрикции эндонуклеазы; белок семейства MgpC белков клеточной адгезии (белок псевдогена), белок семейства DUF31; транспортный белок (MFS transporter) |
GTG |
62 |
GTT |
1 |
в каких последовательностях встретились |
белок семейства MgpC белков клеточной адгезии (белок псевдогена) |
TTA |
2 |
в каких последовательностях встретились |
гипотетический протеин |
TTG |
40 |
Mycoplasma pneumoniae M29 имеет ряд генов отвечающих за синтез белков клеточной адгезии и липопротеинов, но некоторая часть из них, как видно из таблицы - в своей кодирующей последовательности имеет "нетипичный" старт-кодон и может быть псевдогеном. можно предположить что, такие старт-кодоны нужны также для регуляции синтеза соответственных белков; “предпочтение” отдается синтезу белков клеточной адгезии и липопротеинов с нормальными старт-кодонами.[2]
Вывод: -нетипичные старт-кодоны могут быть результатом нейтральных мутаций, не влияющих на синтез -или могут быть механизмом регуляции трансляции
Задание 2.lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS] ген является псевдогеном , “доставшимся” от профага; этот ген - лишь часть более длинной кодирующей последовательности lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
последние три последовательности, кодируют субъединицы формиатдегидрогеназы, (функция которой состоит в том, чтобы катализировать окисление формиата до со2). В них кодон TGA считывается не как стоп-кодон, а как кодон, отвечающий за синтез селеноцистеина, благодаря специфичной последовательности после него.[3]
Задание 3.
Escherichia coli str. K-12 substr. MG1655 |
|
TGA |
1241 |
TAA |
2756 |
TAG |
303 |
other |
2 |
|
ATA, GAA |
Candidatus Gracilibacteria bacterium 28_42_T64 |
|
TGA |
1 |
TAA |
1000 |
TAG |
188 |
other |
7 |
|
TCT-2, TTA-1, AAA-1, CTT-1, ACA-1, GAA-1 |
Mycoplasma pneumoniae M29 |
|
TGA |
0 |
TAA |
531 |
TAG |
210 |
other |
13 |
|
GTT -1, ACT-1, GTG -1, AAT-2 TTT-1, GAT-1, GGC -2, TAC-1, CGG-1, GGG-1, AAA-1 |
у Candidatus Gracilibacteria bacterium кодон TGA - кодирует глицин[4] у Mycoplasma pneumoniae – триптофан.[5]
Задание 4.
Escherichia coli str. K-12 substr. MG1655 |
|
CTA |
5201 |
CTC |
14926 |
CTG |
71198 |
CTT |
14719 |
TTA |
18484 |
TTG |
18283 |
Candidatus Gracilibacteria bacterium 28_42_T64 |
|
CTA |
4861 |
CTC |
4491 |
CTG |
4147 |
CTT |
8053 |
TTA |
15077 |
TTG |
8048 |
Mycoplasma pneumoniae M29 |
|
CTA |
3619 |
CTC |
2168 |
CTG |
3220 |
CTT |
5267 |
TTA |
8959 |
TTG |
6679 |
Для разных организмов, разные синонимические кодоны являются превалирующими. Это можно связать с разным количеством соответствующих т-РНК в клетке, произошедшими мутациями. Может быть, таким образом регулируется скорость трансляции.
Задание 5.
минимум cumulative GC-skew в точке 1513000 - соответствует точке начала репликации. максимум cumulative GC-skew в точке 3870000 - соответствует точке терминации репликации. что приблизительно соответствует данным со страницы бактерии : 3925744..3925975 - расположение точки начала репликации
источники:
- Comparative Proteomics Enables Identification of Nonannotated Cold Shock Proteins in E. coli Nadia G. D’Lima, Alexandra Khitun, Aaron D. Rosenbloom, Peijia Yuan, Brandon M. Gassaway, Karl W. Barber, Jesse Rinehart, and Sarah A. Slavoff Journal of Proteome Research 2017 16 (10), 3722-3731 DOI: 10.1021/acs.jproteome.7b00419
Ralf Himmelreich, Helmut Hilbert, Helga Plagens, Elsbeth Pirkl, Bi-Chen Li, Richard Herrmann, Complete Sequence Analysis of the Genome of the Bacterium Mycoplasma Pneumoniae, Nucleic Acids Research, Volume 24, Issue 22, 1 November 1996, Pages 4420–4449, https://doi.org/10.1093/nar/24.22.4420
- Yoshizawa S, Böck A. The many levels of control on bacterial selenoprotein synthesis. Biochim Biophys Acta. 2009;1790(11):1404-1414. doi:10.1016/j.bbagen.2009.03.010
- Hanke A, Hamann E, Sharma R, Geelhoed JS, Hargesheimer T, Kraft B, Meyer V, Lenk S, Osmers H, Wu R, Makinwa K, Hettich RL, Banfield JF, Tegetmeyer HE, Strous M. Recoding of the stop codon UGA to glycine by a BD1-5/SN-2 bacterium and niche partitioning between Alpha- and Gammaproteobacteria in a tidal sediment microbial community naturally selected in a laboratory chemostat
- Su C. J., Tryon V. V., Baseman J. B. Cloning and sequence analysis of cytadhesin P1 gene from Mycoplasma pneumoniae //Infection and immunity. – 1987. – Т. 55. – №. 12. – С. 3023-3029.