Практикум 13
Код для каждого задания находится в папке на гугл диске (ссылка)
Задание 1
Escherichia coli str. K-12 substr. MG1655 |
ATG 3890, GTG 338, TTG 80 ATT 4, CTG 2, TTC 1 |
|
Candidatus Gracilibacteria bacterium 28_42_T64 |
ATG 1129, GTG 41, TTG 23 TCA 1, TCT 1, ACA 1 |
|
Mycoplasma pneumoniae M29 |
ATG 627, GTG 60, TTG 49, AAA 1, ACA 1, ACT 1, ATA 3, ATC 1, ATT 7, CAA 1, CAC 1, CTA 1, CTC 3, CTG 2, GAA 1, GTT 1, TCC 2, TCT 1, TGA 1, TTA 1, TTC 1 |
Чаще всего используется кодон ATG, реже, но тоже часто используются кодоны GTG и TTG, остальные кодоны используются гораздо реже. Вероятно, это происходит потому, что GTG и TTG очень похожи на канонический старт кодон ATG (отличается только один нуклеотид) и мутация слабо повлияла на экспрессию гена или была компенсирована мутациями в последовательности Шайна — Дальгарно [1]. Старт кодоны, встретившиеся только один раз, за редким исключением, находятся на псевдогенах.
Задание 2
Используя код, получил следующий результат:
>lcl|U00096.3_cds_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
>lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
>lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
>lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
первая последовательность является псевдогеном и может содержать мутацию, остальные кодируют белки, при этом при их трансляции, когда рибосома 'дойдет' до стоп кодона (в первой последовательности это позиции 586..588, во второй 586..588, в третьей 418..420) к полипептиду присоединится селеноцистеин (Sec)
Задание 3 Полученные результаты:
|
TGA |
TAA |
TAG |
Escherichia coli str. K-12 substr. MG1655 |
1246 |
2761 |
306 |
Candidatus Gracilibacteria bacterium 28_42_T64 |
1 |
1000 |
188 |
Mycoplasma pneumoniae M29 |
0 |
526 |
220 |
Выделяется то, что стопкодон TGA встретился у второй бактерии только 1 раз, у третьей ни разу. Как оказалось, у микоплазмы TGA встречается 1663 раза в кодирующих последовательностях, у Candidatus Gracilibacteria bacterium TGA встречается 15445 раз. Значит, она кодирует какую-то аминокислоту. У второй бактерии это глицин, у третьей - триптофан [2][3].
Задание 4
Escherichia coli str. K-12 substr. MG1655 |
CTA 8916, CTC 14339, CTG 33831, CTT 21063, TTA 22989, TTG 25656 |
|
Candidatus Gracilibacteria bacterium 28_42_T64 |
CTA 6061, CTC 5694, CTG 4799, CTT 9867, TTA 14371, TTG 10484 |
|
Mycoplasma pneumoniae M29 |
CTA 3739, CTC 2317, CTG 3320, CTT 6807, TTA 8876, TTG 7609 |
Разная частота использования использования синонимичных кодонов может быть связана с адаптациями к определенному образу жизни(патогенная/непатогенная бактерия, аэробная/анаэробная и т.д)[4]
Задание 5
Максимальное значение cumulative GC-skew составило 47,733 и встретилось на позиции 1513000, минимально составило -28,328 и встретилось на позиции 3870000. Минимальное значение соответствует точке начала репликации (origin), максимальное значение соответствует точке окончания репликации (terminus). Связано это с тем, что при репликации на лидирующей цепи происходит больше C→T мутаций, а "механизмы репликации отстающей цепи имеют более высокий уровень репарации той же мутации C→T" [5]
Полученная мной позиция (3870000) приблизительно соответствует данным с ncbi (3925744..3925975). Nucleotide - NCBI www.ncbi.nlm.nih.gov Nucleotide - NCBI www.ncbi.nlm.nih.gov
Задание 6
полученный результат для Escherichia coli str. K-12 substr. MG1655 ссылка
Чаще всего встречается последовательность AAGGAG(327) и TAAGGA(282).
- Вероятно, они являются отрезками последовательности Шайна-Дальгарно.
1. Belinky F, Rogozin IB, Koonin EV. Selection on start codons in prokaryotes and potential compensatory nucleotide substitutions. Sci Rep. 2017 Sep 29;7(1):12422. doi: 10.1038/s41598-017-12619-6. PMID: 28963504; PMCID: PMC5622118
2. Inamine JM, Ho KC, Loechel S, Hu PC. Evidence that UGA is read as a tryptophan codon rather than as a stop codon by Mycoplasma pneumoniae, Mycoplasma genitalium, and Mycoplasma gallisepticum. J Bacteriol. 1990 Jan;172(1):504-6. doi: 10.1128/jb.172.1.504-506.1990. PMID: 2104612; PMCID: PMC208464.
3. Sieber CMK, Paul BG, Castelle CJ, Hu P, Tringe SG, Valentine DL, Andersen GL, Banfield JF. Unusual Metabolism and Hypervariation in the Genome of a Gracilibacterium (BD1-5) from an Oil-Degrading Community. mBio. 2019 Nov 12;10(6):e02128-19. doi: 10.1128/mBio.02128-19. PMID: 31719174; PMCID: PMC6851277.
4. Arella D, Dilucca M, Giansanti A. Codon usage bias and environmental adaptation in microbial organisms. Mol Genet Genomics. 2021 May;296(3):751-762. doi: 10.1007/s00438-021-01771-4. Epub 2021 Apr 5. PMID: 33818631; PMCID: PMC8144148.
5. Lu J, Salzberg SL. SkewIT: The Skew Index Test for large-scale GC Skew analysis of bacterial genomes. PLoS Comput Biol. 2020 Dec 4;16(12):e1008439. doi: 10.1371/journal.pcbi.1008439. PMID: 33275607; PMCID: PMC7717575.