Практикум 12
Данные по геному были взяты с сайта Национального Центра Биотехнологической информации (NCBI):
1) Escherichia coli str. K-12 substr. MG1655 https://www.ncbi.nlm.nih.gov/nuccore/U00096.3
2) Candidatus Gracilibacteria bacterium 28_42_T64 https://www.ncbi.nlm.nih.gov/nuccore/CP042461.1
3) Mycoplasma pneumoniae M29 https://www.ncbi.nlm.nih.gov/nuccore/NZ_CP008895.1
Ссылка на Google Colab с кодами для решения заданий: https://colab.research.google.com/drive/1_v10MP8_QUWyuayB6pxs7ZTPoDdwgs06?usp=sharing
Задание 1
Результаты для Escherichia coli:
Старт-кодон |
Количество |
ATG |
3890 |
ATT |
4 |
CTG |
2 |
GTG |
338 |
TTC |
1 |
TTG |
80 |
Результаты для Candidatus Gracilibacteria:
Старт-кодон |
Количество |
ACA |
1 |
ATG |
1129 |
GTG |
41 |
TCA |
1 |
TCT |
1 |
TTG |
23 |
Результаты для Mycoplasma pneumoniae:
Старт-кодон |
Количество |
AAA |
1 |
ACT |
1 |
ATA |
4 |
ATC |
1 |
ATG |
629 |
ATT |
8 |
CAA |
2 |
CTC |
2 |
CTG |
1 |
GAA |
1 |
GGA |
1 |
GTG |
60 |
GTT |
1 |
TCT |
1 |
TTA |
3 |
TTG |
53 |
Результаты:
Преобладающим старт-кодоном для всех трех бактерий является канонический ATG, иногда для инициации трансляции используются GTG и TTG, также очень редко встречаются другие кодоны. Частоту встречаемости кодонов GTG и TTG можно объяснить их сходством с ATG (отличие только в 1 первом нуклеотиде), что означает, что при наличии достаточно сильной последовательности Шайна-Дальгарно(SD) и оптимальной длины спейсера, вероятность инициации трансляции высока. Высокой эффективностью SD и спейсера также можно объяснить инициацию с более редких кодонов. Большинство генов, начинающихся с очень редких старт-кодонов являются псевдогенами, возможно эти старт-кодоны образовались в результате мутаций и отсутствия стабилизирующего отбора.
Задание 2
Кодирующие последовательности E. coli, в которых содержится стоп-кодон не в конце последовательности:
1) >lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
2) >lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
3) >lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
4) >lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Результаты:
1)Одна из CDS, в которой встретился стоп-кодон не в конце, является псевдогеном. Такое положение стоп-кодона может объясняться мутациями и отсутствием стабилизирующего отбора для данной последовательности.
2)Три другие последовательности со стоп-кодонами не только в конце кодируют фермент формиатдегидрогеназу или ее субъединицы. Эти стоп-кодоны кодируют аминокислоту селеноцистеин, которая является лигандом, координирующим ион метала в активном центре фермента.
Задание 3
Результаты для Escherichia coli:
Стоп-кодон |
Количество |
ATA |
1 |
GAA |
1 |
TAA |
2761 |
TAG |
306 |
TGA |
1246 |
Результаты для Candidatus Gracilibacteria:
Стоп-кодон |
Количество |
AAA |
1 |
ACA |
1 |
CTT |
1 |
GAA |
1 |
TAA |
1000 |
TAG |
188 |
TCT |
2 |
TGA |
1 |
TTA |
1 |
Результаты для Mycoplasma pneumoniae:
Стоп-кодон |
Количество |
AAA |
1 |
AAT |
1 |
ACT |
1 |
ATA |
1 |
ATT |
1 |
CCC |
1 |
GAT |
1 |
GGG |
4 |
GGT |
1 |
TAA |
533 |
TAC |
1 |
TAG |
221 |
TAT |
1 |
TTA |
1 |
Результаты:
У первой бактерии присутствуют все 3 стандартные стоп-кодонанта. У двух оставшихся кодон TGA используется очень редко или не используется совсем в качестве стоп-кодона. Он встречается в последовательностях и кодирует аминокислоту, скорее всего для него существует специальная тРНК. В качестве стоп-кодонов иногда используются кодоны, кодирующие аминокислоты в классических случаях, возможно это связано с определёнными последовательностями вокруг этого кодона.
Ссылка на статью:
Swart Е. С. Serra V., Petroni G., Nowacki M. Genetic Codes with No Dedicated Stop Codon Context-Dependent Translation Termination // Cell. 2016. 166. Р. 691-702. doi: 0.1016/j.cell.2016.06.020
Задание 4
Результаты для Escherichia coli:
Кодон |
Количество |
CTG |
71305 |
TTA |
18505 |
TTG |
18301 |
CTC |
14952 |
CTT |
14728 |
CTA |
5203 |
Результаты для Candidatus Gracilibacteria:
Кодон |
Количество |
CTG |
1714 |
TTA |
14766 |
TTG |
3237 |
CTC |
3968 |
CTT |
9332 |
CTA |
3357 |
Результаты для Mycoplasma pneumoniae:
Кодон |
Количество |
CTG |
2474 |
TTA |
10307 |
TTG |
5572 |
CTC |
3139 |
CTT |
2789 |
CTA |
2852 |