Практикум 12
Задание №1
1. Старт-кодоны Escherichia coli str. K-12 substr. MG1655:
ATG 3883
ATT 4
CTG 2
GTG 334
TTC 1
TTG 78
2. Старт-кодоны Candidatus Gracilibacteria bacterium 28_42_T64:
ACA 1
ATG 1129
CTG 41
TCA 1
TCT 1
TTG 23
3. Старт-кодоны Mycoplasma pneumoniae M29:
ACC 2
ATA 2
ATC 3
ATG 634
ATT 4
CTG 4
GTG 62
GTT 1
TTA 2
TTG 40
Старт-кодоны, похожие на ATG, достаточно хорошо связываются с инициирующей тРНК. GTG похож по структуре на старт-кодон ATG, поэтому является вторым по распространенности старт-кодоном.
Задание №2
Среди кодирующих последовательнстей E. coli нашлось 5 таких, в которых содержится стоп-кодон НЕ в конце последовательности. Три из них кодируют субъединицу формиатдегидрогеназы, две другие являются псевдогенами. Субъединицы формиатдегидрогеназы содержат аминокислоту селеноцистеин. В отличие от других аминокислот, встречающихся в белках, селеноцистеин не имеет своего особого кодона в генетическом коде. В действительности он особым образом кодируется кодоном TGA, который обычно является стоп-кодоном, и особой последовательностью после него.
Задание №3
1. Стоп-кодоны Escherichia coli str. K-12 substr. MG1655:
TGA 1241
TAA 2756
TAG 303
2. Стоп-кодоны Candidatus Gracilibacteria bacterium 28_42_T64:
TGA 1
TAA 1000
TAG 188
3. Стоп-кодоны Mycoplasma pneumoniae M29:
TGA 0
TAA 531
TAG 210
У второй бактерии TGA встретился в конце кодирующей последовательности только 1 раз, а у третьей бактерии не встретился ни разу. Если искать этот кодон в кодирующей последоватетельности, в результате будет обнаружено большое число кодонов не в конце цепи. Можно предположить, что для них TGA не является стоп-кодоном, а кодирует аминокислоту.
Подробнее об этом можно прочитать здесь.
Задание №4
Кодоны, кодирующие лейцин:
1. Escherichia coli str. K-12 substr. MG1655:
CTA 5201
CTC 14926
CTG 71198
CTT 14719
TTA 18484
TTG 8283
2. Candidatus Gracilibacteria bacterium 28_42_T64:
CTA 3357
CTC 3968
CTG 1714
CTT 9332
TTA 14766
TTG 3237
3. Mycoplasma pneumoniae M29:
CTA 2848
CTC 3161
CTG 2473
CTT 2797
TTA 10295
TTG 5601
Предпочтение кодонов - понятие, описывающее феномен неравных частот встречаемости синонимичных кодонов в пределах одного организма. Существует две гипотезы, объясняющих это. Первая: некоторые кодоны более склонны к мутациям и поэтому встречаются реже. Вторая: предпочтение кодонов влияет на эффективность и точность генной экспрессии и, таким образом, создается и поддерживается отбором.
Разница частоты используемости синонимичных кодонов для разных бактерий обусловлена мутациями, различиями в генетическом коде.
Задание №5
По данной ссылке находится график cumulative GC-skew.
Минимум GC-skew соответствует ориджину репликации, а максимум - месту, где заканчивается репликация.
Задание №6
Чаще всего встречаются 6-меры: AGGAGG, GGAGGA, GGAGGT, GAGGAG. Эти участки узнаются РНК-полимеразой перед репликацией.