Практикум 12
Задание №1, встречаемость разл. старт-кодонов
Escherichia coli str. K-12 substr. MG1655:
ATG 3883
GTG 334
TTG 78
ATT 4 (поли-А полимераза, YmcF, YnfQ (Qin prophage protein), IF-3 (фактор инициации трансляции))
TTC 1 (Rac - GTPase)
CTG 2 (ингибитор инициации репликации ДНК, белок внутр.мембраны (связывает FAD))
Candidatus Gracilibacteria bacterium 28_42_T64:
ATG 1129
GTG 41
TTG 23
TCA 1 (serine/threonine protein kinase)
ACA 1 (?)
TCT 1 (ATP synthase subunit C)
Mycoplasma pneumoniae M29:
ATG 634
GTG 62
TTG 40
ATT 4 (MPN647 lipoprotein, P80 lipoprotein, субъединица рестриктазы (type I restriction endonuclease subunit R), DUF240)
ATC 3 (DUF237, DUF16, (?))
CTG 4 (MFS transporter, субъединица рестриктазы (restriction endonuclease subunit S), cytadherence protein, DUF31 family protein)
ATA 2 (cytadherence protein, оба белка)
GTT 1 (cytadherence protein)
ACC 2 (cytadherence protein, оба белка)
TTA 2 (??)
* (?) - гипотетический белок
Вывод:
Белки, гены которых имеет старт кодоны, которые сильно отличаются от кодона ATG (больше, чем на один нуклеотид, исключение CTG) не должны быть в клетке постоянно, только при определенных условиях. Необычные старт-кодоны регулируют их экспрессию. Например, ингибитор инициации репликации нужен только если клетка в стрессовых условиях, ей не нужно делиться/делать белки. Часть генов является псевдогенами. Больше всего ATG, так как это стандартный старт-кодон.
Задание №2, стоп-кодоны в середине последовательности
1
CP4-6 prophage; IS911A regulator fragment. Это фрагмент из нукл. посл-ти профага, который бактерия когда-то интегрировала в свой геном. Псевдоген.
2-4
Formate dehydrogenase (ФДГ): N, O (субъединицы), H. В этих случах стоп-кодон является регуляцией трансляции (кодирует селеноцистеин). В недостатке селена трансляция прервется на стоп-кодоне, в итоге белки не будут функционировать должным образом (нет селеноцистеина). Если селен есть, то трансляция будет продолжаться, белки будут нормальными.
Задание №3, частота стоп-кодонов
Escherichia coli str. K-12 substr. MG1655:
TGA 1241
TAA 2756
TAG 303
Candidatus Gracilibacteria bacterium 28_42_T64:
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae M29:
TGA 0
TAA 531
TAG 210
Вывод:
В некоторых бактериях триплет TGA кодирует различные аминокислоты. У второй бактерии это глицин, а третьей - триптофан. Обоснование:
Recoding of the stop codon UGA to glycine by a BD1-5/SN-2 bacterium and niche partitioning between Alpha- and Gammaproteobacteria in a tidal sediment microbial community naturally selected in a laboratory chemostat Anna Hanke, Emmo Hamann, Ritin Sharma, Jeanine S. Geelhoed, Theresa Hargesheimer, Beate Kraft, Volker Meyer, Sabine Lenk, Harald Osmers, Rong Wu, Kofi Makinwa, Robert L. Hettich, Jillian F. Banfield, Halina E. Tegetmeyer, and Marc Strous
Evidence that UGA is read as a tryptophan codon rather than as a stop codon by Mycoplasma pneumoniae, Mycoplasma genitalium, and Mycoplasma gallisepticum. J M Inamine, K C Ho, S Loechel, and P C Hu
Задание №4, Leu
Escherichia coli str. K-12 substr. MG1655:
TTA 18484
TTG 18283
CTT 14719
CTC 14926
CTA 5201
CTG 71198
Candidatus Gracilibacteria bacterium 28_42_T64:
TTA 15077
TTG 8048
CTT 8053
CTC 4491
CTA 4861
CTG 4147
Mycoplasma pneumoniae M29:
TTA 8959
TTG 6679
CTT 5267
CTC 2168
CTA 3619
CTG 3220
Вывод
Возможно, наиболее часто встречаемые кодоны внутри одной бактерии являются наиболее выгодными. Может, бактерия имеет больше тех тРНК, которые узнают частые кодоны, а для редких тРНК меньше для меньших затрат. Плюс вероятность случайно распределения, так называемого предпочтения кодонов. В разных бактериях частота различная, так как каждая бактерия по-своему приспосабливается к своим условиям обитания, или произошел ряд мутаций.
Задание №5, GC-Skew
Максимальноe значение соответствует участку терминации репликации, а минимальное - ориджину. Значит, ориджин находится ~38500000, терминация на ~1500000. В genbank oriC находится на позиции 3925744..3925975, что примерно совпадает с результатами на графике. Можно еще раз убедиться в результате, воспользовавшись сервисом Gen Skew :