НЕЗАВЕРШЕННЫЙ ВАРИАНТ!!!
Задание 1
Таблица 1 . Встречаемость стоп-кодонов в исследуемых бактериях
Кодоны |
Бактерия Candidatus Gracilibacteria 28_42_T64 |
Escherichia coli str. К-12 подл. MG1655 |
Mycoplasma pneumoniae M29 |
ACC |
|
|
2 |
ATA |
|
|
2 |
ATC |
|
|
3 |
ACA |
1 |
|
|
ATT |
|
4 |
4 |
ATG |
1129 |
3883 |
634 |
CTG |
|
2 |
4 |
GTG |
41 |
334 |
62 |
GTT |
|
|
1 |
TTA |
|
|
2 |
TTG |
23 |
78 |
40 |
Из таблицы замечаем, что наиболее часто встречаемый кодон - ATG, что соответствует ожиданиям. Однако существуют и другие кодоны, встреченные не единично: GTG, TTG. Они отличаются от старт-кодона только первым нуклеотидом. Можно предположить, что ключевыми для распознавания РНК-полимеразой являются второй и третий нуклеотид (включая другие участки в некодирующей области), поэтому последовательность с измененным первым нуклеотидом также способную функционирование.
Задание 2
Были найдены последовательности E.coli, в которых встречается стоп-кодон встречается не только в конце. Их четыре: 1 псевдоген и три субъединицы фермента формиат дегидрогеназа. В описании указано, что в белке на позиции, соответствующей стоп-кодону, присутствует неканоническая аминокислота, селеноцистеин.
Задание 3
Таблица 2 . Встречаемость стоп-кодонов в геномах исследуемых бактерий
|
Candidatus Gracilibacteria 28_42_T64 |
Escherichia coli str. К-12 подл. MG1655 |
Mycoplasma pneumoniae M29 |
TGA |
1 |
1241 |
0 |
TAA |
1000 |
2756 |
531 |
TAG |
188 |
303 |
210 |
Из литературных данных известно, что у C.gracilibacteria TGA кодирует глицин, а не является стоп-кодоном, кроме единственного гена, являющегося псевдогеном (molecular chaperone DnaJ). У M.pneumoniae стоп-кодон TGA кодирует триптофан [1].
Задача 4
Таблица 3. Частота встречаемости кодонов, кодирующих лейцин
Кодон, кодирующий лейцин |
Candidatus Gracilibacteria bacterium 28_42_T64 |
Escherichia coli str. K-12 substr. MG1655 |
Mycoplasma pneumoniae M29 |
CTA |
0.109 |
0.036 |
0.121 |
CTC |
0.101 |
0.105 |
0.073 |
CTG |
0.093 |
0.499 |
0.108 |
CTT |
0.180 |
0.103 |
0.1761 |
TTA |
0.338 |
0.129 |
0.300 |
TTG |
0.180 |
0.128 |
0.223 |
Заметим, что у каждой из бактерий наблюдается преобладание одного кодона. Могу предположить, что возникновение предпочтения того или иного кодона возникает случайно и закрепляется в ходе эволюции, которая у бактерий, как у ярко выраженных r-стратегов, проходит быстрее, чем у большинства организмов.
Задание 5
С помощью средств Python и Excel построен график cumulative_GC_skew для E.coli: https://docs.google.com/spreadsheets/d/1uwsPrDxDI1rKFbr0iQ9d5sMtsctgSuzwlhRq_Xd0Lto/edit#gid=762678221.
Рисунок 1. График cumulative GC-skew в зависимости от текущей позиции
Минимальное значение равно -28.33 и соответствует позициям 3,868,000..3,872,000. Максимальное значение равно 47.73 и соответствует позициям 1,511,000..1,516,000.
Координаты OriC из GenBank: 3,925,744..3,925,975. Нетрудно заметить, что они приблизительно соответствуют позициям для минимума GC_skew. Максимум GC_skew соответствует точке конца репликации.
Задание 6
С использованием координат кодирующих последовательностей в формате GenBank были найдены 6-меры в последовательностях длины 20, расположенных до кодирующей области.
Источники:
[1] https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi#SG4
[2] Vimberg, V., Tats, A., Remm, M. et al. Translation initiation region sequence preferences in Escherichia coli. BMC Molecular Biol 8, 100 (2007). https://doi.org/10.1186/1471-2199-8-100
Программы и их выдачи будут доступны по ссылке: (или не будут)...