Практикум 12
Анализ кодирующих последовательностей бактерий: Escherichia coli, Candidatus Gracilibacteria bacterium, Mycoplasma pneumoniae M29
Данные по геномам бактерий были получены из базы данных NCBI
Escherichia coli str. K-12 substr. MG1655 (Далее E.coli)
Candidatus Gracilibacteria bacterium 28_42_T64 (Далее Candidatus)
Mycoplasma pneumoniae M29 (Далее Mycoplasma)
Задание 1
Помимо классического старт кодона ATG у бактерий встречаются альтернативные кодоны:
E.coli: ATG(3890), GTG(338), TTG(80). Менее 10 раз встречаются ATT,CTG,TTC.
Candidatus: ATG(1129), GTG(41), TTG(23). Менее 10 раз встречаются ACA, TCA, TCT.
Mycoplasma: ATG(629), GTG(60), TTG(53). Менее 10 раз встречаются AAA, ACT, ATA, ATC, ATT, CAA, CTC, CTG, GAA, GGA, GTT, TCT, TTA.
Задание 2
Последовательности E.coli со стоп-кодонами НЕ в конце
Для последовательностей 2-4 стоп-кодон кодирует аминокислоту Селеноцистеин. Интересно, что продукты этих генов – субъединицы дегидрогеназ.
Для последовательности 1 явной замены кодона не указано. Эта последовательность является псевдогеном и вероятно возникший стоп-кодон внутри последовательности и является той мутацией, которая изменила функцию дуплицированного исходного гена.
Задание 3
Анализ стоп-кодонов.
E.coli:
TGA 1246
TAA 2761
TAG 306
Candidatus:
TAA 1000
TAG 188
Mycobacteriun:
TAG 221
TAA 533
Была посчитана частота кодонов в геномах с отсутствующим стоп-кодоном. Его обозначили '&' в аминокислотном коде. Процентное содержание аминокислот