Задание 1 старт кодоны
Старт кодон |
Escherichia coli |
Candidatus Gracilibacteria |
Mycoplasma pneumoniae |
ACA |
0 |
1 |
2 |
ACC |
0 |
0 |
0 |
ATA |
0 |
0 |
2 |
ATG |
3883 |
1129 |
634 |
ATT |
4 |
0 |
4 |
CTG |
2 |
0 |
4 |
GTG |
344 |
41 |
62 |
GTT |
0 |
0 |
1 |
TCA |
0 |
1 |
0 |
TTA |
0 |
0 |
2 |
TCT |
0 |
1 |
0 |
TTC |
1 |
0 |
0 |
TTG |
78 |
23 |
40 |
Больше всего ATG.Затем по частоте идет GTG.Третий TTG.У этих самых распространенных кодонов есть одно общее -второй и третий нуклеотид.Можно предположить что для белков экспрессии по каким-либо причинам наиболее важны эти 2 последних нуклеотида.
Задание 2 .Стоп кодоны не являющиеся последними кодонами в последовательности обнаружены в
последовательность
причина
lcl U00096.3_cds_249
пседвоген
lcl U00096.3_cds_AAD13438.1_1457
кодируют особую аминокислоту селеноцистеин
lcl U00096.3_cds_AAD13456.1_3815
кодируют особую аминокислоту селеноцистеин
||lcl U00096.3_cds_AAD13462.1_3987
кодируют особую аминокислоту селеноцистеин
lcl U00096.3_cds_AAC77356.1_4302 ||кодируют особую аминокислоту селеноцистеин ||
ссылка на статью про дегидрогеназу.На второй странице про кишечную палочку. http://www.enzyme.chem.msu.ru/~tishkov/Publications/bcmr_2004_69_11_1537.pdf
ссылка на код https://disk.yandex.ru/d/wObmesJiy7VgBA
Задание 3 После алгоритма по поиску последнего триплета в последовательности:
вид |
% TAA |
кол-во TAA |
% TAG |
кол-во TAG |
% TGA |
кол-во TGA |
% остальных |
кол-во остальных |
ecoli |
64.04 |
2755 |
7.0432 |
303 |
28.847 |
1241 |
0.0697 |
3 |
Candidatus Gracilibacteria |
84.2243 |
646 |
15.3846 |
118 |
0.0 |
0 |
0.3911 |
3 |
Mycoplasma pneumoniae |
68.2657 |
185 |
29.1513 |
79 |
0.0 |
0 |
2.583 |
7 |
У второй и третьей бактерии не обнаружено кодона TGA на последних позициях последовательностей.Можно предположить что они кодируют у них аминокислоты т.е. являются "обычными" кодонами.
ссылка на код https://disk.yandex.ru/d/PFlP8p-o1i7jbQ
Задание 4
вид |
%TTA |
кол-во |
%TTG |
кол-во |
%CTT |
кол-во |
%CTC |
кол-во |
%CTA |
кол-во |
%CTG |
кол-во |
ecoli |
12.943 |
18484 |
12.8022 |
18283 |
10.3066 |
14719 |
10.4516 |
14926 |
3.6419 |
5201 |
49.8547 |
71198 |
Candidatus Gracilibacteria |
33.7467 |
15077 |
18.0137 |
8048 |
18.0249 |
8053 |
10.0522 |
4491 |
10.8803 |
4861 |
9.2822 |
4147 |
Mycoplasma pneumoniae |
29.9512 |
8959 |
22.3288 |
6679 |
17.6083 |
5267 |
7.2479 |
2168 |
12.0988 |
3619 |
10.7649 |
3220 |
Разная частота встречаемости может быть обусловлена защитой от мутаций .Например при смене TTA на TTG белок получится та же аминокислота => белок не поменяется => и свойства организма не зменятся
Задание 5 https://docs.google.com/spreadsheets/d/1vXZpeSbOxXKenEpHnYpPDoSf8GzIo4zKSMJB7lGbGKo/edit?usp=sharing
точка минимума( в нашем случае -28,3))соответствует точке начала репликации, точка максимума(47,7) точке терминации