Задание 1.
Escherichia coli str. K-12 substr. MG1655 : ATG (3883), GTG (334), TTG (78), ATT (4), CTG (2), TTC (1)
Candidatus Gracilibacteria bacterium 28_42_T64 : ATG (1129), GTG (41), TTG (23), ACA, TCA и TCT (по 1)
Mycoplasma pneumoniae M29 : ATG (634), GTG (62), TTG (40), ATT, CTG (по 4), ATC (3), ACC, ATA, TTA (по 2), GTT (1)
- У данных бактерий чаще всего встречается старт-кодон ATG,а также нередки старт-кодоны GTG и TTG.
Задание 2.
Последовательности, в которых содержится стоп-кодон НЕ в конце последовательности:
lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS] - здесь
lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Эти последовательности являются генами формиат дегидратазы, которая содержит селеноцистеин. При наличии специальной последовательности после стоп-кодона селеноцистеин кодируется TGA стоп-кодоном
Задание 3.
- Escherichia coli str. K-12 substr. MG1655:
TGA 1200 (частота 28.85%)
TAA 2680 (частота 64.06%)
TAG 290 (частота 7.04%)
- Candidatus Gracilibacteria bacterium 28_42_T64
TGA 1 (частота 0.08%)
TAA 969 (частота 83.61%)
TAG 181 (частота 15.72%)
- Mycoplasma pneumoniae M29
TGA 0 (частота 0%)
TAA 518 (частота 70.42%)
TAG 202 (частота 27.85%)
- У данных бактерий “пропавший” стоп-кодон - это TGA
У Candidatus Gracilibacteria bacterium 28_42_T64 и Mycoplasma pneumoniae M29 TGA триплет, кодирующий аминокислоту - глицин
(источник.)
Задание 4
Escherichia coli str. K-12 substr. MG1655
CTA 3.64% (5201)
CTC 10.45% (14926)
CTG 49.85% (71198)
CTT 10.31% (14719)
TTA 12.94% (18484)
TTG 12.80% (18283)
Candidatus Gracilibacteria bacterium 28_42_T64
CTA 9.23% (3357)
CTC 10.91% (3968)
CTG 4.71% (1714)
CTT 25.66% (9333)
TTA 40.59% (14767)
TTG 8.90% (3237)
Mycoplasma pneumoniae M29
CTA 10.48% (2848)
CTC 11.63% (3161)
CTG 9.10% (2473)
CTT 10.30% (2798)
TTA 37.90% (10302)
TTG 20.60% (5601)
- Разница частоты используемости разных кодонов обусловлена ее зависимостью от встречаемости соответствующих тРНК, а также от мутаций.
- Для разных бактерий разница в частоты используемости разных кодонов связана с разными мутациям данных кодонов, присущих разным живым объектам.
Задание 5.
- Минимум = -28,33. Это точка начала репликации (OriC).
- Максимум = 47,73. Это точка конца репликации (Ter).