Kodomo

Пользователь

Отчет по практике 13:

Задание 1: Пoдcчет старт-кoдoнoв

1. Escherichia coli str. K-12 substr. MG1655:

ATG – 3883 ATT - 4 CGT - 2 GTG – 334 TTC - 1 TTG – 78

2. Candidatus Gracilibacteria bacterium 28_42_T64:

ATG – 1129 GTG – 41 TTG – 23 TCA – 1 TCT – 1 ACA – 1

3. Mycoplasma pneumoniae M29:

ATG – 634 GTG – 62 TTG - 40 ATT – 4 CTG – 4 ATC – 3 ATA – 2 ACC – 2 TTA – 2 GTT – 1

Основным cтрaт-кoдоном является ATG, также довольно часто встречаются: GTG (3,43%~8,22%) и TTG(1,81%~5,31%) - можно предположить, что это своеобразный механизм маркеровки.

Задание 2: Поиск последовательностей, в которых стоп-кодон не в конце.

1. lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

2. lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

3. lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

4. lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

1 - псевдоген (нефункционирующий гомолог работающего гена); 2,3,4 - кодируют ген ответственный за встраивание селеноцистеина.

Задание 3: подсчет частоты стоп-кодонов

1. Escherichia coli str. K-12 substr. MG1655:

TAA - 2756, TAG - 303, TGA - 1241

2. Candidatus Gracilibacteria bacterium 28_42_T64:

TAA - 1000, TAG - 188, TGA - 1

3. Mycoplasma pneumoniae M29:

TAA – 531, TAG - 210, TGA - 0

TGA начал кодировать глицин у Candidatus Gracilibacteria (научная литература) и триптофан у Mycoplasma pneumoniae (научная литература)

Задание 4: подсчет частоты используемости каждого из кодонов

CTA

CTC

CTG

CTT

TTA

TTG

Escherichia coli

~3,64%

~10,45%

~49,85%

~10,30%

~12,94%

~12,80%

Candidatus Gracilibacteria

~10,88%

~10,05%

~9,28%

~18,02%

~33,75%

~18,01%

Mycoplasma pneumoniae

~12,10%

~7,25%

~10,76%

~17,60%

~29,95%

~22,33%

Я не смог найти какой-либо закономерности в неравномерном распределении частоты используемости каждого из кодонов, кодирующих лейцин. Это объясняется гипотезой предпочтения кодонов.

Задание 5: подсчет совокупного GC-перекоса. таблица с результатами.

На кумулятивном графике перекоса GC пики соответствуют точкам переключения (конечная точка или начало координат). При перевернутом определении перекоса GC максимальное значение кумулятивного перекоса соответствует окончанию, а минимальное значение соответствует началу репликации.*

Users/glebbezhko/pr13 (последним исправлял пользователь glebbezhko 2022-03-10 14:05:09)