Отчет по практике 13:
Задание 1: Пoдcчет старт-кoдoнoв
1. Escherichia coli str. K-12 substr. MG1655:
ATG – 3883 ATT - 4 CGT - 2 GTG – 334 TTC - 1 TTG – 78
2. Candidatus Gracilibacteria bacterium 28_42_T64:
ATG – 1129 GTG – 41 TTG – 23 TCA – 1 TCT – 1 ACA – 1
3. Mycoplasma pneumoniae M29:
ATG – 634 GTG – 62 TTG - 40 ATT – 4 CTG – 4 ATC – 3 ATA – 2 ACC – 2 TTA – 2 GTT – 1
Основным cтрaт-кoдоном является ATG, также довольно часто встречаются: GTG (3,43%~8,22%) и TTG(1,81%~5,31%) - можно предположить, что это своеобразный механизм маркеровки.
Задание 2: Поиск последовательностей, в которых стоп-кодон не в конце.
1. lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
2. lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
3. lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
4. lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
1 - псевдоген (нефункционирующий гомолог работающего гена); 2,3,4 - кодируют ген ответственный за встраивание селеноцистеина.
Задание 3: подсчет частоты стоп-кодонов
1. Escherichia coli str. K-12 substr. MG1655:
TAA - 2756, TAG - 303, TGA - 1241
2. Candidatus Gracilibacteria bacterium 28_42_T64:
TAA - 1000, TAG - 188, TGA - 1
3. Mycoplasma pneumoniae M29:
TAA – 531, TAG - 210, TGA - 0
TGA начал кодировать глицин у Candidatus Gracilibacteria (научная литература) и триптофан у Mycoplasma pneumoniae (научная литература)
Задание 4: подсчет частоты используемости каждого из кодонов
|
CTA |
CTC |
CTG |
CTT |
TTA |
TTG |
Escherichia coli |
~3,64% |
~10,45% |
~49,85% |
~10,30% |
~12,94% |
~12,80% |
Candidatus Gracilibacteria |
~10,88% |
~10,05% |
~9,28% |
~18,02% |
~33,75% |
~18,01% |
Mycoplasma pneumoniae |
~12,10% |
~7,25% |
~10,76% |
~17,60% |
~29,95% |
~22,33% |
Я не смог найти какой-либо закономерности в неравномерном распределении частоты используемости каждого из кодонов, кодирующих лейцин. Это объясняется гипотезой предпочтения кодонов.
Задание 5: подсчет совокупного GC-перекоса. таблица с результатами.
На кумулятивном графике перекоса GC пики соответствуют точкам переключения (конечная точка или начало координат). При перевернутом определении перекоса GC максимальное значение кумулятивного перекоса соответствует окончанию, а минимальное значение соответствует началу репликации.*