Содержимое страницы «Users/varvara-p/pr13».
Практикум 13
Задание 1
Старт-кодоны
1. Escherichia coli str. K-12 substr. MG1655
ATG 3883
ATT 4
CTG 2
GTG 334
TTC 1
TTG 78
2. Candidatus Gracilibacteria bacterium 28_42_T64
ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 23
3. Mycoplasma pneumoniae M29
ACC 2
ATA 2
ATC 3
ATG 634
ATT 4
CTG 4
GTG 62
GTT 1
TTA 2
TTG 40
Кодоны ATG, GTG, TTG практически полностью комплиментарны (в GTG и TTG изменен только первый нуклеотид) антикодону, кодирующему метеонин. Остальные кодоны, представленные в списках, скорее всего входят в состав псевдогенов. Также, все остальные кодоны отличаются от ATG не больше чем на 1-2 нуклеотида, что может говорить о том, что антикодон метеонина все равно сможет связаться с этим участком, хотя и слабо. В таком случае, отличие кодона от ATG будет говорить о том, что транскрипция этого гена таким способом регулируется, чтобы соответствующий белок синтезировался в меньшей мере.
Задание 2
1. lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
Данный ген является псевдогеном.
2. lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
3. lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
4. lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Стоп-кодон в этой последовательностях 2-4 кодирует редкую аминокислоту селеноцистеин, поэтому стоп-кодоном в них он не является.
Задание 3
"Стандартные" стоп-кодоны
1. Escherichia coli str. K-12 substr. MG1655
TGA 1241
TAA 2756
TAG 303
2. Candidatus Gracilibacteria bacterium 28_42_T64
TGA 1
TAA 1000
TAG 188
3. Mycoplasma pneumoniae M29
TGA 0
TAA 531
TAG 210
Судя по тому, что у бактерий 2 и 3 стоп-кодон встречается 1 и 0 раз соответственно, возникает мысль, что этот кодон на самом деле кодирует аминокислоты. При поиске этих стоп кодонов мы получили результат - 13688 и 19869. Выяснилось, что эти кодоны кодируют аминокислоты глицин [1] и триптофан [2].
Задание 4
Триплеты, кодирующие лейцин.
1. Escherichia coli str. K-12 substr. MG1655
CTA 5201
CTC 14926
CTG 71198
CTT 14719
TTA 18484
TTG 18283
2. Candidatus Gracilibacteria bacterium 28_42_T64
CTA 4861
CTC 4491
CTG 4147
CTT 8053
TTA 15077
TTG 8048
3. Mycoplasma pneumoniae M29
CTA 3619
CTC 2168
CTG 3220
CTT 5267
TTA 8959
TTG 6679
В пределах каждой из бактерий встречаемость кодонов, соответствующих лейцину, довольно сильно колеблется. Предполагаю, что это может быть связано с количеством тРНК в бактериях, не позволяющих осуществлять активный синтез иРНК с генов, содержащих только один кодон лейцина, поэтому их больше.
Задание 5
В этом графике представлена зависимость cumulative GC-skew от координаты в геноме Escherichia coli. Координаты, которые как мы предполагаем, соответствуют максимальному значению cumulative GC-skew - 3870000 и 1513000. Если посмотреть на страницу бактерии на GenBank, то мы увидим, что данные соотносятся.
Ссылки на источники:
1. https://pubmed.ncbi.nlm.nih.gov/2141170
2. https://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html/index.cgi?chapter=cgencodes#SG25/2141170/