Kodomo

Пользователь

Задания практикума 13

Программы на Python, с помощью которых выполнялись задания

Задание 1

Escherichia coli str. K-12 substr. MG1655

ATG 3890
ATT 4
CTG 2
GTG 338
TTC 1
TTG 80
Совсем редкий старт-кодон "TTC" является псевдогеном.
Старт-кодон "CTG" инициирует транскрипцию гена hda, который кодирует [protein=inibitor of reinitiation of DNA replication] - он является ингибитором реинициации репликации ДНК.

Candidatus Gracilibacteria bacterium 28_42_T64

ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 23
Редкие старт-кодоны "TCT", "ACA", "TCA", являются псевдогенами

Mycoplasma pneumoniae M29

AAA 1

ACA 1

ACT 1

ATA 3

ATC 1

ATG 627

ATT 7

CAA 1

CAC 1

CTA 1

CTC 3

CTG 2

GAA 1

GTG 60

GTT 1

TCC 2

TCT 1

TGA 1

TTA 1

TTC 1

TTG 49

Редкие старт-кодоны "ATA" , "GTT", "ACC" является псевдогенами.

Вывод: возможно разные старт кодоны используются для большей специфичности регуляции разных групп генов

Задание 2

Escherichia coli str. K-12 substr. MG1655

lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

Вывод: Из описания последовательностей следует, что стоп-кодон по середине последовательности кодирует селеноцистеин (Sec)

Задание 3

Escherichia coli str. K-12 substr. MG1655

TGA 1246
TAA 2761
TAG 306

Candidatus Gracilibacteria bacterium 28_42_T64

TGA 1
TAA 1000
TAG 188

Mycoplasma pneumoniae M29

TGA 0
TAA 526
TAG 220

У Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae почти никогда не используется TGA в качестве стоп-кодона. Возможно он имеет другую функцию. Исходя из источника (https://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html), TGA часто кодирует глицин или триптофан.

Задание 4

Escherichia coli str. K-12 substr. MG1655

CTA 5203
CTC 14952
CTG 71305
CTT 14728
TTA 18505
TTG 18301

Candidatus Gracilibacteria bacterium 28_42_T64

CTA 3357
CTC 3968
CTG 1714
CTT 9333
TTA 14767
TTG 3237

Mycoplasma pneumoniae M29

CTA 2826
CTC 3158
CTG 2470
CTT 2782
TTA 10295
TTG 5571

У первой бактерии наиболее часто встречающийся кодон, кодирующий лейцин это CTG, у второй и третьей бактерии это TTA.
Возможно наличие очень большого количество кодонов CTG у Escherichia coli (71 тыс.) может вносить некоторый вклад в GC-состав
ДНК. Увеличение содержания GC-нуклеотидов делает ДНК более прочной и менее подверженной воздействию температур и других факторов.
То есть, возможно, вариация преобладающих лейцин-кодирующих кодонов является приспособлением к особенностям среды.

5 задание

Таблица с графиком

значение GC-skew

окно

MAX

47,733

1 513 000

MIN

-28,328

3 870 000

Минимум и максимум соответствуют расположению oriC (место начало репликации) и ter (место терминации репликации).

Значит Место начало репликации располагается в интервале 1 513 000-1 514 000 нуклеотида.

Место терминации - в интервале с 3 870 000 - 3 871 000 нуклеотида.

6 задание

Escherichia coli

Candidatus Gracilibacteria

Mycoplasma pneumoniae

AAGGAG 328

TAAAAA 202

AATTAA 65

TAAGGA 284

AAAAAA 202

TTTAAA 64

AGGAGA 254

AAATAA 192

TTAAAA 44

CAGGAG 254

ATAAAA 192

AAAGGA 43

AAAGGA 229

AATAAA 180

ATTTAA 43

AAGGAA 226

AAAATA 171

ATTAAA 43

AGGAGT 215

TAATAA 159

AATTTA 42

GGAGAA 205

AAAAAT 155

TAATTA 41

AGGAAA 189

TAAATA 152

TTTTAA 40

ACAGGA 180

TTTTAA 150

TTAAAC 39

GAGGAA 171

TTTTTA 146

AAATAA 39

AAAAGG 152

ATTTTT 139

TTAATT 38

AGGAAT 149

TTTTTT 138

TAAAAA 38

Эти последовательности - последовательности Шайна-Дальгарно. Они являются сайтами связывания рибосом на молекуле мРНК. Как мы видим, эти последовательности отличаются у разных бактерий. На первый взгляд можно заметить, что у Escherichia coli преобладают GC-содержащие последовательности Шайна-Дальгарно и GC-содержащие лейцин-кодирующие кодоны. У Candidatus Gracilibacteria и Mycoplasma pneumoniae ситуация обратная. Таким образом, можно предположить, что нуклеотидный состав последовательности Шайна-Дальгарно коррелирует с GC-составом.

Users/artaevv/pr13 (последним исправлял пользователь artaevv 2022-12-20 20:32:24)