Задания практикума 13
Программы на Python, с помощью которых выполнялись задания
Задание 1
Escherichia coli str. K-12 substr. MG1655
ATG 3890
ATT 4
CTG 2
GTG 338
TTC 1
TTG 80
Совсем редкий старт-кодон "TTC" является псевдогеном.
Старт-кодон "CTG" инициирует транскрипцию гена hda, который кодирует [protein=inibitor of reinitiation of DNA replication] - он является ингибитором реинициации репликации ДНК.
Candidatus Gracilibacteria bacterium 28_42_T64
ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 23
Редкие старт-кодоны "TCT", "ACA", "TCA", являются псевдогенами
Mycoplasma pneumoniae M29
AAA 1
ACA 1
ACT 1
ATA 3
ATC 1
ATG 627
ATT 7
CAA 1
CAC 1
CTA 1
CTC 3
CTG 2
GAA 1
GTG 60
GTT 1
TCC 2
TCT 1
TGA 1
TTA 1
TTC 1
TTG 49
Редкие старт-кодоны "ATA" , "GTT", "ACC" является псевдогенами.
Вывод: возможно разные старт кодоны используются для большей специфичности регуляции разных групп генов
Задание 2
Escherichia coli str. K-12 substr. MG1655
lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Вывод: Из описания последовательностей следует, что стоп-кодон по середине последовательности кодирует селеноцистеин (Sec)
Задание 3
Escherichia coli str. K-12 substr. MG1655
TGA 1246
TAA 2761
TAG 306
Candidatus Gracilibacteria bacterium 28_42_T64
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae M29
TGA 0
TAA 526
TAG 220
У Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae почти никогда не используется TGA в качестве стоп-кодона. Возможно он имеет другую функцию. Исходя из источника (https://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html), TGA часто кодирует глицин или триптофан.
Задание 4
Escherichia coli str. K-12 substr. MG1655
CTA 5203
CTC 14952
CTG 71305
CTT 14728
TTA 18505
TTG 18301
Candidatus Gracilibacteria bacterium 28_42_T64
CTA 3357
CTC 3968
CTG 1714
CTT 9333
TTA 14767
TTG 3237
Mycoplasma pneumoniae M29
CTA 2826
CTC 3158
CTG 2470
CTT 2782
TTA 10295
TTG 5571
У первой бактерии наиболее часто встречающийся кодон, кодирующий лейцин это CTG, у второй и третьей бактерии это TTA.
Возможно наличие очень большого количество кодонов CTG у Escherichia coli (71 тыс.) может вносить некоторый вклад в GC-состав
ДНК. Увеличение содержания GC-нуклеотидов делает ДНК более прочной и менее подверженной воздействию температур и других факторов.
То есть, возможно, вариация преобладающих лейцин-кодирующих кодонов является приспособлением к особенностям среды.
5 задание
|
значение GC-skew |
окно |
MAX |
47,733 |
1 513 000 |
MIN |
-28,328 |
3 870 000 |
Минимум и максимум соответствуют расположению oriC (место начало репликации) и ter (место терминации репликации).
Значит Место начало репликации располагается в интервале 1 513 000-1 514 000 нуклеотида.
Место терминации - в интервале с 3 870 000 - 3 871 000 нуклеотида.
6 задание
Escherichia coli |
Candidatus Gracilibacteria |
Mycoplasma pneumoniae |
AAGGAG 328 |
TAAAAA 202 |
AATTAA 65 |
TAAGGA 284 |
AAAAAA 202 |
TTTAAA 64 |
AGGAGA 254 |
AAATAA 192 |
TTAAAA 44 |
CAGGAG 254 |
ATAAAA 192 |
AAAGGA 43 |
AAAGGA 229 |
AATAAA 180 |
ATTTAA 43 |
AAGGAA 226 |
AAAATA 171 |
ATTAAA 43 |
AGGAGT 215 |
TAATAA 159 |
AATTTA 42 |
GGAGAA 205 |
AAAAAT 155 |
TAATTA 41 |
AGGAAA 189 |
TAAATA 152 |
TTTTAA 40 |
ACAGGA 180 |
TTTTAA 150 |
TTAAAC 39 |
GAGGAA 171 |
TTTTTA 146 |
AAATAA 39 |
AAAAGG 152 |
ATTTTT 139 |
TTAATT 38 |
AGGAAT 149 |
TTTTTT 138 |
TAAAAA 38 |
Эти последовательности - последовательности Шайна-Дальгарно. Они являются сайтами связывания рибосом на молекуле мРНК. Как мы видим, эти последовательности отличаются у разных бактерий. На первый взгляд можно заметить, что у Escherichia coli преобладают GC-содержащие последовательности Шайна-Дальгарно и GC-содержащие лейцин-кодирующие кодоны. У Candidatus Gracilibacteria и Mycoplasma pneumoniae ситуация обратная. Таким образом, можно предположить, что нуклеотидный состав последовательности Шайна-Дальгарно коррелирует с GC-составом.