Kodomo

Пользователь

Задание 1

Скрипты

Количество старт-кодонов

Старт - кодоны

Escherichia coli str. K-12 substr. MG1655

Candidatus Gracilibacteria bacterium 28_42_T64

Mycoplasma pneumoniae M2

AAA

-

-

1

Псевдоген

ACA

-

1

1

Псевдоген гипот. белка

Псевдоген

ACT

-

-

1

Псевдоген

ATA

-

-

3

3 псевдогена

ATС

-

-

1

Гипот. белок

ATG

3890

1129

627

ATT

4

-

7

Обычные белки

2 обычных белка, 1 псевдоген, 4 гипот. белка

CAA

-

-

1

Псевдоген

CAC

-

-

1

Псевдоген

CTA

-

-

1

Псевдоген

CTC

-

-

1

Псевдоген

CTG

2

-

2

Обычные белки

1 Обычный и 1 гипот. белок

GAA

-

-

1

Псевдоген

GTG

338

41

60

GTT

-

-

1

Псевдоген

TCA

-

-

1

Псевдоген

TCC

-

-

2

Псевдогены

TCT

-

1

1

Псевдоген

Псевдоген

TGA

-

-

1

Псевдоген

TTA

-

-

1

Обычный белок

TTС

1

-

-

Псевдоген

TTG

80

23

49

Выводы:

Исходя из результатов поиска описаний генов с альтернативными старт-кодонами (кроме инициаторного кодона ATG, кодирующего у бактерий модифицированный метионин) можно предположить следующие закономерности:

1) Альтернативные старт-кодоны предположительно влияют на регуляцию экспрессии генов "На прокариотах классическое исследование показало, что кодоны UUG и GUG «класса I» могут инициировать трансляцию в E. coli с эффективностью AUG на 12–15% в той же репортерной конструкции; стартовые кодоны "класса IIA" CUG, AUU, AUC, AUA и ACG продуцировали 1-3% выхода белка по сравнению с AUG, а оставшиеся протестированные кодоны (AGG, AAG) не давали обнаруживаемой трансляции " [1]

2) Редко встречаемые кодоны почти всегда являются началом псевдогенов, так как кодон часто может меняться в результате мутаций, вероятно исходный старт-кодон был изменен, а то, что стало старт-кодоном ранее этим не являлось

Источники: [1]Sussman JK, Simons EL & Simons RW Фактор 3 инициации трансляции Escherichia coli различает кодон инициации in vivo . Молекулярная микробиология 21 , 347–360, doi: 10.1046/j.1365-2958.1996.6371354.x [2]https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7256928/


Задание 2

1) >lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true][location=join(270278..270540,271764..272190)] [gbkey=CDS]

Название белка: CP4-6 prophage; IS911A regulator fragment

Согласно описанию, является псевдогеном(не кодирует полипептид, рамка считывания смещена и поэтому стоп кодон находится не в конце)

2) >lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

Название белка: Formate dehydrogenase N subunit alpha

3) >lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

Название белка: Formate dehydrogenase O subunit alpha

4) >lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

Название белка: Formate dehydrogenase H

Все три последовательности кодируют субъеденицы формиатдегидрогеназы (subunit), что вероятно ведет к тому, что синтез прерывается. Кроме того, формиатдегидрогеназа содержит селеноцистеин, эту аминокислоту кодирует кодон TGA(т.к. это 21 аминокислота, в таблице ген.кода для нее нет соответствующего кодона)


Задание 3

Стоп-кодоны

Escherichia coli str. K-12 substr. MG1655

Candidatus Gracilibacteria bacterium 28_42_T64

Mycoplasma pneumoniae M2

TAA

2761

1000

526

TAG

306

188

220

TGA

1246

1

0

Выводы:

В источниках было найдено, что у второй бактерии TGA кодирует глицин, а у третьей - триптофан. Источники:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6851277/ https://www.ncbi.nlm.nih.gov/pmc/articles/PMC208464/ https://pubmed.ncbi.nlm.nih.gov/7691196/


Задача 4

Кодоны

Escherichia coli str. K-12 substr. MG1655

Candidatus Gracilibacteria bacterium 28_42_T64

Mycoplasma pneumoniae M2

CTA

5203

3357

2826

CTC

14952

3968

3158

CTG

71305

1714

2470

CTT

14728

9333

2782

TTA

18505

14767

10295

TTG

18301

3237

5571

Выводы:

1)Возможно в пределах одной бактерии разница в частоте использования кодонов обусловлена тем, что использование одного и того же кодона ускоряет процесс синтеза белка, так как используется одни и те же тРНК. Кроме того, это исключает "несинонимичные" замены в случае мутаций, так что это выгодно для бактерии.

2)Различия в частотах между разными видами бактерий могут быть продиктованы различиями в генетическом коде и особенностями бактерий, их метаболизма и среды.


Задача 5

Таблица и график GC-skew cumulative

Выводы:

Минимуму GC-skew cumulative соответствует origin репликации. Минимум исходя из таблицы приблизительно соответствует положению oriC из GenBank: 3 870 000 - в таблице(GC-skew равно -28,328 и соответствует 3 870 000 позиции), а rep_origin 3925744..3925975 - в GenBank Так как у бактерий кольцевые хромосомы, то максимуму соответствует точка, в которой происходит терминация. Максимум в таблице - 1 513 000 (GC-skew 47, 733 и соответствует 1 513 000 позиции, а в GenBank: 1511000..1516000.


Задача 6

Escherichia coli str. K-12 substr. MG1655

Candidatus Gracilibacteria bacterium 28_42_T64

Mycoplasma pneumoniae M2

AAGGAG 183

AAATAA 115

AATTAA 44

TAAGGA 163

AAAAAA 113

TTTAAA 40

AGGAGA 129

TAAAAA 111

ATTAAA 37

AAGGAA 122

TTTTTT 110

TTAAAA 35

AAAGGA 120

ATAAAA 107

AAAGGA 33

Чаще всего в 20 нуклеотидах перед старт-кодоном у бактерий встречались данные 6-меры.

Users/aa/pr12 (последним исправлял пользователь aa 2022-12-19 15:50:22)