Задание 1
Количество старт-кодонов |
|||
Старт - кодоны |
Escherichia coli str. K-12 substr. MG1655 |
Candidatus Gracilibacteria bacterium 28_42_T64 |
Mycoplasma pneumoniae M2 |
AAA |
|||
- |
- |
1 |
|
|
|
Псевдоген |
|
ACA |
|||
- |
1 |
1 |
|
|
|
Псевдоген гипот. белка |
Псевдоген |
ACT |
|||
- |
- |
1 |
|
|
|
|
Псевдоген |
ATA |
|||
- |
- |
3 |
|
|
|
|
3 псевдогена |
ATС |
|||
- |
- |
1 |
|
|
|
|
Гипот. белок |
ATG |
|||
3890 |
1129 |
627 |
|
|
|
|
|
ATT |
|||
4 |
- |
7 |
|
|
Обычные белки |
|
2 обычных белка, 1 псевдоген, 4 гипот. белка |
CAA |
|||
- |
- |
1 |
|
|
|
|
Псевдоген |
CAC |
|||
- |
- |
1 |
|
|
|
|
Псевдоген |
CTA |
|||
- |
- |
1 |
|
|
|
|
Псевдоген |
CTC |
|||
- |
- |
1 |
|
|
|
|
Псевдоген |
CTG |
|||
2 |
- |
2 |
|
|
Обычные белки |
|
1 Обычный и 1 гипот. белок |
GAA |
|||
- |
- |
1 |
|
|
|
|
Псевдоген |
GTG |
|||
338 |
41 |
60 |
|
|
|
|
|
GTT |
|||
- |
- |
1 |
|
|
|
|
Псевдоген |
TCA |
|||
- |
- |
1 |
|
|
|
|
Псевдоген |
TCC |
|||
- |
- |
2 |
|
|
|
|
Псевдогены |
TCT |
|||
- |
1 |
1 |
|
|
|
Псевдоген |
Псевдоген |
TGA |
|||
- |
- |
1 |
|
|
|
|
Псевдоген |
TTA |
|||
- |
- |
1 |
|
|
|
|
Обычный белок |
TTС |
|||
1 |
- |
- |
|
|
Псевдоген |
|
|
TTG |
|||
80 |
23 |
49 |
|
|
|
|
|
Выводы:
Исходя из результатов поиска описаний генов с альтернативными старт-кодонами (кроме инициаторного кодона ATG, кодирующего у бактерий модифицированный метионин) можно предположить следующие закономерности:
1) Альтернативные старт-кодоны предположительно влияют на регуляцию экспрессии генов "На прокариотах классическое исследование показало, что кодоны UUG и GUG «класса I» могут инициировать трансляцию в E. coli с эффективностью AUG на 12–15% в той же репортерной конструкции; стартовые кодоны "класса IIA" CUG, AUU, AUC, AUA и ACG продуцировали 1-3% выхода белка по сравнению с AUG, а оставшиеся протестированные кодоны (AGG, AAG) не давали обнаруживаемой трансляции " [1]
2) Редко встречаемые кодоны почти всегда являются началом псевдогенов, так как кодон часто может меняться в результате мутаций, вероятно исходный старт-кодон был изменен, а то, что стало старт-кодоном ранее этим не являлось
Источники: [1]Sussman JK, Simons EL & Simons RW Фактор 3 инициации трансляции Escherichia coli различает кодон инициации in vivo . Молекулярная микробиология 21 , 347–360, doi: 10.1046/j.1365-2958.1996.6371354.x [2]https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7256928/
Задание 2
1) >lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true][location=join(270278..270540,271764..272190)] [gbkey=CDS]
Название белка: CP4-6 prophage; IS911A regulator fragment
Согласно описанию, является псевдогеном(не кодирует полипептид, рамка считывания смещена и поэтому стоп кодон находится не в конце)
2) >lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
Название белка: Formate dehydrogenase N subunit alpha
3) >lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
Название белка: Formate dehydrogenase O subunit alpha
4) >lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Название белка: Formate dehydrogenase H
Все три последовательности кодируют субъеденицы формиатдегидрогеназы (subunit), что вероятно ведет к тому, что синтез прерывается. Кроме того, формиатдегидрогеназа содержит селеноцистеин, эту аминокислоту кодирует кодон TGA(т.к. это 21 аминокислота, в таблице ген.кода для нее нет соответствующего кодона)
Задание 3
Стоп-кодоны |
Escherichia coli str. K-12 substr. MG1655 |
Candidatus Gracilibacteria bacterium 28_42_T64 |
Mycoplasma pneumoniae M2 |
TAA |
2761 |
1000 |
526 |
TAG |
306 |
188 |
220 |
TGA |
1246 |
1 |
0 |
Выводы:
- У второй бактерии TGA встретился в конце кодирующей последовательности только 1 раз, а у третьей бактерии он не нашелся вообще. В то время, как, если искать этот кодон "вручную", то можно найти гораздо большее число позиций в середине цепи. Исходя из этого можно предположить, что у 2 и 3 бактерии TGA не является стоп-кодоном, а кодирует какие-то аминокислоты.
В источниках было найдено, что у второй бактерии TGA кодирует глицин, а у третьей - триптофан. Источники:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6851277/ https://www.ncbi.nlm.nih.gov/pmc/articles/PMC208464/ https://pubmed.ncbi.nlm.nih.gov/7691196/
Задача 4
Кодоны |
Escherichia coli str. K-12 substr. MG1655 |
Candidatus Gracilibacteria bacterium 28_42_T64 |
Mycoplasma pneumoniae M2 |
CTA |
5203 |
3357 |
2826 |
CTC |
14952 |
3968 |
3158 |
CTG |
71305 |
1714 |
2470 |
CTT |
14728 |
9333 |
2782 |
TTA |
18505 |
14767 |
10295 |
TTG |
18301 |
3237 |
5571 |
Выводы:
1)Возможно в пределах одной бактерии разница в частоте использования кодонов обусловлена тем, что использование одного и того же кодона ускоряет процесс синтеза белка, так как используется одни и те же тРНК. Кроме того, это исключает "несинонимичные" замены в случае мутаций, так что это выгодно для бактерии.
2)Различия в частотах между разными видами бактерий могут быть продиктованы различиями в генетическом коде и особенностями бактерий, их метаболизма и среды.
Задача 5
Таблица и график GC-skew cumulative
Выводы:
Минимуму GC-skew cumulative соответствует origin репликации. Минимум исходя из таблицы приблизительно соответствует положению oriC из GenBank: 3 870 000 - в таблице(GC-skew равно -28,328 и соответствует 3 870 000 позиции), а rep_origin 3925744..3925975 - в GenBank Так как у бактерий кольцевые хромосомы, то максимуму соответствует точка, в которой происходит терминация. Максимум в таблице - 1 513 000 (GC-skew 47, 733 и соответствует 1 513 000 позиции, а в GenBank: 1511000..1516000.
Задача 6
Escherichia coli str. K-12 substr. MG1655 |
Candidatus Gracilibacteria bacterium 28_42_T64 |
Mycoplasma pneumoniae M2 |
AAGGAG 183 |
AAATAA 115 |
AATTAA 44 |
TAAGGA 163 |
AAAAAA 113 |
TTTAAA 40 |
AGGAGA 129 |
TAAAAA 111 |
ATTAAA 37 |
AAGGAA 122 |
TTTTTT 110 |
TTAAAA 35 |
AAAGGA 120 |
ATAAAA 107 |
AAAGGA 33 |
Чаще всего в 20 нуклеотидах перед старт-кодоном у бактерий встречались данные 6-меры.