Задание №1
1. Для Escherichia coli. K-12 substr. MG1655
Старт-кодоны:
- "ATG": 3883
- "ATT": 4
- "CTG": 2
- "GTG": 334
- "TTC": 1
- "TTG": 78
Совсем редкий старт-кодон "TTC" является псевдогеном.
Старт-кодон "CTG" инициирует транскрипцию гена hda, который кодирует белок [protein=inibitor of reinitiation of DNA replication] - который является ингибитором повторной инициации репликации ДНК.
2. Для Candidatus Gracilibacteria bacterium 28_42_T64
Старт-кодоны:
- "ACA": 1
- "ATG": 1129
- "GTG": 41
- "TCA": 1
- "TCT": 1
- "TTG": 23
Редкие старт-кодоны "ACA", "TCA", "TCT" являются псевдогенами, считаю это интересным замечанием.
3. Mycoplasma pneumoniae M29
Старт-кодоны:
- "ACC": 2
- "ATA": 2
- "ATC": 3
- "ATG": 634
- "ATT": 4
- "CTG": 4
- "GTG": 62
- "GTT": 1
- "TTA": 2
- "TTG": 40
Редкие старт-кодоны "GTT","ACC", "ATA" является псевдогенами.
Вывод: по моим предположениям, перечисленные бактерии используют разные старт-кодоны для того, чтобы разграничить разные типы генов друг от друга по каким-то параметрам. Например, гены с старт-кодоном "ATC" у третьей исследуемой бактерии объединены в одну группу по какому-то признаку и так далее.
Задание №2
В четырех последовательностях бактерии Escherichia coli. K-12 substr. MG1655 стоп-кодоны встречаются не только на конце последовательности, но и в середине последовательности:
- [gene=insN] [pseudo=true]
- [gene=fdnG] [protein=formate dehydrogenase N subunit alpha]
- [gene=fdoG] [protein=formate dehydrogenase O subunit alpha]
- [gene=fdhF] [protein=formate dehydrogenase H]
Первая последовательность, в которой встречается стоп-кодон, кодирует белок-псевдоген. Оставшиеся три последовательности кодируют белок, входящий в состав фермента формиатдегидрогеназы."Формиатдегидрогеназы присутствуют во всех микроорганизмах, растущих на метаноле. Реакция окисления формиата до СО2 является одним из основных источников энергии в клетках этих штаммов...В настоящее время в бактериях обнаружено несколько типов ферментов, окисляющих формиат. Некоторые из них входят в состав пируватдегидрогеназного комплекса и, как, например, в клетках Escherichia coli, содержат в активном центре селеноцистеин",- написано в статье В.И.Тишкова и В.О.Попова "Механизм действия фермента формиатдегидрогеназы и ее практическое прменение"http://www.enzyme.chem.msu.ru/~tishkov/Publications/bcmr_2004_69_11_1537.pdf
Последние три последовательности содержат аминокислоту, которая кодируется стоп-кодоном. Эта аминокислоты - селеноцистеин.
Задание №3
1. Для Escherichia coli. K-12 substr. MG1655
TAA |
2756 |
TGA |
1241 |
TAG |
303 |
2. Для Candidatus Gracilibacteria bacterium 28_42_T64
TAA |
1000 |
TGA |
1 |
TAG |
188 |
3. Mycoplasma pneumoniae M29
TAA |
531 |
TGA |
0 |
TAG |
210 |
Я заметила, что у последних двух бактерии очень редко или никогда не используется 'TGA' в качестве стоп-кодона. Это наталкивает на мысль о том, что этот кодон имеет не только функцию стоп-кодона. Я просмотрела последовательности последних двух бактерии и поняла, что 'TGA' часто встречается не в качестве стоп-кодона. Чтобы убедиться в своих догадках, я прочитала статью https://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html и убедилась, что 'TGA' кодирует аминокислоту глицин.
Задание №4
1. Для Escherichia coli. K-12 substr. MG1655
CTA |
5201 |
TTG |
18283 |
TTA |
18484 |
CTC |
14926 |
CTG |
71198 |
CTT |
14719 |
2. Для Candidatus Gracilibacteria bacterium 28_42_T64
CTA |
4861 |
TTG |
8048 |
TTA |
15077 |
CTC |
4491 |
CTG |
4147 |
CTT |
8053 |
3. Mycoplasma pneumoniae M29
CTA |
3619 |
TTG |
6679 |
TTA |
8959 |
CTC |
2168 |
CTG |
3220 |
CTT |
5267 |
У первой бактерии наиболее часто встречается кодон "CTG", у второй и третьей - "TTA". Мною подмечена такая деталь: если сравнивать результаты исследования геномов всех трех бактерий, то можно сделать вывод, что бактерии часто используют те кодоны, в которых есть составляющая "TT". Затрудняюсь точно ответить, почему так, но могу предложить, что кодоны, имеющие в своем составе "TT" меньше подвержены негативным мутациям или же, наоборот, подвержены мутациям, положительно влияющим на организм, или же мутации могут изменить триплет, но не изменить аминокислоту, которую кодировал триплет.
Задание №5
минимальное значение: -28.33
максимальное значение: 47.73
Максимум соответсвует месту конца репликации (терминации), а минимум - инициации (ориджин репликации).
Задание №6
*работала с геномом своей бактерии
Поискала среди участков перед началами CDS и обнаружила там некоторые повторяющиеся шестимеры: "AAAAGG": 423
"AAAGGA": 713
"AAGGAG": 820
"AGGAGG": 703
"GGAGGA": 481
Наверное, эти 6-меры принимают участие в метаболизме бактерии Bacillus Safensis