Задания для практикума 13
Все скрипты в Задания для практикума 13
Задание 1
Скрипт pr13.№4StartCodonFasta
- Для Escherichia coli:
ATG 3890, ATT 4, CTG 2, GTG 338, TTC 1 (псевдоген), TTG 80
- Для Candidatus Gracilibacteria bacterium:
ACA 1 (псевдоген), ATG 1129, GTG 41, TCA 1 (псевдоген), TCT 1 (псевдоген), TTG 23
- Для Mycoplasma pneumoniae:
AAA 1 (псевдоген), ACA 1 (псевдоген), ACT 1 (псевдоген), ATA 3 (псевдогены), ATC 1 (гипотетический), ATG 627, ATT 7 (4 гипотетических и 1 псевдоген), CAA 1 (псевдоген), CAC 1 (псевдоген), CTA 1 (псевдоген), CTC 3 (псевдогены), CTG 2 (1 гипотетический), GAA 1 (псевдоген), GTG 60, GTT 1 (псевдоген), TCC 2 (псевдогены), TCT 1 (псевдоген), TGA 1 (псевдоген), TTA 1, TTC 1 (псевдоген), TTG 49
Видно, что у данных бактерий чаще всего старт-кодоном является ATG, но также часто используются GTG и TTG, которые отличаются от него лишь на 1 нуклеотид. Вероятно, эти два кодона являются синонимичными ATG из-за небольшой разницы между ними, которая нивелируется присутствием других регулирующих последовательностей, например, последовательности Шайна-Дальгарно.
Остальные же нетипичные кодоны зачастую являются старт-кодонами псевдогенов. Поэтому можно предположить, что изменение старт-кодона играет роль в "отключении" генов. Также возможно, что подобные гены утратили свою функции именно из-за мутации в старт-кодоне. Но все же некоторые нетипичные кодоны находятся в начале нормально функционирующих последовательностей. Значит, либо подобные гены сохраняют активность благодаря последовательностям, предшествующим нетипичному кодону, либо нетипичные старт-кодоны все же могут распознаваться. Последняя гипотеза подтверждается недавними исследованиями, которые показали, что трансляция также идет с как минимум 17 нетипичных старт-кодонов [1].
Задание 2
Скрипт pr13.№7StrangeCodonFasta
lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Задание 3
Скрипты pr13.№3StopCodonFasta
организм \ триплет |
TGA |
TAA |
TAG |
Escherichia coli |
1246 |
2761 |
306 |
Candidatus Gracilibacteria bacterium |
1 |
1000 |
188 |
Mycoplasma pneumoniae |
0 |
526 |
220 |
Общее количество TGA в геноме Escherichia coli: 1251
Общее количество TGA в геноме Candidatus Gracilibacteria bacterium: 15446
Общее количество TGA в геноме Mycoplasma pneumoniae: 1663
Задание 4
Скрипт modified(pr13.№3)
организм \ триплет |
TTA |
TTG |
CTT |
CTC |
CTA |
CTG |
Escherichia coli |
18505 |
18301 |
14728 |
14952 |
5203 |
71305 |
Candidatus Gracilibacteria bacterium |
14767 |
3237 |
9333 |
3968 |
3357 |
1714 |
Mycoplasma pneumoniae |
10295 |
5571 |
2782 |
3158 |
2826 |
2470 |
Задание 5
Скрипт modified(pr13.№9GCskew)
max 1513000, 47.733
min 3870000, -28.328
Задание 6
Скрипт new
Escherichia coli |
Candidatus Gracilibacteria bacterium |
Mycoplasma pneumoniae |
AAGGAG - 329 |
TAAAAA - 189 |
AATTAA - 63 |
TAAGGA - 283 |
ATAAAA - 185 |
TTTAAA - 60 |
AGGAGA - 255 |
AAATAA - 176 |
AAAGGA - 43 |
CAGGAG - 255 |
AATAAA - 175 |
ATTAAA - 41 |
AAAGGA - 225 |
AAAATA - 163 |
AATTTA - 40 |
AAGGAA - 222 |
TTTTAA - 144 |
TAAAAA - 40 |
AGGAGT - 215 |
TTTTTA - 141 |
TTTTAA - 40 |
GGAGAA - 205 |
TAATAA - 139 |
ATTTAA - 39 |
AGGAAA - 189 |
AAAAAT - 137 |
TTAAAA - 39 |
ACAGGA - 179 |
TAAATA - 132 |
AAATAA - 38 |
GAGGAA - 170 |
TTAAAA - 132 |
TTAAAC - 37 |
AAAAGG - 150 |
TATAAA - 131 |
TTTTTA - 36 |
AGGAAT - 148 |
ATTTTT - 123 |
AATAAA - 35 |
CAAGGA - 140 |
ATAATA - 121 |
TAATTA - 35 |
CTGGAG - 139 |
TTATAA - 121 |
TTAATT - 35 |
Список литературы
Ariel Hecht, Jeff Glasgow, Paul R. Jaschke, Lukmaan A. Bawazer, Matthew S. Munson, Jennifer R. Cochran, Drew Endy, Marc Salit (21.02.2017). "Measurements of translation initiation from all 64 codons in E. coli". Nucleic Acids Research (Vol. 45, Iss. 7, P. 3615–3626). Location: https://doi.org/10.1093/nar/gkx070