Kodomo

Пользователь

Домашнее задание пр13 👨‍💻👨‍🎓👨‍🏫

Задание 1. sequence.txt Counter({'ATG': 3890, 'GTG': 338, 'TTG': 80, 'ATT': 4, 'CTG': 2, 'TTC': 1})

sequence-2.txt Counter({'ATG': 1129, 'GTG': 41, 'TTG': 23, 'TCA': 1, 'ACA': 1, 'TCT': 1})

sequence-3.txt Counter({'ATG': 629, 'GTG': 60, 'TTG': 53, 'ATT': 8, 'ATA': 4, 'TTA': 3, 'CTC': 2, 'CAA': 2, 'ATC': 1, 'CTG': 1, 'GGA': 1, 'ACT': 1, 'AAA': 1, 'GTT': 1, 'TCT': 1, 'GAA': 1}

В подавляющем большинстве случае встречается кодон ATG, помимо этого относительно периодично встречаются кодоны GTG и TTG, которые встречаются в геномах прокариот. Остальные старт-кодоны относятся к псевдогенам или могут быть вызваны ошибкой секвенирования.

Задание 2 Вывод для sequence.txt:

{'U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=',

'U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=',

'U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=',

'U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey='}

Генов со стоп-кодонами не в конце всего четыре, а именно: 3824, 1459, 250, 3997 Три из четырех – кодируют фермент формиат-дегидрогеназу, а еще один представляет из себя псевдоген. Данное предположение подтверждается в данной статье:

“The genomes of 11 Archaea and 54 Eubacteria representing 65 genera were studied for their stop codon usage and the presence of the machinery to incorporate selenocysteine. Members of 17 genera that were investigated, including most of the gamma subdivision of the Proteobacteria, have been annotated, or were found to have, the genes selABD, machinery needed for incorporation of selenocysteine for the UGA codon. A stem-loop structure immediately following the UGA is needed for selenocysteine incorporation in Escherichia coliformate dehydrogenase. Thirteen of the bacterial genomes had homologues of the formate dehydrogenase with the TGA codon at the same site. However, stem-loop structures were much weaker following those TGA codons in the formate dehydrogenase homologues than seen with E. coli. We examined the context of the different stop codons that were used in all annotated open reading frames for clues on the regulation of selenocysteine incorporation. It was found that genes ending in TGA were likely in almost all bacteria to overlap with the downstream gene by four bases. This was extreme in Campylobacter jejuni, which has selABD and formate dehydrogenase containing TGA within the reading frame. Of all genes ending in TGA in C. jejuni (25.5% of all genes), 60% of genes had the four-base overlap. In Pseudomonas aeruginosa, which also has the selenocysteine pathway, 79% of stop codons were found to be TGA, of which 11% overlapped by four bases with the downstream gene. The phylogeny of SelABD and formate dehydrogenase suggests that the system was anciently acquired and lost by many modern bacteria. The context of the use of TGA may be a remnant of a regulatory mechanism for the incorporation of selenocysteine.”

Задание 3

sequence

Counter({'TAA': 2761, 'TGA': 1246, 'TAG': 306, 'ey=': 5, '(1-': 2, 'ATA': 1, 'GAA': 1})

Sequence2

Counter({'TAA': 1000, 'TAG': 188, 'TCT': 2, 'TTA': 1, 'AAA': 1, 'CTT': 1, 'ACA': 1, 'TGA': 1, 'GAA': 1})

Sequence3

Counter({'TAA': 533, 'TAG': 221, 'ey=': 16, 'GGG': 4, 'ACT': 1, 'ATA': 1, 'AAT': 1, 'CCC': 1, 'GGT': 1, 'GAT': 1, 'TAT': 1, 'ATT': 1, 'TAC': 1, 'AAA': 1, 'TTA': 1})

Стоп-кодон TGA был потерян в последовательностях Candidatus Gracilibacteria bacterium 28_42_T64 и Mycoplasma pneumoniae M29. В связи с тем, что стоп-кодон TGA часто встречается в геномах бактерий, мы можем предположить, что в геномах этих организмов он кодирует аминокислоту, а именно, глицин, не является стоп-кодоном, такую информацию можно найти в приведенной статье:

Задание 4

sequence

TTA:18505 TTG:18301 CTA:5203 CTT:14728 CTG:71305 CTC:14952

Sequence2

TTA:14767 TTG:3237 CTA:3357 CTT:9333 CTG:1714 CTC:3968

Sequence3

TTA:10308 TTG:5572 CTA:2852 CTT:2789 CTG:2474 CTC:3139

Частота кодонов, кодирующих лейцин, различается во всех трех видах. Это связано в первую очередь со степенью экспрессии гена, может влиять GC-состав, а у Mycoplasma pneumoniae M29 кодон ТТА используется чаще всего. У Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae M29 наиболее часто используется кодон TTA – единственный из всех, без гуанина и цитозина, что подтверждает эту гипотезу.

Задание 5

Минимум GC-skew cumulative -28.327, в положении примерно 3869000-3871000. В положении минимума находится ориджин репликации.

Максимум GC-skew cumulative 47.733, в положении примерно 1513000. В положении, близком к максимуму находится точка терминации репликации.

Список литературы:

I Wassenaar T. M., Meinersmann R. J. The TGA stop codon and the phylogeny of the selenocysteine pathway //Genome Letters. – 2003. – Т. 2. – №. 4. – С. 127-138.

Сопроводительные материалы:

Код из задания 1:

[[https://drive.google.com/file/d/1BqB6x6U6Cz63oVr1ZPA0suozI4L124NG/view?usp=sharing |https://drive.google.com/file/d/1BqB6x6U6Cz63oVr1ZPA0suozI4L124NG/view?usp=sharing]]

Код из задания 2:

https://drive.google.com/file/d/1Gp6gJ5hTCDquZN-obF_4dbl-Nt0Z-qQ0/view?usp=sharing

Код из задания 3:

https://drive.google.com/file/d/1AolcdobY3KLAEHdONpBEEv2RBoE9aMrh/view?usp=sharing

Код из задания 4:

https://drive.google.com/file/d/1KEplZTq6qeyn3x9qZ3ujStwWQtqBW50n/view?usp=sharing

Код из задания 5:

https://drive.google.com/file/d/1tDuM-ElybikCZx5GQzT7bE4UbnwFT4Za/view?usp=sharing

График из задания 5:

[[https://drive.google.com/file/d/1yikJiQwxQowousf_PgbJhvtYVfaOhIJY/view?usp=sharing|https://drive.google.com/file/d/1yikJiQwxQowousf_PgbJhvtYVfaOhIJY/view?usp=sharing ]]

Users/ami-abzalimov/pr13 (последним исправлял пользователь ami-abzalimov 2023-12-21 17:44:23)