Содержимое страницы «Users/shestakova-av/pr13». == Старт-кодоны == [[https://i.postimg.cc/WzqYtpNW/table1.png|Табл. 1]] Колоны в таблице - известные старт-кодоны прокариот. Помимо этих у бактреий встречаются менее чем в 10 копиях следующие старт-кодоны: Echericha: ATT, CTG, TTC Candidatus: ACA, TCA, TCT Mycoplasma: AAA, ACA, ACT, ATA, ATC, ATT, CAA, CAC, CTA, CTC, CTG, GAA, GTT, TCC, TCT, TGA, TTA, TTC Вероятнее всего, они из "поломанных" генов == Стоп-кодоны посреди последовательности == Многие из CDS, содержащих стоп-кодон посреди последовательности, просто кодируют псевдогены (полный список названий и кратких описаний "странных последовательностей" в приложенном файле). У Escherichia странных последовательностей мало и следующий феномен не наблюдается. Но в некоторых белках, где есть аминокислоты, не входящие в стандартные 20, стоп-кодон позволяет связаться с матричной РНК и рибосомой тРНК, несущей эту особую аминокислоту. == Стоп-кодоны == [[https://i.postimg.cc/LXGKxbhW/table-2.png|Табл. 2]] Кодон TGA не встречается в качестве стоп-кодона у Candidatus и Mycoplasma, это происходит потому что этот кодон у этих организмов кодирует аминокислоту. В последовательности он встречается много раз. (один случай в статистике стоп-кодонов Candidatus наверняка относится к псевдогену или является другого вида отклонением, не опровергающим данного объяснения) == Лейцин == [[https://i.postimg.cc/SNFb83B2/table3.png|Табл. 3]] Разность в частоте использования может быть связана с различным количеством тРНК данного вида в клетке, что в свою очередь, зависит от количества копий гена данной тРНК и близости её расположения к ориджину репликации (бактерии часто размножаются быстрее полного времени репликации, так что генов с начала цепи в клетке больше) == GC-skew == [[https://i.postimg.cc/FKn2KBbK/graph1.png|Граф. 1]] Согласно графику минимум GC-skew достигаеся примерно на 3850000 пар оснований дальше точки, с которой начинается запись последовательности в файл. Этот минимум соответсвует началу репликации, а максимум - ее терминации. == 6-меры == [[https://i.postimg.cc/kXFzS4Nz/graph2.png|Граф. 2]] На графике зависимость встречаемости 6-мера у Eschericha от его "попуярности" (места в списке 6-меров, упорядоченном по частоте встречаемости). График показывает, что распределение не случайно и есть сильное отклонение в сторону некоторых 6-меров. У других бактерий картина похожая Чаще всех у Escherichia встречаются: AAGGAG, TAAGGA, AGGAGA, CAGGAG, AAAGGA, AAGGAA, AGGAGT, GGAGGA (эти шестимеры встретились 200 и более раз) Чаще всех у Candidatus встречаются: TAAAAA, ATAAAA, AAATAA, AAAAAA, AATAAA (эти шестимеры встретились 175 и более раз) Чаще всех у Mycoplasma встречаются: TTTAAA, AATTAA, TTAAAA, ATTTAA, ATTAAA, AAAGGA, AATTTA (эти шестимеры встретились 40 и более раз) Это последовательности промотора, они похожи на типичный TATA-бокс и последовательность Шайна-Дальгарно