Содержимое страницы «Users/shestakova-av/pr13».
Старт-кодоны
Колоны в таблице - известные старт-кодоны прокариот.
Помимо этих у бактреий встречаются менее чем в 10 копиях следующие старт-кодоны:
Echericha: ATT, CTG, TTC Candidatus: ACA, TCA, TCT Mycoplasma: AAA, ACA, ACT, ATA, ATC, ATT, CAA, CAC, CTA, CTC, CTG, GAA, GTT, TCC, TCT, TGA, TTA, TTC
Вероятнее всего, они из "поломанных" генов
Стоп-кодоны посреди последовательности
Многие из CDS, содержащих стоп-кодон посреди последовательности, просто кодируют псевдогены (полный список названий и кратких описаний "странных последовательностей" в приложенном файле). У Escherichia странных последовательностей мало и следующий феномен не наблюдается. Но в некоторых белках, где есть аминокислоты, не входящие в стандартные 20, стоп-кодон позволяет связаться с матричной РНК и рибосомой тРНК, несущей эту особую аминокислоту.
Стоп-кодоны
Кодон TGA не встречается в качестве стоп-кодона у Candidatus и Mycoplasma, это происходит потому что этот кодон у этих организмов кодирует аминокислоту. В последовательности он встречается много раз. (один случай в статистике стоп-кодонов Candidatus наверняка относится к псевдогену или является другого вида отклонением, не опровергающим данного объяснения)
Лейцин
Разность в частоте использования может быть связана с различным количеством тРНК данного вида в клетке, что в свою очередь, зависит от количества копий гена данной тРНК и близости её расположения к ориджину репликации (бактерии часто размножаются быстрее полного времени репликации, так что генов с начала цепи в клетке больше)
GC-skew
Согласно графику минимум GC-skew достигаеся примерно на 3850000 пар оснований дальше точки, с которой начинается запись последовательности в файл. Этот минимум соответсвует началу репликации, а максимум - ее терминации.
6-меры
На графике зависимость встречаемости 6-мера у Eschericha от его "попуярности" (места в списке 6-меров, упорядоченном по частоте встречаемости). График показывает, что распределение не случайно и есть сильное отклонение в сторону некоторых 6-меров. У других бактерий картина похожая
Чаще всех у Escherichia встречаются: AAGGAG, TAAGGA, AGGAGA, CAGGAG, AAAGGA, AAGGAA, AGGAGT, GGAGGA (эти шестимеры встретились 200 и более раз)
Чаще всех у Candidatus встречаются: TAAAAA, ATAAAA, AAATAA, AAAAAA, AATAAA (эти шестимеры встретились 175 и более раз)
Чаще всех у Mycoplasma встречаются: TTTAAA, AATTAA, TTAAAA, ATTTAA, ATTAAA, AAAGGA, AATTTA (эти шестимеры встретились 40 и более раз)
Это последовательности промотора, они похожи на типичный TATA-бокс и последовательность Шайна-Дальгарно