Prac

Выравнивания и мутации

Таблица с результатами

Обсуждение результатов

Одиночные замены: пять точечных замен в разных позициях. Две оказались молчащими (характерно, что в обоих случаях нуклеотиды стояли последними в триплете, что вполне согласуется с большим числом синонимичных кодонов в генетическом коде, различающихся только последним нуклкеотидом); две вызвали замену нуклеотида (в обоих случаях заменена полярная незаряженная аминокислота на положительно заряженную, то есть возможно, на третичную структуру белка это значительно не повлияет). Одна мутация привела к образованию стоп-кодона (старался не допускать такой ситуации, тк для этого был отдельный пункт, но все-таки проглядел и стоп-кодон появился - убирать не стал)
Делеции и вставки также оказали различный эффект. Делеция 19-24 нуклеотидов (т.е. идущих после нуклеотида с номером, кратным трем) ожидаемо не повлекла за собой изменений больших, чем исчезновение двух аминокислот в последовательности белка, поскольку были удалены два триплета, кодирующих эти аминокислоты. Делеция 20-25 нуклеотидов помимо исчезновения двух аминокислот, привела к замене следующей за ними (причем с отрицателно на положительно заряженную). Одновременная делеция 20 и вставка после 40 привели к смещению рамки считывания только на участке между ними, однако этого хватило, чтобы возник стоп-кодон. Делеция 20, как и вставка двух нуклеотидов после него также привела к утрате функциональной активности белка, причем обе мутации на последовательности белка отразились практически одинаково (сдивиг рамки считывания произошел на один и тот же шаг, разница лишь в том, добавиась одна аминокислота или нет). Во всех случаях при смещении рамки считывания возникло множество стоп-кодонов. Я не оценивал случайность их частоты статистическими методами и не изучал подробно вопрос в литературе, но могу осторожно предположить, что их частота окажется статистически значимо выше таковой, будь их возникновение случайным, поскольку было бы естественно, что отбор поддержал вариант генетического кода, где кодоны устроены так, что вероятность возникновения стоп-кодона при смещении рамки считыванияя достаточно велика, а значит бесполезный, а то и потенциально опасный белок не будет транслироваться. Учитывая, насколько генетический код консервативен, он должен был давно максимально оптимизироваться и такое полезное свойство, скорее всего, не могло не закрепиться.
Кроме того, из выравниваний, сделанных в случае сдвига рамки считывания, хорошо видно, что для проверки гомологичности последовательностей нужно сравнивать сами кодирующие последовательности, а не последовательность белка.
Наконец, собственно, появление стоп-кодона, а этот раз сделанное намеренно. Искал для быстроты по первым трем буквам строк (в Fasta-файле длина строки составляла 60 символов, не считая переноса строки, то есть число, кратное трем) последовательность похожую на TAA, TGA или TGA. такая была найдена в районе середины кодирующей последовательности и привела к укорочению белка до 460 аминокислот (считая метионин на N-конце). На PDB-модели (рис. 1, утраченная часть показана красным) видно, что это привело бы к утрате белком одного из двух своих обособленных участков, вероятно, являющегося самостоятельным доменом.