Выравнивания последовательностей
Локальные мутации в кодирующей последовательности
В ходе работы над заданиями этого практикума я вносила изменения в нуклеотидную последовательность гена белка ГТФ-циклогидролазы FolE2. Затем я анализировала, насколько изменилась последовательность аминокислот в экспрессирующемся с этого гена белке. Геном бактерии был скачан в GenBank, а последовательность белка найдена в базе данных UniProt. Последовательность конкретного гена была извлечена из файла с геномом при помощи команды bash seqret sequence.gb[1262582:1263388] CDS.fasta. Мутации в последовательность нуклеотидов вносились вручную, затем мутантные гены транслировались с помощью команды transeq mutatedCDS-*.fasta translated-*.fasta. Затем строилось выравнивание двух аминокислотных последовательностей командой needle CAD8504.1.fasta translated-*.fasta al*.needle .
В результате мутаций происходили изменения в последовательностях аминокислот, эти изменения отражены в таблице
.Комментарии к таблице
- Синонимические мутации в третьем нуклеотиде кодона встречаются довольно часто, потому что они не влияют на последовательность и структуру белка, а значит, на них не влияет естественный отбор. Нейтральная теория молекулярной эволюции построена как раз на синонимичных мутациях, они позволяют оценивать время расхождения видов, то есть накопления в геномах каждого из разделившихся видов нейтральных замен.
- В результате замены первого нуклеотида кодона свойства аминокислоты полностью изменились, а значит изменилась и структура белка. Вероятно, при этом нарушится его функционирование, такой организм будет хуже приспособлен к условиям среды. Скорее всего, первые нуклеотиды кодонов консервативнее вторых (мутации во втором кодоне тоже бывают синонимичными) и тем более третьих, чтобы не подвергать структуру белка значительным изменениям.
- При замене нуклеотида во второй позиции мутация не синонимична, но свойства аминокислот близки между собой. Они обе алифатические и не проявляют кислотных или основных свойств, не образуют дисульфидные или солевые мостики, не вступают в стекинг-взаимодействия. Возможно, генетический код устроен таким образом, чтобы большинство мутаций во втором и третьем кодонах меняли аминокислоты на гомологичные им во избежание слишком сильных изменений в структуре белка.
- Мутация снова синонимична, потому что она произошла в третьем нуклеотиде кодона. Если посмотреть на таблицу генетического кода, то мы увидим, что замена в третьем нуклеотиде этого кодона либо синонимична, либо меняет аспартат на глутамат. Эти аминокислоты обладают схожими свойствами, обе кислотные, они являются гомологами, что отсылает нас к предположению, сделанному в прошлом пункте.
- Эта мутация в третьем нуклеотиде привела к замене гистидина на глутамин. Они обладают разной структурой, но обе способны образовывать, например, солевые мостики или водородные связи между боковыми цепями аминокислот, то есть сохранились критически важные для поддержания структуры свойства. Возможно, генетический код устроен таким образом, чтобы аминокислоты, в кодонах которых отличаются третьи нуклеотиды, обладали схожими свойствами, даже если они не гомологичны.
- При удалении шести нуклеотидов полипептидная цепь утратила лейцин и пролин. Лейцин как алифатическая аминокислота может определять структуру гидрофобного ядра молекулы, что весьма важно для правильного свёртывания в третичную структуру, а пролин сильно изгибает пептидную цепь, его отсутствие может привести к локальному нарушению структуры. Если эти аминокислоты не находились в реакционном центре, их выпадение может не критически повлиять на функционирование фермента. Наверное, остатки аминокислот, критически важных для функционирования молекулы (образующих, например, солевые мостики или дисульфидные связи), кодируются более консервативными участками ДНК.
- Из цепи выпали тот же пролин и изолейцин, мне кажется, что на стркутуру белка это повлияло таким же образом, как и в предыдущем пункте. Единственное возможное отличие в том, что боковая цепь изолейцина всё-таки устроена иначе и ввиду своей хиральности может быть важнее и её осутствие может сильнее изменять третичную структуру.
- При делеции нуклеотида произошёл сдвиг рамки считывания, что привело к полностью дефектной полипептидной цепи. Первый стоп-кодон встретился после 13 аминокислоты, и с учетом того, что для оптимального расходования ресурсов синтез изначально неспособных функционировать белков нужно прервать как можно раньше, может быть, в результате эволюции сохраняются такие синонимические мутации, которые увеличивают количество стоп-кодонов в начале полипептидной цепи при сдвиге рамки считывания. Примечательно, что начальные участки последовательностей не выровнены, хотя первые 10 аминокислот одинаковы.
- Всё то же самое, только рамка сдвинулась на два нуклеотида. Белок так же дефектен.
- Изменились 7 аминокислот, из них только две замены произошли на гомологичную аминокислоту с сохранением некоторых свойств, остальные же замены не гомологичны и ведут к нарушению структуры белка. После вставки рамка считывания возвращается на место и синтез белка идёт дальше. Интересно сравнить последовательности из этой мутации и полученную в результате 8 мутации. Там стоп-кодон возник на месте 13 аминокислоты, и вставкой за 40 кодоном мы, по сути, спасли белок, потому что если бы вставка привела к возникновению стопа или если бы она не произошла, этот кодон был бы считан как стоп и привёл бы к терминации синтеза.
- Удивляет, что, хотя стоп-кодон возник в середине последовательности и на этом трансляция должна была оборваться, програма продолжила трансляцию белка и в результате последовательности отличаются только отсутствием одной аминокислоты. На стоп-кодон я заменила серин, потому что мутацию внесла во второй нуклеотид кодона. Предполагая, что наиболее консервативны первые нуклеотиды кодонов, а наименее консервативны третьи, критично ли наличие серинов и тем более тирозинов в полипептидной цепи, если их кодон проще всего превращается в стоп? Эти аминокислоты встречаются относительно редко, может быть, отбор направленно убирает их там, где они не критически важны для выполнения белком его функций, чтобы случайные мутации не приводили к появлению стоп-кодонов посреди цепи.
- Я убрала старт-кодон из белка, и синтез начался не с того места, с которого должен был. Видимо, следующий старт-кодон сдвигал рамку считывания, и в итоге белок вышел дефектным, совсем непохожим на изначальный. Возможно ли, что синонимические мутации сохраняются таким образом, чтобы при начале синтеза с неправильного места происходили сдвиги рамки считывания и быстрая терминация трансляции во избежание создания совсем неработающих ферментов?