Практикум 10: Мутации и выравнивания

Конспект

Скачать геном -- hydbact_genome.gb. Найти координаты своего чувака, нормальная/комплементарная цепь
seqret hydbact_genome.gb:CP002221[109272:109907] CDS.fasta #достали записали, как поменять ID кроме как руками не ясно
revseq CDS.fasta CDS.fasta #откуда куда
transeq CDS.fasta translated.fasta #откуда куда
Мутировать лучше там где есть номера колонок
needle ADO44514.1_pr5.fasta translated-1.fasta alignment-1.needle #выдаст в понятном глазам формате
needle -aformat msf ADO44514.1_pr5.fasta translated-11.fasta alignment-11.fasta #а этот формат умеет кажись распознавать Jalview. Как до этого догадаться не ясно.

Мысли и возникшие вопросы (в принципе они и в таблице есть)

Ссылка на отчетную табличку

В третьей паре оснований кодона, синонимическая мутация впоне ожидаема. Насколько я понимаю, раз такие мутации не влияют на структуру белка, то будут более или менее часты, и третьи пары в кодонах будут менее консервативны в среднем - и насколько я знаю, так можно предугадывать кодирующую рамку.
При замене 31ого нуклеотида у меня в белке глутаминовая кислота заменилась на лизин. Интересно, что свойства у них прямо противоположные - одна основная, другая кислотная. Интересно, будут ли первые позиции более консервативны, чем вторые? То есть устроен ли генетический код так, чтобы аминокислоты, кодируемые разными нуклеотидами в первой позиции отличались наиболее сильно?
При замене 60ого нуклеотида я сделала замену Т на С, считая что пиримидин на пиримидин заменится с большей вероятностью. Когда я посмотрела на белковую последовательность , оказалось, что замена ТАТ -> ТАС (то есть Y на Y), а ведь ТАА и ТАG - стоп кодоны. Так что все было на волоске от нонсенс мутации. Интересно, насколько опасно вставлять много тирозинов в белковую последовательноть?
При делеции 6-и нуклеотидов выпали 2 аминокислоты - в моем случае V и R. Интересно, сильно ли меняется от таких мутаций белок. Аргинин, как образующий солевые мостики, наверняка может принимать большое участие в свертывании белка а значит и влиять на его активность как фермента. Еще сильнее наверное консервативны позиции цистеинов.
Сдвиг рамки (при делеции одного нуклеотида) полностью изменил последовательность белка (Identity: 1/417 ( 0.2%)) и он стал не функционален. Первый же стоп появился в 17 позиции. (то есть через примерно 10 аминокислотных остатков после ошибки) - что, согласитесь, довольно быстро. Это логично, ведь трансляцию абсолютно неверного белка надо прервать как можно скорее, поэтому во всех некодирующих рамках считывания обычно достаточно много стопов. Интересно, получается ли так случайно, или все-таки идет отбор на синонимические мутации, увеличивающие количество стопов в некодирующих рамках?
Заметим, что и 8 и 9 мутации на самом деле аналогичны - обе сдвиг на +2 (из рамки 1 в рамку 3).
Кстати я не очень понимаю, почему не выравнились начало с началом. Кажется, программы выравнивания устроены таким образом, что больший вес имеют "кластеризованные" последовательности, в которых цельных кусков (без гэпов) больше
При 10ой мутации изменились 8 аминокислот - хотя суммарно рамка и не сдвинулась. И предугадать что повлечет за собой такая мутация сложно - изменеия могут быть радикальные. Хотя в моем случае в целом соотношение кислых/основных/алифотических примерно не изменилось. Зато пропал триптофан, который, как я понимаю, достаточно редкая аминокислота и наверное если уж он встретился в белке, то неспроста.
При нонсенс мутации в 42 кодоне из 211 половинчатый белок все равно выйдет скорее негодным. Интересно, как часты нонсенс мутации на самом конце белка - которые обрезают самый конец, а значит не должны сильно влиять на его функциональность. Наверное это можно косвенно сказать, посмотрев, насколько близко домены обычно расположены к самому концу - потому что если конец белка можно без страшных последствий обрезать, то скорее всего это в эволюции бы происходило.

1)Проверочка