На страницу четвертого семестра


Сравнение разных способов оценки эволюционных расстояний между нуклеотидными последовательностями



В данном задании нашей задачей является сравнение методов, позволяющих оценить эволюционные расстояния. Для осуществеления этой цели мы создали теоретическую эволюционную модель мутирования гена нашего белка, состоящую из последовательных этапов изменения нуклеотидной последовательности.

Ген нашего белка большой цепи карбамоилфосфатсинтетазы - carB. Индетификатор записи банка EMBL данного гена мы определили при выполнении заданий в прошлом семестре - V01500. Последовательность данного гена находится здесь

Мы должны были получить мутантные последовательности с помощью программы msbar на сервере kodomo-count.cmm.msu.ru. На последовательных этапах мутирования (всего шесть мутантных последовательностей) мы положили 10, 10, 30, 25, 50, 50 замен на каждые 100 нуклеотидов, соответственно. Так как длина последовательности гена составляет 3674 нуклеотидов, то общее количество замен будет составлять - 367, 367, 1102, 919, 1837, 1837, соответственно. Общий вид команды получения измененной последовательности:

msbar -point 4 -count <общее количество замен> -auto,
где -point 4 - тип изменения, в нашем случае мы производим мутацию последовательности засчет замен.

С помощью скрипта мы получили все мутантные последовательности и поместили их в один файл.

Скрипт
Мутантные последовательности

Далее мы должны были определить попарные эволюционные расстояния между всеми последовательностями (включая исходную) c помощью программы distmat, выполнив команду:

distmat -sequence mutant.txt -outfile -nucmethod <метод оценки> <номер метода>,

где на входе мы привели файл, содержащий наши последовательности несмотря на то, что на вход должно подаваться множественное выравнивание, так как в нашем случае были только замены (в целом, можно осуществить и другие типы мутаций с помощью программы msbar: делеции, вставки и др.); nucmethod - метод оценки эволюционных расстояний, здесь мы выбираем параметры 0 и 1, соответствующие интересующим нас матрице попарных различий (D, uncorrected distances) и матрице попарных расстояний, вычисленных по формуле Джукса – Кантора (JC), соответственно.
В результате мы получили две матрицы:

Матрица попарных различий
Матрица попарных расстояний, вычисленных по формуле Джукса – Кантора

Мы переходим к обработке полученных данных в Excel. Результаты доступны здесь
Ниже приведены графики, показывающие зависимость попарных различий (некорректированных расстояний) и расстояний, вычисленных по Джуксу-Кантору, от "истинных расстояний":





График "истинных" расстояний - это идеализированный случай, то есть каждая мутация приводит к замене нуклеотида на другой, причем замена на последующей стадии не может происходить в позиции, в которой мутация произошла ранее, то есть количество замен на определенном этапе всегда равно числу происходящих мутаций. Приближение к такой модели, возможно, есть при небольшом количестве мутаций (что видно на графиках).
Видно, что график зависимости некорректированных расстояний от "истинных" расстояний лежит ниже, чем график "истинных расстояний", что указывает на то, что в этом случае учитывается, что при большом количестве мутаций на каждом последующем этапе замены будут происходить и в позициях, в которых на предыдущих этапах уже была замена. Интересно, что в первой же мутантной последовательности число замен не десять, а восемь. Это связано с тем, что в одной позиции за один этап может произойти, в принципе, две замены, причем теоретически нуклеотид в этой позиции в результате двух замен межет остаться исходным нуклеотидом. Уже при 25 мутациях количество замен меньше "истинного" расстояния на 12 замен, далее происходит все большее отклонение графика несовпадений от графика "истинных" расстояний.
График расстояний, рассчитанных по Джуксу-Кантору, идет очень близко к графику "истинных" расстояний. Интересен участок графика с 135 по 175 мутации. При 135 мутациях график наиболее приближается к графику "истинных" расстояний, и отличие в заменах составляет 3. После этой точки график идет вниз. Данная точка соответствует отличию шестой мутантной последовательности от второй мутантной последовательности.




©Шахбатян Римма Рубеновна