Четвертый семестр
Сравнение разных способов оценки эволюционных расстояний между 2-мя генами
-
Была созданана модель эволюции гена белка GLMU_ECOLI:
ген →mutant1→mutant2→mutant3→mutant4→mutant5→mutant6
В данной модели на каждом этапе эволюции происходят только замены. Число замен на последовательных этапах равно:
|
замен на 100 нуклеотидов |
замен на всю длину последовательности (1371 нуклеотидов) |
mut_1; mut_2 |
10 |
137 |
mut_3 |
30 |
411 |
mut_4 |
25 |
343 |
mut_5; mut_6 |
50 |
686 |
Для получения всех мутантных последовательностей в одном файле был написан следующий скрипт:
msbar mine.fasta mut1.fasta -point 4 -count 137 -auto
msbar mut1.fasta mut2.fasta -point 4 -count 137 -auto
msbar mut2.fasta mut3.fasta -point 4 -count 411 -auto
msbar mut3.fasta mut4.fasta -point 4 -count 343 -auto
msbar mut4.fasta mut5.fasta -point 4 -count 686 -auto
msbar mut5.fasta mut6.fasta -point 4 -count 686 -auto
cat mine.fasta >> all.fasta
cat mut1.fasta >> all.fasta
cat mut2.fasta >> all.fasta
cat mut3.fasta >> all.fasta
cat mut4.fasta >> all.fasta
cat mut5.fasta >> all.fasta
cat mut6.fasta >> all.fasta
, где параметр -point определяет тип изменения, в данной задаче это только замены (4).
В результате был получен данный файл . Далее вся работа проводилась с ним.
- Программой distmat пакета EMBOSS были определены попарные эволюционные расстояния между всеми последовательностями (включая исходную).
Значение параметра -nucmethod, равное 0 соответствует матрице попарных
различий, а 1 - матрице попарных расстояний, вычисленных по формуле Джукса – Кантора .
В общем виде команда выглядит так
distmat -sequence "входящий файл" -outfile "исходящий файл" -nucmethod "метод оценки (0 или 1)"
- Полученные данные были обработаны в Excel.

График, расположенный по диагонали, соответствует идеальному случаю. Чем грубее оценка. тем больше отходит ее график от идеала. Идеальная зависимость имеет линейный характер,
следовательно справедливо предположить, что оценка корректна, пока график ее зависимости от истинных значений линеен. Сравнивая графики, можно сказать, что оценка методом попарных различий эффективна при небольшой количестве замен. Метод Джукса-Кантора работает при более широком диапозоне количеств замен.
После 30 замен на 100 нуклеотидов отклонение оценки от истинного значения становится существенно, можно сделать вывод , что чем меньше количество замен на 100 нуклеотидов, тем точнее оценка
©Nechay Olesya 2005