Четвертый семестр

Сравнение разных способов оценки эволюционных расстояний между 2-мя генами


  1.   Была созданана модель эволюции гена белка GLMU_ECOLI:

    ген →mutant1→mutant2→mutant3→mutant4→mutant5→mutant6

    В данной модели на каждом этапе эволюции происходят только замены. Число замен на последовательных этапах равно:

      замен на 100 нуклеотидов замен на всю длину последовательности (1371 нуклеотидов)
    mut_1; mut_2 10 137
    mut_3 30 411
    mut_4 25 343
    mut_5; mut_6 50 686

    Для получения всех мутантных последовательностей в одном файле был написан следующий скрипт:

     
    msbar mine.fasta mut1.fasta -point 4 -count 137 -auto
    msbar mut1.fasta mut2.fasta -point 4 -count 137 -auto
    msbar mut2.fasta mut3.fasta -point 4 -count 411 -auto
    msbar mut3.fasta mut4.fasta -point 4 -count 343 -auto
    msbar mut4.fasta mut5.fasta -point 4 -count 686 -auto
    msbar mut5.fasta mut6.fasta -point 4 -count 686 -auto
    cat mine.fasta >> all.fasta
    cat mut1.fasta >> all.fasta
    cat mut2.fasta >> all.fasta
    cat mut3.fasta >> all.fasta
    cat mut4.fasta >> all.fasta
    cat mut5.fasta >> all.fasta
    cat mut6.fasta >> all.fasta
    
    , где параметр -point определяет тип изменения, в данной задаче это только замены (4).
    В результате был получен данный файл . Далее вся работа проводилась с ним.
  2. Программой distmat пакета EMBOSS были определены попарные эволюционные расстояния между всеми последовательностями (включая исходную). Значение параметра -nucmethod, равное 0 соответствует матрице попарных различий, а 1 - матрице попарных расстояний, вычисленных по формуле Джукса – Кантора . В общем виде команда выглядит так
    distmat -sequence "входящий файл" -outfile "исходящий файл" -nucmethod "метод оценки (0 или 1)"
  3. Полученные данные были обработаны в Excel.


    График, расположенный по диагонали, соответствует идеальному случаю. Чем грубее оценка. тем больше отходит ее график от идеала. Идеальная зависимость имеет линейный характер, следовательно справедливо предположить, что оценка корректна, пока график ее зависимости от истинных значений линеен. Сравнивая графики, можно сказать, что оценка методом попарных различий эффективна при небольшой количестве замен. Метод Джукса-Кантора работает при более широком диапозоне количеств замен.
    После 30 замен на 100 нуклеотидов отклонение оценки от истинного значения становится существенно, можно сделать вывод , что чем меньше количество замен на 100 нуклеотидов, тем точнее оценка

©Nechay Olesya 2005