Практикум 11. Алгоритмы выравнивания. Программы

В практикуме изучались два алгорима выравнивания последовательностей: локального (water) и глобального (needle) выравниваний.

Сравнение алгоритмов выравнивания

Для сравнения двух алгоритмов выравнивания была составлена таблица в Excel, в которой приведены данные о выравниваниях гомологичных и негомологичных последовательностей белков двумя программами.

Было подобрано по 5 пар гомологичных и негомологичных белков. Один белок брался из протеома E. coli (*_ECOLI), второй - из протеома изучаемой бактерии D. dadantii(*_DICD3).

Для каждого выравнивания были оценены сумма баллов (), идентичность и схожесть последовательностей, количество гэпов () и количество инделей. Для локального выравнивания были оценены длины выравненных отрезков по стравнению с длинами целых последовательностей.

Оказалось, что для выравнивания гомологичных белков верно следующее: высокая сумма баллов (по отношению к длинам белков), идентичность и схожесть более 60% (часто больше 90%), небольшое процентное содержание гэпов в выравнивании и близкие к 100% выравненные программой water отрезки. Для негомологичных белков эти требования не выполняются.

Почти всегда отличаются результаты глобального и локального выравниваний: длина глобального обычно больше, потому что выравниваются последовательности целиком, тогда как при локальном выравнивании берутся наиболее схожие отрезки последовательностей. По этой же причине идентичность и схожесть в локальном выравнивании выше, чем в глобальном; число гэпов, соответственно, тоже меньше в локальном выравнивании.

Результаты представлены в файле pr11-table1.xlsx.

Множественное выравнивание

Было проведено множественное выравнивание вариантов распространённого белка ДНК-зависимой РНК-синтетазы (вторая цепь), встречающихся у многих организмов. Для выравнивания брались белки:одного штамма вируса свиного гриппа (African swine fever virus), клеточного слизевика диктиостелиума (Dictyostelium discoideum), домашней мыши (Mus musculus), дрозофилы (Drosophila melanogaster) и нематоды (Caenorhabditis elegans). При эмпирическом анализе выравнивания оказалось, что соотношения гомологичности между последовательностями согласуются с данными молекулярной филогенетики об эволюционных отношениях организмов. Наименее гомологичны между собой белки вируса свиного гриппа и дрозофилы. Для этих двух белков были проведены дополнительные выравнивания с помощью программ выравнивания water и needle.

Оказалось, что выравнивание программой Jalview наиболее сходно с выравниванием программой needle (глобальное выравнивание). Однако в целом многие отрезки выравнивания Jalview отличаются от тех же отрезков у двух других программ (В первой строке - отрезки выравнивания Jalview, во второй - needle).

jalview_al_1.png    jalview_al_2.png

needle_al_1.png    needle_al_2.png

На примере в 1 столбце видно, что алгоритм Jalview выводит выравнивание, в котором гораздо меньше протяжённых инделей. При линейных штрафах за гэпы это более удачное выравнивание. Также в этом выравнивании есть более протяженные участки из хотя бы функционально консервативных столбцов.

На примере в столбце 2 тоже прослеживается предпочтительное наличие в выравнивании Jalview коротких участков гэпов, а не длинных, как в выравнивании needle. При всем этом небольшие блоки функциональной консервативности одинаковы в обоих выравнивыниях.

Выравнивания (множественное, двух белко в программах needle и water) представлены в прикреплённых файлах.

Множ. выравниваниеВыравнивание needleВыравнивание water

Сравнение needle и waterНАЗАД