Программы выравнивания

Цель задания - научиться пользоваться программами "needle", "water", "matcher" и "dotmatcher".

При выполнении задания использовались три файла с аминокислотными последовательностями в FASTA формате:
 myprot.fasta — аминокислотная последовательность моего белка;
 secondprot.fasta — последовательность гомолога моего белка (был выбран белок SYH_YERPE);
 thirdprot.fasta — искусственно созданная последовательность, склеенная из двух небольших (10 и 11 букв каждый) участков аминокислотной последовательности моего белка.

Задание 1: выравнивание последовательностей со схожей функцией (последовательности из myprot.fasta и secondprot.fasta): a) глобальное выравнивание последовательностей с помощью программы needle. Результат в файле 1to2.needle; б) локальное выравнивание последовательностей с помощью программы water. Результат в файле 1to2.water.

Вследствие того, что последовательности очень похожи, и при их выравнивании нет гэпов, обе программы показывают одинаковые результаты.

Задание 2: выравнивание последовательностей, содержащих общие участки (последовательности из myprot.fasta и thirdprot.fasta): a) глобальное выравнивание последовательностей с помощью программы needle. Результат в файле 1to3.needle; очень небольшое сходство выдаёт needle. Дело в том, что программа пропустила идентичный участок последовательности (первые 10 а.о. modSYH_ECOLI). По-видимому, из-за того, что суммарный штраф за продолжение гэпа был бы очень большим. б) локальное выравнивание последовательностей с помощью программы water. Результат в файле 1to3.water; программа выдаёт локальное выравнивание первых 10 а.о. modSYH_ECOLI и участка последовательности SYH_ECOLI. Если бы два склеенных участка в исходной последовательности отстояли бы недалеко друг от друга, то выравнивание было бы сделано по всей последовательности modSYH_ECOLI и значение Score было бы выше. в) локальное выравнивание последовательностей с помощью программы matcher с выводом трех наилучших вариантов. Результаты в файле 1to3.matcher. matcher выдаёт несколько выравниваний, два из которых с хорошими результатами, а третье — cлучайное.

Задание 3: построить глобальные выравнивания последовательностей из myprot.fasta и thirdprot.fasta с помощью программы needle при разных значениях параметра штрафа за открытие гэпа. Значение штрафа за продолжение гэпа принять равным 1.

Штраф за открытие гэпа

Штраф за продолжение гэпа

Файл результатов

10

1

1to3_10_1.needle

5

1

1to3_5_1.needle

1

1

1to3_1_1.needle

Лучшее выравнивание было при соотношении 10 к 0,5, хотя процент сходства был ниже. Процент сходства увеличивается при уменьшении штрафа за начало гэпа. Соответственно, качество выравнивания падало; второй кусок последовательности присоеденился к первому куску. Я нашёл отношение, которое дало мне правильное выравнивание с большим значением Score.

Задание 4: построить карту локального сходства последовательностей из myprot.fasta и thirdprot.fasta с помощью программы dotmatcher. Сравнить карты локального сходства, полученные при разном наборе параметров: размер окна, порог на суммарный вес. При выравнивании с высоким порогом программа не находит соответствий (файл dotmatcher4.ps), при выравнивании с низким и стандартным порогами - находит соответствия с последовательностями из середины (файлы dotmatcher.ps и dotmatcher1.ps). При увеличении окна - выравнивает большие куски. При снижении окна - выравнивает небольшие куски.

На главную страницу семестра


©Ларионов Дмитрий