На главную страницу
На главную страницу второго семестра

Программы выравнивания

Использованные последовательнности:
myprot.fasta   аминокислотная последовательность белка AROE_ECOLI
AROE_VIBCH.fasta последовательность белка AROE_VIBCH, гомолога AROE_ECOLI из другого организма
thirdprot.fasta искусственно созданная последовательность, склеенная из двух участков последовательности AROE_ECOLI

Выравнивание последовательностей со схожей функцией (возможных гомологов)

Построены два выравнивания: глобальное с помощью программы needle и локальное с помощью water Результат глобального выравнивания последовательностей из myprot.fasta и AROE_VIBCH.fasta представлен в 1to2.needle. Его вес 685.
Результат локального выравнивания тех же последовательностей представлен в 1to2.water. Его вес 685.
Оба выравнивания по сути одинаковые, но при локальном концевые куски с гэпами отрезаны. Также отрезаны по два остатка в конце последовательностей. Но веса этих двух замен в матрице BLOSUM62 равны 0. Позтому веса выравниваний равны.

Выравнивание последовательностей, содержащих общие участки

Использованы программы: needle (глобальное выравнивание), water и matcher (локальное). Выравнивались последовательности из myprot.fasta и thirdprot.fasta. Результаты представлены в файлах 1to3.needle, 1to3.water и 1to3.matcher соответственно.

Программа needle выдает верное выравнивание только первого участка искусственной последовательности (при параметрах: штраф за открытие гэпа 20, за продолжение 0,5). При других параметрах выравнивания другие, подробнее об этом – следующий раздел.
Процент идентичности очень мал (что вполне логично для последовательностей, одна из которых в несколько раз больше другой). Вес выравнивания (65,5), однако, оказался достаточно большим (для последовательности такой длины), так как needle при подсчете веса учитывает только значимую часть выравнивания (гэпы на концах отрезаются).
Програма water выводит одно локальное выравнивание с наибольшим весом(67,0). Это первый участок искусственной последовательности (он попросту оказался длиннее). Процент идентичности 100%.
matcher выводит несколько лучших выравниваний, в данном случае 3. Это два идеальных выравнивания обоих участков искусственной последовательности. К второму участку добавлены два остатка, так как близко расположена пара лейцин – изолейцин.
Третье выравнивание, скорее всего, случайное совпадение. Эти участки исходного белка слишком короткие (5 остатков) и расположены далеко друг от друга.

Параметры программ построения выравниваний

Построены несколько глобальных выравниваний с помощью программы needle при разных параметрах штрафа за гэпы.
Штраф за открытие гэпа
(Gap penalty)
Штраф за продолжение гэпа
(Extend penalty)
Файл результатов
10 1 1to3_10_1.needle
5 1 1to3_5_1.needle
1 1 1to3_1_1.needle
5 0,1 1to3_5_01.needle
В идеальном выравнивании длинный участок гэпов. Поэтому если сделать большим штраф за продолжение гэпа, то вес выравнивания окажется низким. При близких значениях штрафа за открытие и продолжение гэпа (например, 3 и 1) две подпоследовательности начинают дробиться, и эти участки плохо выравниваются.
Идеальное выравнивание получается при маленьком штрафе за продолжение гэпа. Оно приведено в файле 1to3_5_01.needle

Карта локального сходства

Для визуализации локальных выравниваний использована программа dotmatcher. При разных параметрах размера окна и минимального веса выравнивания получены разные карты локального сходства.
Так, оптимальная карта (есть все идеальные выравнивания и нет ничего лишнего) получена при размере окна 10 и пороге на суммарный вес 23
При уменьшении размера окна и порога на суммарный вес на карте появляется больше линий, соотвеиствующих выравниям с меньшим весом или более коротких.


©Семенюк Павел