На главную страницу
На главную страницу второго семестра
Программы выравнивания
Использованные последовательнности:
| myprot.fasta |
|
аминокислотная последовательность белка AROE_ECOLI |
| AROE_VIBCH.fasta |
|
последовательность белка AROE_VIBCH, гомолога AROE_ECOLI из другого организма |
| thirdprot.fasta |
|
искусственно созданная последовательность, склеенная из двух участков последовательности AROE_ECOLI |
Выравнивание последовательностей со схожей функцией (возможных гомологов)
Построены два выравнивания: глобальное с помощью программы needle и локальное с помощью water
Результат глобального выравнивания последовательностей из myprot.fasta
и AROE_VIBCH.fasta
представлен в 1to2.needle. Его вес 685.
Результат локального выравнивания тех же последовательностей представлен
в 1to2.water. Его вес 685.
Оба выравнивания по сути одинаковые, но при локальном концевые куски с гэпами отрезаны.
Также отрезаны по два остатка в конце последовательностей. Но веса этих двух замен в
матрице BLOSUM62 равны 0.
Позтому веса выравниваний равны.
Выравнивание последовательностей, содержащих общие участки
Использованы программы: needle (глобальное выравнивание), water и matcher (локальное).
Выравнивались последовательности из myprot.fasta
и thirdprot.fasta. Результаты представлены в файлах 1to3.needle,
1to3.water и 1to3.matcher
соответственно.
Программа needle выдает верное выравнивание только первого участка искусственной
последовательности (при параметрах: штраф за открытие гэпа 20, за продолжение 0,5).
При других параметрах выравнивания другие, подробнее об этом следующий раздел.
Процент идентичности очень мал (что вполне логично для последовательностей, одна из которых
в несколько раз больше другой). Вес выравнивания (65,5), однако, оказался достаточно большим
(для последовательности такой длины), так как needle при подсчете веса учитывает
только значимую часть выравнивания (гэпы на концах отрезаются).
Програма water выводит одно локальное выравнивание с наибольшим весом(67,0). Это
первый участок искусственной последовательности (он попросту оказался длиннее).
Процент идентичности 100%.
matcher выводит несколько лучших выравниваний, в данном случае 3.
Это два идеальных выравнивания обоих участков искусственной последовательности. К второму
участку добавлены два остатка, так как близко расположена пара лейцин изолейцин.
Третье выравнивание, скорее всего, случайное совпадение. Эти участки исходного белка слишком
короткие (5 остатков) и расположены далеко друг от друга.
Параметры программ построения выравниваний
Построены несколько глобальных выравниваний с помощью программы needle при разных
параметрах штрафа за гэпы.
В идеальном выравнивании длинный участок гэпов. Поэтому если сделать большим штраф за
продолжение гэпа, то вес выравнивания окажется низким. При близких значениях штрафа за открытие
и продолжение гэпа (например, 3 и 1) две подпоследовательности начинают дробиться, и
эти участки плохо выравниваются.
Идеальное выравнивание получается при маленьком штрафе за продолжение гэпа. Оно приведено
в файле 1to3_5_01.needle
Карта локального сходства
Для визуализации локальных выравниваний использована программа dotmatcher. При разных
параметрах размера окна и минимального веса выравнивания получены разные карты
локального сходства.
Так, оптимальная карта (есть все
идеальные выравнивания и нет ничего лишнего) получена при размере окна 10 и пороге на
суммарный вес 23
При уменьшении размера окна и порога на суммарный вес на карте появляется больше линий, соотвеиствующих
выравниям с меньшим весом или более коротких.
©Семенюк Павел