Программы построения глобального и локального выравнивания
Для выполнения заданий были созданы три файла:
P37028.fasta, содержащий аминокислотную последовательность белка BTUF_ECOLI,
Q7N842.fasta, содержащий посдеовательность белка BTUF_PHOLL (гомолог BTUF_ECOLI из Photorhabdus luminescens subsp. laumondii), и
thirdprot.fasta, представляющий собой искусственную последовательность, "склеенную" из двух коротких отрезков последовательности BTUF_ECOLI. Все задания выполнялись с помощью программ needle, water, matcher и dotmatcher на сервере
kodomo-count.cmm.msu.ru.
Выравнивание последовательностей со схожей функцией (возможных гомологов)
Вначале я построил глобальное выравнивание последовательностей BTUF_ECOLI и BTUF_PHOLL с помощью needle. Результат сохранён в файле
1to2.needle.
Затем мною было построено их локальное выравнивание. Результат находится в файле
1to2.water.
Несмотря на сходствах последовательностей (49,8% и 55,5% соответственно для needle и water), выравнивая кроме начала и конца последовательностей практически идентичны. Это понятно, т.к. наиболее функционально значимые, а следовательно, консервативные группы находятся вдали от концов последовательности, а на её периферии большую роль играют гэпы, water, которая их убирает, получает больший процент совпадений.
Выравнивание последовательностей, содержащих общие участки
В этом упражнении я построил глобальные и локальные выравнивания последовательностей P37028.fasta и thirdprot.fasta, сохранив их соответственно в файлах
1to3.needle и
1to3.water. Кроме того, для вывода трёх наилучших локальных выравниваний я воспользовался программой matcher, сохраник результат в файле
1to3.matcher.
Последняя наглядно показывает самые консервативные участки в этих двух последовательностях; нетронутый модификацией участок она с успехом нашла, в общем же случае это, судя по всему, функциональные группв.
Параметры программ построения выравниваний
Теперь я поэкспериментировал с настройками алгоритма выравнивания. Построив три глобальных выравнивания P37028.fast и thirdprot.fasta, я получил три файла, как видно из таблицы.
Таблица 1 Параметры программы needle
Первые два выравнивания практически идеальны и полностью совпадают, но в последнем случае из-за маленькой цены на открытие гэпа программа решила, что выгоднее будет сопоставить второй блок ближайшим одноимённым кислотам, и получила достаточно большой score с "неправильным" выравниванием.