Программы построения глобального и локального выравнивания

Для выполнения заданий были созданы три файла: P37028.fasta, содержащий аминокислотную последовательность белка BTUF_ECOLI, Q7N842.fasta, содержащий посдеовательность белка BTUF_PHOLL (гомолог BTUF_ECOLI из Photorhabdus luminescens subsp. laumondii), и thirdprot.fasta, представляющий собой искусственную последовательность, "склеенную" из двух коротких отрезков последовательности BTUF_ECOLI. Все задания выполнялись с помощью программ needle, water, matcher и dotmatcher на сервере kodomo-count.cmm.msu.ru.

Выравнивание последовательностей со схожей функцией (возможных гомологов)

Вначале я построил глобальное выравнивание последовательностей BTUF_ECOLI и BTUF_PHOLL с помощью needle. Результат сохранён в файле 1to2.needle. Затем мною было построено их локальное выравнивание. Результат находится в файле 1to2.water. Несмотря на сходствах последовательностей (49,8% и 55,5% соответственно для needle и water), выравнивая кроме начала и конца последовательностей практически идентичны. Это понятно, т.к. наиболее функционально значимые, а следовательно, консервативные группы находятся вдали от концов последовательности, а на её периферии большую роль играют гэпы, water, которая их убирает, получает больший процент совпадений.

Выравнивание последовательностей, содержащих общие участки

В этом упражнении я построил глобальные и локальные выравнивания последовательностей P37028.fasta и thirdprot.fasta, сохранив их соответственно в файлах 1to3.needle и 1to3.water. Кроме того, для вывода трёх наилучших локальных выравниваний я воспользовался программой matcher, сохраник результат в файле 1to3.matcher. Последняя наглядно показывает самые консервативные участки в этих двух последовательностях; нетронутый модификацией участок она с успехом нашла, в общем же случае это, судя по всему, функциональные группв.

Параметры программ построения выравниваний

Теперь я поэкспериментировал с настройками алгоритма выравнивания. Построив три глобальных выравнивания P37028.fast и thirdprot.fasta, я получил три файла, как видно из таблицы.
Таблица 1 Параметры программы needle
Штраф за открытие гэпа Штраф за продолжение гэпа Файл результатов Процент идентичности Score
10 1 1to3_10_1.needle 24,4% 207,0
5 1 1to3_5_1.needle 24,4% 212,0
1 1 1to3_1_1.needle 19,3% 241,0
Первые два выравнивания практически идеальны и полностью совпадают, но в последнем случае из-за маленькой цены на открытие гэпа программа решила, что выгоднее будет сопоставить второй блок ближайшим одноимённым кислотам, и получила достаточно большой score с "неправильным" выравниванием.