Выравнивание последовательностей. Занятие 2.


№1. Подсчет веса выравнивания двух родственных последовательностей.


Используя короткие последовательности с предыдущего занятия, посчитаем вес выравнивания, опираясь на значения, приведенные в матрице сходства BLOSUM62. За открытие "прорехи" (gap) штраф составляет 12 баллов, за продолжение - 2 балла. Это было сделано, чтобы минимизировать теоретическое количество мутаций, за которое достигается переход одной последовательности в другую.

На мой взгляд, это задание легче всего выполнить в Excel, необходимая для отчета таблица формируется автоматически, результат представлен в виде картинки.

Fig.1

Подсчитанная сумма понадобится для сравнения в следующем задании, также для личного пользования приведу файл первоисточника,- вдруг пригодится.


№2. Автоматическое выравнивания последовательностей с помошью stretcher пакета EMBOSS.


stretcher - это программа пакета EMBOSS, предназначенная для выравнивания двух последовательностей с помошью заданной матрицы сходства.

В данном задании используем два файла с последовательностями в fasta-формате, вводим в Linux команду:
stretcher shortseq1.fasta shortseq2.fasta output.stretcher , и в файле output.stretcher получаем выравнивание и его описание (картинка для простоты сравнения).
Fig.2

Что ж, мы не зря старались, совпадение 100%!


№3. Полное и частичное выравнивания последовательностей с помошью needle и water.

№1. Сперва выполним полное выравнивание белков с помощью needle. и получим файл needle.needle с выравниванием и комментариями.
Алгоритм получения файла идентичен предыдущему пункту, разве что используются идентификаторы белков.

№2. После выполнения частичного выравнивания программой water я нескоько удивился, хотя такого результата следовало ожидать.
Дело в том, что в полученный уже привычным способом файл water.water с частичным выравниванием оказался (за исключением шапки) идентичен предыдущему.

Это обусловлено тем, что полное вравнивание (needle) обошлось без использования "прорех" (gap). Разумеется, то же сделало и частичное выравнивание (water), однако, все-таки мы же анализируем белки с процентом сходства 90.9%. Чего еще от них ждать!

В сухом остатке имеем:

На этом примере мы можем увидеть, что локальное выравнивание всегда имеет большой вес, а значит, легко может оказаться "тяжелее" полного выравнивания (достаточно добавить с краю один gap). Однако может ли быть обратное? - Думаю, да.

Представим оптимальное глобальное выравнивание, состоящее из двух идентичных участков, разделенных некоторым значительным промежутком, понижающим общий вес (например "прорехой").

В целом выравнивние имеет меньший вес, чем сумма двух частичных выравниваний, Но ведь мы пользуемся программой water, а она дает только одно частичное выравнивание, следовательно, она отбросит один из участков, дающих положительный вклад в суммарный вес, поэтому в данном случае вес частичного выравнивания может оказаться меньше.


№4*. Построение карты локального сходства с помощью программы dotmatcher пакета EMBOSS.

Dotmatcher - это программа с графическим выводом, позволяющая визуально оценить сходство последовательностей.
В результате ее выполнения мы получаем файл dotmatcher.ps, в котором лежит карта локального сходства двух последовательностей.

В данном случае эта карта не представляет высокой ценности с точки зрения образовательного процесса, так как, по данным предыдущего задания, последовательности ACP_* практически идентичны.

Поэтому из научного интереса я решил построить карту локального сходства NDP kinase митохондрий человека и бактерии Francisella philomiragia, что, в соответствии с симбиотической теорией происхождения митохондрий, и в следствии высокой консервативности белка было не лишено смысла.

Результат представлен в файле dotmatcher1.ps.


№5*. Получение субоптимальных локальных выравниваний с помощью программы matcher пакета EMBOSS.

Программа matcher способна создавать локальные выравнивания двух последовательностей, а также меньшие по длине субоптимальные локальные выравнивания.

С помощью дополнительного параметра -alternatives , указывающего количество альтернативных выравниваний, создадим три субоптимальные локальные выравнивания (-alternatives 3).

Тогда, как показано в файле, вес оптимального ловальног выравнивания очень внушителен (и это при весьма скромном проценте идентичности), а вот трех последующих - довольно скромен:

всего 28 для 34 остатков

Fig.2


и 24 для 6 остатков, хотя, это очень даже неплохо.

Fig.2


В итоге мы видим, что более полное локальное выравнивание (первое) для белков с невысокой, но достаточной степенью сходства, оказывается даже больше, чем сумма нескольких последующих субоптимальных, что врядли было бы возможно в совершенно неродственных белках.

Конечно, это лишь косвенный признак, но это уже хорошо.



назад в проекты.html


© Aleshin Vasily