Выравнивание последовательностей. Занятие 2.
№1. Подсчет веса выравнивания двух родственных последовательностей.
Используя короткие последовательности с предыдущего занятия, посчитаем вес выравнивания, опираясь на значения,
приведенные в матрице сходства BLOSUM62.
За открытие "прорехи" (gap) штраф составляет 12 баллов, за продолжение - 2 балла.
Это было сделано, чтобы минимизировать теоретическое количество мутаций, за которое достигается
переход одной последовательности в другую.
На мой взгляд, это задание легче всего выполнить в Excel, необходимая для отчета таблица формируется автоматически,
результат представлен в виде картинки.
Подсчитанная сумма понадобится для сравнения в следующем задании,
также для личного пользования приведу файл первоисточника,-
вдруг пригодится.
№2. Автоматическое выравнивания последовательностей с помошью stretcher пакета EMBOSS.
stretcher - это программа пакета EMBOSS, предназначенная для выравнивания двух последовательностей с помошью заданной матрицы сходства.
В данном задании используем два файла с последовательностями в fasta-формате, вводим в Linux команду:
stretcher shortseq1.fasta shortseq2.fasta output.stretcher ,
и в файле output.stretcher получаем выравнивание и его описание (картинка для простоты сравнения).
Что ж, мы не зря старались, совпадение 100%!
№3. Полное и частичное выравнивания последовательностей с помошью needle и water.
№1. Сперва выполним полное выравнивание белков с помощью needle.
и получим файл needle.needle с выравниванием и комментариями.
Алгоритм получения файла идентичен предыдущему пункту, разве что используются идентификаторы белков.
№2. После выполнения частичного выравнивания программой water я нескоько удивился, хотя такого результата следовало ожидать.
Дело в том, что в полученный уже привычным способом файл water.water с частичным выравниванием
оказался (за исключением шапки) идентичен предыдущему.
Это обусловлено тем, что полное вравнивание (needle) обошлось без использования "прорех" (gap).
Разумеется, то же сделало и частичное выравнивание (water), однако, все-таки мы же анализируем белки с процентом сходства 90.9%. Чего еще от них ждать!
В сухом остатке имеем:
- В частичное выравнивание вошел участок с 1-ых по 77-ые (последние) остатки.
- Выравнивания идентичны.
- Вес выравниваний совпадает, 310.0.
На этом примере мы можем увидеть, что локальное выравнивание всегда имеет большой вес, а значит, легко может оказаться "тяжелее" полного выравнивания
(достаточно добавить с краю один gap).
Однако может ли быть обратное? - Думаю, да.
Представим оптимальное глобальное выравнивание, состоящее из двух идентичных участков, разделенных некоторым
значительным промежутком, понижающим общий вес (например "прорехой").
В целом выравнивние имеет меньший вес, чем сумма двух частичных выравниваний,
Но ведь мы пользуемся программой water, а она дает только одно частичное выравнивание, следовательно, она отбросит один из
участков, дающих положительный вклад в суммарный вес, поэтому в данном случае вес частичного выравнивания может оказаться меньше.
№4*. Построение карты локального сходства с помощью программы dotmatcher пакета EMBOSS.
Dotmatcher - это программа с графическим выводом, позволяющая визуально оценить
сходство последовательностей.
В результате ее выполнения мы получаем файл dotmatcher.ps,
в котором лежит карта локального сходства двух последовательностей.
В данном случае эта карта не представляет высокой ценности с точки зрения образовательного процесса, так как,
по данным предыдущего задания, последовательности ACP_* практически идентичны.
Поэтому из научного интереса я решил построить карту локального сходства NDP kinase митохондрий человека и бактерии Francisella philomiragia,
что, в соответствии с симбиотической теорией происхождения митохондрий, и в следствии высокой консервативности белка было не лишено смысла.
Результат представлен в файле dotmatcher1.ps.
№5*. Получение субоптимальных локальных выравниваний с помощью программы matcher пакета EMBOSS.
Программа matcher способна создавать локальные выравнивания двух последовательностей, а также
меньшие по длине субоптимальные локальные выравнивания.
С помощью дополнительного параметра -alternatives , указывающего количество альтернативных выравниваний,
создадим три субоптимальные локальные выравнивания (-alternatives 3).
Тогда, как показано в файле, вес оптимального ловальног выравнивания
очень внушителен (и это при весьма скромном проценте идентичности), а вот трех последующих - довольно скромен:
всего 28 для 34 остатков
и 24 для 6 остатков, хотя, это очень даже неплохо.
В итоге мы видим, что более полное локальное выравнивание (первое) для белков с невысокой, но достаточной степенью сходства, оказывается
даже больше, чем сумма нескольких последующих субоптимальных, что врядли было бы возможно в совершенно неродственных белках.
Конечно, это лишь косвенный признак, но это уже хорошо.
назад в проекты.html
© Aleshin Vasily