Программы построения глобального и локального выравнивания


Для выполнения задания были подготовлены три файла с аминокислотными последовательностями в FASTA формате:

  1. P0A6F3.fasta - аминокислотная последовательность моего белка;
  2. Q9KLJ9.fasta - последовательность одного из белков, найденных мной при выполнении заданий 4 и 5 занятия 2;
  3. thirdprot.fasta - искусственно созданная последовательность, склеенная из двух небольших (10-12 букв каждый) участков аминокислотной последовательности моего белка.


Последующие действия выполнялись на сервере kodomo-count.cmm.msu.ru.

1. Выравнивание последовательностей со схожей функцией (возможных гомологов)

  1. Первым делом мы построили глобальное выравнивание последовательностей из P0A6F3.fasta и Q9KLJ9.fasta с помощью программы needle. Результат сохранили в файле 1to2.needle .
  2. Затем построили локальное выравнивание последовательностей из P0A6F3.fasta и Q9KLJ9.fasta с помощью программы water и сохранили результат в файле 1to2.water .

Результаты:

Общие параметры программ были заданы по умолчанию и мы видим, что они одинаковы. Мой белок и с белком GLPK_VIBCH имеет достаточно высокий процент сходства, поэтому различий между локальным и глобальным выравниванием не так много, но они все же есть: в локальном выравнивании выбран участок, который обладал максимальной гомологией, поэтому в выравнивании не было первой  аминокислоты и двух последних аминокислот GLPK_ECOLI. К тому же, веса выравниваний совпадают, и, мне кажется, это случайность. Смысл же глобального выравнивания заключается в том, что аминокислотные последовательности совмещаются на всём своём протяжении. Причём некоторые выравненные участки могут совсем не иметь сходства. При локальном выравнивании в двух последовательностях ищутся участки, которые обладают наибольшей гомологией, а затем эти участки совмещаются. Причём непохожие участки в этом случае не учитываются.

2. Выравнивание последовательностей, содержащих общие участки

1.      Аналогично предыдущему заданию построил глобальное выравнивание последовательностей из P0A6F3.fasta и thirdprot.fasta с помощью программы needle. Результат сохранили в файле 1to3.needle, затем построили локальное выравнивание последовательностей из P0A6F3.fasta и thirdprot.fasta с помощью программы water и сохранили результат в файле 1to3.water.

2.      Построил локальное выравнивание последовательностей из P0A6F3.fasta и thirdprot.fasta с помощью программы matcher с выводом трех наилучших вариантов. Результат сохраните в файле 1to3.matcher.

Результаты:

Получил различные варианты построения выравнивания, при глобальном выравнивании машина нашла оба кусочка последовательности в последовательности моего белка, и общий счет составил 72.5 При выравнивании с помощью программы matcher мы получили три наилучших локальных выравнивания: первое и второе из них совпадало с локальным выравниванием через программу water и needle соответственно. Третье выравнивание представляло случайное совпадение.

3. Параметры программ построения выравниваний

В этом задании было построены глобальные выравнивания последовательностей из P0A6F3.fasta и thirdprot.fasta с помощью программы needle при разных значениях параметра штрафа за открытие гэпа. Значение штрафа за продолжение гэпа установите равным 1. Полученные результаты находятся ниже.
Результаты:

Параметрами штрафа за открытие гэпа были выбраны числа 10, 5, 1, а за продолжение 1.

В первом случае (1to3_10_1.needle) , общий счет выравнивания составил 60.
Во втором случае (1to3_5_1.needle), общий счет выравнивания составил 63.
В третьем случае (1to3_1_1.needle), общий счет выравнивания составил 80

Полученные выравнивания сильно зависят от штрафа гэпа: от этого их общий счет меняется, если штраф меньше, счет больше. И больше сходство.

4. Карта локального сходства

Построил карту локального сходства последовательностей из P0A6F3.fasta и thirdprot.fasta с помощью программы dotmatcher, построения проводились при различных параметрах: размер окна, порог на суммарный вес. Результаты занесены в таблицу:

Размер окна

Порог на суммарный вес

Результаты

10

23

Первая карта была построена при стандартных условиях, в результате мы получили выравнивание последовательности, чтобы ее вес был не менее 23, а размер окна 10, то есть программа выравнивание проводилось по участкам в 10 аминокислот. Так же можно глядя на карту сказать, где расположены совпадающие последовательности.

Результат можно увидеть здесь dotmatcher.ps

3

23

В результате ничего не получили, по-видимому, программа искала таким образом, чтобы порог счета за выравнивание по трем аминокислотам составлял не менее 23, а такого не могло быть, так как за суммарное совпадение давали меньше, для проверки этого предположения следует провести поиск с меньшим значением порога.

3

15

При данном значении порога программа вновь показывает выравнивание, поэтому сделанное предположение, по-видимому, верно, то есть мы видим участки аминокислотных последовательностей, которые совпадают по тройкам, при которых значение Score для каждой тройки больше 15.

22

23

В данном случае мы сделали размер окна 22 и искали по последовательности такие участки, где счет более 23, программа выдала нам 2 участка по 22 аминокислоты, при этом мы знаем, что в этих участках всего по 11 совпадающих аминокислот, но так как размер окна 22, то нам и показывают весь участок в 22 аминокислоты.

23

23

Мы зашли за порог окна на экране, но программа продолжает показывать линии.

29

23

Это значение, начиная с которого программа выдает непонятную картину, не относящуюся к делу.

11

50

Данные значения выбраны не случайно, 11 - число аминокислот полностью совпадающих, при этом мы видим два выравнивания.

11

59

Дело в том, что выравнивание проводилось таким образом, что в одной части аминокислот совпадающих и близких больше чем в другой, поэтому на картине мы и видим лишь одну линию, соответствующую второму участку выравнивания.

 


На главную страницу второго семестра

На главную


© Кузеванов Алексей,2005