Главная страница Обучение Обо мне Ссылки

Предсказание парных выравниваний

Отчет о данном практикуме можно посмотреть в виде JalView-проекта здесь . Окна 2_i - 2_viii соответствуют пунктам задания:

  • 2_i - исходное множественное выравнивание
  • 2_ii - выравнивание, в котором удалены все последовательности, кроме двух самых далеких друг другу
  • 2_iii - глобальное выравнивание, построенное программой needle
  • 2_iv - локальное выравнивание, построенное программой water
  • 2_v - глобальное парное выравнивание, построенное программой needle со штрафом за открытие гэпов 6.0, а не 10.0
  • 2_vi - локальное парное выравнивание, построенное программой water со штрафом за открытие гэпа 2.0 и за его продолжение 0.1 вместо стандартных 10.0 и 0.5
  • 2_vii - глобальное парное выравнивание двух заведомо негомогичных белков, построенное программой needle
  • 2_viii - локальное парное выравнивание этих же белков, построенное программой water

Несколько комментариев по вышеизложенному: во-первых, две последовательности для парного выравнивания были выбраны по опции Remove Redundancy, так как мне не удалось точно выбрать две наименее родственные последовательности по методу главных компонент. Это оказались последовательности LISML и LACLK, которые, однако, по дереву, построенному в Jalview, довольно близки.

Во-вторых, при снижении штрафа за открытие гэпа в построении глобального выравнивания в нем, как и ожидалось, получилось больше гэпов, чем со страндартным штрафом (рис. 1). Выровнялась еще одна колонка - глутаминовая кислота в 4 позиции.

Рис. 1. Фрагменты глобального парного выравнивания, построенного программой needle: верхний - со стандартными параметрами, нижний - с пониженным штрафом за открытие гэпа.

Для того, чтобы добиться изменений в локальном выравнивании (программа water), пришлось сильно понизить штраф за открытие гэпа, а также штраф за его продолжение. При изменении только штрафа за продолжение гэпа выравнивание не менялось. Как можно увидеть на рис.2, уменьшение штрафов позволило удлинить выравнивание на 3 позиции в начале. Впрочем, в глобальном выравнивании изменения были ровно такие же (по сути, в обоих случаях была добавлена еще одна выровненная колонка), то есть на выравнивание не влияет снижение штрафа за продолжение гэпа (что говорит о том, что выравнивание "хорошее").

Рис. 2. Фрагменты локального парного выравнивания, построенного программой water: слева - со стандартными параметрами, справа - с пониженными штрафами за открытие и продолжение гэпа.

Для выравнивания негомологичных белков были выбраны мой белок антранилат-фосфорибозилтрансфераза (YP_005259411) и белок 2-дегидро-3деоксифосфооктонатальдолаза (YP_001041787). Я решила, что это достаточно далекие друг от друга белки для данной задачи, так как первый белок принадлежит археям, а второй - бактериям, и потом, они принимают участие в разных частях метаболизма. По глобальному выравниванию (см. jar-файл) видно, что довольно хорошо выровненные позиции получаются за счет создания длинных гэпов.

Задание 7. Jalview-проект.

1. Сравнение глобального выравнивания (needle) и выравнивания, полученного из множественного. В Jalview-проекте вкладка 7_1.

Получился только один участок различия с координатами 48-49 позиции. Остальные колонки двух выравниваний одинаковы. Таким образом, различающихся колонок всего 2. Участки рядом с участком различия представлены на рис.3.

Рис. 3. Фрагмент сравнения глобального выравнивания (2 верхние строки) и выравнивания, полученного из множественного (2 нижние строки). Красным выделен участок различия (48-49 позиции). С обеих сторон от них стобцы, в которых нет различий (по 5): 43-47 позиции слева и 50-54 справа.

2. Сравнение локального выравнивания (water) и выравнивания, полученного из множественного. В Jalview-проекте вкладка 7_2.

Нужно было добавить 4 гэпа в начале локального выравнивания для того, чтобы привести его к виду выравнивания, полученного из множественного. В итоге получилось выравнивание такое же, как в предыдущем пункте (с глобальным), только добавился участок 1-4 позиции, в котором в локальном выравнивании вставлены гэпы, а также участок в конце, который не вошел в глобальное.

Рис. 4. Фрагмент сравнения локального выравнивания (2 верхние строки) и выравнивания, полученного из множественного (2 нижние строки). Красным выделен участок различия (4 первых позиции). Справа есть столбцы, в которых различий нет: первые 5 столбцов - с 5 по 9.

Различающихся колонок в этом выравнивании 9.

Комментарии и выводы о парных выравниваниях

Для анализа парных выравниваний с разными параметрами и разной гомологичностью последовательностей полученные c помощью программы infoalign данные по выравниваниям, построенным в предыдущих заданиях, были сведены в Таблицу 1.

Таблица 1. Данные по парным выравниваниям

По этим данным можно сделать следующие выводы:

  • Изначально были взяты очень близкородственные последовательности. Из-за этого, как уже было сказано выше, при несильном изменении параметров для программ парного выравнивания, таких как штраф за открытие гэпа и за его продолжение, выравнивание практически не менялось. Лишь при существенных изменениях в выравнивания добавлялись новые гэпы.
  • Тем не менее, по небольшой, но устойчивой разнице в процентах можно сказать, что локальное парное выравнивание дает более высокие показатели числа сходных и идентичных колонок, то есть оно лучше. Конкретно в этом случае увеличение консервативности достигается за счет отрезания участка, состоящего из первых 4 позиций, который не консервативны, так как в остальном выравнивания глобальные и локальные (со стандартными параметрами), а так же выравнивание, полученное из множественного, получились одинаковыми.
  • Увеличение процента сходных и идентичных позиций в парных выравниваниях с измененными параметрами объясняется тем, что я снизила штрафы за гэпы, тем самым позволив вставлять большее их количество в выравнивание, тем самым создавая новые консервативные колонки.
  • Сравнить выравнивание, полученное из множественного, с выравниваниями, построенными программой, тоже довольно сложно (на основе полученных данных).
  • В целом можно сказать, что в разных ситуациях может быть удобнее разный тип выравнивания. Если нужно найти какие-то схожие блоки в двух последовательностях, которые, предположительно, будут одинаковы по функциям, то будет удобнее использовать выравнивание, построенное по алгоритму Смита-Ватермана, потому что оно будет находить такие участки. Для получения общей картины выравнивания двух последовательностей удобнее использовать глобальное выравнивание, оно даст больше информации о возможном родстве белков, об их схожести. Выравнивание, полученное из множественного, будет полезно, если мы знаем, каким было множественное. Во множественном точнее будут выбраны консервативные позиции, входящие в вертикальные блоки, поэтому и в парном консервативные позииции будут достовернее.
  • Можно сравнить выравнивание гомологичных и негомологичных последовательностей: у последний процент идентичных и сходных колонок примерно в 2 раза меньше, чем у гомологов. Естественно, у локального выравнивания негомологичных белков процент идентичных и сходных колонок гораздо выше, чем в глобальном, так как не учитываются малоидентичные участки.

    На страницу второго семестра

  • © Alexandra Boyko, 2014. Faculty of Bioengineering and Bioinformatics, MSU.