Учебный сайт Титовой Анастасии
ГЛАВНАЯ СТРАНИЦА
СЕМЕСТРЫ
ОБО МНЕ
КОНТАКТЫ
САЙТ ФББ
Оптимальное парное выравнивание. Алгоритмы.

Сравнение параметров глобального и локального выравнивания пары гомологичных белков

В парном выравнивании различают глобальное и локальное выравнивание. В глобальное выравнивание включаются обе входные последовательности целиком. Локальное выравнивание применяется, если последовательности содержат как родственные (гомологичные), так и неродственные участки. Результатом локального выравнивания является выбор участка в каждой из последовательностей и выравнивание между этими участками. Для получения парного выравнивания используются разновидности метода динамического программирования: для глобального выравнивания — алгоритм Нидлмана — Вунша, для локального — алгоритм Смита — Ватермана.[1]
Для сравнения параметров глобального и локального выравнивания были взяты две последовательности белков из предыдущего практикума [2]:
  • DNAK_NATPD: Chaperone protein DnaK
  • HSP72_PARBA: Heat shock 70 kDa protein 2
Далее с помощью команд needle для глобального и water для локального выравниваний пакета EMBOSS эти последовательности были выравнены. Ниже вы можете увидеть изображения фрагментов, полученных выравниваний, а также таблицу, иллюстрирующую некоторые данные этих выравниваний.
Рис. 1. Фрагменты выравнивания, полученного с помощью команды needle
Рис. 2. Фрагменты выравнивания, полученного с помощью команды water
Некоторые различия:
  • в локальном выравнивании отутствуют остатки 1-6, 677-697 из глобального выравнивания;
  • в локальном выравнивании отсутствуют позиции с гэпами из глобального;
  • в остальном глобальное и локальное выравнивания совпадают.
Таблица 1. Параметры выравниваний
Вид выравниванияДлина выравниванияЧисло консервативных позиций%Количество функционально консервативных позиций %Гэпы (%)Число инделейScore
Глобальное69730944.3041158.9712.10171367.5
Локальное65630346.2040561.748.20141377.0
Параметры локального выравнивания негомологичных белков*
1-61102220.003531.8235.50536.0
2-620735.001050.0035.00129.0
3-6321031.251753.1312.50328.50
4-61603723.135735.6028.75948.5
5-613646.15861.5423.08126.0
В первой колонке таблицы числа означают номера последовательностей, выравненных попарно.
Основываясь на данных, приведенных выше, можно сделать некоторые выводы о различиях глобального и локального выравниваний:
  • Длина локального выравнивания меньше (иногда значительно, например, в случае выравнивания негомологичных последовательностей) длины глобального;
  • Вес локального выравнивания больше, чем вес глобального;
  • В локальном выравнивании намного меньше инделей (гэпов);
Таблица 2. Параметры выравниваний, используемые программой по умолчанию
Вид выравниванияМатрица весов Штраф за открытие инделяШтраф за удлинение инделя Штраф за концевые гэпыШтраф за удлинение концевых гэпов
ГлобальноеEBLOSUM6210.00.510.00.5
ЛокальноеEBLOSUM6210.00.5--

Сравнение параметров локального выравнивания пары гомологичных белков и пяти пар не гомологичных белков

Для данного задания были выбраны следующие белки[3]:
  • 1: Q8NTB8_CORGL [4]
  • 2: Q842J9_9BACI [5]
  • 3: TUS_ECOLI [6]
  • 4: PGKT_THEMA [7]
  • 5: Q54816_STRPE [8]
  • 6: Y1251_METJA - белок описанный мною ранее.
Далее с помощью команды water, они были попарно выравнены. Изображения, некоторых полученных выравниваний, вы можете видеть ниже. Также таблица 1 была дополнена параметрами локального выравнивания негомологичных белков.
Рис. 3. Локальное выравнивание негомологичных последовательностей 1-6
Рис. 4. Локальное выравнивание негомологичных последовательностей 2-6
Рис. 5. Локальное выравнивание негомологичных последовательностей 3-6
На основе изображений и данных, приведенных в таблице 1, можно сделать некоторые выводы о локальном выравнивании негомологичных последовательностей:
  • Длина выравнивания значительно меньше длины исходных последовательностей, засчет вырезания наиболее гомологичного участка;
  • В выравниваниях негомологичных последовательностей намного длиннее гэпы, чем в выравнивании гомологичных;
  • Вес выравниваний негомологичных последовательностей значительно меньше веса выравниваний гомологичных последовательностей ( конкретно в данном случае примерно в 20-30 раз );
  • Количество консервативных и функционально консервативных последовательностей в выравнивании негомологичных последовательностей очень мало;

Отличия между тремя выравнивания одних и тех же двух последовательностей, построенные разными программами

Далее три выравнивания, полученные разными программами, были объединены в новом окне JalView и выравнены вручную (удалены гэпы в множественном выравнивании в позициях 1-35 и 69-72, из-за чего само выравнивание не пострадало). Были задействованы следующие выравнивания:
  • Парное выравнивание, полученное из множественного[2] путем удаления всех последовательностей, кроме двух;
  • Глобальное выравнивание. Программа needle (EMBOSS), параметры по умолчанию;
  • Локальное выравнивание. Программа water (EMBOSS).
Ниже вы можете видеть изображение, иллюстрирующее эти три выравнивания. Ссылка на проект JalView.
Рис. 6. Выравнивания, построенные разными программами
Глядя на рис.5, можно заметить некоторые различия, например:
  • Метионин, находящийся в первых позициях в двух последовательностях гомологичен в глобальном выравнивании, но негомологичен во множественном;
  • Лизин в 78 позиции у HSP72_PARBA находится под аспарагиновой кислотой (DNAK_NATPD) в глобальном и локальном выравниваниях, но в множественном выравнивании на его месте находится гэп;
  • В множественном выравнивании в последовательности DNAK_NATPD находится гэп в позициях 81-103; а в локальном и глобальном гэп занимает позиции с 88-113, соответственно там гомологичными считаются другие остатки.

Выводы

На основе изображений и данных, приведенных в таблице 1, можно сделать некоторые выводы выравниваниях:
  • Глобальное и локальное выравнивания практически идентичны для гомологичных белков, за исключением негомологичных участков;
  • Для негомологичных последовательностей локальное выравнивание не подходит, из-за того, что в данном случае вырезается гомологичный участок с наибольшим весом выравнивания;
  • Глобальное вырвнивание и выравнивание, выполненное в JalView практически совпадают;
На мой взгляд, наиболее правдоподобным парным выравниванием является глобальное выравнивание. Очевидно, что локальное выравнивание имеет больший вес, и его хорошо использовать для поиска гомологичных участков. Однако в негомологичных последовательностях данный вид выравнивания абсолютно непоказателен. На практике, конечно, можно предположить, что исходные белки гомологичны, как в случае белков семейства HSP70 из предыдущего практикума, однако предположить, что два случайных белка гомологичны довольно трудно, поэтому, как мне кажется, в данном случае целесообразно использовать сначала локальное выравнивание для поиска гомологичных участков/доменов, а затем при хорошем результате - глобальное выравнивание.

Источники:

[1]: Википедия. Выравнивание последовательностей;
[3]: Uniprot
[4]-[8]: Учебные сайты студентов ФББ.

Titova Anastasiya, 2017 ©