Сравнение параметров глобального и локального выравнивания пары гомологичных белков
В парном выравнивании различают глобальное и локальное выравнивание. В глобальное выравнивание включаются обе входные
последовательности целиком. Локальное выравнивание применяется, если последовательности содержат как родственные (гомологичные), так и
неродственные участки. Результатом локального выравнивания является выбор участка в каждой из последовательностей и выравнивание между
этими участками.
Для получения парного выравнивания используются разновидности метода динамического программирования: для глобального выравнивания — алгоритм
Нидлмана — Вунша, для локального — алгоритм Смита — Ватермана. [1]
Для сравнения параметров глобального и локального выравнивания были взяты две последовательности белков из предыдущего практикума
[2]:
- DNAK_NATPD: Chaperone protein DnaK
- HSP72_PARBA: Heat shock 70 kDa protein 2
Далее с помощью команд needle для глобального и water для локального выравниваний пакета EMBOSS эти последовательности были выравнены.
Ниже вы можете увидеть изображения фрагментов, полученных выравниваний, а также таблицу, иллюстрирующую некоторые данные этих выравниваний.
| |
Рис. 1. Фрагменты выравнивания, полученного с помощью команды needle |
| |
Рис. 2. Фрагменты выравнивания, полученного с помощью команды water |
Некоторые различия:
- в локальном выравнивании отутствуют остатки 1-6, 677-697 из глобального выравнивания;
- в локальном выравнивании отсутствуют позиции с гэпами из глобального;
- в остальном глобальное и локальное выравнивания совпадают.
Таблица 1. Параметры выравниваний |
Вид выравнивания | Длина выравнивания | Число консервативных позиций | % | Количество функционально консервативных позиций |
% | Гэпы (%) | Число инделей | Score |
Глобальное | 697 | 309 | 44.30 | 411 | 58.97 | 12.10 | 17 | 1367.5 |
Локальное | 656 | 303 | 46.20 | 405 | 61.74 | 8.20 | 14 | 1377.0 |
Параметры локального выравнивания негомологичных белков* |
1-6 | 110 | 22 | 20.00 | 35 | 31.82 | 35.50 | 5 | 36.0 |
2-6 | 20 | 7 | 35.00 | 10 | 50.00 | 35.00 | 1 | 29.0 |
3-6 | 32 | 10 | 31.25 | 17 | 53.13 | 12.50 | 3 | 28.50 |
4-6 | 160 | 37 | 23.13 | 57 | 35.60 | 28.75 | 9 | 48.5 |
5-6 | 13 | 6 | 46.15 | 8 | 61.54 | 23.08 | 1 | 26.0 |
В первой колонке таблицы числа означают номера последовательностей, выравненных попарно. |
Основываясь на данных, приведенных выше, можно сделать некоторые выводы о различиях глобального и локального выравниваний:
- Длина локального выравнивания меньше (иногда значительно, например, в случае выравнивания негомологичных последовательностей) длины глобального;
- Вес локального выравнивания больше, чем вес глобального;
- В локальном выравнивании намного меньше инделей (гэпов);
Таблица 2. Параметры выравниваний, используемые программой по умолчанию |
Вид выравнивания | Матрица весов |
Штраф за открытие инделя | Штраф за удлинение инделя |
Штраф за концевые гэпы | Штраф за удлинение концевых гэпов |
Глобальное | EBLOSUM62 | 10.0 | 0.5 | 10.0 | 0.5 |
Локальное | EBLOSUM62 | 10.0 | 0.5 | - | - |
Сравнение параметров локального выравнивания пары гомологичных белков и пяти пар не гомологичных белков
Для данного задания были выбраны следующие белки [3]:
- 6: Y1251_METJA - белок описанный мною ранее.
Далее с помощью команды water, они были попарно выравнены. Изображения, некоторых полученных выравниваний, вы можете видеть ниже. Также таблица
1 была дополнена параметрами локального выравнивания негомологичных белков.
|
Рис. 3. Локальное выравнивание негомологичных последовательностей 1-6 |
|
Рис. 4. Локальное выравнивание негомологичных последовательностей 2-6 |
|
Рис. 5. Локальное выравнивание негомологичных последовательностей 3-6 |
На основе изображений и данных, приведенных в таблице 1, можно сделать некоторые выводы о локальном выравнивании негомологичных последовательностей:
- Длина выравнивания значительно меньше длины исходных последовательностей, засчет вырезания наиболее гомологичного участка;
- В выравниваниях негомологичных последовательностей намного длиннее гэпы, чем в выравнивании гомологичных;
- Вес выравниваний негомологичных последовательностей значительно меньше веса выравниваний гомологичных последовательностей ( конкретно
в данном случае примерно в 20-30 раз );
- Количество консервативных и функционально консервативных последовательностей в выравнивании негомологичных последовательностей очень мало;
Отличия между тремя выравнивания одних и тех же двух последовательностей, построенные разными программами
Далее три выравнивания, полученные разными программами, были объединены в новом окне JalView и выравнены вручную (удалены гэпы в множественном
выравнивании в позициях 1-35 и 69-72, из-за чего само выравнивание не пострадало). Были задействованы следующие выравнивания:
- Парное выравнивание, полученное из множественного[2]
путем удаления всех последовательностей, кроме двух;
- Глобальное выравнивание. Программа needle (EMBOSS), параметры по умолчанию;
- Локальное выравнивание. Программа water (EMBOSS).
Ниже вы можете видеть изображение, иллюстрирующее эти три выравнивания.
Ссылка на проект JalView.
|
Рис. 6. Выравнивания, построенные разными программами |
Глядя на рис.5, можно заметить некоторые различия, например:
- Метионин, находящийся в первых позициях в двух последовательностях гомологичен в глобальном выравнивании, но негомологичен во множественном;
- Лизин в 78 позиции у HSP72_PARBA находится под аспарагиновой кислотой (DNAK_NATPD) в глобальном и локальном выравниваниях, но в множественном
выравнивании на его месте находится гэп;
- В множественном выравнивании в последовательности DNAK_NATPD находится гэп в позициях 81-103; а в локальном и глобальном гэп занимает
позиции с 88-113, соответственно там гомологичными считаются другие остатки.
Выводы
На основе изображений и данных, приведенных в таблице 1, можно сделать некоторые выводы выравниваниях:
- Глобальное и локальное выравнивания практически идентичны для гомологичных белков, за исключением негомологичных участков;
- Для негомологичных последовательностей локальное выравнивание не подходит, из-за того, что в данном случае вырезается гомологичный
участок с наибольшим весом выравнивания;
- Глобальное вырвнивание и выравнивание, выполненное в JalView практически совпадают;
На мой взгляд, наиболее правдоподобным парным выравниванием является глобальное выравнивание. Очевидно, что локальное выравнивание имеет больший вес, и
его хорошо использовать для поиска гомологичных участков. Однако в негомологичных последовательностях данный вид выравнивания абсолютно непоказателен.
На практике, конечно, можно предположить, что исходные белки гомологичны, как в случае белков семейства HSP70 из предыдущего практикума,
однако предположить, что два случайных белка гомологичны довольно трудно, поэтому, как мне кажется, в данном случае целесообразно
использовать сначала локальное выравнивание для поиска гомологичных участков/доменов, а затем при хорошем результате - глобальное выравнивание.
Источники:
[1]: Википедия. Выравнивание последовательностей;
[3]: Uniprot
[4]-[8]: Учебные сайты студентов ФББ.
|