Парные выравнивания белков. Применение алгоритмов парных выравниваний к белку MntR
Сравнение матриц аминокислотных замен
Существуют разные типы матриц аминокислотных замен. Самая известная матрица типа BLOSUM (BLOcks SUbstitution Matrix)) была разработана в 1992 году на основе базы данных BLOCKS, включающей в себя эталонные выравнивания, в основном, цитоплазматических белков.
Существуют матрицы этого типа с разным порогом кластеризации (такая идентичность последовательностей, после которой последовательности считают за одну).
BLOSUM62 - 62% идентичности. Для матрицы же типа PHAT были использованы данные о мембранных белках, что и объясняет различия с весах замен.
С использованием последних данных базы данных BLOCKS была построена еще одна матрица аиминокислотных замен. Сравнение весов замен пролина на другме аминокислоты в разных матрицах представлено на таблице 1.
С полученно матрицей можно ознакомиться здесь
Таблица 1 Вес замены пролина на другие аминокислоты в разных матрицах.
Как видно из таблицы, значения для полученной самостоятельно матрицы и для BLOSUM62 почти не отличаются между собой, что можно объяснить схожими исходными данными.
Значения для замены пролина на самого себя совпали, а в матрице типа PHAT выше. Это может быть связано со свойствами самой аминокислоты пролина. Пролин часто
находится в месте поворота цепи, то есть позиция его должна быть очень консервативна, что мы и видим по высокому весу замены. Еще более высокий вес для
мембранных белков может быть обусловнен еще большей важностью поворота цепи в нужном месте. Так, например, трансмембранные белки, имеющие 7 трансмембранных доменов, очевидно будут очень консервативны по остаткам пролина.
Сравнение выравниваний, полученных для коротких мутантов вручную и построенных классическими алгоритмами Нидлмана-Вунша и Смита-Ватермана
Для парного выравнивания используются различные алгоритмы. Один из них это алгоритм Нидлмана-Вунша, реальруемый программой needle из пакета
EMBOSS. А второй - алгоритм Смита-Ватермана, реализуемый командой water из пакета EMBOSS. Оба алгоритма предназначены для выравнивания последовательной, но алгоритм Нидлмана-Вунша реализует, так называемое, глобальное выравнивание, пытаясь выравнивать последовательности целиком.
Алгоритм Смита-Ватермана реализует локальное выравнивание, то есть ищет наиболее идентичные участки последовательности.
Оба алгоритма используют матрицу весов аминокислотных замен BLOSUM62, и штраф за первый гэп 10, и по 0,5 за каждый последующий гэп.
Работа велась с уже полученными ранее с помощью скрипта evolve_protein.pl тремя 20ти аминокислотными мутантными последовательностями. Результаты работы алгоритмов представлены ниже.
Мутант 1
Алгоритм |
Картинка |
Идентичность |
Сходство |
Вес выравнивания |
Ручное |
|
6,3% |
9,8% |
25 |
Нидлмана-Вунша |
|
7% |
7,7% |
28 |
Смита-Ватермана |
|
61,5% |
61,5% |
33 |
Мутант 2
Алгоритм |
Картинка |
Идентичность |
Сходство |
Вес выравнивания |
Ручное |
|
7,7% |
10,5% |
37 |
Нидлмана-Вунша |
|
8,5% |
10,6% |
39 |
Смита-Ватермана |
|
73,3% |
86,7% |
50 |
Мутант 3
Алгоритм |
Картинка |
Идентичность |
Сходство |
Вес выравнивания |
Ручное |
|
9,8% |
12% |
65 |
Нидлмана-Вунша |
|
10,6% |
12% |
69,5 |
Смита-Ватермана |
|
77.8% |
88,9% |
74 |