Парные выравнивания белков. Применение алгоритмов парных выравниваний к белку MntR

Сравнение матриц аминокислотных замен

Существуют разные типы матриц аминокислотных замен. Самая известная матрица типа BLOSUM (BLOcks SUbstitution Matrix)) была разработана в 1992 году на основе базы данных BLOCKS, включающей в себя эталонные выравнивания, в основном, цитоплазматических белков. Существуют матрицы этого типа с разным порогом кластеризации (такая идентичность последовательностей, после которой последовательности считают за одну). BLOSUM62 - 62% идентичности. Для матрицы же типа PHAT были использованы данные о мембранных белках, что и объясняет различия с весах замен.
С использованием последних данных базы данных BLOCKS была построена еще одна матрица аиминокислотных замен. Сравнение весов замен пролина на другме аминокислоты в разных матрицах представлено на таблице 1.

С полученно матрицей можно ознакомиться здесь
Таблица 1 Вес замены пролина на другие аминокислоты в разных матрицах.


Как видно из таблицы, значения для полученной самостоятельно матрицы и для BLOSUM62 почти не отличаются между собой, что можно объяснить схожими исходными данными. Значения для замены пролина на самого себя совпали, а в матрице типа PHAT выше. Это может быть связано со свойствами самой аминокислоты пролина. Пролин часто находится в месте поворота цепи, то есть позиция его должна быть очень консервативна, что мы и видим по высокому весу замены. Еще более высокий вес для мембранных белков может быть обусловнен еще большей важностью поворота цепи в нужном месте. Так, например, трансмембранные белки, имеющие 7 трансмембранных доменов, очевидно будут очень консервативны по остаткам пролина.

Сравнение выравниваний, полученных для коротких мутантов вручную и построенных классическими алгоритмами Нидлмана-Вунша и Смита-Ватермана

Для парного выравнивания используются различные алгоритмы. Один из них это алгоритм Нидлмана-Вунша, реальруемый программой needle из пакета EMBOSS. А второй - алгоритм Смита-Ватермана, реализуемый командой water из пакета EMBOSS. Оба алгоритма предназначены для выравнивания последовательной, но алгоритм Нидлмана-Вунша реализует, так называемое, глобальное выравнивание, пытаясь выравнивать последовательности целиком. Алгоритм Смита-Ватермана реализует локальное выравнивание, то есть ищет наиболее идентичные участки последовательности. Оба алгоритма используют матрицу весов аминокислотных замен BLOSUM62, и штраф за первый гэп 10, и по 0,5 за каждый последующий гэп.
Работа велась с уже полученными ранее с помощью скрипта evolve_protein.pl тремя 20ти аминокислотными мутантными последовательностями. Результаты работы алгоритмов представлены ниже.

Мутант 1

Алгоритм Картинка Идентичность Сходство Вес выравнивания
Ручное 6,3% 9,8% 25
Нидлмана-Вунша 7% 7,7% 28
Смита-Ватермана 61,5% 61,5% 33

Мутант 2

Алгоритм Картинка Идентичность Сходство Вес выравнивания
Ручное 7,7% 10,5% 37
Нидлмана-Вунша 8,5% 10,6% 39
Смита-Ватермана 73,3% 86,7% 50

Мутант 3

Алгоритм Картинка Идентичность Сходство Вес выравнивания
Ручное 9,8% 12% 65
Нидлмана-Вунша 10,6% 12% 69,5
Смита-Ватермана 77.8% 88,9% 74

© Ходыкина Наталья,2012