Применения алгоритмов парных выравниваний к белку TENI_BACSU
Отредактировано 12/05/13
1. Сравнение матриц аминокислотных замен Матрицы аминокислотных замен – это таблицы, в которых указаны вероятности замены для каждой пары аминокислоты. Число положительно, если замена может произойти, и отрицательно, если замена невозможна. Матрица основана на встречаемости конкретной аминокислоты базе данных аминокислотных последовательностей. Для построения BLOSUM62 используется база данных BLOCKS. Цифра 62 – это порог кластеризации (процент сходства, выше которого последовательности считаются идентичными и объединяются в один кластер). Кластеры учитывают при построении матриц, чтобы правильно определить вероятность. Матрицы BLOSUM применимы в основном к цитоплазматическим белкам. К мембранным белкам применяют другие матрицы - PHAT. Использование различных матриц обосновано особенностями мембранных и цитоплазматических белков. Таблица 1
Значения классической и реконструированной матриц BLOSUM62 отличаются, потому что для ручного построения матрицы использовалась более новая версия BLOCKS. Однако, построены они по одному алгоритму, что объясняет незначительность отличий. Значения матрицы PHAT отличается от значений матрицы BLOSUM из-за применения их к различным белкам (мембранным и цитоплазматическим соответственно). Замена Asp на саму себя оценивается большим весом (12) в PHAT и меньшим весом в BLOSUM (6). Это значит, что замена аспарагиновой кислоты на саму себя в мембранных белках происходит чаще в примерно 6 раз, чем в цитоплазматических. Скорее всего, это связано с небольшой изменчивостью последовательностей мембранных белков в процессе эволюции. Glu – аминокислота, близкая по химическим свойствам аспарагиновой кислоте. У цитоплазматических белков (матрица BLOSUM) вероятность замены Asp на Glu мала (равна 2). А вот в мембранных белках такая замена происходит чаще, о чем свидетельствует значение 6 в матрице PHAT. Наиболее «неудачные» замены – замены Asp на аминокислоты из других функциональных групп. Они характеризуются наибольшими по модулю и отрицательными по знаку значениями в матрицах. Для мембранных белков самой «неудачной» является замена на триптофан, цистеин и аргинин (значение в PHAT: -7). Объяснить это можно наличием у этих аминокислот неполярных (гидрофобного) радикалов, в то время, как Asp имеет полярный отрицательно заряженный радикал. Очевидно, что замена Asp на Trp, Arg или Cys приведет к сильным (и вряд ли желаемым) изменениям в данной позиции последовательности. Для цитоплазматических белков самой «неудачной» является замена на цистеин, лейцин, изолейцин, валин, метионин и фенилаланин, потому что они тоже имеют гидрофобные радикалы. Сравнение выравниваний, полученных для коротких мутантов вручную и построенных классическими алгоритмами Нидлмана-Вунша и Смита-Ватермана Программа needle из пакета EMBOSS позволяет строить оптимальное глобальное выравнивание при стандартных параметрах (их значения указаны в скобках):
Программа работает по алгоритму Нидлмана-Вунша, пытаясь выровнять полноразмерные последовательности. Water – еще одна программа из пакета EMBOSS, которая строит локальные оптимальные выравнивания. Ее стандартные параметры аналогичны таковым у программы needle. В основе работы Water лежит алгоритм Смита-Ватермана, который ищет схожие части белковой последовательности. Ниже приведено сравнение характеристик ручного выравнивания с выравниваниями, проделанными описанными программами. Таблица 3
Условные обозначения
Согласно Таблице 1 качество выравниваний различно. Программа water по умолчанию выравнивает «хорошо выравниваемые» участки последовательности, а неидентичные участки убирает. Из-за этого возникают различия в весах выравниваний. Результатом можно манипулировать, изменяя параметры. Ручное выравнивание и выравнивание программы needle использует всю последовательность. Проценты схожести различны в связи с разницей в определении схожести аминокислот по боковым радикалам. Группировка по такому признаку может зависеть, например, от условий конкретной задачи. Разделение, использованное в данной работе можно посмотреть на странице Парное выравнивание белков Результаты ручного выравнивания во втором и третьем случаях (Выравнивания 2 и Выравнивания 3) отличаются от программного тем, что проценты идентичности и схожести выше. Возможно, это связано с тем, что правильное выравнивание не считается программами оптимальным или же скрипт evolve_protein.pl сделал в своей работе много вставок. Выравнивание с помощью программы water содержит в первом и третьем случаях (Выравнивания 1 и Выравнивания 3) те же выровненные участки, что и ручное выравнивание. Во втором случае (Выравнивания 2) выровненные участки не совпадают. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
© Малеева Александра
|