Вернуться на страницу семестров

BLOSUM62

Матрица весов BLOSUM62 была создана по данным базы BLOCKS, содержащей эталонные выравнивания, для определения веса выравнивания цитоплазматических белков. Число 62 означает процент идентичности сравниваемых последовательностей – порог кластеризации, после которого последовательности считаются одинаковыми. Матрица весов PHAT предназначена для трансмембранных белков. Естественно данные двух матриц будут отличаться по весу. Ниже построена матрица BLOSUM62


Теперь приведу свою матрицу для аланина(ALA), и сравню её с BLOSUM62 и PHAT75.(приведен рисунок ниже)
Как мы видим, данные отличаются, так как матрица BLOSUM62 использует более устаревшие базы последовательностей, в отличие от новой построенной матрицы.


Сравнение выравниваний, полученных для полноразмерных мутантов вручную и построенных классическими алгоритмами Нидлмана-Вунша и Смита-Ватермана

1) Для своего белка, а именно для OPUAC_BACSU, с помощью скрипта evolve.protein.pl, я получил 3 цепи из аминокислотных остатков, в каждой из которых их 20. В задании необходимо получить эти 3 последовательности с определенными эволюционными параметрами, которые представлены ниже в виде таблицы, которая предоставлена ниже.
Параметр Мутант №1 Мутант №2 Мутант №3
Вероятность изменения остатка (моделирующая "ошибку" ДНК-полимеразы) 0.6 0.6 0.4
Вероятность замены остатка в случае, если данная позиция будет изменена 0.6 0.8 0.8

2) По заданию практикума №5, я провел ручное выравнивание последовательностей с получением определенных данных, а именно: % идентичности, % сходства (по функциональным группам) и вес по матрице BLOSUM62. Результаты предоставлены ниже.

3) Из биоинформатического пакета EMBOSS были использованы команды NEEDLE и WATER. NEEDLE работает по алгоритму Нидлмана-Вунша для глобального выравнивания последовательностей, WATER работает по алгоритму Смита-Ватермана для локального выравнивания. Глобальное выравнивание охватывает обе последовательности, вне зависимости от колическтва выравниваемых элементов. Локальное выравнивание затрагивает конкретный участок 2-ух последовательностей. Сравнения данных ручного выравнивания и выравниваний с помощью NEEDLE и WATER предоставлены ниже



OPUAC_BACSU и Мутант1

Выравнивания Ручное Needle Water
идентичность(%) 60 4.4 65
сходство (%) 50 4.4 65
вес по матрице BLOSUM62 54 53.5 54.5
изображения
Заметим, что результаты ручного выравнивания и WATER не сильно отличаются, ни по весу, ни по идентичности, так как, как упоминалось выше, алгоритм выравнивания WATER - локальный, и выровнял короткий участок. NEEDLE же наоборот дает очень маленькое процентое сходство и идентичность, так как в выравнивании первой последовательности остатков почти в 20 раз больше (откуда наличие множества гэпов)



OPUAC_BACSU и Мутант2

Выравнивания Ручное Needle Water
идентичность(%) 50 3.1 52.9
сходство (%) 56 3.4 58.8
вес по матрице BLOSUM62 19 24 32
изображения
Ручное выранивание мутанта_2 и выравнивание WATER дают схожие данные об идентичности и сходстве. Существенное отличие только по весу в матрице BLOSUM62, так как алгоритм WATER засчитывает лишние значения гэпов, а в данном выравнивании их немало.



OPUAC_BACSU и Мутант3

Выравнивания Ручное Needle Water
идентичность(%) 67 4.1 75
сходство (%) 67 4.4 81.2
вес по матрице BLOSUM62 52 48 56
изображения
Выравнивание мутанта_3 вручную и с помощью WATER дает не сильно различающиеся данные, но есть различия полученные при изучении сходства, WATER выровнял более удачно, так как при данном выравнивании наблюдалась так называемая "лестница", сдвиг которой давал более большие показатели сходства, но уменьшал шансы на идентичность.