Вернуться на главную |
Страница проектов |
Заметки |
Картинкой ниже показаны результаты сравнения для различных замен в матрицах типа BLOSUM и PHAT.
Видна довольно сильная корреляция между матрицами замен из-за характера исходных данных.
Матрица PHAT строилась согласно данным о трансмембранных белках, а матрица BLOSUM согласно данным о хорошо изученных цитоплазматических белках.
Построенная мной таблица опирается на обновленную базу данных BLOCKS, поэтому имеются некоторые различия с классическим ее вариантом. Матрица BLOSUM62: число 62 означает порог кластеризации, то есть то, с какого процента последовательности можно объединять в кластер и считать за одну,уменьшая влияние идентичных последовательностей.
Программа water использует алгоритм Смита-Ватермана,предназначенный для локального выравнивания двух последовательностей, т.е. в процессе локального выравнивания находятся участки, обладающие большим сходством.
Таким образом ищется наилучшее взаиморасположение одной последовательности относительно другой.
Программа needle использует алгоритм Нидлмана-Вунша, предназначенный для глобального выравнивания, т.е. программа пытается выровнять все элементы последовательностей.
Таким образом ищется наилучшее взаиморасположение двух последовательностей целиком.
NEEDLE:
Mutant 1
Mutant 2
Mutant 3
WATER:
Mutant 1
Mutant 2
Mutant 3
Выравнивания, сделанные собственноручно:
Значения needle не совпадают с ручным подсчетом и подсчетом по water, т. к. needle выравнивает глобально и сравнивает соответственно с большим кол-вом гэпов
Значения water и ручного сравнения довольно близки, т. к. и там и там выравнивание локальное. Но они не могут совпадать, т.к. собственноручное выравнивание, к примеру, не учитывало штрафы за гэпы, оно не являлось оптимальным.
© Прозоров Данила