Предсказание парных выравниваний

На этой странице представлен результат построения парного выравнивания. Для выбора двух последовательностей использовалась опция построения трехмерного координатного пространства в Jalview. Выбирались последовательности, у которых парное выравнивание будет иметь найбольший вес.
Были использованы программы needle и water, входящие в пакет EMBOSS. Для визуальной оценки выравниваний они представлены в проекте Jalview.
Для начала были построены выравнивания с неизменными настройками программ, а именно: величина штрафа за добавление гэпа (gap open) составляла 10,0, а штраф за длину гэпа (extension) - 0,5.
Затем для программы needle параметры были изменены на 1 и 0 соответственно. Таким образом, разрешалось ставить больше гэпов для поиска максимального количества консервативных позиций. Можно заметить, что программе действительно удалось найти больше консервативных уастков (Рис.1), однако чем больше в выравнивании гэпов, тем менее обоснованным оно становится. Каждый гэп обозначает эволюционное изменение в структуре белка, а значит, если их много, белки эволюционно далеки друг от дрруга.

Рис.1

»Первое выравнивание needle
»Второе выравнивание needle
Для программы water использовались параметры 5 и 4. Следовательно по сравнению с первым выравниванием ожидалось получить больше гэпов меньшей длины. Как оказалось, штраф на длину участка гэпов был более значителен, чем штраф на открытие участка, вследствие чего наблюдалось уменьшение длины гэпов до одного параллельно с уменьшением их числа.
    Информация о выравниваниях
    Способ
    получения
    Длина Гэпы % Консервативные
    позиции
    %
    гомологичные множественное
    выравнивание
    83 7 8,4 22 26,5
    needle [10; 0,5] 93 27 29,0 25 26,9
    water [10; 0,5] 89 25 28,1 25 28,1
    needle [1; 0] 107 52 48,6 31 29,0
    water [5; 4] 80 9 11,3 21 26,3
    негомологичные needle [10; 0,5] 434 400 92,2 7 1,6
    water [10; 0,5] 45 2 4,4 12 26,7
В результате сравнени всех выравниваний можно сделать вывод, что парное выравнивание, полученное из множественного, является наиболее удачным: оно содержит мало гэпов (8,4%) и относительно много консервативных позиций (26,5%). В других выравниваниях не удалось достичь таких результатов. При сравнении гомологичных белков разными способами программы ставили значительно больше гэпов, слабо увеличивая процент консервативности.
Наилучшего результата удалось достичь с помощью программы water при установке высокого штрафа за длину гэпа (extension = 4). Таким образом процент гэпов составил 11,3%, и при этом удалось найти 21 консервативную позицию (26,3%). Но важно то, что это локальное выравнивание, а значит части последовательностей в начале вравнивания не учитывались. Этим же можно объяснить удивительно высокий процент консервативности при сравнении негомологичных белков (26,7%)
Программа needle при сравнении негомологичных белков построила выравнивание длиной 434 аминокислоты, в котором гэпы составляют 92,2%, что явно свидетельствует об их неродственности.
В этом смысле локальное выравнивание может ввести в заблуждение, поскольку в нём упускается из внимания часть последовательности белка и полученные данные сложно анализировать. Поэтому для установления гомологии белков логичнее использовать глобальное выравнивание.
    Сравнение с выравниванием, полученным из множественного
    Выравнивание Количество совпавших
    колонок
    %
    needle [10; 0,5] 57 58,8
    water [10; 0,5] 52 55,3
    needle [1; 0] 29 26,1
    water [5; 4] 55 68,7
Если оценивать выравнивание по степени похожести на первое, полученное из множественного, также больший процент совпавших колонок будет наблюдаться у глобального выравнивания (при одинаковых параметрах). При этом увеличение штрафа на длину гэпов ведёт к большей похожести на первое выравнивание.
«Назад
Дальше»

© Колупаева А.Л. 2014