Предсказание парных выравниваний

Меню

На главную

Второй семестр
Для выполнения заданий выбрано множественное выравнивание №4 из предыдущего практикума.
JalView project с результатами практикума.
Окна в проекте:
i. с исходным множественным выравниванием
ii. с выравниванием, полученным удалением лишних последовательностей из данного множественного;
iii. с парным выравниванием выбранных последовательностей, построенным программой needle;
iv. то же, но с использованием программы water;
v. то же, но с измененными параметрами программы needle;
vi. то же, но с измененными параметрами программы water;
vii. с глобальным парным выравниванием последовательностей заведомо не гомологичных белков;
viii. с локальным парным выравниванием заведомо не гомологичных белков.

Задание 1.

На рисунке 1 представлено множественное выравнивание с раскраской ClustalX. На нем отмечены серым две наиболее негомологичные последовательности, выбранные для парного выравнивания.

Рис.1 Множественное выравнивание с раскраской ClustalX.

В задании требовалось выбрать две наименее родственные последовательности. Для этого был использован метод главных компонент, которых позволяет изобразить последовательности точками в пространстве и судить о гомологичности по длине расстояний между этими точками. (Рис.2) Три последовательности: STAAC, MACCJ и LACKL составляют равносторонний треугольник. Поэтому придется выбирать на глаз из этих трех с помощью дерева родства (рис.3). Последовательность LACKL отделяется от остального дерева раньше всех, то есть ее обязательно надо брать. Из остальных двух можно любую взять, например MACCJ.

Рис.2 Результаты нахождения наиболее негомологичных последовательностей с помощью метода главных компонент.

Рис.3 Дерево родства последовательностей (Neighbour Joining Using PAM 250).

Задание 2.

На рисунке 4 представлено парное выравнивание, полученное из множественного удалением ненужных последовательностей и пустых колонок.

Рис.4 Парное выравниваение, полученное из множественного.

Задание 3.

Парные выавнивания делают программы needle и water, которые надо запукать из командной строки в линуксе. Последовательности надо подать отдельными файлами. seq1.fasta и seq2.fasta

Задание 4.

Последовательности были выровнены 4 раза: со стандартными штрафами за гэпы (рис. 5 и 6) и с неаффинными штрафами за гэпы (рис. 6 и 8). Чтобы сделать штраф за гэп неафинным штраф за наличия гэпа был изменен с 10 до 0. Штраф за длину был увеличен до 1.

Рис.5 Глобальное парное выравнивание с помощью needle со стандартными штрафами за гэпы.


Рис.6 Локальное парное выравнивание с помощью water со стандартными штрафами за гэпы.


Рис.7 Глобальное парное выравнивание с помощью needle с неаффинными штрафами за гэпы.


Рис.8 Локальное парное выравнивание с помощью water с неаффинными штрафами за гэпы.

Задание 5.

В задании требовалось выбрать две заведомо негомологичные последовательности белков бактерий из первого семестра: моей (YP_144620) и какой-нибудь еще (YP_006423837.1). Длину чужого белка уменьшила до длины моего белка (до 150 а.к.).


Рис.9а,б Глобальное выравнивание негомологичных белков.

В локальном выравнивании на рисунке 10 представлен только наиболее гомологичный фрагмент.

Рис.10 Локальное выравнивание негомологичных белков.

Задание 7.

Сравнивала выравнивание, полученное из множественного, и локальное выравнивание со стандартными штрафами за гэпы.

Рис. 11 Выравнивание выравниваний.

Участок несовпадения выравниваний,заключенный между двумя блоками. Координаты: 29-46. Всего 41 различающаяся позиция.

Рис.12 Участок несовпадения выравниваний.

Задание 8

Результаты сравнения выравниваний представлены в таблице 1. (Они получены с помощью программы infoalign)
Множественное выравнивание по количеству консервативных и функционально консервативных позиций немного уступает парным, но зато в нем меньше гэпов. Локальное и глобальное выравнивание гомологичных последовательностей различаются только на три позиции. В локальном эти позиции отсутствуют, и оно начинается с блока. Сокращение длины засчет несхожего участка увеличивает процент функционально консервативных позиций даже при уменьшении их числа на 1. Гэпов в 10 раз больше в выравниваниях, построенных needle и water с неаффинными штрафами за гэпы, чем со стандартными. Притом увеличение числа идентичных и совпадающих позиций в таких выранвниваниях незначительно. Самым оптимальным является локальное парное выравнивание, потому что у него самый высокий процент сходных и идентичных колонок и адекватное количество гэпов. В выравниваниях негомологичных последовательностей тоже преимущество у локального, потому что процент консервативных и функционально консервативных сопоставим с ним же для выравниваний гомологов. Это обеспечивается тем, что water выравнивает только совпадающий фрагмент, обрезая последовательности.

Табл. 1 Сравнение качества выравниваний.

Выравнивание Длина выравнивания Кол-во конс. позиций В % Кол-во функц-но конс. позиций В % Число гэпов
Полученное из множественного 86 22 26 35 41 3
Глобальное со стандартными штрафами за гэпы в needle 93 25 27 38 41 4
Локальное со стандартными штрафами за гэпы в water 89 25 28 37 42 4
Глобальное с неаффинными штрафами за гэпы 107 27 25 47 44 40
Локальное с неаффинными штрафами за гэпы 112 32 29 44 39 28
Глобальное негомологичных последовательностей 160 37 23 51 32 10
Локальное негомологичных последовательностей 29 9 31 13 45 1

© Корзина Анастасия, 2015