Практикум 12
1. Сравнение выравнивания одних и тех же последовательностей программами Tcoffee, MSAprobs, Mafft.
Для выполнения последнего практикума я выбрал белки из 9 практикума, т.к уже выравнивал их (RL10_RAT, RL10_DANRE, RL10_PONAB, RL10_YEAST, RL10_DROME).
Для сравнения выравниваний я использовал программу Ксении Кирцовой.
В качестве программы А я выбрал выравнивание Tcoffee и сравнивал ее с MSAprobs и Mafft.
Рисунок 1. Сравнение выравнивания Tcoffee с MSAprobs
Рисунок 2. Сравнение выравнивания Tcoffee с Mafft
Длина выравнивания одинакова у первого выравнивания (281), но отличается у второго (241-Tcoffee и MSAprobs, 247-у Tcoffee и Mafft)
В выравнивании нет фрагментов одинаково выровненных для 3 программ. Скорее всего это связано с тем, что точность программ отличается.
2.Построение выравнивания по совмещению структур и сравнение его с выравниванием программой MSA.
Для выполнения этого задания я брал 3D структуры из семейства доменов, которое я выбрал в 11 практикуме - Protein adenylyltransferase SelO (PF02696)
На сайте PDB я получил выравнивание этих 3 структур
Рисунки 3 и 4. Выравнивание 3 последовательностей в PDB
Рисунок 5. Наложение 3D структур
Референсным белком здесь был 6III
С помощью текстового редактора я сделал
После этого я поместил файл с выравниванием в JalView и провел выравнивание по MUSCLE with defaults
Дальше, с помощью программы Ксении Кирцовой, я получил совпадающие блоки относительно этих 2 выравниваний.
Рисунок 6. Совпадающие блоки 2 выравниваний
3. Описание программы MSAprobs
MSAprobs-новый и практичный алгоритм множественного выравнивания белковых последовательностей. Проект MSAprobs основан на комбинации парных скрытых марковский моделей и функций для вычесления апостериорных вероятностей. Для повышения точности используют взвешенное преобразование вероятностной согласованности и взвешенное выравнивание профиль–профиль.
Исходный код MSAProbs, написанный на C ++, находится в свободном доступе на http://msaprobs.sourceforge.net.
Принцип работы:
1.Вычисление всех парных матриц апостериорных вероятностей с использованием как парного метода, так и функции разбиения
2.Вычисление матрицы парных расстояний с использованием матриц апостериорных вероятностей
3.Построение направляющего дерева из матрицы парных расстояний и вычисления весов последовательностей
4.Выполнение взвешенного преобразования вероятностной согласованности всех парных матриц апостериорных вероятностей
5.Вычисление прогрессивного выравнивания вдоль направляющего дерева с использованием преобразованных матриц апостериорных вероятностей
Для повышения точности выравнивания выполняется дополнительное итеративное уточнение в качестве постобработки этапа 5
Рисунок 7. Сравнение точности с другими алгоритмами
Как видно из рисунка 7 программа MSAProbs статистически оценивается как лучшая
Ссылка на статью: https://academic.oup.com/bioinformatics/article/26/16/1958/218540?login=false