• Главная страница
  • Обо мне
  • Семестры
  • Сайт ФББ

Практикум 12

1. Сравнение выравнивания одних и тех же последовательностей программами Tcoffee, MSAprobs, Mafft.

Для выполнения последнего практикума я выбрал белки из 9 практикума, т.к уже выравнивал их (RL10_RAT, RL10_DANRE, RL10_PONAB, RL10_YEAST, RL10_DROME).

Для сравнения выравниваний я использовал программу Ксении Кирцовой. В качестве программы А я выбрал выравнивание Tcoffee и сравнивал ее с MSAprobs и Mafft.

picture_1
Рисунок 1. Сравнение выравнивания Tcoffee с MSAprobs
picture_2
Рисунок 2. Сравнение выравнивания Tcoffee с Mafft

Длина выравнивания одинакова у первого выравнивания (281), но отличается у второго (241-Tcoffee и MSAprobs, 247-у Tcoffee и Mafft)

В выравнивании нет фрагментов одинаково выровненных для 3 программ. Скорее всего это связано с тем, что точность программ отличается.

2.Построение выравнивания по совмещению структур и сравнение его с выравниванием программой MSA.

Для выполнения этого задания я брал 3D структуры из семейства доменов, которое я выбрал в 11 практикуме - Protein adenylyltransferase SelO (PF02696)

    Структуры:
  • 6III(оранжевый)
  • 6INY (синий)
  • 6K20 (зеленый)

На сайте PDB я получил выравнивание этих 3 структур

picture_3 picture_4
Рисунки 3 и 4. Выравнивание 3 последовательностей в PDB
picture_5
Рисунок 5. Наложение 3D структур

Референсным белком здесь был 6III

С помощью текстового редактора я сделал

После этого я поместил файл с выравниванием в JalView и провел выравнивание по MUSCLE with defaults

Дальше, с помощью программы Ксении Кирцовой, я получил совпадающие блоки относительно этих 2 выравниваний.

picture_6
Рисунок 6. Совпадающие блоки 2 выравниваний
3. Описание программы MSAprobs

MSAprobs-новый и практичный алгоритм множественного выравнивания белковых последовательностей. Проект MSAprobs основан на комбинации парных скрытых марковский моделей и функций для вычесления апостериорных вероятностей. Для повышения точности используют взвешенное преобразование вероятностной согласованности и взвешенное выравнивание профиль–профиль.

Исходный код MSAProbs, написанный на C ++, находится в свободном доступе на http://msaprobs.sourceforge.net.

Принцип работы:

1.Вычисление всех парных матриц апостериорных вероятностей с использованием как парного метода, так и функции разбиения

2.Вычисление матрицы парных расстояний с использованием матриц апостериорных вероятностей

3.Построение направляющего дерева из матрицы парных расстояний и вычисления весов последовательностей

4.Выполнение взвешенного преобразования вероятностной согласованности всех парных матриц апостериорных вероятностей

5.Вычисление прогрессивного выравнивания вдоль направляющего дерева с использованием преобразованных матриц апостериорных вероятностей

Для повышения точности выравнивания выполняется дополнительное итеративное уточнение в качестве постобработки этапа 5

picture_7
Рисунок 7. Сравнение точности с другими алгоритмами

Как видно из рисунка 7 программа MSAProbs статистически оценивается как лучшая

Ссылка на статью: https://academic.oup.com/bioinformatics/article/26/16/1958/218540?login=false