На главную


Оптимальное парное выравнивание. Алгоритмы.

1. Сравнение глобального и локального выравниваний для белков A1UA31.1 и P22953.3

Для глобального и локального выравниваний этих белков использовались команды needle и water пакет EMBOSS со стандартными параметрами Gap penalty: 10.0, Extend penalty: 0.5, End penalty: 10.0, end extend penalty:0.5. Программой по умолчанию используется матрица весов EBLOSUM62 (для белковых послеовательностей).
Таблица 1. Сравнение параметров локального и глобального выравниваний
ВыравниваниеДлина выравниванияГэпГэп, %Identity absIdentity percentSimilarity absSimilarity percentЧисло инделейВес выравнивания
needle 673 73 10.8% 300 44.6% 412 61.2% 7 1361.0
water 647 54 8.3% 297 45.9% 409 63.2% 13 1365.5

При глобальном выравнивании предполагается, что последовательности гомологичны по всей длине, а при локальной, что белки содержат как гомологичные домены, так и нет, и можно перейти в любое место последовательности без штрафа. В нашем случае локлаьное и глобальное выравнивание различаются только в N- и С- концах последовательности (см. рисунок 1). И это неудивительно, ведь белок A1UA31.1 принадлежит представителю домена Бактерии, а P22953.3 - Эукариотам, и N- и С-концы, обычно служащие маркерами локализации белков в клетке (или связывания с сигнальными молекулами), у них различаются. (Примечательно, что сначала я пыталась работать с одним белком представителя Архей, а другим- Бактерий и в этом случае локальное и глобальное выравнивания совпали, что свидетельствует о бОльшей консервативности этих белков между Бактериями и Археями, чем Бактерий и Эукариот).

Рисунок 1. Разница в глобальном и локальном выравнивании белков A1UA31.1 и P22953.3

2. Сравнение локального выравниваний для негомологичных белков

Для выполнения этого задания я использовала локального выравнивание двух гомологичных белков из задания 1 и 5 пар выравниваний заведомо негомологичных белков (своего белка Q816E8_BACCR, репарирующего алкилированные основания [1] с белками A0A0U3M8E6_9BURK, хитиназой [2], E8YFS1_9BURK, гликозил-трансферазой [3], A0A0H4VDW6_9SPHN, белком-регулятором клеточного деления [4], NHAA_RHOER, субъединицей нитрил-гидратазы [5] и Q82CH9_STRAW, глобин-подобным белком [6]). В таблице 2 приведены основные параметры этих выравниваний.
Таблица 2. Сравниения локальных выравниваний 5 пар негомологичных белков
Идентификатор белкаДлина выравниванияГэпГэп, %IdentityIdentity,%SimilaritySimilarity,%Число инделейВес выравнивания
A0A0U3M8E6_9BURK 32 3 9.4% 8 25.0% 17 53.1% 2 29.5
E8YFS1_9BURK 102 29 28.4% 20 19.6% 35 34.3% 4 29.5
A0A0H4VDW6_9SPHN 109 16 14.7% 21 19.3% 44 40.4% 4 45
NHAA_RHOER 7 0 0% 6 85.7% 6 85.7% 0 27.0
Q82CH9_STRAW 29 4 13.8% 9 31.0% 15 51.7% 2 30.0

На рисунке 2 представлены изображения локальных выравниваний негомологичной пары (выше) и гомологичной (ниже).
Рисунок 2. Сравнение локальных выравниваний для негомологичной и гомологичной пар

Если сравнить данные из таблиц 1 и 2, то можно заметить, что при локальном выравнивании негомологичных белков длина выровненного участка значительно меньше, чем в случае гомологичной пары (по 30-100 нуклеотидов вместо обычных 600). Также интересно заметить, что программа гораздо дольше (несколько секунд) строила выравнивание негомологичных пар. Очевидно, что такому выравниванию верить нельзя и найденные программой якобы гомологичный участок между двумя белками является случайностью. Если говорить в общем, то на мой взгляд выравнивание негомологичны белков лишено смысла и абсолютно неинформативно.

3. Отличия между выравниваниями

Я выбрала выравнивания, описанные в задании 1 между белками A1UA31.1 и P22953.3. Выбранные выравнивания практически полностью совпали, за исключением начальных и конечных участков. Отличия. В множественном выравнивании напротив Met1 стоит Met1, а в глобальном выравнивании напротив Met1 стоит Glu6. В множественном выравнивании напротив Ala2 стоит Ser2, а в глобальном напротив Ala2 стоит Gly7. Напротив Thr83 стоит Arg, а в глобальном выравнивании напротив него стоит Ser7. Рисунок выравнивания приведен ниже.
Рисунок 3. Сравнение множественного, глобального и локального выравниваний для пары A1UA31.1 и P22953.3
Видно, что выравнивания, в основном, отличаются на концевых участках. Интересно, что выравнивания в гомологичных блоках совпадают, а в негомологичных участках различаются (разные программы ставят разное количество гэпов). В случае данных белков глобальное и локальное по информативности не отличаются (тк эти белки довольно консервативны и содержат гомологичые блоки по всей длине. Глобальное и множественное выравнивание отличаются, в основном количеством гэпов в неконсервативных участках (в множественном их больше).

4. Описание глобального выравнивания с аффинными штрафами за гэпы

Выравняем кусочек последовательности MARAWWWWWWWVGIDLG и MSKIGIDLG. На рисунке 4 представлены матрицы значений. Представим, что большая матрица с аминоксилотами представляет собой верхнюю грань параллелепипеда, в каждой ячейке написан вес замены (матрица BLOSUM62), а маленькая -вертикальный срез между двумя конкретными строками (спуск по грани этих ячеек: штраф 10, прохождение по этой ячейке- штраф 0.5, подъем наверх - 0). Сначала двигаемся по верхней грани по диагоналям ячеек (так как это наиболее выгодно по весам), как только мы проходим ячейку R-K, то перед нами встает выбор: продолжать двигаться по верхней грани или спуститься вглубь. Рациональнее будет потратить 10 очков, на "спуск в метро" и пройти "плохой" участок со штрафами в 0.5 за ячейку, чем оставться на верхней грани, где штрафы -3 -2. Красным цветом отмечено движение по верхней грани, зеленым - по " внутренней" части, как вертикальный разрез. После прохождения последнего триптофана можно "подняться наверх" и продолжить движение по диагонали. Итого вес выравнивания: 5+1+2 -10 - (0,5*7)+3+6+4+6+4+6=23.

Рисунок 4. Построение трехмерного графа для глобального выравнивания с аффинными штрафами за гэпы. На схеме изображены только активные ребра графа (по которым происходит перемещение)

5. Описание локального выравнивания с линейными штрафами за гэпы

Выравниваются те же участки последовательности, что и в задании 4. Отличием локального от глобального выравнивания является то, что из любой точки можно "перескочить" в любую без штрафа. Таким образом можно "выбросить" негомологичные кусочки. Что и происходит в нашем примере. Если посмотреть на рисунок , можно увидеть, что сначала мы двигаемся как и в предыдущем задании, затем доходим до негомологичного участка, перемещаемся в гомологичный и двигаемся до конца. Результатом выравнивания является 2 попарно гомологичных кусочка последовательностей. В данном случае выгоднее было не вставлять 8 гэпов (штрафы за них бы линейно суммировались), а перескочить негомологичный участок. Вес выравнивания : 1 кусочек 5+1+2 =7 , 2 кусочек 3+6+4+6+4+6=28.
Рисунок 5. Построение ориентирвоанного графа для локлального выравнивания.

6. Составление матрицы "весов дружелюбности"

Для выполнения этого задания я пользовалась матрицей Редхеффера. Число возможных пар:132, итоговые значения умножались на 10.
Рисунок 6. Матрица Редхеффера

Таблица 3. Матрица весов для матрицы Редхеффера
10Сумма
1 -16,1-9-25,1
0-10,89,8-1
Сумма-26,918,8

7. Список литературы


[1] http://kodomo.fbb.msu.ru/~azbukinanadezda/term2/pr4/pr4.html
[2] http://kodomo.fbb.msu.ru/~kamikki0/term_2/practicum3.html
[3] http://kodomo.fbb.msu.ru/~sergebus/term2/prak5.html
[4] http://kodomo.fbb.msu.ru/~buyanchik/term2/pr5/uniprotinf.html
[5] http://kodomo.fbb.msu.ru/~liliavasilyeva/pr5.html
[6] http://kodomo.fbb.msu.ru/~sophia.veselova/term2/pr5/uniprot.html