Учебный сайт Юдиной А.С.

Главная

Обо мне

Семестры

Парные выравнивания.

Сравнение глобального и локального выравнивания.

Для построения выравниваний я взяла последовательности гомологичных белков из семейства HSP70. С помощью программы needle из пакета EMBOSS я получила глобальное выравнивание, то есть включающее в себя обе последовательности целиком. С помощью программы water я получила локальное выравнивание, результатом которого является выбор участка в каждой из последовательностей и выравнивание между этими участками.[1] Программы используют по умолчанию матрицу весов EBLOSUMS62 для белков, штраф за открытие гэпа с конца или в последовательности - 10.0, за удлинение инделя - 0.5.

Для выравниваний я использовала Chaperone protein DnaK из Halorubrum lacusprofundi и 78 kDa glucose-regulated protein из Homo sapiens. Параметры варавнивания приведены в Таблице 1.

Таблица 1.

ID Длина выравнивания Абсолютно консервативные позиции % Функционально консервативные позиции % Число гэпов Число инделей
Глобальное выравнивание
DNAK_HALLT 683 298 43.63 415 60.76 39 9
GPR78_HUMAN 707 298 42.15 415 58.70 53 4
Локальное выравнивание
DNAK_HALLT 636 295 46.38 409 64.31 39 9
GPR78_HUMAN 636 295 46.38 409 64.31 21 3

На рисунках 1 и 2 предсатвлены части соответствующих варавниваний с покрашенными абсолютно консервативными позициями. Выравнивания были визуализированы в прогармме Jalview.


Рис.1 Глобальное выравнивание. Начало


Рис.2 Локальное выравнивание. Начало


Рис.3 Глобальное выравнивание. Конец


Рис.4 Локальное выравнивание. Конец

Лучше всего отличия глобального и локального выравниваний видны в начале и конце: в глобальном выравнивании в первой последовательности DNAK_HALLT в начало вставлено большое число концевых гэпов, в то время как в локальном выравнивании несовпадающий крайний учаток отброшен. За счет этого локальное выравнивание получилось короче глобального.
Теперь орбратим внимание на конец выравниваний: в глобальном стоят два иделя, в локальном - один, соответствующий предпоследнему в глобальном, но существенно укороченный. При более внимательном рассмотрении видно, что в последовательности DNAK_HALLT два участка в этом конце соответствуют одному из последовательности GRP78_HUMAN. В глобальном этот единственный участок из GRP78_HUMAN соотносится с последним из DNAK_HALLT, чтобы концы последовательностей тоже совпали. В локальном концы последоваетльностей отбрасываются и сопоставляются участки дальше от конца выравнивания. Таким образом локальное выравнивание укорачивается относительно глобального и теряет три абсолютно консервативные позиции, но выигрывает за счет уменьшения числа гэпов и удаления одного инделя.

Локальное выранивание гомологичных и негомологичных последовательностей.

Теперь обратим внимание только на локальные выравнивания. Я построила такое для гомологичных белков DNAK_HALLT и GRP78_HUMAN, и для негомологичных белков A0A0U3LMY0_STRGL - Chitin binding protein, A0A0U3QLP1_9MICC - ADP-ribose pyrophosphatase, E8YVR4_9BURK - Regulatory protein MarR, A0A109QDP9_9BACL - Lipase, которые я скомбинировала по парам.

ID Длина последовательности Длина выравнивания Абсолютно консервативные позиции % Функционально консервативные позиции % Число гэпов Число инделей
Гомологичные последовательности.
DNAK_HALLT 644 636 295 46.38 409 64.31 39 9
GPR78_HUMAN 654 636 295 46.38 409 64.31 21 3
Негомологичные последовательности
A0A0U3LMY0_STRGL 171 51 14 27.45 26 50.98 6 2
A0A0U3QLP1_9MICC 242 51 14 27.45 26 50.98 3 2
A0A0U3LMY0_STRGL 171 27 7 25.92 9 37.04 0 0
A0A109QDP9_9BACL 384 27 7 25.92 9 37.04 0 0
A0A0U3LMY0_STRGL 171 73 18 24.66 25 34.25 10 2
E8YVR4_9BURK 166 73 18 24.66 25 34.25 4 1
A0A0U3QLP1_9MICC 242 100 25 25.00 42 42.00 20 4
E8YVR4_9BURK 166 100 25 25.00 42 42.00 2 2
A0A109QDP9_9BACL 242 24 8 33.33 12 50.00 6 1
E8YVR4_9BURK 384 24 8 33.33 12 50.00 0 0

Для наглядного представления того, что в локальном выравнивание участвуют только части исходных последовательностей я вставила в таблицу колонку длины белковой последовательности.
Результаты таковы: локальные выравнивания негомологичных последовательностей гораздо короче относительно длин сравниваемых белковых последовательностей, чем локальные выравнивания гомологичных последовательностей.
Процент абсолютно консервативных позиций примерно одинаков у всех выравниваний негомологов и меньше такового для выравнивания гомологов.
Число функционально консервативных позиций для локального выравнивания негомологичных последовательностей оказалось меньше, чем число абсолютно консевативных позиций.

На рисунках ниже представлены выравнивания негомологичных последоваетльностей целиком.


Рис.5


Рис.6


Рис.7


Рис.8


Рис.9

Сравнение выравниваний.

Для выполнения данного сравнения я взяла последовательности гомологичных белков с идентификаторами DNAK_HALMT и HSP70_THEPA. Первое выравнивание выполнено совместно с другими белками этого же семейства (см.Практикум 10), второе - глобальное выранивание в программе needle, третье - локальное в программе water.

Все три выравнивания собраны в один файл и выровнены вручную для сравнения.

В большинстве своем выравнивания совпадают, но различия встречаются. Для удобства комментирования различий я привела иллюстрации из выравниваний - Рис.10


Рис.10

  1. Обратим внимание на позиции 46-48. В множественном выравнивании в последовательности HSP70_THEPA гэп соответствует D из DNAK_HALMT. В глобальном и локальном гэп соответствует G.
  2. В позициях 77-81 в множественном выравнивании D из DNAK_HALMT соответствует R, в глобальном и локальном участку последовательности 'RKF' из HSP70_THEPA соответствует индель из DNAK_HALMT, а на позициях 80-81 - DD.
  3. С позиции 91 по 115 между участками 'EGEE' и 'YTPE' во множественном выравнивание в DNAK_HALMT стиот индель. В глобальном и локальном выравниваниях индель короче и находится между участками 'DD' и 'GYTV'. Благодаря инделю именно между этими участками в позициях 105-115 в глобальном и локальном выравниваниях встречаются консервативные и функционально консервативные позиции, поэтому я считаю такой вариант более правдоподобным.
  4. В позициях 642-645 стоит индель во множественном выравнивании в DNAK_HALMT, в локальном и глобальном выравниваниях он отсутствует.

Выравнивание целиком можно посмотреть здесь.

Наиболее правдоподобным я считаю как глобальное, так и локальное выравнивания, т.к. они практически не отличаются друг от друга за исключением концевых гэпов в локальном выравнивани, кроме того они содержат больше консервативных и функционально консервативных позиций относительно множественного выравнивания.

Источники

1. Выравнивание последовательностей - wikipedia.org


© Юдина Анастасия, 2016