Алгоритмы выравнивания. Программы

Сравнение выравниваний гомологичных и негомологичных белков

Для построения выравниваний из базы данных Swissprot были взяты пять пар гомологичных и негомалогичных белков из протеомов двух бактерий: кишечной палочки (Escherichia colistrain K12) и сенной палочки (Bacillus subtilis strain 168). Выравнивание каждой пары производилось по два раза: глобально (команда needle) и локально (команда water). Различные характеристики всех проведённых выравниваний приведены в таблице Exel.

Чтобы понять, как отличить гомологичные белки от негомологичных с помощью выравнивания, сравним данные таблиы. Первое, что бросается в глаза - это огромная разница в покрытии гомологичных и негомологичных белков. Остальные характеристики тоже имеют существенные различия. Идентичность приведённых гомологичных белков в среднем составляет ~47% (для локалных и глобальных выравниваний вместе взятых) и не опускается ниже 20,9%, в то время как средняя идентичность негомологичных белков составляет ~2% и не превышает 24% (даже для локальных выравниваний). Аналогичная статистика прослеживается в характерстике "Similarity". Количество гэпов превосходит в негомологичных выравниваниях, в то время как количество инделей не является показательной величиной, за счёт большой длины некоторых инделей у негомологичных выравниваний.

Поиск отличий в парных выравниваниях последовательностей одних и тех же белков, построенных разными программами

Для построения множественного выравнивания были выбраны белки с мнемоникой ALF1 (Fructose-bisphosphate aldolase class 1): ALF1_PEA, ALF1_HALS3, ALF1_ECIOLI, ALF1_CLOAB и ALF1_CHLPN. Выравнивание производилось с помощью программы Jalview. Ссылка на проект множественного выравниваня.

Сравнение выравниваний

После того, как из множественного выравнивания были удалены все последовательности, кроме двух (ALF1_ECIOLI и ALF1_CLOAB) с ними были построены глобальное и локальное парные выравнивания в fasta формате. Все три пары выравниваний были импортированны в одно окно Jalview. Между ними и необходимо найти отличия. Ссылка на проект сравнения выравниваний.

alignment

Если посмотреть на выравнивания целиком, то можно заметить, что в начале и в конце нет гомологичных участков, вместо них там находятся длинные индели, однако посередине есть консервативные блоки.

alignment

Если рассмотреть их поближе, то можно заметить, что множественное выравнивание не отображает многие гомологичные участки, тем самым хуже отражая родство этих белков. Также можно заметить, что глобальное и локальное выравнивания во многом совпадают и способны выявить консервативные участки.

alignment1

Например, на картинке выше можно заметить, как во множественном выравнивании во второй последовательности представлен продолжительный индель, в то время как в глобальном и локальном выравниваниях эти же самые участки являются гомологичными.

lgailfentm

Можно заметить, что участок "LGAILFENTM", имеющий координаты 69-78 а.о., во множественном выравнивании выровнялся с другим участком, нежели в глобальном и локальном выравниваниях, которые выровняли его одинаково.

lgailfentm2