Парное выравнивание белковых последовательностей и применение алгоритмов парных выравниваний к цитратсинтазе I

Модель эволюции белковых последовательностей

Задача и методы: В данном задании вручную произведено парное выравнивание последовательности моего белка с несколькими 20-ти аминокислотными участками, которые были предварительно получены как результат работы скрипта evolve_protein.pl при использовании различных параметров. Скрипт иллюстрирует появление случайных мутаций в последовательности белка из-за ошибок в деятельности ДНК-полимеразы и использует для своей работы несколько параметров: (i) вероятность возникновения мутации в данном месте аминокислотной последовательности {параметр -i}; (ii) вероятность того, что при наличии мутации произойдёт замена, а не делеция или вставка другой аминокислоты {параметр -r}.

Для работы скрипта также определены следующие дополнительные параметры: Результаты работы скрипта: В результате применения скрипта evolve_protein.pl были получены следующие 20-ти аминокислотные фрагменты искусственных мутантов цитратсинтазы I из B.subtilis (для каждого фрагмента в названии указаны значения параметров (i) и (ii)):
  1. >0|simulation_result|change=0.6|replace=0.6|generations=1 SVLSVQFIALRFNLTYFPKT
  2. >0|simulation_result|change=0.6|replace=0.8|generations=1 PTFAESLQDFMDRDAGRNCS
  3. >0|simulation_result|change=0.4|replace=0.8|generations=1 MSDIGEEHNFEAYKEKLTGE
Результаты выравнивания: Иллюстрации выравниваний (получены с помощью программы JalView) и их рассчитанные параметры представлены в таблице (см. ниже). В использованном варианте раскраски аминокислоты подразделены на следующие группы по свойствам бокового радикала: Для каждого выравнивания были подсчитаны следующие параметры: Identity - процент идентичных аминокислот в двух последовательностях от общей длины участка выравнивания, Similarity - процент схожих по свойствам аминокислот между двумя последовательностям, Alignment weight - вес выравнивания по матрице BLOSUM62, учитывался штраф за открытие пробела (gap) в -12, а за продолжение пробела -2. (о матрицах аминокислотных замен и весах выравниваний см. ниже). Все результаты подсчётов приведены в таблице.

ВыравниваниеIdentitySimilarityAlignment weight
10/21*100% = 47,6% 10/21*100% = 47,6% 14
9/21*100% = 42,86% 13/21*100% = 61,9% 17
13/22*100% = 59% 14/22*100% = 63,64% 44

Обсуждение результатов:

Выравнивание цитратсинтазы I с её ортологами

В данном разделе приведены результаты, полученные при проведении выравнивания моего белка с его ортологами (об ортологах см. соответствующий раздел второго семестра). Сначала был составлен файл, содержащий последовательности трёх белков в FASTA-формате.
Затем с использованием программы MUSCLE было проведено выравнивание последовательностей. Для каждой пары выровненных последовательностей были определены характеристики с использованием программы infoalign из пакета EMBOSS.

Описание программы infoalign:
Программа выводит данные о множественном (в том числе и о парном) выравнивании последовательностей. Важнейшие опции: Ниже представлены выходные данные программы infoalign для трёх пар последовательностей из совместного выравнивания.

NameSequence LengthAligned LengthGapsGap LengthIdentitySimilarityDifference% ChangeWeight
CISY_BACSU/1-366 366 377 3 11 366 0 0 2.917772 1.000000
CISY_BACCO/1-373 373 377 1 4 142 73 158 62.334217 1.000000

NameSequence LengthAligned LengthGapsGap LengthIdentitySimilarityDifference% ChangeWeight
CISY_BACSU/1-366 366 377 3 11 366 0 0 2.917772 1.000000
Q81QS0_BACAN/1-372 372 378 2 6 146 72 154 61.375660 1.000000

NameSequence LengthAligned LengthGapsGap LengthIdentitySimilarityDifference% ChangeWeight
CISY_BACCO/1-373 373 377 1 4 373 0 0 1.061008 1.000000
Q81QS0_BACAN/1-372 372 378 2 6 271 35 66 28.306879 1.000000

Выравнивание трёх последовательностей было окрашено по схеме Clustalx с использованием порога идентичности в 66% (позволяет окрашивать только те позиции, где идентичными являются 2 или 3 аминокислоты во множественном выравнивании (см. рис. 1).

Рис. 1 Участок выравнивания с 1-ой по 122-ю позицию выравнивания, раскрашенный по схеме Clustalx с порогом идентичности в 66%.

Дата последнего обновления: 31.03.2013
© Dmitry Travin, 2012