Выравнивание последовательностей и эволюционные закономерности.

Выравнивание 6 последовательностей белков семейства HSP70

Произведенное выравнивание представлено внизу и доступно по ссылке (предосторожность на случай некорректного отображения фрейма) Данные таблицы получены с помощью команды infoalign пакета emboss.
Название последовательностиДоменДлина последовательности в выравниванииКонсервативные позицииКонсервативные позиции,%Функционально консервативные позицииФункционально консервативные позиции,%ГэпыГэпы,%Позиции консервативные на 70%Позиции консервативные на 70%,%
DNAK_METMA Археи 674 184 27.29 261 38.72 53 7.86 234 34.72
DNAK_HALSA Археи 673 184 27.34 261 38.78 53 7.88 234 34.77
DNAK_NOCSJ Бактерии 677 184 27.17 261 38.55 53 7.83 234 34.57
DNAK_METPB Бактерии 677 184 27.17 261 38.55 53 7.83 234 34.57
HSP7A_DROME Эукариоты 663 184 27.75 261 39.37 53 8.00 234 35.29
DNAK_CYAM1 Эукариоты 669 184 27.50 261 39.01 53 7.92 234 34.98
Для данного выравнивания было введено дополнительное поле "Разметка". В нем отмечались колонки в выравниваниях, которые обладали определенными свойствами, а именно: F - функционально консервативные участки, C - участки консервативные на 80 и более %, G - участки выравнивания содержащие гэпы. Как функционально консервативные отмечались участки, в которых содержатся аминокислоты с близкими свойсвами. Например, в первой такой колонке (17) содержатся аланин, цистеин и валин - это гидрофобные аминокислоты среднего размера. В18 колонке похожая ситуация. Там представлены крупные гидрофобные аминокислоты: валин, фенилаланин и изолейцин. В 28 колонке тоже присутствуют крупные гидрофобные аминокислоты валин и изолейцин.

Эволюция последовательностей белка.

Эксперимент проводился на последовательности свиного ангиогенина - фактора роста сосудов. В ходе запуска этого скрипта происходило восемь раундов мутации и образования новых последовательностей. Ниже приведен список первых десяти мутаций с начала последовательности.

  1. В позиции 1 вставка фенилаланина от p4 к p5.
  2. В позиции 2 замена лизина на аргинин от р0 к р1.
  3. В позиции 5 вставка фенилаланина от p4 к p5.
  4. В позиции 8 вставка гистидина от p7 к p8.
  5. В позиции 14 вставка глицина от p2 к p3.
  6. В позиции 14 замена глицина на цистеин от p5 к p6.
  7. В позиции 16 замена глутамина на пролин от p6 к p7.
  8. В позиции 17 делеция гистидина от р6 к р7.
  9. В позиции 20 вставка глицина от р5 к р6.
  10. В позиции 23 замена пролина на серин от р3 к р4.

Выравнивание, проведенное по алгоритмы muscle, отличалось от эволюционного, поскольку программа поставила два гэпа в четвертой и пятой последовательности не в том месте. Это не отражает эволюционной закономерности, поскольку там происходила делеция треонина и вставка серина, что некорректно отображено в изначальном выравнивании. Первоначальное выравнивание находится на этой подстранице, а исправленное - на этой.

Эволюция последовательностей ДНК

Эксперимент проводился на последовательности ангиогенина черной крысы. В ходе запуска этого скрипта происходило семь раундов мутации и образования новых последовательностей. Впоследствии они были транслированны в один файл и выравнены. Результаты этого выравнивания доступны по ссылке. Последовательность меняется так сильно, поскольку изменения нуклеотидов могут приводить к появлению стоп-кодонов и сдвигу рамку считывания для самых серьезных перестроек белка.

Все файлы выравниваний лежат в этом проекте.


© Бусыгин Сергей, 2017