Учебный сайт Юдиной А.С.

Главная

Обо мне

Семестры

Выравнивания последовательностей белков.

Выравнивание гомологичнх последовательностей.

Для выполнения данного задания были взяты шесть последовательностей белков из семейства HSP70, белки этого семейства встречаются во всех трех доменах. Чтобы увидеть эволющионные взаимосвязи белков, было построено выравнивание в программе Jalview. Часть выравнивания с выделенными абсолютно консервативными участками представлена на рисунке ниже. DNAK_HALMT и DNAK_HALS3 - последовательности белков архей, DNAK_MYCBP и DNAK_MYCTU - бактерий, DNAK_THAPS и HSP70 THEPA - эукариот.


Риc.1

Таблица 1. Консервативность последовательностей.

Название Длина Длина выравнивания Абсолютно консервативные позиции % Функционально консервативные позиции % Gaps % Консервативные на 70% %
DNAK_HALMT 625 681 184 27.02 294 43.17 56 8.23 369 54.19
DNAK_HALS3 629 680 184 27.06 294 43.24 51 7.50 365 53.68
DNAK_MYCBP 625 682 184 26.98 294 43.10 57 8.36 378 55.43
DNAK_MYCTU 625 682 184 26.98 294 43.10 57 8.36 378 55.43
DNAK_THAPS 602 664 184 27.71 294 42.28 62 9.34 323 48.64
HSP70 THEPA 647 665 184 27.67 294 42.21 18 2.71 317 47.67

Все данные о консервативности белков получены с помощью программы Infoalign из пакета EMBOSS. Я выявила количество абсолютно консервативных позиций - аминокислотные остатки в которых совпадают полностью, количество абсолютно функционально консервативных позиций - в которых происходят замены на близкие по свойствам аминокислоты, количество "гэпов", количество позиций консервативных на 70 и более процентов.

В выравнивание я вставила дополнительную разметку, в которой указаны позиции: C - консервативные на более, чем 80%; F - функционально консервативные; G - содержащие пропуски.

Из функционально консервативных позиций я отметила 6,7,28 и 29 позиции. В них у разных организмов чередуются аланин(A), валин(V), лейцин(L) и изолейцин(I) - это алифатические аминокислоты, небольшого размера, поэтому скорее всего свойства белка не меняются значительно при замене их одна на другую.

Эволюция последовательности

Для построения следующих выравниваний я провела 10 раундов мутаций фермента глиоксалазы из организма Streptomyces globisporus C-1027. Последовательность этого белка имеет длину 115 аминокислотных остатка. Этот фермент участвует в метаболизме глутатиона - трипептида, определяющего окислительно-восстановительные характеристики внутриклеточной среды.[1]


Рис.2

На рисунке 2 представлено выравнивание, полученное в программе Jalview. Комментарии к наблюдаемым мутациям:

  1. В позиции 7 вставка глицина от p3 к p4.
  2. В позиции 11 вставка триптофана от p8 к p9.
  3. В позиции 12 замена аспарагина на гистидин от p4 к p5.
  4. В позиции 13замена лейцина на изолейцин от p3 к p4.
  5. В позиции 31 делеция тирозина от p4 к p5.
  6. В позиции 48 вставка серина от p4 к p5.
  7. В позиции 49 замена изолейцина на алланин от p7 к p8.
  8. В позиции 53 вставка валина p2 к p3.
  9. В позиции 57 происходит вставка аланина от p2 к p3, затем делеция от p5 к p6 и снова вставка этого же остатка.
  10. В позиции 67 происходит две замены: глутамина на лизин от p1 к p2 и лизина на глицин от p7 к p8.


Рис.3

Выравнивание, полоченное в программе пришлось редактировать вручную, на рисунке 3 представлен исправленный вариант.

  1. Я переставила остаток пролина с 10 на 9 позицию в p6, так как вероятнее всего произошла одна вставка пролина в позиции 10 с p6 на p7, чем делеция и снова вставка этого остатка в позиции 9.
  2. В исходной последовательности и p1 с позиций 29 переместила остатки аргинина на 28 позицию, так как вероятнее произошла только вставка пролина, чем вставка аргинина в 28 и замена аргинина на пролин в 29.
Сылка на скрипт. Ссылка на проект.

Эволюция нуклеотидной последовательности

Для выполнения этого задания я взяла нуклеотидную последовательность Chitin-binding protein [2] из организма Streptomyces globisporus C-1027. В своих предыдущих работах я уже описывала этот белок и его геномное окружение - 1 семестр. Сейчас могу добавит, что цепь этого белка включает сигнальную последовательность с 1 по 30 аминокислотный остаток и основной домен с 31 по 168 остаток. Также вероятность существоания этого белка - 4. [3]

Выравнивание получивщихся белковых последоваетльностей представлено на рисунке 4. Цветом выделены позиции, консервативные на 70 и более процентов, и таких оказалось весьма мало.


Рис.4

Можно увидеть следующие мутации:

  1. Вставка глутамина, лейцина и триптофана на позиции 1,2 и 3 соответственно от p1 к p2.
  2. Замена аденина на триптофан в позиции 5 от р1 к р2.
  3. В позиции 7 замена валина на метионин от р1 к р2 и затем делеция метионина от р6 к р7.
  4. В позиции 9 замена валина на аденин от р1 к р2 и затем замена аденина на аспарагиновую кислоту от р6 к р7.
  5. В позиции 14 произошло 3 замены: глутамат - цистеин от р1 к р2, цистеин - аргинин от р4 к р5, аргинин - глицин от р6 к р7.
  6. В позиции 18: глицин - серин от р1 к р2, делеция серина от р2 к р3, вставка метиони от р4 к р5, замена метина на глицин от р6 к р7.
  7. В позиции 19 замена валина на цистеин от р1 к р2 и обратно от р4 к р5.
  8. В позиции 23 делеция пролина от р0 к р1, затем вставка обратно от р4 к р5 и замена на аланин от р6 к р7.
  9. В позиции 26 вставка пролина от р4 к р5 и замена на аланин от р6 к р7.
  10. В позиции 27 вставка серина от р4 к р5.
Предположу, что белковая последовательность изменяется так сильно при мутациях в нуклеотидной последовательности (в сравнении с мутациями сразу в белке), из-за сдвига рамки считывания в связи с делециями и вставками новых нуклеотидов. Это объясняет множественные изменения, произошедшие, к примеру, от р1 к р2.

Из-за большого количества изменений в последовательности крайне сложно понять, как вероятнее всего сменялись аминокислотные остатки. Я сделала попытку исправить выравнивание вручную:


Рис.5

  1. Сдвинула аспарагиновую кислоту и аланин в позиции 8 и 9 соответственно в р7.
  2. Сдвинула аспаргиновую кислоту с 29 на 30 позицию в р5 и р6, при этом вставила еще одну позицию, в которой а=произошла вставка и делеция серина от р4 к р5 и от р6 к р7.

Сценарий, с помощью которого были получены измененные последоватльности, здесь.

Ссылка на проект для выравниваний.

Источники:

1. Глутатион - wikipedia.org
2. NCBI Nucleotide.
3. Uniprot - база данных последовательностей белков.


© Юдина Анастасия, 2016

з