ВЫРАВНИВАНИЕ КАК ОТРАЖЕНИЕ ЭВОЛЮЦИИ

ПОСТРОЕНИЕ ВЫРАВНИВАНИЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ГОМОЛОГИЧНЫХ БЕЛКОВ

В данной работы было пострено выравнивание последовательностей для шести гомологичных белков из семейства HSP70 (два из эукариот (PDB ID HSP7C_HUMAN_1; HSP71_YEAST_1), два из бактерий (PDB ID: DNAK_THEFY_1; DNAK_THEVO_1), два из архей (PDB ID: DNAK_BEUC1_1: DNAK_THEAC_1). Выравнивание было потстроено с помощью программы Jalview. Ниже приведен фрагмент результата ее работы (Рис. 1).

Рис.1 Выравнивание для шести последовательностей гомологичных белков

На Рис.1 одинаковыми цветами показаны абслютно консервативные позиции (колонки).

Под выравнием на Рис.1 добавлена строка с обозначением типа консерватизма для различных позиций, где "C" - позиции, консервативные более чем на 80%, "G" - позиции, содержащие гэп, "F" - абсолютно функциональные позиции (позиции, содержащие аминокислотные остатки из одних функциональных групп).

В данном случае пометки "F" были присвоены нескольким позициям, в том числе позиции 3, где расположены аналогичные по свойствам положительно заряженные аминокислотные остатки аргенина и лизина (аналогично позиции 61); в позициях 6 и 7 чередуются алифатические аминокислоты аланин, валин и изолейцин (аналогично в позициях 56, 72, 75) и т.д..

В таблице 1 содержатся информация о выравнии.

Таблица 1. Информация о выравнивании.
Uniprot IDДлина белкаДлина выравн. Абсолютно консерв. позиции%Функционально консерв. позиции %Число гэпов%Консерв. более чем на 70%%
DNAK_BEUC1_162868118927,7531339,94537,7833348,90
DNAK_THEAC_161368118927,7531339,06689,9933649,34
DNAK_THEFY_161368118927,7531341,41689,9934750,95
DNAK_THEVO_161368118927,7531339,06689,9933449,05
HSP7C_HUMAN_164668118927,7531338,47355,1431446,11
HSP71_YEAST_164268118927,7531338,47395,7331546,26

В таблице 1 приведена информация о длинах последовательностей и длине выравнивания, числе гэпов, числе абсолютно и функционально консервативных позиций, числе позиций, консервативных на 70%, и их процент от длины.

Для рассчетов результатов из таблицы была использована программа infoalign пакета EMBOSS.

ЭВОЛЮЦИЯ БЕЛКА

Эволюция белка изучалась на примере белка остеокальцина человека (Uniprot ID: OSTCN_HUMAN; составляет 1-2% от всех белков кости, прочно связывается с кальцием в костях), взятым из базы данных Uniprot. Длина данного белка 100 а.к..

При помощи команды msbar пакета EMBOSS было проведено семь раундов мутаций различных типов (делеции, вставки, замены, дупликации, перемешения). При этом исходная аминокислотная последовательность белка остеокальцина человека выступает в роли предка, а каждая последующая, полученная при помощи msbar последовательность - потомок, в котором за условно взятую единицу времени (100 лет) произошло 7 новых мутации. В дальнейшем поледовательности именуются p - предковая, p1, p2, p3... - полученные последовательным мутагенезом.

Ниже можно ознакомится со сценарием, при использовании которого были получены все последовательности и полученным на его выходе файле.*

На Рис.2 представлен результат выравнивания, предложенного Jalview для данных последовательностей.

Рис.2 Выравнивание восьми поколений последовательностей
КОММЕНТАРИИ К ВЫРАВНИВАНИЮ

  • Позиция 14: вставка лейцина (от p2 к p3)
  • Позиции 15,16: дупликации аланинов (от p5 к p6)
  • Позиция 23: дупликация глутамина (от p6 к p7)
  • Позиция 35: вставка тирозина (от p1 к p2)
  • Позиция 44: вставка валина (от p3 к p4)
  • Позиция 46: вставка пролина (от p2 к p3)
  • Позиция 47: вставка треонина (от p4 к p5)
  • Позиция 48: вставка лейцина (от p к p1)
  • Позиция 49: вставка лизина (от p4 к p5)

ИСПРАВЛЕННОЕ ВЫРАВНИВНИЕ

Не всегда выравнивания построенные автомататически, по заданным параметрам абслолютно верны. Некоторые могут содержать очевидные огрехи. В данном случае выравнивание, полученное в Jalview было несколько изменено, с целью убрать очевидные ошибки. Исправленное выравнивание продемонстрировано на Рис.3.
Рис.3 Исправленное выравнивание восьми поколений последовательностей
КОММЕНТАРИЙ К ИСПРАВЛЕННОМУ ВЫРАВНИВАНИЮM

  • Позиция 59: наиболее вероятная консервативность валина в колонке и вставка метионина (от p3 к p4), чем вставка валина и изменение валина на пролин в сосдней колонке (это подтверждается поэтапным сравнением полученных последовательностей).
  • Позиция 87: наиболее вероятна вставка валина в этой позиции от p к p1, а не замена пролина на валин, и его вставку в соседней колонке, учитывая консервативность пролина в соседней последовательности у всех потомков (аналогично подтверждается сравнением последовательностей).
*Сценарий получения семи поколений последовательности, каждое из которых получает по семь новых точечных мутаций.
Файл, содержащий получившиеся после мутирования последовательности, используемые в дальнейшем для выравнивания.

ЭВОЛЮЦИЯ НУКЛЕОТИДНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ

Для изучения того, как влияет изменение нуклеотидной последоваветльности на эволюцию белка, был взят белок ацетил-носитель (UniProt ID: ACP_BACSU)из протеома Bacillus subtilis (strain 168), изучавшийся в более ранней работе. Этот белок участвует в пути биосинтеза жирных кислот, являющимся частью липидного метаболизма. Длина данного белка 77 а.к..

Аналогично предыдущему экспериметну было проведено семь раундов мутаций различных типов (делеции, вставки, замены, дупликации, перемешения), однако на этот раз нуклеотидной последовательности. С помощью программы transeq из мутированных нуклеотидных последовательностей были получены белковые последовательности продуктов трансляций. Аналогично в дальнейшем поледовательности именуются p - предковая, p1, p2, p3... - полученные последовательным мутагенезом.

Ниже можно ознакомится со сценарием, при использовании которого были получены все последовательности и полученным на его выходе файле, а также с исходной нуклеотидной последовательностью*

На Рис.4 представлен результат выравнивания, предложенного Jalview для данных последовательностей.

Рис.4 Выравнивание восьми поколений последовательностей
КОММЕНТАРИИ К ВЫРАВНИВАНИЮ

  • Позиция 1: замена метионина на аспарагин (от p5 к p6)
  • Позиция 2: замена аланина на глицин (от p к p1)
  • Позиция 3: замена аспарагиновой кислоты на аргенин (от p к p1) и замена аргенина на глутамин (от p5 к p6)
  • Позиция 4: вставка серина(от p2 к p3), его замена на лизин (от p5 к p6) и замена на аспарагин (от p6 к p7)
  • Позиция 5: замена треонина на тирозин (от p к p1) замена на изолейцин (от p1 к p2) замена на тироцин (от p5 к p6) и обратная замена на изолейцин (от p к p1)
  • Позиция 6: замена лейцина на фенилаланин (от p5 к p6) и его обратная замена на лейин (от p6 к p5)
  • Позиция 7: замена глутаминовой кислоты на аргенин (от p5 к p6) и обратная замена на глутаминвую куслоту (от p6 к p7)
  • Позиция 8: замена аргенина на аланин (от p5 к p6), замена аланина на пролин (от p6 к p7)
  • Позиция 9: замена валина на цистеин (от p3 к p4), замена цистеина на валин (от p5 к p6), замена валина на цистеин (от p6 к p7)
  • Позиция 10: замена треонина на лизин (от p к p1), лизина на валин (от p1 к p2), валина на глицин (от p3 к p4), глицина на триптофан (от p5 к p6), триптофана на глицин (от p6 к p7)

ИСПРАВЛЕННОЕ ВЫРАВНИВНИЕ

Рис.5 Исправленное выравнивание восьми поколений последовательностей
КОММЕНТАРИЙ К ИСПРАВЛЕННОМУ ВЫРАВНИВАНИЮM

  • Позиция 10: перед лизином во второй последовательности добвлен гэп, а гэп в 13 позиции той же последовательности убран, так как ниболее вероятна консервативность лизина в этой колонке и трех последующих нуклеотидов между p2 и p3. Вероятно в 6 последовательности за счет изменений исходной нуклеотидной последовательности изменилась рамка считывания с первых позиций, так как в начале посследовательности ни одна аминокислота не совпадает с предыдущей аминокислотной последовательностью. Ближе к концу поледовательности этот процесс пропадает, а седьмая поледовательности с четвертой аминокислоты, по-видимому возвращается к исходной рамке.
  • Позиция 23: были добавлены гэпы в позиции 22 у последовательностей p5-p7, консервативность глйтаминовой кислоты в позиции 23, а также консервативность четырах валинов в позициях 24-27 p4, p6 и фрагмента SCCG в тех же позициях последовательностей p5, p7.Таже были добавлены гэпы в позиции 30 p-p3 и позицию 29 для p4, чтобы сохранить полученное программой выравнивание остальной части последовательностей.
*Сценарий получения семи поколений последовательности, каждое из которых получает по семь новых точечных мутаций.
Файл, содержащий получившиеся после мутирования последовательности, используемые в дальнейшем для выравнивания.
Файл, содержащий исходную нуклеотидную последовательность.

TAKE HOME MESSAGE

"Только мутации в половых клетках наследуются" - Этот тезис применим к группе организмов, размножающихся только половым путем. В случае бесполого и вегетативного размножения, свойственного многим живым организмам, в том числе большинству растениям, грибам, некоторым животным и т.д, утверждать подобное не является целесообразное. Контрпример: существуют виды, не размножающиеся половым путем, и тем не менее нельзя утверждать, что в их геномах не происходят мутации. Зеленая водоросль хлорелла, размножающаяся лишь вегетативно, делением клетки пополам, будучи одноклеточной, передает все возникающие соматические мутации потомству. При бесполом размножении у грибов, мутации возникающие не в половых клетках, будут также переданы потомству.

"В гомологичных последовательностях живущих сегодня организмов мы видим почти исключительно мутации, прошедшие отбор" - многие вредные мутации, не являющиеся летальными, все же снижают жизнеспособность особи-носителя, понижают ее шансы на выживание, и, вероятно, в дальнейшем приведут к гибели. Во-первых, если в тезисе идет речь о нуклеотидных последовательностях, часть вредных мутаций, могут не проявлятся в фенотипе, но все же накапливаться генетическим грузом в генотипе. Пример - рецессивные мутации. Такие мутации безусловно могут присутствовать в геномах живущих организмов, но про них не в кое мере нельзя сказать, что они прошли отбор. При серповидно-клеточной анемии, гоммологичная последовательность живущих на сегодняшний день нездоровых людей также существует, однако нельзя сказать, что эта последовательность прошла отбор.

Главнaя страница

© Анна Камышева 2016