JalView. Выравнивание как отражение эволюции.


Часть первая. Выравнивания.

Для работы были выбраны шесть последовательностей гомологичных белков семейства HSP70 у эукариот, архей и бактерий. В таблице ниже представлены данные

EntryEntry nameProtein namesLengthSuperkingdomOrganism
Q9HRY2DNAK_HALSAChaperone protein DnaK (HSP70) 629ArchaeaHalobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) (Halobacterium halobium)
P0CW13DNAK_METMAChaperone protein DnaK (HSP70) 619ArchaeaMethanosarcina mazei (strain ATCC BAA-159 / DSM 3647 / Goe1 / Go1 / JCM 11833 / OCM 88) (Methanosarcina frisia)
B5Z9P0DNAK_HELPGChaperone protein DnaK (HSP70) 620BacteriaHelicobacter pylori (strain G27)
Q82EX9DNAK1_STRAWChaperone protein dnaK1 (HSP70-1) 622BacteriaStreptomyces avermitilis (strain ATCC 31267 / DSM 46492 / JCM 5070 / NBRC 14893 / NCIMB 12804 / NRRL 8165 / MA-4680)
P20163HSP7D_CAEELHeat shock 70 kDa protein D657EukaryotaCaenorhabditis elegans
P29843HSP7A_DROMEHeat shock 70 kDa protein cognate 1641EukaryotaDrosophila melanogaster (Fruit fly)
Таблица 1.Основные данные по белкам.

Используя опцию Tcoffee with Defaults, было смоделировано выравнивание последовательностей белков с раскраской по схеме ClustalX, при Identity Threshold = 100%. Часть выравнивания приведена ниже ссылкой на полное выравнивание. Так же предоставляю ссылку на файл, автоматически сохданный JalView в формате .jvp Помимо базовой разметки, вроде консервативности, качества выравнивания и консенсуса (достоверности подстановки конкретного остатка на данной позиции) добавлена новая строка разметки по типам консервативности, где соответствующими буквами отмечены в качестве примера некоторые остатки консервативные на 80% или более (C), абсолютно функционально консервативные (F), и позиций с гэпами (G).


Кластер следующих таблиц отображает некоторые параметры выравнивания - каждой из исследуемых с помощью команды infoalign пакета EMBOSS последовательностей соответсвует строка таблицы следующего содержания: Name-Seqlen (имя и длина); AlignLen(длина выравнивания); GapLen,%(число и процент позиций с гэпами); Ident(число и процент идентичных позиций). Данные, полученные для консервативных и абсолютно консервативных позиций представлены в таблицах 2-4 . Функционально консервативной (с возможностью быть отмеченной F в выравнивании) считается позиция, в которой стоят те аминокислотные остатки, что обладают схожими свойствами, обусловленными схожими функциональными группами. Аминокислоты делятся на классы, с учётом их свойств и структурному составу радикала: ароматические, кислые, основные, амиды, серосодержащие и т.д. С Замена на позиции, приводящая к появлению на месте исходной аминокислоты той, что обладает схожими свойствами, характеризует консервативность данной позиции.

Таблица 2.Консервативность 100% Таблица 3.Консервативность 70% и выше:
Name-Seqlen AlignLen GapLen Ident Similar
DNAK_MYCVP_1-622 683 61 181 0
DNAK_METMA_1-619 683 64 181 0
HSP7A_DROME_1-641 683 42 181 0
DNAK_HALSA_1-629 683 54 181 0
DNAK1_STRAW_1-622 683 61 181 0
DNAK_HELPG_1-620 683 63 181 0
Name-Seqlen AlignLen GapLen Ident Similar
DNAK_MYCVP_1-622 683 61 366 5
DNAK_METMA_1-619 683 64 352 19
HSP7A_DROME_1-641 683 42 268 103
DNAK_HALSA_1-629 683 54 326 45
DNAK1_STRAW_1-622 683 61 353 18
DNAK_HELPG_1-620 683 63 326 45
Таблица 4.Функциональная консервативность 100%:Таблица 5.Функциональная консервативность 70% и выше:
Name-Seqlen AlignLen GapLen Ident Similar
DNAK_MYCVP_1-622 683 61 279 19
DNAK_METMA_1-619 683 64 268 30
HSP7A_DROME_1-641 683 42 233 65
DNAK_HALSA_1-629 683 54 262 36
DNAK1_STRAW_1-622 683 61 271 27
DNAK_HELPG_1-620 683 63 260 38
Name-Seqlen AlignLen GapLen Ident Similar
DNAK_MYCVP_1-622 683 61 370 35
DNAK_METMA_1-619 683 64 359 12
HSP7A_DROME_1-641 683 42 279 92
DNAK_HALSA_1-629 683 54 326 62
DNAK1_STRAW_1-622 683 61 368 39
DNAK_HELPG_1-620 683 63 334 58

Число консервативных позиций складывается из Ident и Similar. Представим сводную таблицу о выравнивании:

БелокЧисло абсолютно консервативных позицийДоля, %Число функционально консервативных позицийДоля, %Число гэповДоля, %Число позиций, консервативных на 70%Доля, %
DNAK_MYCVP1812629843.661937154.3
DNAK_METMA1812629843.6649.337154.3
HSP7A_DROME1812629843.6426.137154.3
DNAK_HALSA1812629843.654837154.3
DNAK1_STRAW1812629843.661937154.3
DNAK_HELPG1812629843.6639.237154.3
Таблица 2. Численные данные о полученном выравнивании.

Часть вторая. Эволюция.

В данной части, с целью симулировать процесс эволюции, была искусственно произведена мутация белка. За основу был взят фрагмент из ста нуклеотидов белка 4-альфа-амиломальтазы Corynebacterium glutamicum, уже известной нам по предыдущему практикуму, (Uniprot ID: Q8NNA7_CORGL) со 110 по 210 аминокислоту. С помощью команды msbar пакета EMBOSS в последовательность вносились мутации всех типов, кроме блоковых.
Ознакомиться со скриптом можно по данной ссылке.
В модельном эксперименте за единицу времени, 100 лет, в последовательности происходит семь точечных мутаций. Наблюдается 7 поколений предка: p > p1 > p2 > ... > p7. Для каждого следующег поколения предковой последовательностью считается послежовательность предыдущего поколения, уже претерпевшая какие-либо изменения(если это не изначальная последовательность, конечно). Таким образом в конце эксперимента мы имеем 8 поколений. Полученные последовательности были импортированы в программу Jalviewer, после чего выровнены с помощью Tcoffee with Defaults.


Соответственно, мы мутации на выбранном участке (они представлены в порядке возникновения):


Однако не все из искуственно-смоделлированных мутаций соответствовали бы естестественному ходу эволюции. Наименее вероятными показались бы нам вставки с последующим исчезновением позиции (вроде глутамата), неаналогичные замены аминокислот и тому подобное. Приведём два указанных примера с нашего участка (красным бегунком помечены исправленные участки):

или
Очевидно, что замены лизина на валин вообще не могло произойти, потому как эти аминокислоты не аналогичны. Значит на этом месте может либо остаться лизин, либо появиться гэп Возникновение гэпа на месте только что вставленной, то есть эволюционно-выгодной аминокислоты, тоже можно посчитать невозможным.

Полное выравнивание можно скачать по ссылке.

Ссылки:


Вернуться назад

На главную страницу


©Solonovich Vera,2017