<< BACK

Выравнивание как отражение эволюции.
Jalview

Задание №1

Я построил 6-последовательное выравнивание по алгоритму ТcoffeeWSслучайно выбранных белков в семействе HSP70 из Eukaryota, Bacteria и Archea.Затем окрасил его по схеме ClustalX с условием Identity Threshold = 100% (представлено на рис. 1). Цветовая схема совершает окрашивание столбцов только со 100% идентичными аминокислотными остатками в каждой последовательности.

Рис 1. Полное выравнивание


На выравнивании я разметил несколько позиций, консервативных на 80% и более (C), функционально консервативных (F), позиций с гэпами (G). Так, в позициях 6, 7, 17, 28 функциональная консервативность обуславливается наличием гидрофобных а.к.о. аланина, валина, изолейцина и лейцина. В позиции 162 присутствуют функционально идентичные остатки аспарагиновой и глутаминовой кислот, имеющих положительный заряд при физиологических pH. Также я определил основные свойства рассматриваего выравнивания с помощью пакета программ EMBOSS, для этого мною использовалось три различные опции: -identity 100.0, -identity 70.0 и -plurality 100.0. Сначала продемонстрировано идентичные на 100% остатки, затем - на 70%, в итоге - на 100% функционально идентичные остатки. Кроме этого, мною использовались функции для подсчета количества позиций, занимаемых "гэпами" (-gapcount) и длины выравнивания (-alignlength). Полученные данные можно увидеть в таблице 1.


Taблица 1. Основные свойства выравнивания 1

Uniprot AC
Domain
Sequence length
Alignment length
Amount of gap positions
Percent of gap positions
Amount of 100%
conserved positions
Percent of 100%
conserved positions
Amount of 70%
conserved positions
Percent of 70%
conserved positions
Amount of functionally
conserved positions
Percent of functionally
conserved positions
DNAK_HALLT_1-644 Archaea 644 688 44 6,4 218 31,69 337 48,98 357 51,89
DNAK_HALMA_1-635 Archaea 635 688 53 7,7 218 31,69 337 48,98 358 52,03
DNAK_MYCTO_1-625 Bacteria 625 688 63 9,16 218 31,69 337 48,98 365 53,05
DNAK_STRCO_1-618 Bacteria 618 688 70 10,17 218 31,69 337 48,98 357 51,89
HSP7C_RAT_1-646 Eukaryota 646 688 42 6,1 218 31,69 337 48,98 330 47,97
HSP7C_HUMAN_1-646 Eukaryota 646 688 42 6,1 218 31,69 337 48,98 330 47,97

В таблице 1 представленые результаты расчета параметров выравнивания с помощью команды infoalign пакета EMBOSS. Всего абсолютно консервативных позиций в выравнивании 218, абсолютно функционально консервативных - 337. Стоит отметить, что длина гэпов, их расположение, а также параметры неполной консервативности для пары белков, взятых из одной систематической группы, схожи или идентичны, например, как для человеческого и крысиного белка.



Задание №2

Для моделирования возникновения мутаций в белке мной был выбран гистон H4 человека (UniProtID - H4_HUMAN), длина которого составляет 103 а.к.о. Текст скрипта bash, работающего на EMBOSS и добавляющего 7 случайных мутаций в каждом поколении. Для построения выравнивания я использовал программу JalView, алгоритм TcoffeeWS, раскраску ClusterX с порогом идентичности 100%. Неисправленное выравнивание по ссылке.

Рис 2. Исправленное выравнивание. Gen0- исходная последовательность, Gen1-Gen7 - видоизмененные потомки. TCoffeeWS с 100% идентичность.

Мутации были воспроизведены таким образом, что только семь точечных мутаций произошло в каждом из семи рассматриваемых пооколений. Информация о первых десяти позициях содержится в таблице 2.


Taблица 2. Данные о первых десяти мутациях в искусственно мутированном белке.

Было, а.к.о (поз.)Стало, а.к.о (поз.)Поколение мутации
SG(2,3)SSG(2,3,4)g3-g4
S(3)M(3)g5-g5
SSG(2,3,4)SAMG(2,3,4,5)g5-g6
GL(10,11)GGL(10,11,12)g2-g3
LG(11,12)LRG(12,13,14)g2-g3
GAK(15,16,17)GK(15,16)g0-g1
KR(17,18)KGR(16,17,18)g0-g1
HR(19,20)HKR(19,20,21)g0-g1
GR(20,21)GER(21,22,23)g5-g6
HKR(21,22,23)HHR(22,23,24)g3-g4

Мной были перенесены лейцины из позиции 14 выравнивания в позицию 13, чтобы была идентичность. В позицию 20 вставил гэпы 1-7 поколениям, чтобы получилась полностью консервативная колонка лизинов. Перенес лизины из 30 позиции в 29. Подводя итог, можно утверждать, что выравнивание указывает лишь на возможный путь эволюции. Данный опыт показал, что эвистический алгоритм выравнивания не способен правильно восстановить даже простой пример процесса эволюции.