Работа с JalView


1. Выравнивание 6 последовательностей гомологичных белков семейства HSP70



Выбранные белки


ИдентификаторМнемоникаНазвание белкаНазвание ДНКДлинаОрганизмДоменСистематическая группа
Q97BG8DNAK_THEVO Chaperone protein DnaK (HSP70) (Heat shock 70 kDa protein) (Heat shock protein 70) dnaK TV0487 TVG0471466 613Thermoplasma volcanium (strain ATCC 51530 / DSM 4299 / JCM 9571 / NBRC 15438 / GSS1) Archaea Euryarchaeota
P50023DNAK_THEAC Chaperone protein DnaK (HSP70) (Heat shock 70 kDa protein) (Heat shock protein 70) dnaK Ta1087 613Thermoplasma acidophilum (strain ATCC 25905 / DSM 1728 / JCM 9062 / NBRC 15155 / AMRC-C165) Archaea Euryarchaeota
C3LTA5DNAK_VIBCM Chaperone protein dnaK (HSP70) (Heat shock 70 kDa protein) (Heat shock protein 70) dnaK VCM66_0812 635Vibrio cholerae serotype O1 (strain M66-2) Bacteria Proteobacteria
Q7MN85DNAK_VIBVY Chaperone protein DnaK (HSP70) (Heat shock 70 kDa protein) (Heat shock protein 70) dnaK VV0832 636Vibrio vulnificus (strain YJ016) Bacteria Proteobacteria
P11141HSP7F_CAEEL Heat shock 70 kDa protein F, mitochondrial hsp-6 hsp70f C37H5.8 657Caenorhabditis elegans Eukaryota Opisthokonta
P27420HSP7C_CAEEL Heat shock 70 kDa protein C hsp-3 hsp70c C15H9.6 661Caenorhabditis elegans Eukaryota Opisthokonta


Выравнивание 6 последовательностей белков JalView


G - гэп
C - консервативная не менее чем не 80% последовательность
F - абсолютно (100%) функционально консервативная последовательность

Параметры консервативности белков


Мнемоника белкаDNAK_THEVODNAK_THEACDNAK_VIBCMDNAK_VIBVYHSP7F_CAEELHSP7C_CAEELВыравнивание в целом
Длина без выравнивания613613635636657661-
Длина после выравнивания656656660660680690691
Число инделей1011111110617
Число гэпов 434325242329117
Процент гэпов, %6,556,553,793,643,384,2016,93
Абсолютно консервативные позиции190190190190190190190
Процент А. К. П., %28,9628,9628,7928,7927,9427,9427,50
Абсолютно функционально консервативные позиции299299299299299299299
Процент А. Ф. К. П., %45,5845,5845,3045,3043,9743,3343,27
Консервативные позиции на 70% и более325322362360329298-
Процент К. П. На 70% и более, %49,5449,0954,8554,5548,3843,19-

Абсолютно функционально консервативные последовательности состоят из сходных по свойствам аминокислот, имеющих положительное значение на пересечении матрицы BLOSUM62.

2. Искусственная эволюция



Выбранная последовательность (100 а.к.о.)


>Q97BG8[1:100]  
MSKIIGIDLGTSNSAAAVVISGKPTVIPSSEGVSIGGKAFPSYVAFTKDGQMLVGEPARR
QALLNPEGTIFAAKRKMGTDYKFKVFDKEFTPQQISAFIL


Программное выравнивание




Ручное выравнивание



Первостепенной целью ручной коррекции было создание наибольшего числа абсолютно консервативных последовательностей. Второстепенной целью являлось создание максимально консервативных последовательностей из числа оставшихся аминокислот. Третьестепенной целью было уменьшение числа гэпов (не в ущерб основным целям).

Ход эволюции


Указано для первых 10 позиций с мутациями ручного выравнивания:
1 поколение: позиция 10, делеция аспарагиновой кислоты
2 поколение: позиция 16, вставка аспарагина
3 поколение: мутаций нет
4 поколение: позиция 5, вставка аспарагина; позиция 8, вставка аспарагина; позиция 14, делеция серина; позиция 21, вставка аланина
5 поколение: позиция 4, делеция изолейцина; позиция 20, вставка валина
6 поколение: позиция 7, делеция глицина
7 поколение: позиция 1, замена метионина на гистидин
Источники:
NCBI
архив с выделениями в JalView (.jvp) и bash-скриптами (.sh)


© Матвеев Андрей, 2017 AD