Выравнивание последовательностей.

Задание 1

Для выполнния этого задания, я взял 6 гомологичных белков из семейства HSP70, построил выравнивание этих белков и раскраси по схеме ClustalX с условием "Identity Threshold = 100%".
Название записи Название белка Организм Домен
DNAK_HALLT Chaperone protein DnaK (HSP70) (Heat shock 70 kDa protein) (Heat shock protein 70) Halorubrum lacusprofundi (strain ATCC 49239 / DSM 5036 / JCM 8891 / ACAM 34) Archaea
DNAK_HALMA Chaperone protein DnaK (HSP70) (Heat shock 70 kDa protein) (Heat shock protein 70) Haloarcula marismortui (strain ATCC 43049 / DSM 3752 / JCM 8966 / VKM B-1809) (Halobacterium marismortui) Archaea
DNAK_CORGL Chaperone protein DnaK (HSP70) (Heat shock 70 kDa protein) (Heat shock protein 70) Corynebacterium glutamicum (strain ATCC 13032 / DSM 20300 / JCM 1318 / LMG 3730 / NCIMB 10025) Bacteria
DNAK_ARTS2 Chaperone protein DnaK (HSP70) (Heat shock 70 kDa protein) (Heat shock protein 70) Arthrobacter sp. (strain FB24) Bacteria
BIP2_ORYSJ Heat shock 70 kDa protein BIP2 (Luminal-binding protein 2) (OsBiP2) Oryza sativa subsp. japonica (Rice) Eukaryota
HSP7M_SOLTU Heat shock 70 kDa protein, mitochondrial Solanum tuberosum (Potato) Eukaryota
Таблица 1. Белки

Имя Длина последовательности Длина выравнивания Количевство гепов Длина гепов Длина гепов(%) Абсолютно консервативные Абсолютно консервативные(%) Функционально консервативные Функционально консервативные(%)
DNAK_HALLT 644 753 16 109 14.5 190 25.2 302 40.1
DNAK_HALMA 635 753 19 118 15.7 190 25.2 302 40.1
DNAK_CORGL 618 753 18 135 17.9 190 25.2 302 40.1
DNAK_ARTS2 622 753 19 131 17.4 190 25.2 302 40.1
BIP2_ORYSJ 669 753 16 84 11.2 190 25.2 302 40.1
HSP7M_SOLTU 682 753 19 71 9.4 190 25.2 302 40.1
Таблица 2. Параметры выравнивания.


Рисунок 1. Фрагмент выравнивания с отмеченными типами консервативности. Ссылка на выравнивание


Из таблицы 2. видно, что абсолютно консервативные позиции занимают более 25% выравнивания, в то же время функционально консервативные позиции занимают 40% всего выравнивания. Из этого я могу сделать вывод, что сохранение фунциональннально схожих аминокислотных остатков в белках важнее сохранение абсолютно консервативных позиций.

Виды консервативности:


Консервативных на 80% или более (C): позии 68, 75, 76
Абсолютно функционально консервативных (F): позиции 1, 61, 62
Позиций с гэпами (G): позиции 5, 6, 10

Задание 2

Для выполнения этого задания я взял последовательность белка "P00947" длиной 100 а.к.о(p0) и провел не более 7 точечных мутаций в каждом последующем поколении.
Рисунок 2. Выравнивание без исправлений. Ссылка на выравнивание

Рисунок 3. Выравнивание с исправлениями. Ссылка на выравнивание
Bash - скрипт.


Позиция Мутация Поколение(p)
1 25 вставка "Phe" p0-p1
2 56 вставка "Asn" p0-p1
3 47 вставка "Ala" p1-p2
4 56 делеция "Asn" p1-p2
5 40 делеция "Leu" p2-p3
6 47 вставка "Ala" p2-p3
7 1 вставка "Leu" p3-p4
8 29 вставка "Gln" p3-p4
9 54 делеция "Glu" p4-p5
10 20 замена "Leu" на "Glu" p6-p7

Таблица 3. Эволюция


Коментарии к исправлению выравнивания:


1)в p4 произошла вставка "Gln" на позицию 29, и все "Asp" в поколениях р4-р7 встали на 30 позиции, я перенес "Asp" в р0-р3 на 30 поцизию
2)в p0-р1 "Thr" 50 был гомологичен "Val" 50, теперь гомологичен "Thr" 49, и образовался консервативный на 87,5% столбец (различия лишь в p7


© Угольков Ярослав, 2017