Выравнивание шести гомологичных последовательностей
Из предложенной таблицы были случайным образом были выбраны шесть белков из семейства HSP70. Последовательности в FASTA-формате были получены
из базы данных Uniprot[1]:
- Uniprot ID: Q3IUI0; DNAK_NATPD; Chaperone protein DnaK (Archaea)
- Uniprot ID: Q6L0S7; DNAK_PICTO; Chaperone protein DnaK (Archaea)
- Uniprot ID: Q1IT15; DNAK_KORVE; Chaperone protein DnaK (Bacteria)
- Uniprot ID: A5CM86; DNAK_CLAM3; Chaperone protein DnaK (Bacteria)
- Uniprot ID: P78695; GRP78_NEUCR; 78 kDa glucose-regulated protein homolog (Eukaryota)
- Uniprot ID: Q96W30; HSP72_PARBA; Heat shock 70 kDa protein 2(Eukaryota)
Далее данные последовательности были выравнены с помощью инструментов JalView.
Длина выравнивания составила 744 позиции. Ниже вы можете увидеть фрагмент полученного
выравнивания, окрашенного по схеме ClustalX, причем окрашены абсолютно консервативные позиции (т.е. те, которые совпадают для всех последовательностей).
|
Рис. 1. Фрагмент выравнивания шести гомологичных последователеностей. |
После выравнивания последовательностей была добавлена разметка для разных типов консервативности:
консервативных на 80% или более (C), абсолютно функционально консервативных (F), позиций с гэпами (G). Ссылка
на проект JalView.
|
Рис. 2. Фрагмент выравнивания шести гомологичных последователеностей с разметкой. |
Из функционально консервативных позиций были отмечены 42, 55, 64 и 91 позиции. Здесь чередуются изолейцин, лейцин и валин - это группа аминокислот,
состоящая из небольших по размеру алифатических аминокислот, поэтому, можно предположить, что при замене одной на другую, свойства белков не
будут сильно различаться.
Далее с помощью команды infoalign пакета EMBOSS были рассчитаны параметры консервативности: длина выравнивания, число и процент абсолютно консервативных позиций, число и процент
абсолютно функционально консервативных позиций, число и процент позиций с гэпами, число и процент позиций, консервативных на 70% или более.
Ниже представлены таблицы с некоторыми данными.
Таблица 1. Параметры консервативности выравнивания. |
Длина выравнивания |
Количество абсолютно консервативных позиций | % |
Количество абсолютно функционально консервативных позиций | % |
Количество консервативных на 70% позиций | % |
744 | 163 | 23.02 | 278 | 37.37 |
255 | 34.27 |
Таблица 2. 70% консервативность последовательностей, гэпы. |
Последовательность | Длина, а.о. | Длина выравнивания | Количество консервативных на 70 и более процетов позиций | % |
Количество гэпов | Количество позиций с гэпами | % |
DNAK_NATPD | 656 | 708 | 309 | 43.64 | 14 | 52 | 7.35 |
DNAK_PICTO | 613 | 699 | 302 | 43.21 | 14 | 86 | 12.30 |
DNAK_KORVE | 644 | 702 | 322 | 45.87 | 14 | 58 | 8.26 |
DNAK_CLAM3 | 623 | 707 | 311 | 43.99 | 14 | 84 | 11.88 |
GRP78_NEUCR | 661 | 732 | 310 | 42.35 | 11 | 71 | 9.70 |
HSP72_PARBA | 654 | 699 | 293 | 41.92 | 13 | 45 | 6.44 |
Небывалая эволюция последовательности белка
В данном задании было необходимо провести несколько сеансов работы с проведением 7 точечных мутаций в каждом. Для выполнения задания был взят
фрагмент ранее описанного белка [2], размером 100 а.о. Данное задание было выполнено с помощью функции msbar и некоторых ее параметров
пакета EMBOSS. Ниже вы можете видеть изображение автоматически полученного выравнивания, отражающее эволюцию фрагмента белка в течение 700 лет.
Ссылка на проект jalview
|
Рис. 3. Фрагмент выравнивания, отражающего эволюцию белка. |
Далее вручную выравнивание было поправленно (вставлены гэпы на позиции, некоторые, наоборот, удалены). Ниже вы можете видеть изображение исправленного выравнивания.
Ссылка на проект jalview
|
Рис. 4. Фрагмент исправленного выравнивания, отражающего эволюцию белка. |
В таблице, приведенной ниже вы можете увидеть, какие мутации произошли в первых десяти позициях.
Таблица 5. Мутации, их расположение в выравнивании и во времени. |
Номер мутации | Позиция | Мутация | Поколение |
1 | 4 | Вставка треонина | p2 |
2 | 9 | Вставка аланина | p6 |
3 | 11 | Вставка аргинина | p3 |
4 | 12 | Вставка триптофана | p6 |
5 | 15 | Вставка аланина | p4 |
6 | 22 | Вставка и делеция лейцина | p3, p6 |
7 | 29 | Вставка валина и последующая замена на метионин | p4 |
8 | 32 | Вставка аланина | p3 |
9 | 33 | Вставка аланина | p7 |
10 | 34 | Вставка серина | p2 |
Ссылка на bash-скрипт.
Источники:
[1]: UniProt;
|