Практикум 11. Выравнивание последовательностей

1. Глобальное парное выравнивание гомологичных белков

Таблицу с идентификаторами скачала с Uniprot. Использовала следующие запросы: "mnemonic:*_ECOLI reviewed:yes" и "mnemonic:*_BACSU reviewed:yes". Объединила две таблицы в один файл и отсортировала по названию.

Далее выбрала для выравниваний 3 белка: 6-фосфоглюконатдегидрогеназу, 6-фосфоглюконолактоназу и аспартаткиназу.

Выравнила при помощи команды needle для выравнивания по Ниделману-Вуншу из пакета EBLOSSUM. Пример использования ниже.

needle 'sw:6PGD_ecoli' 'sw:6PGD_bacsu' 6PGD.needle -auto

Результаты свела в таблицу.

name	ID1	ID2	score	identify	similarity	gaps	indels
6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating/ 6-phosphogluconate dehydrogenase, decarboxylating	6PGD_BACSU	6PGD_ECOLI	1718.0	70.0%	83.4%	3	3
6-phosphogluconolactonase	6PGL_BACSU	6PGL_ECOLI	304.5	25.3%	42.0%	62	12
Aspartokinase 3/Lysine-sensitive aspartokinase 3	AK3_BACSU	AK3_ECOLI	358.5	26.7%	43.6%	65	17

2. Локальное парное выравнивание гомологичных белков

Белковые последовательности выравнила командой water для локального выравнив по Смиту-Уотерману из пакета EBLOSSUM. Пример использования:

water 'sw:6PGD_ecoli' 'sw:6PGD_bacsu' 6PGD.water -auto

Результаты выравнивания сведены в таблице

name	ID1	ID2	score	identify	similarity	gaps	indels	coverage 1	coverage 2
6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating/ 6-phosphogluconate dehydrogenase, decarboxylating	6PGD_BACSU	6PGD_ECOLI	1719.0	70.1%	83.6%	3	3	99,8%	99,8%
6-phosphogluconolactonase	6PGL_BACSU	6PGL_ECOLI	317.0	30.6%	48.7%	16	4	75,1%	76,1%
Aspartokinase 3/Lysine-sensitive aspartokinase 3	AK3_BACSU	AK3_ECOLI	360.5	27.3%	44.4%	57	14	98,2%	98,7%

3. Результат применения программ выравнивания к неродственным белкам

Аналогично предыдущим провела выравнивания двух негомологичных последовательностей: 53DR_BACSU и 3MG1_ECOLI. Результаты представлены в таблице

выравнивание	ID1	ID2	score	identify	similarity	gaps	indels	Coverage 1	Coverage 2
глобальное	53DR_BACSU	3MG1_ECOLI	22.5	13.2%	26.0%	125	12
локальное	53DR_BACSU	3MG1_ECOLI	29.0	19.4%	35.7%	48	8	51,81%	60,96%

Идентичность, схожесть и покрытие у этих последовательностей ниже, чем у гомологичных. Инделей меньше, поскольку для выравнивания двух несхожих последовательностей оптимально выравнять их на гэпы.

4. Множественное выравнивание белков и импорт в Jalview

Произвела поиск по запросу "mnemonic:6pgd_*" в UniProt. Всего таких белков в базе данных 57. Для анализа выбрала 6-фосфоглюконатдегидрогеназу Schizosaccharomyces pombe, Lactococcus lactis subsp. cremoris, Dictyostelium discoideum, Chlamydia trachomatis и человека.

Написала текстовый файл с мнемониками белков 6PGD_homologs.txt, создала fasta-файл с их последовательностями при помощи команды

seqret @6PGD_homologs.txt 6PGD.fasta

Произвела множественное выравнивание при помощи muscle[1].

muscle -in 6PGD.fasta -out 6pgd_align.fasta

Далее полученный файл открыла в Jalview, колонки раскрасила по проценту. Полученный проект доступен по ссылке или в гугл-диске.

Выравнивание в виде картинки представлено ниже

выравнивание, ничего интересного. можете пойти пить чай, хорошего дня

Видно, что есть участки с большей и меньшей схожестью. Самые консервативные участки, вероятно, влияющие на функцию или общую структуру белка, выделены темно-синим.

Литература

[1] Edgar, R.C. Nucleic Acids Res 32(5), 1792-97.