Практикум 11

Парное выравнивание

Protein Name ID1 ID2 Score % Identity % Similarity Gaps Indels
6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating* 6PGD_ECOLI 6PGD_BACSU 1718.0 70.0 83.4 3 3
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha ACCA_ECOLI ACCA_BACSU 814.5 51.1 66.0 14 4
Acyl carrier protein ACP_ECOLI ACP_BACSU 216.0 60.3 71.8 1 1
Таблица 1. Характеристики глобального парного выравнивания трёх пар белков программой needle.

*для ECOLI: 6-phosphogluconate dehydrogenase, decarboxylating
Protein Name ID1 ID2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating* 6PGD_ECOLI 6PGD_BACSU 1719.0 70.1 83.6 3 3 99.8% 99.8%
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha ACCA_ECOLI ACCA_BACSU 823.5 53.8 69.6 3 2 97.8% 95.1%
Acyl carrier protein ACP_ECOLI ACP_BACSU 216.0 61.0 72.7 0 0 98.7% 100%
Таблица 2. Характеристики локального парного выравнивания трёх пар белков программой water.

*для ECOLI: 6-phosphogluconate dehydrogenase, decarboxylating
Program ID1 ID2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
needle 6PGD_BACSU ACCA_BACSU 33.5 9.0 13.7 466 17 - -
water 6PGD_BACSU ACCA_BACSU 51.5 22.7 32.0 77 10 23.2% 48.6%
Таблица 3. Характеристики глобального и локального парного выравнивания одной пары белков 6PGD_BACSU и ACCA_BACSU.

Неудивительно, что для глобального выравнивания общая длина гэпов оказалась больше, чем длина каждой из последовательностей, а уровень схожести - очень низким. Локальное выравнивание показало меньшее по сравнению с локальными выравниваниями гомологичных последовательностей покрытие, что позволило создать выравнивание с большей схожестью, чем для глобального.

Множественное выравнивание

Для мнемоники ACP_* на Swiss-Prot нашлась 521 запись. Было выбрано 7 белков: sw:ACP_BACSU, sw:ACP_ECOLI, sw:ACP_VARPS, sw:ACP_STAAN, sw:ACP_CAMJE, sw:ACP_BORAP, sw:ACP_METRJ. Рекомендованное полное имя белка ACP_ECOLI - Acyl carrier protein.

Сначала с помощью команды

infoseq sw:acp_*|tr -s ' ' ','|cut -d ',' -f1|head -6|grep '^sw'|cut -c1,2,6-> acp.txt

был создан файл acp.txt с идентификаторами белков. С помошью команд

seqret @acp.txt acp.fasta

и

muscle -in acp.fasta -out acp_alignment.fasta

был создан общий fasta-файл с последовательностями и файл с выравниванием в формтае fasta соответственно.

Ссылка на проект Jalview

Папка с выравниваниями

Все белки хорошо выровнялись. Гэпы можно обнаружить только на концах выравнивания, а сами последовательности содержат консервативные участки(например, 31-41, 43-53, 57-65), что позволяет сделать вывод о том, что белки гомологичны.