Protein Name | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels |
6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating* | 6PGD_ECOLI | 6PGD_BACSU | 1718.0 | 70.0 | 83.4 | 3 | 3 |
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha | ACCA_ECOLI | ACCA_BACSU | 814.5 | 51.1 | 66.0 | 14 | 4 |
Acyl carrier protein | ACP_ECOLI | ACP_BACSU | 216.0 | 60.3 | 71.8 | 1 | 1 |
Protein Name | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating* | 6PGD_ECOLI | 6PGD_BACSU | 1719.0 | 70.1 | 83.6 | 3 | 3 | 99.8% | 99.8% |
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha | ACCA_ECOLI | ACCA_BACSU | 823.5 | 53.8 | 69.6 | 3 | 2 | 97.8% | 95.1% |
Acyl carrier protein | ACP_ECOLI | ACP_BACSU | 216.0 | 61.0 | 72.7 | 0 | 0 | 98.7% | 100% |
Program | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
needle | 6PGD_BACSU | ACCA_BACSU | 33.5 | 9.0 | 13.7 | 466 | 17 | - | - |
water | 6PGD_BACSU | ACCA_BACSU | 51.5 | 22.7 | 32.0 | 77 | 10 | 23.2% | 48.6% |
Неудивительно, что для глобального выравнивания общая длина гэпов оказалась больше, чем длина каждой из последовательностей, а уровень схожести - очень низким. Локальное выравнивание показало меньшее по сравнению с локальными выравниваниями гомологичных последовательностей покрытие, что позволило создать выравнивание с большей схожестью, чем для глобального.
Для мнемоники ACP_* на Swiss-Prot нашлась 521 запись. Было выбрано 7 белков: sw:ACP_BACSU, sw:ACP_ECOLI, sw:ACP_VARPS, sw:ACP_STAAN, sw:ACP_CAMJE, sw:ACP_BORAP, sw:ACP_METRJ. Рекомендованное полное имя белка ACP_ECOLI - Acyl carrier protein.
Сначала с помощью команды
infoseq sw:acp_*|tr -s ' ' ','|cut -d ',' -f1|head -6|grep '^sw'|cut -c1,2,6-> acp.txt
был создан файл acp.txt с идентификаторами белков. С помошью команд
seqret @acp.txt acp.fasta
и
muscle -in acp.fasta -out acp_alignment.fasta
был создан общий fasta-файл с последовательностями и файл с выравниванием в формтае fasta соответственно.
Ссылка на проект JalviewВсе белки хорошо выровнялись. Гэпы можно обнаружить только на концах выравнивания, а сами последовательности содержат консервативные участки(например, 31-41, 43-53, 57-65), что позволяет сделать вывод о том, что белки гомологичны.