Практикум №9. Выравнивание последовательностей
1. Глобальное выравнивание гомологичных белков
Protein name |
ID 1 |
ID 2 |
Score |
% Identity |
% Similarity |
Gaps |
Indels |
6-phosphogluconate dehydrogenase, decarboxylating* |
6PGD_ECOLI |
6PGD_BACSU |
1718.0 |
70.0% |
83.4% |
3 |
3 |
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta |
ACCD_ECOLI |
ACCD_BACSU |
597.0 |
41.3% |
58.4% |
36 |
7 |
Glucose-6-phosphate 1-dehydrogenase |
G6PD_ECOLI |
G6PD_BACSU |
931.5 |
39.4% |
59.8% |
26 |
11 |
*У 6PGD_BACSU немного другое название: 6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating
2. Локальное парное выравнивание гомологичных белков
Protein name |
ID 1 |
ID 2 |
Score |
% Identity |
% Similarity |
Gaps |
Indels |
Coverage 1 |
Coverage 2 |
6-phosphogluconate dehydrogenase, decarboxylating* |
6PGD_ECOLI |
6PGD_BACSU |
1719.0 |
70.1% |
83.6% |
3 |
3 |
99,8% |
99,8% |
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta |
ACCD_ECOLI |
ACCD_BACSU |
614.0 |
48.5% |
66.5% |
5 |
3 |
85,2% |
88,3% |
Glucose-6-phosphate 1-dehydrogenase |
G6PD_ECOLI |
G6PD_BACSU |
935.5 |
39.7% |
60.3% |
25 |
10 |
99,2% |
99,4% |
Как я искал Coverage: вычел из последней координаты первую, прибавил единицу, результат поделил на длину.
3. Результат применения программ выравнивания к неродственным белкам
Alignment type |
ID 1 |
ID 2 |
Score |
% Identity |
% Similarity |
Gaps |
Indels |
Global |
ASNA_ECOLI |
ACP_BACSU |
15.0 |
4.1% |
8.8% |
277 |
5 |
Alignment type |
ID 1 |
ID 2 |
Score |
% Identity |
% Similarity |
Gaps |
Indels |
Coverage 1 |
Coverage 2 |
Local |
ASNA_ECOLI |
ACP_BACSU |
30.5 |
30.6% |
42.9% |
8 |
3 |
14.85 |
53.25 |
Ожидаемо, у негомологичных белков очень низкий вес, процент совпадающих и сходных букв относительно высок
только в локальном выравнивании (так как участок короткий, не говорит о гомологичности), в глобальном выравнивании много гэпов.
4. Множественное выравнивание белков и импорт в Jalview
А) Нашлось 65 белков с мнемоникой 6PGD.
Б) Выравнивание делал с помощью программы muscle:
создал список с ID:
sw:6pgd_bacsu
sw:6pgd_ecoli
sw:6pgd_chlpn
sw:6pgd_shidy
sw:6pgd_bucai
sw:6pgd_staam
sw:6pgd_halvd
с помощью команды seqret @eno.txt eno.fasta создал файл в формате fasta, c помощью команды muscle -in eno.fasta -out eno_alignment.fasta
запустил muscle.
В)
Ссылка на файл с проектом в Jalview
Г) Все белки гомологичны (так как при небольшом количестве гэпов имеется много совпадающих и сходных букв).
Наиболее консервативные участки (указаны номера столбцов): 5-39, 61-116, 124-162, 167-205, 223-310
,
322-379, 409-462