Практикум №9. Выравнивание последовательностей

1. Глобальное выравнивание гомологичных белков

Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
6-phosphogluconate dehydrogenase, decarboxylating* 6PGD_ECOLI 6PGD_BACSU 1718.0 70.0% 83.4% 3 3
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta ACCD_ECOLI ACCD_BACSU 597.0 41.3% 58.4% 36 7
Glucose-6-phosphate 1-dehydrogenase G6PD_ECOLI G6PD_BACSU 931.5 39.4% 59.8% 26 11
*У 6PGD_BACSU немного другое название: 6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating

2. Локальное парное выравнивание гомологичных белков

Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
6-phosphogluconate dehydrogenase, decarboxylating* 6PGD_ECOLI 6PGD_BACSU 1719.0 70.1% 83.6% 3 3 99,8% 99,8%
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta ACCD_ECOLI ACCD_BACSU 614.0 48.5% 66.5% 5 3 85,2% 88,3%
Glucose-6-phosphate 1-dehydrogenase G6PD_ECOLI G6PD_BACSU 935.5 39.7% 60.3% 25 10 99,2% 99,4%
Как я искал Coverage: вычел из последней координаты первую, прибавил единицу, результат поделил на длину.

3. Результат применения программ выравнивания к неродственным белкам

Alignment type ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Global ASNA_ECOLI ACP_BACSU 15.0 4.1% 8.8% 277 5
Alignment type ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Local ASNA_ECOLI ACP_BACSU 30.5 30.6% 42.9% 8 3 14.85 53.25

Ожидаемо, у негомологичных белков очень низкий вес, процент совпадающих и сходных букв относительно высок только в локальном выравнивании (так как участок короткий, не говорит о гомологичности), в глобальном выравнивании много гэпов.

4. Множественное выравнивание белков и импорт в Jalview

А) Нашлось 65 белков с мнемоникой 6PGD.
Б) Выравнивание делал с помощью программы muscle:
создал список с ID:
sw:6pgd_bacsu sw:6pgd_ecoli sw:6pgd_chlpn sw:6pgd_shidy sw:6pgd_bucai sw:6pgd_staam sw:6pgd_halvd
с помощью команды seqret @eno.txt eno.fasta создал файл в формате fasta, c помощью команды muscle -in eno.fasta -out eno_alignment.fasta запустил muscle.
В) Ссылка на файл с проектом в Jalview
Г) Все белки гомологичны (так как при небольшом количестве гэпов имеется много совпадающих и сходных букв). Наиболее консервативные участки (указаны номера столбцов): 5-39, 61-116, 124-162, 167-205, 223-310 , 322-379, 409-462