Практикум 9. Выравнивание последовательностей

2. Глобальное парное выравнивание гомологичных белков

Protein name ID1 ID2 Score % Identity % Similarity Gaps Indels
6-phosphogluconate dehydrogenase, decarboxylating 6PGD_ECOLI 6PGD_BACSU 1718.0 70.0% 83.4% 3 3
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha ACCA_ECOLI ACCA_BACSU 814.5 51.1% 66.0% 14 4
Acyl carrier protein ACP_ECOLI ACP_BACSU 216.0 60.3% 71.8% 1 1

Локальное парное выравнивание гомологичных белков

Protein name ID1 ID2 Score % Identity % Similarity Gaps Indels Coverage1 Coverage2
6-phosphogluconate dehydrogenase, decarboxylating 6PGD_ECOLI 6PGD_BACSU 1719.0 70.1% 83.6% 3 3 99.79% 99.79%
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha ACCA_ECOLI ACCA_BACSU 823.5 53,8% 69.6% 3 2 85,27% 69,23%
Acyl carrier protein ACP_ECOLI ACP_BACSU 216.0 61.0% 72.7% 0 0 98.72% 98.72%

4. Комментарии к выравниваниям

По резудьтатам выравнивания можно сказать, что все три белка гомологичны, т. к. в каждом из выравниваний Identity больше или значительно больше 25%. Локальное выравнивание не оказалось сильно информативнее глобального: во всех трех белках идентичность отличается крайне малов в глобальном и локальном выравнивании.

5. Результат применения программ выравнивания к неродственным белкам

Выравнивание ID1 ID2 Score % Identity % Similarity Gaps Indels Coverage1 Coverage2
Глобальное 6PGD_ECOLI ACCA_ECOLI 48.0 14.9% 23.8% 273 23 - -
Локальное 6PGD_ECOLI ACCA_ECOLI 56.5 21.5% 33.1% 105 16 48,08% 85,27%

Как и предполагалось, белки оказались негомологичными: гомологичные участки отсутствуют, identity меньше 25%, также simularity в обоих случаях имеет низкое значение.

6. Множественное выравнивание белков и импорт в Jalview

Для множественного выравнивания был выбран белок с мнемоникой 6PGD. Имя белка у E. coli - 6PGD_ECLOI. Всего в UniProt нашлось 56 белков с такой мнемоникой. Для множественного выравнивания, помимо белков 6PGD_ECOLI и 6PGD_BACSU были выбраны следующие белки: 6PGD_SHEEP, 6PGD_RAT, 6PGD_HUMAN, 6PGD_TRYBB, 6PGD_HALVD. Для выполнения выравнивания я создал текстовый файл с USA исследуемых белков, с помощью программы seqret изменил формат файла с txt на fasta, применил к файлу программу muscle и импортировал файл из выдачи в JalView.

Проект Jalview

По результатам выравнивания можно сказать, что белки выравнялись хорошо и скорее всего являются гомологичными: на это указывает высокий процент идентичности значительное количество консервативных участков. Наиболее длинными из таких участков являются 186-192 (189 позиция неидентична у 6PGD_TRYBB0), 103-106 (104 позиция неидентична у 104), 132-134, 267-270 (267, 268 позиции неидентичны). Также присутствует множество более коротких консервативных участков