9. Выравнивание последовательностей

1. Глобальное парное выравнивание гомологичных белков

Ссылка на скрипт на Python для поиска белков с одинаковой мнемноникой
Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
6-phosphogluconate dehydrogenase, decarboxylating (EC 1.1.1.44) 6PGD_ECOLI 6PGD_BACSU 1718.0 70.0% 83.4% 3 3
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha (ACCase subunit alpha) (Acetyl-CoA carboxylase carboxyltransferase subunit alpha) (EC 2.1.3.15) ACCA_ECOLI ACCA_BACSU 814.5 51.1% 66.0% 14 4
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta (ACCase subunit beta) (Acetyl-CoA carboxylase carboxyltransferase subunit beta) (EC 2.1.3.15) ACCD_ECOLI ACCD_BACSU 597.0 41.3% 58.4% 36 7

2. Локальное парное выравнивание гомологичных белков

Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
6-phosphogluconate dehydrogenase, decarboxylating (EC 1.1.1.44) 6PGD_ECOLI 6PGD_BACSU 1719.0 70.1% 83.6% 3 3 100% 100%
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha (ACCase subunit alpha) (Acetyl-CoA carboxylase carboxyltransferase subunit alpha) (EC 2.1.3.15) ACCA_ECOLI ACCA_BACSU 823.5 53.8% 69.6% 3 2 97.8% 96.0%
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta (ACCase subunit beta) (Acetyl-CoA carboxylase carboxyltransferase subunit beta) (EC 2.1.3.15) ACCD_ECOLI ACCD_BACSU 614.0 48.5% 66.5% 5 3 85.5% 89.6%

3. Результат применения программ выравнивания к неродственным белкам

Таблица 3. Характеристики глобального и локального выравнивания негомологичной пары белков
Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
5-formyltetrahydrofolate cyclo-ligase (5-FCL) (EC 6.3.3.2) (5,10-methenyltetrahydrofolate synthetase) (MTHFS) Protein names High-affinity zinc uptake system binding-protein ZnuA 5FCL_ECOLI ZNUA_BACSU 8.5 8.9% 14.7% 263 11 - -
5-formyltetrahydrofolate cyclo-ligase (5-FCL) (EC 6.3.3.2) (5,10-methenyltetrahydrofolate synthetase) (MTHFS) Protein names High-affinity zinc uptake system binding-protein ZnuA 5FCL_ECOLI ZNUA_BACSU 27.5 29.0% 45.2% 5 2 17.0% 9.7%

В глобальном выравнивании у 5FCL_ECOLI и ZNUA_BACSU очень низкий процент идентичности и очень большое число гэпов. В локальном выравнивании больший процент идентичности объясняется очень маленьким покрытием: выравнивание захватывает только 31 аминокислоту.

4. Множественное выравнивание белков и импорт в Jalview

Для выполнения этого задания я выбрал мнемонику ACCA, которая соответствует альфа субъединице ацетил-КоА-карбоксилазы (Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha)(далее - ACCA). Этот фермент осуществляет карбоксилирование ациетил-КоА с образованием малонил-КоА, который в дальнейшем участвует в реакциях синтеза жирных кислот. С помощью поиска в UnoProt были выбраны следующие белки для выравнивания: ACCA_ECOLI, ACCA_BACSU, ACCA_ANTSP, ACCA_ARATH, ACCA_NEOYE, ACCA_PEA, ACCA_PORPU. Эти идентификаторы были введены в текстовый файл и с помощью команды seqret был создан fasta-файл. После этого была запущена программа muscle и файл с выравниванием загружен в Jalview и колонки раскрашены по проценту идентичности. Ссылка на проект выравнивания в Jalview

Первое что бросается в глаза, это то, что ACCA_PEA (Pisum sativum) и ACCA_ARATH (Arabidopsis thaliana) имеют длину почти в два раза больше, чем другие вышеперечисленные ACCA (~800 и ~300 а.к. соответсвенно). Я просмотрел записи этих белков в UniProt и обнаружил, что все остальные белки, кроме ACCA_PEA и ACCA_ARATH, принадлежат бактериям (ACCA_ECOLI, ACCA_BACSU) и водорослям (ACCA_ANTSP, ACCA_NEOYE, ACCA_PORPU). А ACCA_PEA и ACCA_ARATH - высшим растениям. Предполагаю, что различие по длине объясняется этим.

Посмотрев на выравнивание, можно сказать, что наиболее консервативный участок располагается с 170 по 360 аминокислоту (далее - а.к.), там наибольшая идентичность. Так же, из-за разницы в длинах у ACCA низших растений и бактерий по бокам располагаются большие ГЭПы: с 0 по 90 а.к. и с 411 по 915. В месте выравнивания коротких ACCA с длинными (т.е. где нет длинных ГЭПов), по бокам располагаются малоконсервативные учатски (с 90 по 170 а.к. и с 360 по 411).