Выравнивание последовательностей

Глобальное парное выравнивание гомологичных белков

Для выравнивания программой needle (с параметрами по умолчанию) трех пар белков из штамма K12 кишечной палочки (идентификатор заканчивается на _ECOLI) и штамма 168 сенной палочки (идентификатор заканчивается на _BACSU) были выбраны мнемоники ZUR_, ACCD_ и PURA_.

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta ACCD_ECOLI ACCD_BACSU 597.0 41.3% 58.4% 36 7
Adenylosuccinate synthetase PURA_ECOLI PURA_BACSU 992.0 45.6% 63.8% 6 6
Zinc-specific metallo-regulatory protein ZUR_ECOLI ZUR_BACSU 93.0 20.9% 33.0% 48 9

Локальное парное выравнивание гомологичных белков

Выравнивание выполнено программой water с параметрами по умолчанию.

Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta ACCD_ECOLI ACCD_BACSU 614.0 48.5% 66.5% 5 3 85.2% 88.3%
Adenylosuccinate synthetase PURA_ECOLI PURA_BACSU 995.0 45.9% 64.3% 4 4 99.5% 99.5%
Zinc-specific metallo-regulatory protein ZUR_ECOLI ZUR_BACSU 104.5 25.0% 42.1% 14 5 78.9% 90.3%

Комментарии к выравниваниям

ACCD_ECOLI / ACCD_BACSU

Глобальное выравнивание показало идентичность 41.3%, подобие 58.4%, всего 36 гэпов, вес 597.0. Поэтому белки можно считать гомологичными (процент идентичности > 25%).

Локальное выравнивание оказалось точнее глобального: идентичность 48.5%, подобие 66.5%, 5 гэпов, вес 614.0 и покрытие 85.2% и 88.3%. Большая часть обоих белков попала в выравнивание.

Вывод: Белки можно считать гомологичными по всей длине, так как локальное и глобальное выравнивания дало схожие результаты. Но локальное выравнивание более информативно, так как, например, процент идентичности выше, а количество гэпов, напротив, значительно меньше.

PURA_ECOLI / PURA_BACSU

Глобальное выравнивание показало неплохие результаты: идентичность 45.6%, подобие 63.8%, всего 6 гэпов, вес 992.0. Белки можно считать гомологичными, так как процент идентичности больше 25%.

Локальное выравнивание дало очень близкие к глобальному выравниванию результаты: идентичность 45,9%, подобие 64,3%, 4 гэпа, покрытие 99,5% для обоих последовательностей. Это означает, что оба белка почти полностью попали в локальное выравнивание.

Вывод: Локальное и глобальное выравнивания привели к практически идентичным результатам, поэтому можно сказать, что выравнивание с помощью программы water не является в данном случае более информативным. Белки гомологичны по всей длине.

ZUR_ECOLI / ZUR_BACSU

Глобальное выравнивание показало низкий процент идентичности (20.9%) и подобия (33.0%), а также небольшой вес выравнивания (93.0). Это говорит о том, что белки, скорее всего, не гомологичны по всей длине. (так как процент идентичности менее 25%)

Локальное выравнивание дало несколько лучшие результаты: идентичность 25.0%, подобие 42.1%, 14 гэпов, вес 104.5, покрытие 78.9% и 90.3%. Поскольку значимая часть обоих белков попала в выравнивание, но процент идентичности все же остался на пороговом значении, то это снова позволяет предположить, что белки не гомологичны по всей длине.

Вывод: белки не гомологичны целиком, но все же имеют гомологичные участки. Локальное выравнивание в данном случае можно назвать более информативным.

Применение программ выравнивания к неродственным белкам

Проведем парное выравнивание для белков ACCD_ECOLI и ZUR_BACSU.

Таблица 3. Характеристики глобального парного выравнивания неродственных белков
Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta Zinc-specific metallo-regulatory protein ACCD_ECOLI ZUR_BACSU 19.0 4.0% 6.5% 347 7
Таблица 4. Характеристики локального парного выравнивания неродственных белков
Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta Zinc-specific metallo-regulatory protein ACCD_ECOLI ZUR_BACSU 35.0 29.6% 44.4% 10 3 7.9% 13.8%

Как и следовало ожидать, белки не гомологичны, о чем свиделтельствуют результаты глобального выравнивания (всего 4% идентичности и большое количество гэпов). Незначительный схожий участок удалось выявить благодаря локальному выравниванию, но при покрытии 7.9% и 13.8% это не может быть свидетельством гомологии белков.

Множественное выравнивание

Мнемонике PURA_ соответствует полное имя для ECOLI: Adenylosuccinate synthetase. При помощи команды infoseq 'sw:PURA_*' -only -name -nohead | wc -l было найдено 785 белков. Из них было выбрано 5 (не считая белков из ECOLI и BACSU): PURA_BORBR, PURA_CLOBM, PURA_VARPS, PURA_FRATO, PURA_PROMT и загружены с помощью команды seqret. Далее было проведено выравнивание командой muscle -align pura_all.fasta -output pura_aligned.fasta. Полученный файл с выравниванием был открыт на локальном компьютере через Jalview.

Все белки хорошо выровнялись и их можно считать гомологичными, гэпов очень мало, консервативные участки обширны.

Проект Jalview