Анализ выравниваний белков

Глобальное парное выравнивание

Для работы были выбраны белки с мнемониками 6PGD, 6PGL, ABRB. Их полные названия представлены в таблице в колонке Protein Name (для белка с мнемоникой 6PGD присутствуют разночтения: 6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating). Выравнивание выполнено с помощью команды needle (алгоритм Нидлмана-Вунша) и опции -auto.

Таблица 1. Глобальное парное выравнивание для гомологичных белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
6-phosphogluconate dehydrogenase 6PGD_ECOLI 6PGD_BACSU 1718.0 70.0 83.4 3 3
6-phosphogluconolactonase 6PGL_ECOLI 6PGL_BACSU 304.5 25.3 42.0 62 12
Transition state regulatory protein AbrB ABRB_ECOLI ABRB_BACSU 5.0 0.5 0.9 420 2

Локальное парное выравнивание

Выравнивание выполнено с теми же белками, при помощи команды water (алгоритм Смита-Ватермана) и опции -auto.

Таблица 2. Локальное парное выравнивание для гомологичных белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1, % Coverage 2, %
6-phosphogluconate dehydrogenase 6PGD_ECOLI 6PGD_BACSU 1719.0 70.1 83.6 3 3 84.8 84.9
6-phosphogluconolactonase 6PGL_ECOLI 6PGL_BACSU 317.0 30.6 48.7 16 6 75.8 74.8
Transition state regulatory protein AbrB ABRB_ECOLI ABRB_BACSU 27.0 36.4 81.8 0 0 2.9 10.4

Анализ результатов

  • 6PGD: Высокая идентичность (70% при глобальном и 70.1% при локальном выравнивании) подтверждает сильную консервативность этого белка. Минимальные различия между методами указывают на отсутствие значимых вариабельных участков.
  • 6PGL: Умеренная идентичность (25.3% глобально, 30.6% локально) и снижение числа гэпов (с 62 до 16) в локальном выравнивании свидетельствуют о наличии консервативных доменов, которые алгоритм Смита-Ватермана выделил, исключив менее схожие регионы.
  • ABRB: Резкий рост идентичности с 0.5% (глобально) до 36.4% (локально) указывает на то, что белок содержит короткие высококонсервативные участки, которые не учитывались при глобальном выравнивании.

Для всех трёх белков идентичность превышает 25% (локально), что исключает случайное совпадение.

Применение программ выравнивания к неродственным белкам

Для этого задания я решила рассмотреть 2 белка с мнемониками ATPG - ATP synthase gamma chain, ATP synthase F1 sector gamma subunit, ATPase gamma subunit и CHEW - Chemotaxis protein CheW, Coupling protein CheW и выровнять их с помощью алгоритмов Нидлмана-Вунша и Смита-Ватермана.

Таблица 3. Глобальное и локальное парное выравнивания для негомологичных белков
Program Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1, % Coverage 2, %
needle ATPG_ECOLI CHEW_BACSU 15.5 8.5% 17.1% 189 2 - -
water ATPG_ECOLI CHEW_BACSU 27.0 27.3% 45.5% 0 0 7.3 13.5

Ключевые выводы

  • Белки не гомологичны: Глобальное выравнивание не выявило значимых совпадений. Локальные совпадения — артефакт алгоритма, не подтверждающий родство.
  • Ограничения методов: Глобальное выравнивание бесполезно для неродственных белков из-за шума. Локальное выравнивание может давать ложноположительные результаты.
  • Биологический контекст: ATPG (АТФ-синтаза) и CheW (хемотаксис) выполняют разные функции и относятся к разным метаболическим путям.

Множественное выравнивание белков и импорт в Jalview

Выбор мнемоники - 6PGD. В swiss-prot было найдено 55 белков. Для построения выравнивания были выбраны: 6PGD_HUMAN, 6PGD_RAT, 6PGD_SHEEP, 6PGD_MOUSE, 6PGD_DROSI.

Скачать файл множественного выравнивания (FASTA)

Описание выравнивания

  • Позиции 121-146, 168-206 полностью идентичны
  • На отрезке 121-154 полностью отличны 2 позиции у 6PGD_DROSI
  • На отрезке 254-302 отличны 2 позиции у 6PGD_DROSI
  • Отрезок 354-381 отличен на одну позицию у 6PGD_DROSI

Значит, эти отрезки играют важную роль в функционировании белка. Различия в вариабельных участках отражают адаптацию к видовой регуляторной специфичности.