анализ выравниваний белков
глобальное парное выравнивание
для работы были выбраны белки с мнемониками 6pgd, 6pgl, abrb. их полные названия представлены в таблице в колонке protein name (для белка с мнемоникой 6pgd присутствуют разночтения: 6-phosphogluconate dehydrogenase, nadp(+)-dependent, decarboxylating). выравнивание выполнено с помощью команды needle (алгоритм нидлмана-вунша) и опции -auto.
| protein name | id 1 | id 2 | score | % identity | % similarity | gaps | indels |
|---|---|---|---|---|---|---|---|
| 6-phosphogluconate dehydrogenase | 6pgd_ecoli | 6pgd_bacsu | 1718.0 | 70.0 | 83.4 | 3 | 3 |
| 6-phosphogluconolactonase | 6pgl_ecoli | 6pgl_bacsu | 304.5 | 25.3 | 42.0 | 62 | 12 |
| transition state regulatory protein abrb | abrb_ecoli | abrb_bacsu | 5.0 | 0.5 | 0.9 | 420 | 2 |
локальное парное выравнивание
выравнивание выполнено с теми же белками, при помощи команды water (алгоритм смита-ватермана) и опции -auto.
| protein name | id 1 | id 2 | score | % identity | % similarity | gaps | indels | coverage 1, % | coverage 2, % |
|---|---|---|---|---|---|---|---|---|---|
| 6-phosphogluconate dehydrogenase | 6pgd_ecoli | 6pgd_bacsu | 1719.0 | 70.1 | 83.6 | 3 | 3 | 84.8 | 84.9 |
| 6-phosphogluconolactonase | 6pgl_ecoli | 6pgl_bacsu | 317.0 | 30.6 | 48.7 | 16 | 6 | 75.8 | 74.8 |
| transition state regulatory protein abrb | abrb_ecoli | abrb_bacsu | 27.0 | 36.4 | 81.8 | 0 | 0 | 2.9 | 10.4 |
анализ результатов
- 6pgd: высокая идентичность (70% при глобальном и 70.1% при локальном выравнивании) подтверждает сильную консервативность этого белка. минимальные различия между методами указывают на отсутствие значимых вариабельных участков.
- 6pgl: умеренная идентичность (25.3% глобально, 30.6% локально) и снижение числа гэпов (с 62 до 16) в локальном выравнивании свидетельствуют о наличии консервативных доменов, которые алгоритм смита-ватермана выделил, исключив менее схожие регионы.
- abrb: резкий рост идентичности с 0.5% (глобально) до 36.4% (локально) указывает на то, что белок содержит короткие высококонсервативные участки, которые не учитывались при глобальном выравнивании.
для всех трёх белков идентичность превышает 25% (локально), что исключает случайное совпадение.
применение программ выравнивания к неродственным белкам
для этого задания я решила рассмотреть 2 белка с мнемониками atpg - atp synthase gamma chain, atp synthase f1 sector gamma subunit, atpase gamma subunit и chew - chemotaxis protein chew, coupling protein chew и выровнять их с помощью алгоритмов нидлмана-вунша и смита-ватермана.
| program name | id 1 | id 2 | score | % identity | % similarity | gaps | indels | coverage 1, % | coverage 2, % |
|---|---|---|---|---|---|---|---|---|---|
| needle | atpg_ecoli | chew_bacsu | 15.5 | 8.5% | 17.1% | 189 | 2 | - | - |
| water | atpg_ecoli | chew_bacsu | 27.0 | 27.3% | 45.5% | 0 | 0 | 7.3 | 13.5 |
ключевые выводы
- белки не гомологичны: глобальное выравнивание не выявило значимых совпадений. локальные совпадения — артефакт алгоритма, не подтверждающий родство.
- ограничения методов: глобальное выравнивание бесполезно для неродственных белков из-за шума. локальное выравнивание может давать ложноположительные результаты.
- биологический контекст: atpg (атф-синтаза) и chew (хемотаксис) выполняют разные функции и относятся к разным метаболическим путям.
множественное выравнивание белков и импорт в jalview
выбор мнемоники - 6pgd. в swiss-prot было найдено 55 белков. для построения выравнивания были выбраны: 6pgd_human, 6pgd_rat, 6pgd_sheep, 6pgd_mouse, 6pgd_drosi.
скачать файл множественного выравнивания (fasta)описание выравнивания
- позиции 121-146, 168-206 полностью идентичны
- на отрезке 121-154 полностью отличны 2 позиции у 6pgd_drosi
- на отрезке 254-302 отличны 2 позиции у 6pgd_drosi
- отрезок 354-381 отличен на одну позицию у 6pgd_drosi
значит, эти отрезки играют важную роль в функционировании белка. различия в вариабельных участках отражают адаптацию к видовой регуляторной специфичности.