Практикум 9

Глобальное парное выравнивание гомологичных белков

Для парных выравниваний были выбраны три пары белков с мнемониками 6PGD, FLIG и APPC. Было выполнено глобальное выравнивание с помощью команды needle.

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating 6PGD_ECOLI 6PGD_BACSU 1718.0 70.0% 83.4% 3 3
Flagellar motor switch protein FliG FLIG_ECOLI FLIG_BACSU 490.0 31.9% 56.4% 15 5
Oligopeptide transport system permease protein AppC APPC_ECOLI APPC_BACSU 35.5 8.4% 16.1% 399 13

Также было выполнено локальное выравнивание с помощью команды water.

Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating 6PGD_ECOLI 6PGD_BACSU 1719.0 70.1% 83.6% 3 3 99.36% 99.57%
Flagellar motor switch protein FliG FLIG_ECOLI FLIG_BACSU 490.0 32.6% 57.8% 10 4 96.78% 98.83%
Oligopeptide transport system permease protein AppC APPC_ECOLI APPC_BACSU 54.5 19.0% 33.5% 89 12 34.38% 39.14%

По итогам глобального и локального выравнивания можно сказать, что 6-фосфоглюконатдегидрогеназа и белок FliG гомологичны у штаммов K12 и 168 по всей длине (70% и 35% идентичности соотвественно), а белок AppC- нет (меньше 20% идентичности). При этом у AppC нет и гомологичных участков (всё так же меньше 20% идентичности). В случае данных двух первых белков локальное выравнивание будет несильно информативно, так как проценты идентичности схожи, а из идентичности по всей цепи следует идентичность по участкам. В случае AppC локальное выравнивание чуть информативнее, процент идентичности вырос, но гомологии нет.

Результат применения программ выравнивания к неродственным белкам

Таблица 3. Характеристики глобального и локального парного выравнивания пары белков с разными мнемониками функций
Type ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Global PTHB_ECOLI COMGB_BACSU 11.5 8.5% 14.6% 344 12 - -
Local PTHB_ECOLI COMGB_BACSU 32.5 37.5% 45.8% 6 1 5.29% 4.38%

Случайным образом мною были выбраны две мнемоники - PTHB (PTS system glucitol/sorbitol-specific EIIB component) и COMGB (ComG operon protein 2). Результаты выравниваний представлены в таблице. Как и предполагалось, белки не гомологичны. Локальное выравнивание нашло небольшой участок с более высокой процентной идентичностью, но его размер незначительный и, возможно, был выбран случайно (PTHB_ECOLI 49-72, COMGB_BACSU 229-246).

Множественное выравнивание белков и импорт в Jalview

Для множественного выравнивания была выбрана мнемоника 6PGD (6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating). Всего по поисковому запросу 6PGD AND (reviewed:true) нашлось 1222 белка. Для выравнивания были выбраны следующие 5 белков, помимо 6PGD_ECOLI 6PGD_BACSU: 6PGD_HALVD, 6PGD_TRYBB, 6PGD_CITKO, 6PGD_DICDI и 6PGD_CERCA. Выравнивание выполнила с помощью команды muscle -align 6pgd.fasta -output 6pgd_alig.fasta, перед этим был создан текстовый файл с ID семи белков. После полученный после выравнивания файл был загружен в Jalview.Ссылка на проект в Jalview. По итогу выравнивания нельзя сказать, что все семь белков гомологичны. Есть нечастые гомологичные участки 10-20, 80-110, 133-150, 185-203, 462-473.