Практикум 9

Глобальное парное выравнивание гомологичных белков

Таблица 1

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Adenylate kinase KAD_ECOLI KAD_BACSU 527.5 46.4% 65.8% 13 3
Primosomal protein N' PRIA_ECOLI PRIA_BACSU 1139.5 33.3% 51.1% 95 18
Ribulokinase ARAB_ECOLI ARAB_BACSU 769.0 30.6% 48.7% 56 14

Локальное парное выравнивание гомологичных белков

Таблица 2

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Adenylate kinase KAD_ECOLI KAD_BACSU 527.5 47.2% 67.0% 9 2 99.5% 98.2%
Primosomal protein N' PRIA_ECOLI PRIA_BACSU 1145.5 33.5% 51.4% 94 17 99.6% 99.5%
Ribulokinase ARAB_ECOLI ARAB_BACSU 776.0 31.9% 50.2% 44 12 97.2% 95.4%

Результат применения программ выравнивания к неродственным белкам

Два белка, выравнивание которых приведено в этом задании (а именно ISCA_ECOLI (Iron-binding protein IscA) и ALBC_BACSU (Putative ABC transporter ATP-binding protein AlbC)) не являются гомолочными и выполняют различные функции: перенос железо-серных кластеров и выработка бактериоцина субтилозина соответственно.

Таблица 3

Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Iron-binding protein IscA Putative ABC transporter ATP-binding protein AlbC ISCA_ECOLI ALBC_BACSU 13 6.7% 9.8% 224 5

Из результатов глобального парного выравнивания можно сделать вывод, что белки действитеотно не гомологичны, так имеют низкие показатели идентичночти и схожести(меньше 10%). Вес выравнивая всего 13.

Таблица 4

Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Iron-binding protein IscA Putative ABC transporter ATP-binding protein AlbC ISCA_ECOLI ALBC_BACSU 32 29.0% 40.3% 11 3 55.1% 21.8%

Показатели, полученные в результате локального выравнивания выше, чем результаты глобального, за счет выравнивания лишь частей последовательности. Схожесть выравнивания достаточно высокая(40.3%), однако вес выравнивая все равно очень низкий(32).

Множественное выравнивание белков и импорт в Jalview

Выбранная мнемоника ARAB_* обозначающает белки-рибулкиназы, отвечающие за каталитическую активность. Всего по поску (id:ARAB_*) в базе UniProtKB было найдено 77 белков. С помощью кода infoseq 'sw:arab_*' -only -name -nohead -out human.txt в kodomo было найдено всего 75 белков. ЭТО СВЯЗАНО С ТЕМ, ЧТО ...

Из этих белков были выбраны 5 наиболее аннотированных:

ARAB_ECOLI - Escherichia coli (strain K12)
ARAB_BACSU - Bacillus subtilis (strain 168)
ARAB_SALTY - Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720)
ARAB_YERPE - Yersinia pestis
ARAB_ENT38 - Enterobacter sp. (strain 638)
ARAB_ECOHS - Escherichia coli O9:H4 (strain HS)
ARAB_SALG2 - Salmonella gallinarum (strain 287/91 / NCTC 13346)

Две последовательности принадлежат бактериям одного рода Salmonella, но разных видов. Было интересно узнать, насколько расходятся гомолочные белки между разными видами. Две последовательновательности принадлежат бактерии Escherichia coli из разных штаммов, однако даже такие последовательности имеют расхождения.

Для выполнения этого задания использовалась программа EMBOSS muscle. Был создан txt файл с ID белков, который затем был переведен в формат fasta с помощью команды seqret, после чего был запущен muscle. Полученное выравнивание было импортированно в Jalview, где колонки были раскрашены по цвету идентичности.

  • Ссылка на проект Jalview
  • Fig.1.Результат множественного выравнивания.
    Fig.1. Фрагмент множественного выравнивания.

    Из результатов выравнивания можно сделать вывод, что белки гомологичны. Однако белок ARAB_BACSU является наиболее отличным от остальных: это видно на участках 12, 40-51, 80-83. ГОмологичность белков основывается на том, что в выравнивании присутствует выраженная структура: достаточно много консервативных блоков. Например, 13-15, 85-86, 87-89, 94-97, 130-133, 164-168.