Пракикум 9: Выравнивание последовательностей

Глобальное парное выравнивание гомологичных белков

Таблица 1.
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Putative general secretion pathway protein A* GSPA_ECOLI GSPA_BACSU 58.5 13.4% 23.7% 146 25
Cold shock-like protein CspD CSPD_ECOLI CSPD_BACSU 188.0 45.9% 66.2% 5 2
High-affinity zinc uptake system membrane protein ZnuB ZNUB_ECOLI ZNUB_BACSU 316.5 29.8% 49.6% 12 6

Bacillus subtilis (strain 168) белок называется General stress protein A


Локальное парное выравнивание гомологичных белков

Таблица 2.
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Putative general secretion pathway protein A* GSPA_ECOLI GSPA_BACSU 64.5 20.4% 34.8% 54 19 56.44% 88.11%
Cold shock-like protein CspD CSPD_ECOLI CSPD_BACSU 188.0 52.3% 73.8% 1 1 87.84% 96.96%
High-affinity zinc uptake system membrane protein ZnuB ZNUB_ECOLI ZNUB_BACSU 319.0 30.4% 51.5% 7 3 99.23% 95.71%

Bacillus subtilis (strain 168) белок называется General stress protein A

    Немного цифр о том, как считала процент покрытия
  • GSPA_ECOLI: (378-103+1)/489*100=56.44%
  • GSPA_BACSU: (260-9+1)/286*100=88.11%
  • CSPD_ECOLI: (65-1+1)/74*100=87.84%
  • CSPD_BACSU: (64-1+1)/66*100=96.96%
  • ZNUB_ECOLI: (260-2+1)/261*100=99.23%
  • ZNUB_BACSU: (273-6+1)/280*100=95.71%

Результат применения программ выравнивания к неродственным белкам

Таблица 3. Глобальное парное выравнивание
Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels
D-allose transport system permease protein AlsC Competence transcription factor ALSC_ECOLI COMK_BACSU 10.5 1.4% 2.4% 235 4
Таблица 4. Локальное парное выравнивание
Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
D-allose transport system permease protein AlsC Competence transcription factor ALSC_ECOLI COMK_BACSU 25.0 35.7% 57.1% 0 0 4.29% 7.29%
    Немного цифр о том, как считала процент покрытия
  • ALSC_ECOLI: (282-269+1)/326*100=4.29%
  • COMK_BACSU: (72-59+1)/192*100=7.29%

Исходя из данных глобального исследования, можно сделать вывод, что белки действительно негомологичны:

  • Показатель индентичности низкий: 1.4% (<<10%)
  • Показатель схожести низкий: 2.4% (<<10%)
  • Малый вес выравнивания: 10.5

Данные локального парного выравнивания выглядят намного лучше, но это лишь за счет того, что сравниваются лишь фрагменты исходных последовательностей. На самом деле, по этим данным тоже можно видеть, что белки негомологичны.

  • Вес выравнивания мал для подверждения гомологии: 25.0

Множественное выравнивание белков и импорт в Jalview

Решила рассмотреть белки с мнемоникой "CSPD", Cold shock-like protein CspD. По поисковому запросу "(id:CSPD_*)" нашлось 11 белков, из которых 10 из базы Swiss-Prot и один удаленный (demerged) CSPD_ECOLI.

Для анализа, помимо белков CSPD_ECOLI и CSPD_BACSU, взяла следующие белки: CSPD_SHIFL, CSPD_HAEIN, CSPD_BACCE, CSPD_VIBCH, CSPD_BACCR.

Выравнивание выполняла в программе Jalview 2.11.3.2. Колонки были окрашены по цвету индентичности.

Скачать проект Jalview с выравниванием можно по ссылке.

Рис. 1. Множественное выравнивание белков Cold shock-like protein CspD

По результатам выравнивания видно, что белки гомологичны. Конечно, они не идентичны, но количество несовпадающих аминокислот не критично, чтобы считать белки негомологичными.


Placeholder

Практикум 8

UniProt Proteomes, EMBOSS, bash

Тык

Placeholder

Практикум 10

Программа BLAST

Тык

Placeholder

Практикум 11

Множественное выравнивание как отражение эволюции белков

Тык