Глобальное парное выравнивание гомологичных белков

Таблица 1. Характеристика глобального парного выравнивания белков с помощью needle.
Protein Name ID1 ID2 Score % Identity % Similarity Gaps Indels
Alkanesulfonate monooxygenase SSUD_ECOLI SSUD_BACSU 1269.5 63.6% 75.1% 7 3
7-cyano-7-deazaguanine synthase QUEC_ECOLI QUEC_BACSU 658.0 53.8% 70.1% 18 5
Oligopeptide transport ATP-binding protein OppF OPPF_ECOLI OPPF_BACSU 741.5 48.8% 63.3% 37 7

Локальное парное выравнивание гомологичных белков

Таблица 2. Характеристика локального парного выравнивания белков с использованием water.
Protein Name ID1 ID2 Score % Identity % Similarity Gaps Indels Coverage1 Coverage2
Alkanesulfonate monooxygenase SSUD_ECOLI SSUD_BACSU 1269.5 64.0% 76.3% 2 1 98.4% 99.2%
7-cyano-7-deazaguanine synthase QUEC_ECOLI QUEC_BACSU 666.0 57.4% 75.0% 4 2 93.5% 96.8%
Oligopeptide transport ATP-binding protein OppF OPPF_ECOLI OPPF_BACSU 749.5 51.6% 67.0% 19 3 93.1% 96.4%

*длина белков бралась из файла с глобальным выравниванием (needle).

Характеристики локального и глобального выравнивания указывают на явную гомологичность белков. Минимальное значение идентичности - 48.8%; такой показатель считается достаточно хорошим для "родственных" белков.

Результат применения программ выравнивания к неродственным белкам

Таблица 3. Результат применения программ выравнивания (первая строка - needle, вторая - water) к неродственным белкам, характеристика.
Type ID1 ID2 Score % Identity % Similarity Gaps Indels Coverage1 Coverage2
Global TFAD_ECOLI SP3AH_BACSU 51 15.9% 22.7% 149 9 --- ---
Local TFAD_ECOLI SP3AH_BACSU 61.5 24.8% 36.9% 40 6 81.8% 55.5%

*длина белков бралась из файла с глобальным выравниванием (needle).

Полученные данные показывают, что эти белки действительно неродственны. Такой вывод можно сделать хотя бы по количеству гэпов, а также по % идентичности. Однако стоит упомянуть, что белки схожи на 36,9%. Такой процент в локальном выравнивании может говорить о какой-то эволюционной связи исследуемых белков.

Множественное выравнивание белков и импорт в Jalview

Мнемоника: SSUD
RecName: Alkanesulfonate monooxygenase
Нашлось белков: 79 (Swiss-Prot)
Выбранные белки: SSUD_PSEAE, SSUD_BUTSP, SSUD_PSESP, SSUD_RHOPA, SSUD_XANAC (+ SSUD_ECOLI, SSUD_BACSU)

Последовательности загружались в Jalview через встроенный поиск по UniProt: File --> Fetch Sequences. Затем я сделала выравнивание с помощью MUSCLE (Web Service --> Alignment --> Muscle with Defaults). Всё было покрашено по проценту идентичности. Ниже приведён фрагмент выравнивания:

1
Рис. 1. Фрагмент множественного выравнивания в программе Jalview. Выравнивание выполнено с помощью MUSCLE (окрашено по проценту идентичности).
Проект можно найти тут, а fasta-файл - тут. Белки можно считать гомологичными: в выравнивании (далее рассматривается на фрагменте с рис. 1) действительно много (предположительно) абсолютно консервативных позиций (например, 186-190, 234-241, 243-245, др.), абсолютно функциональных консервативных позиций(например, 184, 192, 271) и их процент от всего выравнивания достаточно велик (даже если определять это визуально).