учебная страница панькиной вари

Практикум 9. Выравнивание последовательностей

1. Глобальное выравнивание гомологичных белков

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Aconitate hydratase A ACNA_ECOLI ACNA_BACSU 2647.5 56.4% 71.7% 18 6
Acyl carrier protein ACP_ECOLI ACP_BACSU 216 60.3% 70.8% 1 1
Adenine deaminase ADEC_ECOLI ADEC_BACSU 853.5 34.7% 52.8% 39 14

Путь к коду программы для подсчета инделей: /home/students/y25/parvara/public_html/term2/indels/indels.py.

2. Локальное парное выравнивание гомологичных белков

Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Aconitate hydratase A ACNA_ECOLI ACNA_BACSU 2647.5 56.6% 71.9% 25 5 100% 99.50%
Acyl carrier protein ACP_ECOLI ACP_BACSU 216 61.0% 72.7% 0 0 98.70% 100%
Adenine deaminase ADEC_ECOLI ADEC_BACSU 858.5 36.3% 54.9% 16 12 94.4% 96.7%

3. Выводы

Исходя из полученных данных можно заключить, что все три последовательности гомологичны, хотя имеют разную степень сходства. В частности, acna и acp показали identity около 60%, в то время как у adec едва доходит до 35%. Simularity у всех белков немного выше, что отражает функциональное сходство позиций. Для adec simularity выше чем identity, что указывает на более давнее расхождение в эволюции этих двух белков, с накоплением мутаций, в том числе синонимичных.

Локлаьно все белки выравниваются с немного большей identity, но у adec, в отличие от acp и acna даже немного увеличился score, что свидетельсвует о большем схлжстве в рамках конкретных участков последовательностей.

В целом, думаю, можно заключить, что локальное выравнивание этих белков имеет очень малое преимущество над глобальным.

4. Результат применения программ выравнивания к неродственным белкам

Я сравнивала два разных белка — ACP и ADEC из разных видов — E. coli n B. subtilis. Глобальное и локальное выравнивания имеют низкий вес в сравнение с тем, что мы получили у гомологичных белков в предыдущем пункте практикума, что свидетельствует в пользу того, что два выбранных белка не гомологичны. Глобальное выравнивание имеет очень низкое покрытие, что ожидаемо, тк белки имеют разную длину, низкие identity% и simularity% (меньше 6% каждый), а также в выравнивании обнаружено большое кличество гэпов (519), что говорит о неинформативности глобального выравнивания. В локальном выравнивании был обнаружен короткий гомологичный участок длиной в 30 аминокислот (что составляет 37,2% от длины ACP), обладающий значительным количеством синонимичнх аминокислот (Simularity: 60%). Однако требуются дальнейшие исследования, чтобы понять, является ли этот участок гомологичным, либо же это совпадение. Это можно сделать, сравнив доменную организацию двух этих белков, тк чтобы проверить "биологический смысл" выравнивания.

Таблица 3. Характеристики локального парного выравнивания трёх пар белков
Algorythm ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
needle ACP_ECOLI ADEC_BACSU 27.5 3.2% 5.3% 519 5
water ACP_ECOLI ADEC_BACSU 40 30.0% 60.0% 1 1 37.2% 4.8%

5. Множественное выравнивание белков и импорт в Jalview

Для выраванивания я выбрала белки с мнемоникой ACP_* (запрос ), в E. coli рекоммендованное имя -- Acyl carrier protein. Было найдено 545 записей с этой мнемоникой. Я постаралась выбрать белки как из разных филогенетических групп, в итоге выбрала следующие: ACPM_YEAST, ACP_COMTE, ACP_GUITH, ACP_PORPU, ACP_AEDAE.

Выравнивания я строила по примеру в задании через muscle на kodomo, загружала этот файл в JalView, ссылка на проект.

Рис. 1.Выравнивание ACP из семи видов

Мы видим значительные различия при выранивании между филогенетически далекими группами. Если провести выравнивание только среди бактерий, то можно говорить о гомологии белков (Рис. 2), они выравниваются без гэпов почти по всей длине, индели короткие. Однако при добавлении к выравниванию эукариот (исходный рисунок, Рис. 1) нельзя назвать все эти последовательности гомологичными, у них есть только пять участков выравнивания без гэпов, а гэпы в длинных инделях получаются из-за эукариотических последователностей, не зря они расположены в выравнивании друг под другом.

Рис. 2. Выравнивание бактериальных ACP.

Говоря о консервативных и неконсервативных учстках, для выравнивания 1 консервативные участки это колонки 77-86, соттветсвующие 32-41 ак 5 из 7 белков (бактерий), а у эакариот это 34-43 ак у белка арабидопсиса и 77-86 ак дрожжжей, также здесь есть 2 потяженных инделя, общие для всех последовательностей кроме дрожжевой -- 5-43 колонки, а второй -- 87-104, кроме арабидопсиса. Для вырванивания два самый протяженный консервативный участок (по совместительству где-то там активный центр белка) расположен в 34-41 и 43-47 колонках.