1. Глобальное выравнивание гомологичных белков
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
| Aconitate hydratase A | ACNA_ECOLI | ACNA_BACSU | 2647.5 | 56.4% | 71.7% | 18 | 6 |
| Acyl carrier protein | ACP_ECOLI | ACP_BACSU | 216 | 60.3% | 70.8% | 1 | 1 |
| Adenine deaminase | ADEC_ECOLI | ADEC_BACSU | 853.5 | 34.7% | 52.8% | 39 | 14 |
Путь к коду программы для подсчета инделей: /home/students/y25/parvara/public_html/term2/indels/indels.py.
2. Локальное парное выравнивание гомологичных белков
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
| Aconitate hydratase A | ACNA_ECOLI | ACNA_BACSU | 2647.5 | 56.6% | 71.9% | 25 | 5 | 100% | 99.50% |
| Acyl carrier protein | ACP_ECOLI | ACP_BACSU | 216 | 61.0% | 72.7% | 0 | 0 | 98.70% | 100% |
| Adenine deaminase | ADEC_ECOLI | ADEC_BACSU | 858.5 | 36.3% | 54.9% | 16 | 12 | 94.4% | 96.7% |
3. Выводы
Исходя из полученных данных можно заключить, что все три последовательности гомологичны, хотя имеют разную степень сходства. В частности, acna и acp показали identity около 60%, в то время как у adec едва доходит до 35%. Simularity у всех белков немного выше, что отражает функциональное сходство позиций. Для adec simularity выше чем identity, что указывает на более давнее расхождение в эволюции этих двух белков, с накоплением мутаций, в том числе синонимичных.
Локлаьно все белки выравниваются с немного большей identity, но у adec, в отличие от acp и acna даже немного увеличился score, что свидетельсвует о большем схлжстве в рамках конкретных участков последовательностей.
В целом, думаю, можно заключить, что локальное выравнивание этих белков имеет очень малое преимущество над глобальным.
4. Результат применения программ выравнивания к неродственным белкам
Я сравнивала два разных белка — ACP и ADEC из разных видов — E. coli n B. subtilis. Глобальное и локальное выравнивания имеют низкий вес в сравнение с тем, что мы получили у гомологичных белков в предыдущем пункте практикума, что свидетельствует в пользу того, что два выбранных белка не гомологичны. Глобальное выравнивание имеет очень низкое покрытие, что ожидаемо, тк белки имеют разную длину, низкие identity% и simularity% (меньше 6% каждый), а также в выравнивании обнаружено большое кличество гэпов (519), что говорит о неинформативности глобального выравнивания. В локальном выравнивании был обнаружен короткий гомологичный участок длиной в 30 аминокислот (что составляет 37,2% от длины ACP), обладающий значительным количеством синонимичнх аминокислот (Simularity: 60%). Однако требуются дальнейшие исследования, чтобы понять, является ли этот участок гомологичным, либо же это совпадение. Это можно сделать, сравнив доменную организацию двух этих белков, тк чтобы проверить "биологический смысл" выравнивания.
| Algorythm | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 | |
| needle | ACP_ECOLI | ADEC_BACSU | 27.5 | 3.2% | 5.3% | 519 | 5 | |||
| water | ACP_ECOLI | ADEC_BACSU | 40 | 30.0% | 60.0% | 1 | 1 | 37.2% | 4.8% |
5. Множественное выравнивание белков и импорт в Jalview
Для выраванивания я выбрала белки с мнемоникой ACP_* (запрос ), в E. coli рекоммендованное имя -- Acyl carrier protein.
Было найдено 545 записей с этой мнемоникой. Я постаралась выбрать белки как из разных филогенетических групп, в итоге выбрала следующие:
ACPM_YEAST, ACP_COMTE, ACP_GUITH, ACP_PORPU, ACP_AEDAE.
Выравнивания я строила по примеру в задании через muscle на kodomo, загружала этот файл в JalView, ссылка на проект.
Мы видим значительные различия при выранивании между филогенетически далекими группами. Если провести выравнивание только среди бактерий, то можно говорить о гомологии белков (Рис. 2), они выравниваются без гэпов почти по всей длине, индели короткие. Однако при добавлении к выравниванию эукариот (исходный рисунок, Рис. 1) нельзя назвать все эти последовательности гомологичными, у них есть только пять участков выравнивания без гэпов, а гэпы в длинных инделях получаются из-за эукариотических последователностей, не зря они расположены в выравнивании друг под другом.
Говоря о консервативных и неконсервативных учстках, для выравнивания 1 консервативные участки это колонки 77-86, соттветсвующие 32-41 ак 5 из 7 белков (бактерий), а у эакариот это 34-43 ак у белка арабидопсиса и 77-86 ак дрожжжей, также здесь есть 2 потяженных инделя, общие для всех последовательностей кроме дрожжевой -- 5-43 колонки, а второй -- 87-104, кроме арабидопсиса. Для вырванивания два самый протяженный консервативный участок (по совместительству где-то там активный центр белка) расположен в 34-41 и 43-47 колонках.