Выравнивание последовательностей
Глобальное парное выравнивание гомологичных белков
Для выравнивания программой needle (с параметрами по умолчанию) трех пар белков из штамма K12 кишечной палочки (идентификатор заканчивается на _ECOLI) и штамма 168 сенной палочки (идентификатор заканчивается на _BACSU) были выбраны мнемоники ZUR_, ACCD_ и PURA_.
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|
| Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta | ACCD_ECOLI | ACCD_BACSU | 597.0 | 41.3% | 58.4% | 36 | 7 |
| Adenylosuccinate synthetase | PURA_ECOLI | PURA_BACSU | 992.0 | 45.6% | 63.8% | 6 | 6 |
| Zinc-specific metallo-regulatory protein | ZUR_ECOLI | ZUR_BACSU | 93.0 | 20.9% | 33.0% | 48 | 9 |
Локальное парное выравнивание гомологичных белков
Выравнивание выполнено программой water с параметрами по умолчанию.
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta | ACCD_ECOLI | ACCD_BACSU | 614.0 | 48.5% | 66.5% | 5 | 3 | 85.2% | 88.3% |
| Adenylosuccinate synthetase | PURA_ECOLI | PURA_BACSU | 995.0 | 45.9% | 64.3% | 4 | 4 | 99.5% | 99.5% |
| Zinc-specific metallo-regulatory protein | ZUR_ECOLI | ZUR_BACSU | 104.5 | 25.0% | 42.1% | 14 | 5 | 78.9% | 90.3% |
Комментарии к выравниваниям
ACCD_ECOLI / ACCD_BACSU
Глобальное выравнивание показало идентичность 41.3%, подобие 58.4%, всего 36 гэпов, вес 597.0. Поэтому белки можно считать гомологичными (процент идентичности > 25%).
Локальное выравнивание оказалось точнее глобального: идентичность 48.5%, подобие 66.5%, 5 гэпов, вес 614.0 и покрытие 85.2% и 88.3%. Большая часть обоих белков попала в выравнивание.
Вывод: Белки можно считать гомологичными по всей длине, так как локальное и глобальное выравнивания дало схожие результаты. Но локальное выравнивание более информативно, так как, например, процент идентичности выше, а количество гэпов, напротив, значительно меньше.
PURA_ECOLI / PURA_BACSU
Глобальное выравнивание показало неплохие результаты: идентичность 45.6%, подобие 63.8%, всего 6 гэпов, вес 992.0. Белки можно считать гомологичными, так как процент идентичности больше 25%.
Локальное выравнивание дало очень близкие к глобальному выравниванию результаты: идентичность 45,9%, подобие 64,3%, 4 гэпа, покрытие 99,5% для обоих последовательностей. Это означает, что оба белка почти полностью попали в локальное выравнивание.
Вывод: Локальное и глобальное выравнивания привели к практически идентичным результатам, поэтому можно сказать, что выравнивание с помощью программы water не является в данном случае более информативным. Белки гомологичны по всей длине.
ZUR_ECOLI / ZUR_BACSU
Глобальное выравнивание показало низкий процент идентичности (20.9%) и подобия (33.0%), а также небольшой вес выравнивания (93.0). Это говорит о том, что белки, скорее всего, не гомологичны по всей длине. (так как процент идентичности менее 25%)
Локальное выравнивание дало несколько лучшие результаты: идентичность 25.0%, подобие 42.1%, 14 гэпов, вес 104.5, покрытие 78.9% и 90.3%. Поскольку значимая часть обоих белков попала в выравнивание, но процент идентичности все же остался на пороговом значении, то это снова позволяет предположить, что белки не гомологичны по всей длине.
Вывод: белки не гомологичны целиком, но все же имеют гомологичные участки. Локальное выравнивание в данном случае можно назвать более информативным.
Применение программ выравнивания к неродственным белкам
Проведем парное выравнивание для белков ACCD_ECOLI и ZUR_BACSU.
| Protein Name 1 | Protein Name 2 | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|---|
| Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta | Zinc-specific metallo-regulatory protein | ACCD_ECOLI | ZUR_BACSU | 19.0 | 4.0% | 6.5% | 347 | 7 |
| Protein Name 1 | Protein Name 2 | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|---|
| Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta | Zinc-specific metallo-regulatory protein | ACCD_ECOLI | ZUR_BACSU | 35.0 | 29.6% | 44.4% | 10 | 3 | 7.9% | 13.8% |
Как и следовало ожидать, белки не гомологичны, о чем свиделтельствуют результаты глобального выравнивания (всего 4% идентичности и большое количество гэпов). Незначительный схожий участок удалось выявить благодаря локальному выравниванию, но при покрытии 7.9% и 13.8% это не может быть свидетельством гомологии белков.
Множественное выравнивание
Мнемонике PURA_ соответствует полное имя для ECOLI: Adenylosuccinate synthetase. При помощи команды infoseq 'sw:PURA_*' -only -name -nohead | wc -l было найдено 785 белков. Из них было выбрано 5 (не считая белков из ECOLI и BACSU): PURA_BORBR, PURA_CLOBM, PURA_VARPS, PURA_FRATO, PURA_PROMT и загружены с помощью команды seqret. Далее было проведено выравнивание командой muscle -align pura_all.fasta -output pura_aligned.fasta. Полученный файл с выравниванием был открыт на локальном компьютере через Jalview.Все белки хорошо выровнялись и их можно считать гомологичными, гэпов очень мало, консервативные участки обширны.