1. Глобальное парное выравнивание гомологичных белков
Protein Name | ID 1 | ID 2 | Score | Identity,% | Similarity,% | Gaps | Indels |
---|---|---|---|---|---|---|---|
Zinc regulation protein* | ZUR_ECOLI | ZUR_BACSU | 93.0 | 21.0 | 33.7 | 46 | 9 |
Cytidine deaminase | CDD_ECOLI | CDD_BACSU | 101.0 | 13.9 | 20.5 | 176 | 8 |
Deferrochelatase | EFEB_ECOLI | EFEB_BACSU | 661.5 | 36.4 | 50.9 | 45 | 16 |
*Для Bacillus subtilis указано имя Zinc-specific metallo-regulatory protein
2. Локальное парное выравнивание гомологичных белков
Protein Name | ID 1 | ID 2 | Score | Identity,% | Similarity,% | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Zinc regulation protein* | ZUR_ECOLI | ZUR_BACSU | 104.5 | 25.0 | 42.1 | 14 | 5 | 78.4 | 89.7 |
Cytidine deaminase | CDD_ECOLI | CDD_BACSU | 108.0 | 32.8 | 47.4 | 11 | 5 | 36.1 | 83.1 |
Deferrochelatase | EFEB_ECOLI | EFEB_BACSU | 665.5 | 37.1 | 52.1 | 42 | 13 | 96.2 | 96.4 |
Применение программ выравнивания к неродственным белкам
Для выполнения выравнивания я случайным образом выбрала структуры из списка и получила два белка: TNAA_ECOLI (tryptophanase) и RNY_BACSU (ribonuclease y). Затем я выполнила глобальное и локальное выравнивания при помощи программ water и needle пакета EMBOSS и получила их характеристики (приведены ниже).
Метод выравнивания | ID 1 | ID 2 | Score | Identity,% | Similarity,% | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
water | TNAA_ECOLI | RNY_BACSU | 56.0 | 21.4 | 37.7 | 58 | 17 | 55.4 | 44.4 |
needle | 36.5 | 9.0 | 14.6 | 521 | 20 | - | - |
Итоговые результаты выравнивания вышли вполне ожидаемыми: они имеют достаточно низкие показатели сходства и идентичности. Но можно заметить, что вывод программы для локального выравнивания не так плох. Можно предположить, что некоторое сходство между белками является признаком их дальнего родства, или же, наоборот, появилось вследствие влияния случайных факторов (аналогия).
Множественное выравнивание белков и импорт в Jalview
Для множественного выравнивания я решила использовать последовательности с мнемоникой “CDD” (рекомендованное полное имя белка из ECOLI – цитидин деаминаза). Белков, имеющих идентификатор, начинающийся с такой мнемоники, нашлось 125, из них я выбрала пять по высоте оценки аннотации (по возможности старалась отбирать организмы из разных таксонов).
Выравнивание было выполнено при помощи Jalview.
Белки выровнялись достаточно хорошо. Можно выделить наиболее консервативные участки: 30 - 45 и 66 - 189 столбцы. Интересно, что 5/7 последовательностей крайне схожи между собой, а оставшиеся две (E. coli и Actinobacillus pleuropneumoniae) имеют длинные дополнительные участки, различающиеся между собой. Осмелюсь предположить, что все выбранные структуры являются гомологами, поскольку в выравнивании находится достаточно большое количество консервативных участков, которые могут указывать на схожесть функционала белков.