Практикум 9

1. Глобальное парное выравнивание гомологичных белков

Табл. 1 Данные глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score Identity,% Similarity,% Gaps Indels
Zinc regulation protein* ZUR_ECOLI ZUR_BACSU 93.0 21.0 33.7 46 9
Cytidine deaminase CDD_ECOLI CDD_BACSU 101.0 13.9 20.5 176 8
Deferrochelatase EFEB_ECOLI EFEB_BACSU 661.5 36.4 50.9 45 16

*Для Bacillus subtilis указано имя Zinc-specific metallo-regulatory protein

2. Локальное парное выравнивание гомологичных белков

Табл. 2 Данные локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score Identity,% Similarity,% Gaps Indels Coverage 1 Coverage 2
Zinc regulation protein* ZUR_ECOLI ZUR_BACSU 104.5 25.0 42.1 14 5 78.4 89.7
Cytidine deaminase CDD_ECOLI CDD_BACSU 108.0 32.8 47.4 11 5 36.1 83.1
Deferrochelatase EFEB_ECOLI EFEB_BACSU 665.5 37.1 52.1 42 13 96.2 96.4

Применение программ выравнивания к неродственным белкам

Для выполнения выравнивания я случайным образом выбрала структуры из списка и получила два белка: TNAA_ECOLI (tryptophanase) и RNY_BACSU (ribonuclease y). Затем я выполнила глобальное и локальное выравнивания при помощи программ water и needle пакета EMBOSS и получила их характеристики (приведены ниже).

Табл. 2 Данные локального парного выравнивания трёх пар белков
Метод выравнивания ID 1 ID 2 Score Identity,% Similarity,% Gaps Indels Coverage 1 Coverage 2
water TNAA_ECOLI RNY_BACSU 56.0 21.4 37.7 58 17 55.4 44.4
needle 36.5 9.0 14.6 521 20 - -

Итоговые результаты выравнивания вышли вполне ожидаемыми: они имеют достаточно низкие показатели сходства и идентичности. Но можно заметить, что вывод программы для локального выравнивания не так плох. Можно предположить, что некоторое сходство между белками является признаком их дальнего родства, или же, наоборот, появилось вследствие влияния случайных факторов (аналогия).

Множественное выравнивание белков и импорт в Jalview

Для множественного выравнивания я решила использовать последовательности с мнемоникой “CDD” (рекомендованное полное имя белка из ECOLI – цитидин деаминаза). Белков, имеющих идентификатор, начинающийся с такой мнемоники, нашлось 125, из них я выбрала пять по высоте оценки аннотации (по возможности старалась отбирать организмы из разных таксонов).

Выравнивание было выполнено при помощи Jalview.

Белки выровнялись достаточно хорошо. Можно выделить наиболее консервативные участки: 30 - 45 и 66 - 189 столбцы. Интересно, что 5/7 последовательностей крайне схожи между собой, а оставшиеся две (E. coli и Actinobacillus pleuropneumoniae) имеют длинные дополнительные участки, различающиеся между собой. Осмелюсь предположить, что все выбранные структуры являются гомологами, поскольку в выравнивании находится достаточно большое количество консервативных участков, которые могут указывать на схожесть функционала белков.