Выравнивание последовательностей


1. Глобальное парное выравнивание гомологичных белков


Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
NH(3)-dependent NAD(+) synthetase NADE_ECOLI NADE_BACSU 734.5 54.0 69.9 5 1
Acyl carrier protein ACP_ECOLI ACP_BACSU 216.0 60.3 71.8 1 0
Elongation factor P EFP_ECOLI EFP_BACSU 375.0 41.5 57.4 3 1

2. Локальное парное выравнивание гомологичных белков


Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
NH(3)-dependent NAD(+) synthetase NADE_ECOLI NADE_BACSU 734.5 54.2 70.2 4 1 99.6% 100%
Acyl carrier protein ACP_ECOLI ACP_BACSU 216.0 61 72.7 0 0 98.7% 100%
Elongation factor P EFP_ECOLI EFP_BACSU 381.0 43.3 60.0 0 0 95.7% 97.3%

3. Применение программ выравнивания к неродственным белкам

В качестве пары белков с разными мнемониками функций были выбраны CAS1_ECOLI(CRISPR-ассоциированная эндонуклеаза гена Cas1) и BOFA_BACSU(Cигма-К фактор регуляции процессинга BofA). Эти белки не имеют функциональной связи, и логично предположить, что они разного происхождения. Результаты выравниваний также на это указывают: проценты идентичности как глобального, так и локального выравниваний меньше 25%, у выравниваний низкий вес, большое количество гэпов.

Таблица 3. Парное выравнивание негомологичных белков
Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Глобальное выравнивание
CRISPR-associated endonuclease Cas1 Sigma-K factor-processing regulatory protein BofA CAS1_ECOLI BOFA_BACSU 19.5 9.1 13.4 248 10 - -
Локальное выравнивание
CRISPR-associated endonuclease Cas1 Sigma-K factor-processing regulatory protein BofA CAS1_ECOLI BOFA_BACSU 29.0 22.4 43.1 18 4 15.7% 57.5%

4. Множественное выравнивание белков и импорт в Jalview

Было произведено множественное выравнивание 7 белков с мнемоникой функции ACP(рекомендованное полное имя белка для ECOLI: Acyl carrier protein). Всего нашлось 532 белка, были выбраны белки с идентификаторами ACP_ANAVA, ACP_PSESM, ACP_OCELI, ACP_RHIME, ACP_SACEN, ACP_ECOLI и ACP_BACSU.
Выравнивание было сделано на сайте UniProt, программой Clustal Omega. Я отметила галочками выбранные идентификаторы, нажала кнопку Align, а затем сохранила выравнивание в FASTA формате.
Белок ACP_SACEN довольно таки сильно отличается от остальных, он также является наиболее длинным. Можно выделить несколько полностью консервативных участков с номерами столбцов: 8, 18, 35-36, 39-42, 44-47,51,53,66 и 68-69. Наиболее консервативным участком является область 35-51.
В целом можно с уверенностью предположить, что белки явлются гомологичными.

Проект выравнивания доступен по ссылке