IMPERIAL

Выравнивание последовательностей


Глобальное парное выравнивание гомологичных белков


Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha ACCA_ECOLI ACCA_BACSU 814,5 51,1% 66,0% 14 4
Transcription termination/antitermination protein NusA NUSA_ECOLI NUSA_BACSU 703,5 28,7% 48,3% 124 3
Cell division protein ZapA ZAPA_ECOLI ZAPA_BACSU 41,5 13,2% 29,8% 48 5

Локальное парное выравнивание гомологичных белков


Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha ACCA_ECOLI ACCA_BACSU 823,5 53,8% 69,6% 3 2 97,8% 95,0%
Transcription termination/antitermination protein NusA NUSA_ECOLI NUSA_BACSU 707,0 40,2% 65,6% 1 1 69,3% 92,2%
Cell division protein ZapA ZAPA_ECOLI ZAPA_BACSU 50,0 16,5% 48,1% 9 3 70,6% 84,7%

Результат применения программ выравнивания к неродственным белкам


Type of alignment ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Глобальное CHEB_ECOLI DAAA_BACSU 29,5 7,3% 11,3% 417 13 40,2% 100%
Локальное CHEB_ECOLI DAAA_BACSU 33,5 20,8% 39,3% 19 7 17,9% 57,1%


Можно с достаточно высокой уверенностью сказать, что белки не гомологичны, так как процент идентичности глобального выравнивания сильно мал, но в то же время, процент идентичности по локальному выравниванию стоит на грани определения - гомологичен он или нет.


Множественное выравнивание белков и импорт в Jalview


Была выбрана мнемоника "ACCA", рекомендованное полное название которой: Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha.

В результате поиска белков, чьи идентификаторы начинаются с мнемоники "ACCA" в Swiss-Prot было найдено 463 белка.

Я выбрал следующие белки для множественного выравнивания:


ACCA_PEA

ACCA_ARATH

ACCA_SALTY

ACCA_PSEAE

ACCA_STRPN

ACCA_ECOLI

ACCA_BACSU


  1. Выравнивание провел программой muscle. Создал списочный файл с ID белков acca.txt. Затем создал файл в fasta-формате с помощью команды:
  2. seqret @acca.txt acca.fasta
  3. После этого запустил программу muscle:
  4. muscle -in acca.fasta -out acca_alignment.fasta

Ссылка на файл проекта в формате .jvp


По моим наблюдениям все белки гомологичны, так как имеют частые и достаточно протяженные консервативные участки. Консервативные участки вы можете увидеть на следующих координатах:
210-215; 224-231; 250-260; 293-303;
Также очень много консервативных участков короткой длины(2-4).