Выравнивание последовательностей

Глобальное парное выравнивание гомологичных белков

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score Identity Similarity Gaps Indels
Transcriptional regulatory protein PhoP PHOP_ECOLI PHOP_BACSU 280.0 29.0% 51.9% 19 5
UDP-N-acetylmuramoyl-L-alanyl-D-glutamate--2,6-diaminopimelate ligase MURE_ECOLI MURE_BACSU 809.0 36.9% 53.5% 51 12
Full=3-hydroxyacyl-[acyl-carrier-protein] dehydratase FabZ FABZ_ECOLI FABZ_BACSU 345.0 45.4% 61.2% 12 4

Название белка PHOP у данных организмов немного отличается. У кишечной палочки он называется Transcriptional regulatory protein PhoP, а у сенной палочки Alkaline phosphatase synthesis transcriptional regulatory protein PhoP

Локальное парное выравнивание гомологичных белков

Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score Identity Similarity Gaps Indels Coverage 1 Coverage 2
Transcriptional regulatory protein PhoP PHOP_ECOLI PHOP_BACSU 286.0 30.2% 53.9% 13 3 98.6% 96.2%
UDP-N-acetylmuramoyl-L-alanyl-D-glutamate--2,6-diaminopimelate ligase MURE_ECOLI MURE_BACSU 817.0 38.3% 55.5% 37 9 96.9% 95.3%
Full=3-hydroxyacyl-[acyl-carrier-protein] dehydratase FabZ FABZ_ECOLI FABZ_BACSU 348.0 49.3% 66.4% 4 2 92.0% 97.2%

Комментарии к выравниваниям

Результаты глобального и локального выравниваний отличаются незначительно. Отличия в выравниях встречается только на концах последовательностей, что может обуславливаться видовыми особенностями организмов (небольшие рассхождения на N- и C-концах).

Если судить о гомологичности последовательностей по всей длине, то можно заключить, что данные белки являются гомологичными. Такой вывод можно сделать основываясь на идентичности и сходстве последовательностей.

Наименьший процент идентичности показывает белок с названием Transcriptional regulatory protein PhoP, что может говорить о давности дивергенции последовательностей у этих организмов. Однако тем не менее процент сходства довольно велик.

Во всех трёх случаях локальное выравнивание не несёт больше полезной информации, чем глобальное, разве что немного сокращает длину. Такой вывод можно сделать исходя из небольшого расхождения значений идентичности и сходства, а также по высокому проценту покрытия всей последовательности.

Результат применения программ выравнивания к неродственным белкам

Таблица 3. Характеристики локального и глобального парного выравнивания неродственных пар белков
Выравнивания Protein Name 1 Protein Name 2 ID 1 ID 2 Score Identity Similarity Gaps Indels Coverage 1 Coverage 2
Глобальное Undecaprenyl-diphosphatase Uracil phosphoribosyltransferase UPPP_ECOLI UPP_BACSU 39.5 11.6% 18.4% 226 11 - -
Локальное Undecaprenyl-diphosphatase Uracil phosphoribosyltransferase UPPP_ECOLI UPP_BACSU 60.5 32.7% 57.1% 5 2 17.9% 21.0%

Как можно заметить, белки с разной мнемоникой имеют малый процент идентичности и схожести по всей длине, что говорит о том, что данные белки скорее всего не гомологинчы. Однако локальное выравнивание дало неплохой процент идентичности и сходства. Необходимо подробнее посмотреть на данное выравнивание.

Длина локального выравнивания составляет всего 49 аминоксилот, а вес выравнивания 60.5. Также в этом выравнивании 2 инделя (что примечательно, так как длина выравнивания маленькая), которые отделяют 2 аминокислоты от части последовательности в белке UPP_BACSU, создавая небольшой островок. Кроме того выравнивненая последовательность белка UPPP_ECOLI начинается с 8 по порядку аминокислоты, в то время как у UPP_BACSU оно начинается с 77. Все эти факторы говорят о малой вероятности гомологичности этих участков.

Множественное выравнивание белков и импорт в Jalview

Для множественного выравнивания была выбрана мнемоника MURE. Полное имя белка для ECOLI - UDP-N-acetylmuramoyl-L-alanyl-D-glutamate--2,6-diaminopimelate ligase. Всего белков с данной мнемоникой в Swiss-Prot оказалось 207 (получено с помощью конвейера bash).

# Количество белков в Swiss-Prot с мнемоникой MURE
infoseq 'sw:MURE_*' -only -name -nohead | wc -l

Были выбраны следующие белки:

С помощью Jalview были найдены последовательности и сделано множественное выравнивание

Белки не слишком похожи по всей длине, но тем не менее есть консервативные участки. Меньше всего на все остальные похож белок MURE_STRS2 (в консервативных участках у него чаще всего встречаются несовпадения). В выравнивании можно выделить наиболее консервативные участки (столбцы): 44-46; 130-136; 199-229; 382-391; 407-450; 485-503. А также наименее консервативные участки: 1-40; 82-95; 159-172; 252-300; 451-472; 505-534.

Я склоняюсь к мнению, что данные белки гомологичны. Одним из дополнительных аргументов является анализ значимых участков. Проанализировав информацию об одном из белков (MURE_ECOLI) я выделил участки, которые учасвуют в связвыании и выполняют функцию. Если найти эти участки в выравнивании, то окажется, что они консервативны.

Наименьшая уверенность в гомологичности белка MURE_STRS2, в связи с его особенностями в консервативных участках. Скорее всего, он является гомологичным, просто разашёлся (в эволюционном плане) с остальными белками довольно давно.