Множественные выравнивания

Целью этой работы было составление множественного выравнивания гомологов оксалат-декарбоксилазы Bacillus subtilis из различных групп живых организмов. Для этого сначала была составлена выборка последовательностей предполагаемых гомологов из не слишком филогенетически близких таксонов.

Создание репрезентативной выборки гомологов белка OXDC_BACSU

Для создания выборки использовалась программа BLAST (Basic Local Alignment Search Tool), осуществляющая поиск участков сходства заданной последовательности с теми, что находятся в выбранном банке. Были сделаны отдельные запросы для прокариот и эукариот, бактериальная фила Firmicutes исключена из поиска, так как результаты из неё слишком схожи с OXDC_BACSU и сделают выборку нерепрезентативной. Параметры поиска приведены в таблице 1.

Поиск Алгоритм BLAST Название базы данных Ограничения по таксонам Порог e-value Максимальное количество хитов
По прокариотам blastp (protein-protein BLAST) Reference proteins (refseq_protein) [-]Eukaryota, [-]Firmicutes 0.001* 168
По эукариотам blastp (protein-protein BLAST) Reference proteins (refseq_protein) [+]Eukaryota 0.001* 105
Таблица 1. Параметры поиска * - первоначальный поиск - с порогом e-value 3, все запросы с ограничением в число последовательностей 1000.

Отдельных поисков по филумам не производилось, т.к. число предположительно гомологичных последовательностей было невелико и они были филогенетически не слишком разнообразны; таким образом, оказалось возможным выбрать последовательности просто по дереву в Genpept-е. Филогенетические деревья для выбранных последовательностей приведены на рис.1(прокариоты) и рис.2 (эукариоты), а сам состав выборки в таблице 2.




align1
Рис.1
Филогенетическое древо
для выбранных прокариот


align1
Рис.2
Филогенетическое древо
для выбранных эукариот


Таблица 2. Состав первоначальной выборки предполагаемых гомологов OXDC_BACSU
Домен Филум/Царство Название организма Белки
Archaea Euryarchaeota Haloferax gibbonsii WP_004971736
Halorubrum lipolyticum ZP_21596068
Eubacteria Acidobacteria Terriglobus saanensis YP_004180875
Granulicella tundricola YP_004210489
Actinobacteria Rhodococcus erythropolis WP_003941605
Gordonia rubripertincta WP_005199631
Mycobacterium smegmatis YP_886606
Alphaproteoobacteria Rhizobium leguminosarum WP_004444453
Azospirillum amazonense WP_004272428
Methylocella silvestris YP_002362482
Bacteroidetes Chryseobacterium gleum WP_002978769
Mucilaginibacter paludis ZP_09612351
Betaproteobacteria Burkholderia pseudomallei WP_004540646
Chlamydiae Parachlamydia acanthamoebae YP_004651926
Chloroflexi Ktedonobacter racemifer ZP_06974517
Cyanobacteria Synechococcus sp. WP_004971736
Synechocystis sp. ZP_21596068
Deinococcus-Thermus Marinithermus_hydrothermalis YP_004367785
Gammaproteobacteria Serratia marcescens WP_004940757
Erwinia billingiae YP_003743179
Pantoea ananatis YP_005196086
Planctomycetes Singulisphaera acidiphila YP_007207200
Gemmata obscuriglobus ZP_02733343
Synergistetes Synergistes sp. HMPREF1006_02668
Eukaryota Metazoa Ceratotherium simum simum XP_004422611
Monodelphis domestica XP_003340640
Xenopus tropicalis XP_002934491
Funghi Aspergillus oryzae XP_001827593
Neurospora crassa XP_964781
Leptosphaeria maculans XP_003840465
Postia placenta XP_002473645
Laccaria bicolor XP_001889428
Schizophyllum commune XP_003032127
Plantae Selaginella moellendorffii XP_002988282
Fragaria vesca vesca XP_004291586
Arabidopsis thaliana NP_171885
Brachypodium distachyon XP_003576869

Множественное выравнивание гомологов белка OXDC_BACSU

Выравнивание (рис.3) было построено программой MUSCLE (MUltiple Sequence Comparison by Log- Expectation) на ebi.ac.uk при стандартных параметрах по вышеприведённой выборке.


align1
Рис.3 Черновое множественное выравнивание по всей выборке предполагаемых гомологов OXDC_BACSU (кликабельно)

Выравнивание было проанализировано в программе Jalview. Из него были удалены следующие последовательности, явно негомологичные:

Они с малой идентичностью выравнивались, "растягивая" выравнивание. Эти последовательности также, вероятно, не имеют схожей с оксалат-декарбоксилазой ферментативной активности, так как не содержат сайтов связывания кофермента.
Следующие последовательности выравниваются далеко не по всей длине, хотя ключевые для схожей с оксалат-декарбоксилазой ферментативной активности аминокислотные последовательности в них присутствуют; они вполне могут оказаться гомологами OXDC_BACSU, но в итоговом выравнивании мы исключим их из рассмотрения: Последние два белка оказались принадлежащими группе герминов, которые участвуют в защите растений от грибных инфекций путём создания окислительного стресса в месте заражения. У них сохраняется только один каталитический домен, а сходство с оксалат-декарбоксилазой очень небольшое, но ключевые аминокислоты, связывающие кофермент, такие же.
Также было несколько подредактировано выравнивание концов последовательностей, не показывающее гомологию и содержащее бессмысленно много гэпов при отсутствии консервативных позиций. Итоговое выравнивание приведено на рис. 4.
Сравнительно неширокая представленность белка среди филумов прокариот показывает, что, вероятно, проводимая ферментом реакция является критической в метаболизме не всех организмов или же проводится негомологичным OXDC_BACSU ферментом в некоторых группах. Среди эукариотических последовательностей нет митохондриальных или хлоропластных, но высокий уровень сходства грибных последовательностей и альфапротеобактериальных, а также малое число и низкое сходство с грибными найденных архейных гомологов наводит на мысль об исходно митохондриальном происхождении гена, по крайней мере, у грибов.
У самой B. subtilisимеются два очень схожих паралога, oxdC и oxdD, выполняющих одну функцию, возможно, часть результатов может быть признана более близким гомологом OxdD, чем OxdC.
Очень высокое сходство последовательностей (E-value=0.0) из Bacillus subtilis и Ktedonobacter racemifer, относящихся к разным филам может быть следствием горизонтального переноса генов.



align1
Рис.4 Отредактированное аннотированное множественное выравнивание гомологов OXDC_BACSU (кликабельно)
В строке аннотации LIGANDS помечены буквой L остатки, принимающие участие в координировании ионов магния.
В строке BLOCKS - предполагаемые блоки - достаточно высококонсервативные безгэповые участки выравнивания
(в некоторых случаях для того, чтобы блок стал идеальным, необходимо исключить из рассмотрения одну из последовательностей, в которой отсутствует нужный участок белка)
В строке SECONDARY соотнесена последовательность оксалат-декарбоксилазы Baccilus subtilis и её вторичная структура, что позволяет нам увидеть, как связана консервативность остатка с его участием в образовании элементов вторичной структуры


Результаты анализа множественного выравнивания гомологов белка OXDC_BACSU

Наиболее консервативны оказались связывающие лиганд остатки (у некоторых белков отсутствует один из каталитических доменов, % идентичности по всем восьми остаткам - 93-100%), а также некоторые заряженные остатки, вероятно, играющие важную роль в стабилизации трёхмерной структуры белка (образование кармана для субстрата etc) с помощью солевых мостиков. Было произведено сопоставление множественного выравнивания гомологов OXDC_BACSU и его трёхмерной структуры (в виде файла PDB, с помощью интерфейса JMol) с целью выявить соответсвие консервативных позиций структуре белка. Можно отметить, что для участков последовательности, которые отвечают структурированным элементам вторичной структуры - бета-листам и альфа-спиралям, в целом характерна большая консервативность, что наиболее свойственно близко расположенным крупным элементам вторичной структуры, принимающих основную роль в создании формы белка, и неверно для мелких (рис.5, рис.4). Неструктурированные участки в основном совершенно не несут консервативных остатков.
align1
Рис.5 Третичная структура оксалат-декарбоксилазы B.subtilis
Покрашены консервативные участки на основе выравнивания по функциональным группам,
позиции с сильным полиморфизмом оставлены белыми.
Связанные с лигандом аминокислотные остатки представлены в виде "скелета молекул"