Множественные выравнивания
Целью этой работы было составление множественного выравнивания гомологов оксалат-декарбоксилазы Bacillus subtilis из различных групп живых организмов. Для этого сначала была составлена выборка последовательностей предполагаемых гомологов из не слишком филогенетически близких таксонов.Создание репрезентативной выборки гомологов белка OXDC_BACSU
Для создания выборки использовалась программа BLAST (Basic Local Alignment Search Tool), осуществляющая поиск участков сходства заданной последовательности с теми, что находятся в выбранном банке. Были сделаны отдельные запросы для прокариот и эукариот, бактериальная фила Firmicutes исключена из поиска, так как результаты из неё слишком схожи с OXDC_BACSU и сделают выборку нерепрезентативной. Параметры поиска приведены в таблице 1.Поиск | Алгоритм BLAST | Название базы данных | Ограничения по таксонам | Порог e-value | Максимальное количество хитов |
По прокариотам | blastp (protein-protein BLAST) | Reference proteins (refseq_protein) | [-]Eukaryota, [-]Firmicutes | 0.001* | 168 |
По эукариотам | blastp (protein-protein BLAST) | Reference proteins (refseq_protein) | [+]Eukaryota | 0.001* | 105 |
Отдельных поисков по филумам не производилось, т.к. число предположительно гомологичных последовательностей было невелико и они были филогенетически не слишком разнообразны; таким образом, оказалось возможным выбрать последовательности просто по дереву в Genpept-е. Филогенетические деревья для выбранных последовательностей приведены на рис.1(прокариоты) и рис.2 (эукариоты), а сам состав выборки в таблице 2.
Рис.1
Филогенетическое древо
для выбранных прокариот
Рис.2
Филогенетическое древо
для выбранных эукариот
Таблица 2. Состав первоначальной выборки предполагаемых гомологов OXDC_BACSU
Домен | Филум/Царство | Название организма | Белки |
Archaea | Euryarchaeota | Haloferax gibbonsii | WP_004971736 |
Halorubrum lipolyticum | ZP_21596068 | ||
Eubacteria | Acidobacteria | Terriglobus saanensis | YP_004180875 |
Granulicella tundricola | YP_004210489 | ||
Actinobacteria | Rhodococcus erythropolis | WP_003941605 | |
Gordonia rubripertincta | WP_005199631 | ||
Mycobacterium smegmatis | YP_886606 | ||
Alphaproteoobacteria | Rhizobium leguminosarum | WP_004444453 | |
Azospirillum amazonense | WP_004272428 | ||
Methylocella silvestris | YP_002362482 | ||
Bacteroidetes | Chryseobacterium gleum | WP_002978769 | |
Mucilaginibacter paludis | ZP_09612351 | ||
Betaproteobacteria | Burkholderia pseudomallei | WP_004540646 | |
Chlamydiae | Parachlamydia acanthamoebae | YP_004651926 | |
Chloroflexi | Ktedonobacter racemifer | ZP_06974517 | |
Cyanobacteria | Synechococcus sp. | WP_004971736 | |
Synechocystis sp. | ZP_21596068 | ||
Deinococcus-Thermus | Marinithermus_hydrothermalis | YP_004367785 | |
Gammaproteobacteria | Serratia marcescens | WP_004940757 | |
Erwinia billingiae | YP_003743179 | ||
Pantoea ananatis | YP_005196086 | ||
Planctomycetes | Singulisphaera acidiphila | YP_007207200 | |
Gemmata obscuriglobus | ZP_02733343 | ||
Synergistetes | Synergistes sp. | HMPREF1006_02668 | |
Eukaryota | Metazoa | Ceratotherium simum simum | XP_004422611 |
Monodelphis domestica | XP_003340640 | ||
Xenopus tropicalis | XP_002934491 | ||
Funghi | Aspergillus oryzae | XP_001827593 | |
Neurospora crassa | XP_964781 | ||
Leptosphaeria maculans | XP_003840465 | ||
Postia placenta | XP_002473645 | ||
Laccaria bicolor | XP_001889428 | ||
Schizophyllum commune | XP_003032127 | ||
Plantae | Selaginella moellendorffii | XP_002988282 | |
Fragaria vesca vesca | XP_004291586 | ||
Arabidopsis thaliana | NP_171885 | ||
Brachypodium distachyon | XP_003576869 |
Множественное выравнивание гомологов белка OXDC_BACSU
Выравнивание (рис.3) было построено программой MUSCLE (MUltiple Sequence Comparison by Log- Expectation) на ebi.ac.uk при стандартных параметрах по вышеприведённой выборке.
Рис.3 Черновое множественное выравнивание по всей выборке предполагаемых гомологов OXDC_BACSU (кликабельно)
Выравнивание было проанализировано в программе Jalview. Из него были удалены следующие последовательности, явно негомологичные:
- Selaginella moellendorffii (XP_002988282)
- Arabidopsis thaliana (NP_171885)
Следующие последовательности выравниваются далеко не по всей длине, хотя ключевые для схожей с оксалат-декарбоксилазой ферментативной активности аминокислотные последовательности в них присутствуют; они вполне могут оказаться гомологами OXDC_BACSU, но в итоговом выравнивании мы исключим их из рассмотрения:
- Haloferax gibbonsii (WP_004971736)
- Halorubrum lipolyticum (ZP_21596068)
- Synergistes sp.(YP_004367785)
- Marinithermus hydrothermalis (YP_004367785)
- Fragaria vesca vesca (XP_004291586)
- Brachypodium distachyon (XP_003576869)
Также было несколько подредактировано выравнивание концов последовательностей, не показывающее гомологию и содержащее бессмысленно много гэпов при отсутствии консервативных позиций. Итоговое выравнивание приведено на рис. 4.
Сравнительно неширокая представленность белка среди филумов прокариот показывает, что, вероятно, проводимая ферментом реакция является критической в метаболизме не всех организмов или же проводится негомологичным OXDC_BACSU ферментом в некоторых группах. Среди эукариотических последовательностей нет митохондриальных или хлоропластных, но высокий уровень сходства грибных последовательностей и альфапротеобактериальных, а также малое число и низкое сходство с грибными найденных архейных гомологов наводит на мысль об исходно митохондриальном происхождении гена, по крайней мере, у грибов.
У самой B. subtilisимеются два очень схожих паралога, oxdC и oxdD, выполняющих одну функцию, возможно, часть результатов может быть признана более близким гомологом OxdD, чем OxdC.
Очень высокое сходство последовательностей (E-value=0.0) из Bacillus subtilis и Ktedonobacter racemifer, относящихся к разным филам может быть следствием горизонтального переноса генов.
Рис.4 Отредактированное аннотированное множественное выравнивание гомологов OXDC_BACSU (кликабельно)
В строке аннотации LIGANDS помечены буквой L остатки, принимающие участие в координировании ионов магния.
В строке BLOCKS - предполагаемые блоки - достаточно высококонсервативные безгэповые участки выравнивания
(в некоторых случаях для того, чтобы блок стал идеальным, необходимо исключить из рассмотрения одну из последовательностей, в которой отсутствует нужный участок белка)
В строке SECONDARY соотнесена последовательность оксалат-декарбоксилазы Baccilus subtilis и её вторичная структура, что позволяет нам увидеть, как связана консервативность остатка с его участием в образовании элементов вторичной структуры
Результаты анализа множественного выравнивания гомологов белка OXDC_BACSU
Наиболее консервативны оказались связывающие лиганд остатки (у некоторых белков отсутствует один из каталитических доменов, % идентичности по всем восьми остаткам - 93-100%), а также некоторые заряженные остатки, вероятно, играющие важную роль в стабилизации трёхмерной структуры белка (образование кармана для субстрата etc) с помощью солевых мостиков. Было произведено сопоставление множественного выравнивания гомологов OXDC_BACSU и его трёхмерной структуры (в виде файла PDB, с помощью интерфейса JMol) с целью выявить соответсвие консервативных позиций структуре белка. Можно отметить, что для участков последовательности, которые отвечают структурированным элементам вторичной структуры - бета-листам и альфа-спиралям, в целом характерна большая консервативность, что наиболее свойственно близко расположенным крупным элементам вторичной структуры, принимающих основную роль в создании формы белка, и неверно для мелких (рис.5, рис.4). Неструктурированные участки в основном совершенно не несут консервативных остатков.Рис.5 Третичная структура оксалат-декарбоксилазы B.subtilis
Покрашены консервативные участки на основе выравнивания по функциональным группам,
позиции с сильным полиморфизмом оставлены белыми.
Связанные с лигандом аминокислотные остатки представлены в виде "скелета молекул"