Создание репрезентативной выборки гомологов белка PDXS_BACSU

Целью представленной работы является создание репрезентатичной, но не очень большой выборки гомологов PDXS_BACSU по различным таксонам прокариот и эукариот для последующего множественного выравнивания.

Бактерия (Bacillus Subtilis), которой принадлежит изучаемый белок, относится к филуму Firmicutes (об этом свидетельствуют данные NCBI Taxonomy, январь 2013). Был осуществлен поиск BLAST (алгоритм BlastP) с использованием исходной последовательности PDXS_BACSU. При этом на поиск были наложены следующие параметры:

Параметры финального поиска представлены в таблице 1.

Таблица 1. Параметры финального поиска BLAST.

Поиск Алгоритм BLAST Название базы данных Ограничения по таксонам Порог e-value Максимальное количество хитов
По прокариотам BlastP RefSeq Не Eukaryota, не Firmicutes 2е-04 5000
По эукариотам BlastP RefSeq Только Eukaryota 2е-05 5000

Количество выданных записей:

1) По первому поиску - 818 (прокариотические гомологи)

2) По второму запросу - 149 (эукариотические гомологи)

Для всех последовательностей в обоих случаях была получена выдача GenBank и изображения таксономических деревьев гомологов. Изображения представлены ниже. Деревья содержат названия организмов, которым принадлежат искомые гомологи, и показывает выраженность различий (и, соответственно, сходства) между их последовательностями.

Необходимо сразу отметить, что ни для одного эукариотического гомолога изучаемого белка не была выявления локализация кодирующих генов в митохондриях или хлоропластах. Наиболее вероятным является независимое происхождение белков в различных организмах (про- и эукариотических) для выполнения одинаковых (или сходных) функций за счет определенной близости в их последовательностях и структурах.

Ссылки на выдачу BLAST для обоих запросов можно скачать из данного файла.

tree

Рис. 1-1. Таксономическое дерево гомологов у прокариотических организмов.

tree

Рис. 1-2. Таблица обозначений некоторых таксонов различными цветами для рис 1-1.

tree

Рис. 2-1. Таксономическое дерево гомологов у эукариотических организмов.

tree

Рис. 2-2. Таблица обозначений некоторых таксонов различными цветами для рис 2-1.


Были отобраны последовательности гомологов организмов, принадлежащих разным таксонам. Названия организмов, их принадлежность к филумам/царствам, количество отобранных последовательностей для разных случаев отражены в таблице 2.

Таблица 2. Встречаемость белков, гомологичных PDXS_BACSU, в разных таксонах. Приведены названия организмов, последовательности гомологов исходного белка которых были взяты для репрезентативной выборки и последующего множественного выравнивания.

Домен Филум/Царство Название организма Количество белков
Archaea euryarchaeotes  Natronomonas moolapensis 8.8.11 4
(Halobacteriales)  Halococcus thailandensis JCM 13552
   
  Halobiforma nitratireducens JCM 10879
  Haloarcula japonica DSM 6131
euryarchaeotes  Acidianus hospitalis W1 3
(Сrenarchaeotes) Pyrobaculum sp. 1860
  Caldivirga maquilingensis IC-167
euryarchaeotes  Candidatus Nitrosopumilus sp. AR2 3
(Nitrosopumilales) Nitrosopumilus maritimus SCM1
  Candidatus Nitrosopumilus salaria BD31
Bacteria firmicutes Bacillus subtilis strain 168 1 (исходный)
actinobacteria  Mycobacterium abscessus 5
  Streptomyces davawensis JCM 4913
  Rhodococcus ruber BKS 20-38
  Nocardia brasiliensis ATCC 700358
  Micromonospora lupini str. Lupac 08
proteobacteria Bibersteinia trehalosi USDA-ARS-USMARC-192 5
  Wohlfahrtiimonas chitiniclastica SH04
  Actinobacillus suis H91-0380
  Pasteurella multocida 36950
  Francisella cf. novicida Fx1
CFB group bacteria  Prevotella nigrescens F0103 4
(Bacteroidales) Odoribacter laneus YIT 12061
  Prevotella oralis ATCC 33269
  Prevotella buccae ATCC 33574
CFB group bacteria  Cardinium endosymbiont cEper1 of Encarsia pergandiella 1
(Candidatus Cardinium)  
Eukaryota Fungi Ascomycetes: 2
  Aspergillus oryzae RIB40
  Basidiomycetes:
  Cryptococcus gattii WM276
Green plants Arabidopsis thaliana 1
Apicomplexans Plasmodium chabaudi chabaudi 1
Animals Nematostella vectensis 2
  Bombus impatiens

Последовательности белков, отобранных для выравнивания представлены в следующих файлах:

"/~pankevich-ev/term2/infoseq/infoseq_help.txt" infoseq/infoseq_help.txt">i

Множественное выравнивание гомологов белка PDXS_BACSU

Выравнивание полученных полноразмерных последовательностей (из репрезентативной выборки) было проведено с помощью программы Muscle. Последующая обработка выдачи происходила в программе JalView. Общий вид выравнивания можно увидеть на рисунке 3. Полноразмерное изображение откроется в новом окне при клике на картинку.

multiple aligment

Рис. 3. Выравнивание последовательностей гомологов PDXS_BACSU с исходной последовательностью (для наглядности она приведена в первой и последней строках выравнивания). Полноразмерное изображение можно увидеть кликнув по картинке. Слева от выравнивания - подписи последовательностей (gi-номер, АС, название организма), первые 5 последовательностей (после исходной) - гомологи из эукариот, остальные - из прокариот. Для окраски выравнивания была создана цветовая схема, основанная на свойствах аминокислот (по их радикалам), выбран режим, при котором столбцы, в которых по всей толщине процент идентичности меньше 15% - не окрашиваются (cut-off 15%), яркость окраски столбцов также зависит от количества совпадений. Под выравниванием располагаются следующие строки аннотации:

1. BLOCKS. Показывает блоки выравнивания (B).

2. LIGANDS. Показывает местa связывания лигандов EDO.

3. SECONDARY. Cодержит информацию о известной трехмерной структуре белка PDXS_BACSU (альфа-спирали обозначены красным цветом, бета-листы - зеленым).

4. Conservation. Показывает консервативность каждой позиции выравнивания(по толщине), показывает количество не сходящихся с большинством остатков.

5. Quality. Цветом отражает сходство аминокислот в каждой позиции выравнивания.

6. Consensus. Показывает консервативность каждой позиции выравнивания (по толщине).

Результаты анализа множественного выравнивания гомологов белка PDXS_BACSU

Проведенное выравнивание репрезентативной выборки белков-гомологов PDXS_BACSU дает возможность сделать некоторые выводы. В целом, по общему виду вырванивания можно определить, что последовательность является умеренно консервативной. Далеко не все стоблцы содержат большое колиество идентичных остатков, некоторые белки имеют длинные хвосты в начале, зато не имеют в конце. Это коррелирует с особенностями вторичной стркутры белка. Цепь имеет консувидную форму, причем в ее вершине, как было обнаружено, встречаются более консервативные участки из альфа-спиралей. Там связываются лиганды EDO (этандиол-1,2 или этиленгликоль) при кристаллизации белка. Там же происходит связывание с субъединицами белка (подробнее это описано в работе о внутримолекулярных взаимодействиях в структуре 2NV1 (PDSX_BACSU). Следует отметить, что в целом позиции аминокислот, отвечающих в PDXS_BACSU за образование вторичной структуры, довольно консервативны. Вероятно, гомологи имеют подобную конусовидную форму. Ее функция в образовании третичной и четвертичной структур белка. "Хвосты" в начале последовательности укладываются в основание "конуса", чье значение играет меньшую роль. Соответственно, в начале выравнивание является наихудшим. Также неудачные места выравнивания составляют колонки с гэпами в середине выраванивания. Их наличие обусловлено определенным числом инсерций в геномах организмов-обладателей некоторых гомологов. Интересно, что в первом таком месте "лишние" аминокислотые остатки появляются там, где идет альфа-спираль PDXS_BACSU. Возможно, что эти остатки входят в альфа-спирали вторичной структуры гомологов. Во втором же случае рядом стоящие колонки с гэпами приходятся на линейную часть структуры и, вероятно, не изменяют ее.

В процессе работы были проставлены "блоки", они обозначены буквой "В" в первой строке аннотации. Большинство блоков попадает на позиции аминокислот, которые обусловливают вторичную структуру PDXS_BACSU. Тем не менее, обратного видеть мы не можем: далеко не все позиции, с которыми связана вторичная структура, дают блоки. Это вызвано тем, что блоки выбирались вручную и по весьма жестким критериям. Столбец считался блоком, если идентичность остатков в нем была очень значительной. Возможно, вернее было бы ослабить критерии выбора и уменьшить человеческий фактор при помощи написания специальных скриптов, обозначающих блоками позции с определенной идентичностью остатков по толщине.

Следует оценить консервативность остатков, которые связывают лиганды в белке.

На рисунках 5 и 6 представлены соответственно общий вид расположения лигандов EDO в структуре белка и увеличенный вид с указанием на места связывания лиганда определенными аминокислотами. Отметим, что картинки были получены с помощью интерфейса JMol в программе JalView, которая позволяет с большим удобством определять связь между консервативностью определенных позиций аминокислот и их расположения в пространственной структуре молекулы (этим можно пользоваться при связывании последовательности белка с его структурой PDB, в том числе можно переносить окраску выравнивания на трехмерную структуру).

tree

Рис. 5. Общий вид связываения EDO с PDXS_BACSU.

tree

Рис. 6. 2 молкулы EDO и аминокислоты, связывающие эти лиганды.

Подробно о связывании EDO можно прочитать в работе о области контакта белка и лиганда EDO в структуре 2NV1(PDSX_BACSU). Отметим, что для лиганда, связываемого аланином-186 и лизином-187 (в выравнивании - позиции 238, 239), столбцы выравнивания весьма консервативны и могут составлять блоки. Можно заметить, что лизин часто заменяется на аргинин, который в приниципе может выполнять сходные функции. Для второго лиганда, который в PDXS_BACSU связывается аланином-191 и тирозином-187 (в выравнивании позиции 243, 245), столбцы имеют различную степень консервативности. Позиция аланина является слабо консервативной, часто аминокислота заменяется на валин, который (как в случае замены лизина на аргинин) может выполнять ту же функцию, включая в себя неполярный алифатический радикал. Позиция тирозина же имеет слабую консервативность. Этот остаток заменяется на остатки аминокислот иной природы и иными функциями. Можно предположить, что EDO в данном случае вообще не связывается с белком в этом месте. Из этого не может следовать, что белок теряет свою биологическую функцию, т.к. EDO является лигандом, который служит исключительно для кристаллизации данного белка. Если связь у некоторых гомологов не происходит, то можно только предположить, что для этих белков существует несколько иной способ кристаллизации.


Последнее изменение: 15-04-2013 (pankevich-ev)