Множественное выравнивание

Создание репрезентативной выборки гомологов белка YOAJ_BACSU

Выборка гомологов белка была осуществлена с помощью алгоритма BLAST. Отдельно были найдены гомологи среди эукариот и прокариот, исключая филум Firmicutes, к которому относится Bacillus subtilis. Первоначально порог e-value был равен 1, однако после получения первых результатов он был исправлен на 10^(-9) для прокариот и на 10^(-6) для эукариот. Параметры BLAST, с которыми призводился поиск показаны в таблице 1. Количество хитов везде было установлено 500, чтобы количество результатов ограничивалось только значением e-value.

Таблица 1. Параметры BLAST.

Поиск Алгоритм BLAST Название базы данных Ограничения по таксонам Порог e-value Максимальное количество хитов
По прокариотам blastp (protein-protein BLAST) Reference proteins (refseq_protein) Exclude Eucarya (taxid:2759) and exclude firmicutes (taxid:1239) 1е-09 500
По эукариотам blastp (protein-protein BLAST) Reference proteins (refseq_protein) Eucarya (taxid:2759) 1е-06 500

В результате выполнения алгоритма были получены два набора гомологов YOAJ_BACSU приблизительно по 50 белков в каждом. Затем из полученных наборов было отобрано 25 эукариотических и 24 прокариотических белка для создания выборки. Следует отметить, что в полученном наборе гомологов среди белков прокариот не нашлось белков архей. Результаты поиска представлены в таблице 2.

Таблица 2. Таблица встречаемости белков в различных таксонах.

Домен Филум/Царство Название организма (род) Количество белков
Bacteria proteobacteria Xylella 4
Xanthomonas 16
Pectobacterium 6
Dickeya 3
Ralstonia 7
Acidovorax 1
Leptothrix 1
Cystobacter 2
Stigmatella 1
Myxococcus 1
actinobacteria Frankia  3
Streptomyces 1
GNS bacteria Roseiflexus 2
Chloroflexus 1
Herpetosiphon 1
Eucaryotes fungi Aspergillus 6
Neosartorya 1
Penicillium 1
Emericella 1
Leptosphaeria 1
Phaeosphaeria 1
Pyrenophora 2
Nectria 2
Gibberella 1
Magnaporthe 1
Verticillium 1
Sclerotinia 1
Neosartorya 1
Puccinia 3
Schizophyllum 1
oomycetes Phytophthora  10
cellular slime molds Dictyostelium  6
Entamoeba Entamoeba 5
Acanthamoeba Acanthamoeba 5

На рисунках 1 и 2 представлены деревья, показывающие возможные эволюционные отношения гомологов белка YOAJ_BACSU среди прокариот и эукариот соответственно. Смоделированные деревья не могут соответствовать действительной эволюции, однако они наглядно демонстрируют степень схожести гомологов среди различных таксонов.


Рис.1. Таксономическое дерево для прокариотических гомологов белка YOAJ_BACSU.


Рис.2. Таксономическое дерево для эукариотических гомологов белка YOAJ_BACSU .

Множественное выравнивание гомологов белка YOAJ_BACSU

Полученные наборы гомологичных белков были объединены в один файл. Затем было сделано множественное выравнивание последовательностей гомологов с помощью программы MUSCLE на сайте Европейского Биоинформатического Института. Параметры выравнивания были установлены "по умолчанию". Файл с выравниванием был сохранен в формате FASTA, затем все пробелы в нем были заменены на символ "_". Далее выравнивание было открыто с помощью программы Jalview. Для него были созданы аннотации и определенная раскраска. Полное изображение выравнивания можно получить при клике на рисунок 3.


Рис.3. Множественное выравнивание эукариотических и прокариотических гомологов белка YOAJ_BACSU .

На рисунке 3 представлено изображение множественного выравнивания для белка YOAJ_BACSU и его гомологов из прокариотических и эукариотических организмов. Блоки - в данном случае, выровненные по всей длине участки выравнивания, показаны в аннотации BLOKS символом B и отмечены на рисунке цветом. Аминокислотные остатки в блоках покрашены с использованием цветовой схемы, описанной в задании "Применение алгоритмов парных выравниваний к белку YOAJ_BACSU" раздел "Сравнение выравниваний, полученных для коротких мутантов вручную" (в схему внесены небольшие изменения, пролин покрашен в голубой, а не в белый). В аннотации также отмечены специфические домены белка YOAJ_BACSU. Rare lipoprotein A (RlpA)-like double-psi beta-barrel - домен, имеющий структруру боченка из бета-листов, характерный для белка Rare lipoprotein A отмечен символом R. Expansin-like domain EG45 - домен, характерный для экспансин подобных белков, отмечен симолом Е. Кроме того, для белка YOAJ_BACSU характерно наличие сигнального пептида из 25 аминокислот, он отмечен символом S. Также в аннотации есть строчка, показывающая вторичную структуру белка YOAJ_BACSU. Альфа-спирали показаны красным цветом с обозначением альфа, а бета-тяжи показаны зелеными стрелками с обозначением бета.

Результаты анализа множественного выравнивания гомологов белка YOAJ_BACSU

В целом выравнивание достаточно консервативно. Присутствует относительно большое количество замен отдельных аминокислот, но наблюдаются и очень консервативные участки. Центральная часть выравнивания разделена вставками в последовательностях некоторых гомологов в небольшом количестве случаев. На концах гомологов блоки не выделяются, выравнивание, по сути, отсутствует, из чего можно сделать вывод, что последовательности белков наиболее консервативны в своей центральной части. Для соотношения консервативных участков с участками вторичной структуры была настроена цветовая схема "By conservation" с порогом консервативности 20%. На рисунке 4 представлен участок выравнивания, на котором присутствуют вторичные структуры. Участки, совпадающие с достаточно консервативными участками выравнивания выделены черными овалами. На рисунке видно, что они в большинстве случаев совпадают. Из этого можно сделать вывод, что большинство гомологов YOAJ_BACSU имеют схожую с ним вторичную структуру. На элементы вторичной структуры приходится 4 колонки gap из 17 в центральной части выравнивания. Они появляются из-за гомологов со вставками в центральной части. Расположение блоков, которое можно увидеть на рисунке 3, не имеет четкой зависимости от вторичной структуры. Так как блоки выбирались как выровненные по всей длине участки выравнивания, они разделяются колонками gap и охватывают даже малоконсервативные, но выровненные по длине участки, что не вполне совпадает с расположением элементов вторичной структуры.


Рис.4. Множественное выравнивание эукариотических и прокариотических гомологов белка YOAJ_BACSU. Показан центральный участок, в котором выделены элементы вторичной структуры, совпадающие с достаточно консервативными участками выравнивания.

На рисунке 5 показано расположение лиганда глицерола (GOL) в структуре белка. Аминокислотные остатки, взаимодействующие с ним показаны синим и подписаны. Согласно этой цветовой схеме, наиболее консервативные участки окрашены в наиболее яркие цвета, но так как из-за различия цветов не всегда понятно, цвет ярче или просто более темный, здесь такая цветовая схема мало информативна. Поэтому, для улучшения изображения они были покрашены в синий, а их консервативность была оценена исходя из выранивания. На выравнивании видно, что остатки Gly84 и Pro85 высоко консервативны, а Lys125 и Asn124 мало консервативны и заменяются на различные по свойствам остатки. Исходя из этих данных нельзя сделать точное утверждение о возможности связывания GOL гомологами, однако консервативность Gly84 и Pro85 позволяет сделать предположение, что многие гомологи её не утратили.


Рис.5. Участок структуры 3D30 белка YOAJ_BACSU с лигандом GOL. Аминокислотные остатки, взаимодействующие с ним показаны синим и подписаны.


© Анисимова Александра, 2013