Множественное выравнивание

Создание репрезентативной выборки гомологов белка YPJD_BACSU

С помощью алгоритма pblast (то есть blast для белковых последовательностей) был проведен поиск возможных гомологов белка YPJD_BACSU по базе RefSeq. RefSeq - это крупная база данных, где представлены полные геномы. Для получения нужных результатов были изменены некоторые параметры, представленные в таблице 1. Гомологами считались белки с E-value меньше, чем 10-5. Для поиска его значение было задано равным 1.

Таблица 1. Таблица с заданными для поиска параметрами BLAST.
Поиск Алгоритм BLAST Название базы данных Ограничения по таксонам Порог e-value Максимальное количество хитов (количество результатов)
По прокариотам Blastp (protein-protein BLAST) RefSeq Без филума Firmicutes 1 1000 (613)
По эукариотам Blastp (protein-protein BLAST) RefSeq Только Eukaryota 1 100 (39)

Гомологи белка были найдены у бактерий, архей и даже вирусов (5 белков, принадлежащих двум представителям). Мною были выбраны по 1-2 гомологам разных представителей каждого филума (филумы - самые крупные единицы дробления у прокариот, сравнимые с делением на царства у эукариот), кроме филума Firmicutes (к которому принадлежит рассматриваемый белок, но он также указан в таблице). Гомологи белка YPJD_BACSU встречаются также и у эукариот. Не нашлось ни одного белка, для которого было бы указано неэукариотическое происхождение (то есть белок кодировался бы в геноме митохондрии или хлоропласта), так что можно предположить, что все гомологи относятся к ядерному геному. В таблице 2 приведены большинство таксонов, в которых встречаются гомологи YPJD_BACSU, а также названия представителей, чьи последовательности были сохранены мной для создания множественного выравнивания.

Таблица 2. Таблица встречаемости белков в различных таксонах. Серым выделен организм, которому принадлежит белок YPJD_BACSU.
Домен Филум/Царство Название организма Количество белков
Archaea Crenarchaeotes Pyrococcus horikoshii 45
Thermococcus kodakarensis
Euryarchaeotes Desulfurococcus fermentans DSM 16532 2
Desulfurococcus kamchatkensis 1221n
Bacteria Actinobacteria Candidatus Microthrix parvicella 3
Cellulomonas flavigena DSM 20109
CFB group bacteria Cytophaga hutchinsonii 215
Marinilabilia sp. AK2
Deinococcales Deinococcus geothermalis 7
Firmicutes Bacillus subtilis strain 168
Planctomycetes Blastopirellula marina 10
Rhodopirellula baltica
Spirochetes Leptospira interrogans 31
Leptospira wolbachii
Thermales Marinithermus hydrothermalis DSM 14884 9
Thermus aquaticus
Eukaryotes Animals Ailuropoda melanoleuca 17
Bos taurus
Canis lupus familiaris
Cavia porcellus
Dasypus novemcinctus
Felis catus
Metaseiulus occidentalis
Ochotona princeps
Odobenus rosmarus divergens
Oryctolagus cuniculus
Otolemur garnettii
Ovis aries
Sarcophilus harrisii
Sorex araneus
Sus scrofa
Green plants Cucumis sativus 21
Fragaria vesca subsp. Vesca
Glycine max
Physcomitrella patens subsp. patens
Populus trichocarpa
Ricinus communis
Solanum lycopersicum
Vitis vinifera
Zea mays
Viruses Mycobacterium phage SWU1 5
Streptococcus phage 2972

Ниже приведены изображения "деревьев" таксономических групп организмов, к которым принадлежат найденные гомологи.
Рисунок 1. Прокариотические гомологи. Рисунок 2. Эукариотические гомологи.

Множественное выравнивание гомологов белка YPJD_BACSU

Выравнивание было построено с помощью программы Muscle на сайте Европейского Биоинформатического Института. Результат выравнивания и эукариотических, и прокариотических гомологов белка YPJD_BACSU (и его включительно) можно увидеть на рисунке 3.

Для окраски использую созданную мной схему, где цвета соответствуют следующим аминокислотам: светло-зеленый – алифатические; зеленый – иминокислота пролин; желтый – серосодержащие; синий – положительно заряженные; красный – отрицательно заряженные; розовый - нейтральные. Рисунок 3. Множественное выравнивание белка YPJD_BACSU и его гомологов с помощью программы Muscle. Ссылка на выравнивание в формате jar

Результаты анализа множественного выравнивания гомологов белка YPJD_BACSU.

Выравнивание можно считать хорошим, так как большинство участков консеративности приходится на какие-либо элементы вторичной структуры.

Самое плохое выравнивание (или почти отсутствующее) - выравнивание на концах и между блоками. Разброс на этих участках закономерен и объясняется тем, что на этих участках обычно располагаются петли (они не образуют вторичной структуры и могут сильно видоизменяться в ходе эволюции).

На участки вторичной структуры приходится меньше колонок-гэпов, чем на остальное выравнивание, однако существуют белки, в которых на участках, соответствующих вторичной структуре, возникают вставки. В результате прямо на середине спирали могут образовываться колонки гэпов.

Выбранные мной блоки в значительной мере совпадают с элементами вторичной структуры, выбор был основан на большой толщине и в какой-то степени консервативности выравнивая на каждом участке.

На рисунках 4 и 5 представлены иллюстрации консервативности остатков, связывающих лиганд в белке YPJD_BACSU. В белке 4 цепи и каждая связывает по одному лиганду - иону натрия. Цепи идентичны, на примере цепи А иожно увидеть, что лиганд связывают 3 остатка глутаминовой кислоты (Glu37, Glu40 и Glu66). Консервативность этих участков очень и очень высока: 60-ый не заменяется, 37-ый и 40-ой остатки иногда заменяются на аспарагиновую кислоту. Такая замена является довольно логичной.

Нельзя определенно сказать, что все гомологи способны связывать этот лиганд, однако эта вероятность очень высока, так как эти остатки почти не заменяются и лежат напротив участков вторичных структур (спиралей).

Даже по названиям некоторых гомологов: MazG, пирофосфотазы, неохарактеризованные белки, - можно говорить о схожести их функций. Тот факт, что большинство этих белков имеют высококонсервативные участки в местах связывания лиганда (то есть, теоретически, они тоже могут связывать ионы натрия), также говорит о том, что они могут выполнять похожие функции с белком YPJD_BACSU.

Рисунок 4. Расположение аминокислотных остатков, связывающих лиганд, по отношению ко всему белку. Лиганд покрашен фиолетовым цветом, аминокислотные остатки - по разработанной мной схеме.

Рисунок 5. Отдельно цепь А. Расцветка такая же, как и на рисунках 3 и 4. Подписаны остатки глутаминовой кислоты, связывающие лиганд.

Источники:

Дата последнего изменения: 26/04/2013. Сайт kodomo © Trushina Nataliya