Поиск белка с заданной функциональной специфичностью
Группа белков-регуляторов транскрипции, родственных белку LacI - ингибитору экспрессии лактозного оперона, содержит немалое
число гомологичных представителей. Их объединяют определённые консервативные участки структуры, но для каждой разновидности
характерны определённые сайты, задающие специфичность к низкомолекулярному лиганду или конкретному участку ДНК.
Моя задача состояла в том, чтобы в условно неизвестном протеоме найти белки определённой специфичности (или предположить их отсутствие).
Для этого мне было необходимо найти такие последовательности в аминокислотной цепочке белков одной группы специфичности, которые
были бы свойственны каждому из них и при этом не встречались у регуляторов иного рода. Эта биоинформатическая задача выполняется в несколько этапов.
Белок FRUR_Ecoli - прототип нашего гипотетического белка - осуществляет регуляцию транскрипции оперона, отвечающего за метаболизм фруктозы,
и связывает фруктозу-1-фосфат или фруктозу-1,6-бифосфат в качестве сигнального лиганда.
В базе данных Pfam пользователь может ознакомиться с доменной структурой, общей для семейства LacI.
Организация в целом такая
Чётко различимы два домена:
зелёный - ДНК-связывающий
красный - лиганд-связывающий
Нас интересует второй - для него мы и получаем в базе данных Pfam полное выравнивание.
Затем мы извлекаем из этого выравнивания последовательности небольшой группы белков в соответствии со списком.
Выравнивание эффекторсвязывающего домена
- для группы специфичности FruR*
- для группы специфичности LacI*(вклад в общую работу)
Чтобы выявить участки последовательности, отвечающие за специфичность, мы "собираем" из выравниваний групп специфичности общее выравнивание,
где каждой группе присвоен определённый цвет (группа frur - сверху, выделена ярко-синим). 1.79Mb
Виузально проще находить а.о., характерные для одной какой-то группы, используя опцию Differences Mode в меню Shade программы GeneDoc.
Относительно уникальными для frur можно считать:
49-глутаминовая кислота, 52-серин, 59-лизин/аргинин, 212-валин/изолейцин и аланин в позициях 61, 111 и 147.
Глутамин в позиции 74 присутствует только у одной группы, кроме frur - scrr.
Используем WebLogo для создания наглядного изображения консервативных последовательностей.
LOGO для группы специфичности FruR*
для всех эффекторсвязывающих доменов *
Составляем профиль нашего эффекторсвязывающего домена.
С помощью программы pfw добавляем веса.*
Строим профиль командой pfmake.*
Нормируем командой autoscale.*
Ищем по профилю гомологичные последовательности в протеоме Tolumonas auensis с помощью программы pfsearch (пороговые значения 5, 10 и 30) -
соответственно получаем 63, 13 и 1 находку.
13 находок, соответствующие среднему значению порога, мы внесли в один fasta-файл c выровненными последовательностями,
по которым мы строили профиль, и провели ещё одно выравнивание программой clustalw2.256Kb
Заметно, что последовательность под номером 289 сильно походит на уже рассмотренные нами белки семейства frur.
Общие черты с прочими последовательностями из исследуемого протеома почти не выражены. Позиции, которые мы считали ответственными за специфичность, сохранены только у №289.
Кстати, №289 был единственной находкой при наивысшем пороге - то есть, можно предположить, что в протеоме T. auensis мы нашли белок из нашей группы специфичности.