Поиск белка с заданной функциональной специфичностью

Группа белков-регуляторов транскрипции, родственных белку LacI - ингибитору экспрессии лактозного оперона, содержит немалое
число гомологичных представителей. Их объединяют определённые консервативные участки структуры, но для каждой разновидности
характерны определённые сайты, задающие специфичность к низкомолекулярному лиганду или конкретному участку ДНК.
Моя задача состояла в том, чтобы в условно неизвестном протеоме найти белки определённой специфичности (или предположить их отсутствие).
Для этого мне было необходимо найти такие последовательности в аминокислотной цепочке белков одной группы специфичности, которые
были бы свойственны каждому из них и при этом не встречались у регуляторов иного рода. Эта биоинформатическая задача выполняется в несколько этапов.

Белок FRUR_Ecoli - прототип нашего гипотетического белка - осуществляет регуляцию транскрипции оперона, отвечающего за метаболизм фруктозы, 
и связывает фруктозу-1-фосфат  или  фруктозу-1,6-бифосфат в качестве сигнального лиганда.
В базе данных Pfam пользователь может ознакомиться с доменной структурой, общей для семейства LacI.
Организация в целом такая
  
Чётко различимы два домена: 
зелёный - ДНК-связывающий
красный - лиганд-связывающий
Нас интересует второй - для него мы и получаем в базе данных Pfam полное выравнивание.
Затем мы извлекаем из этого выравнивания последовательности небольшой группы белков в соответствии со списком.   

Выравнивание эффекторсвязывающего домена 
- для группы специфичности FruR*
- для группы специфичности LacI*(вклад в общую работу)

Чтобы выявить участки последовательности, отвечающие за специфичность, мы "собираем" из выравниваний групп специфичности общее выравнивание,
где каждой группе присвоен определённый цвет (группа frur - сверху, выделена ярко-синим). 1.79Mb
Виузально проще находить а.о., характерные для одной какой-то группы, используя опцию Differences Mode в меню Shade программы GeneDoc.
Относительно уникальными для frur можно считать: 
49-глутаминовая кислота, 52-серин, 59-лизин/аргинин, 212-валин/изолейцин и аланин в позициях 61, 111 и 147. 
Глутамин в позиции 74 присутствует только у одной группы, кроме frur - scrr.

Используем WebLogo для создания наглядного изображения консервативных последовательностей.
LOGO для группы специфичности FruR* 
для всех эффекторсвязывающих доменов *

Составляем профиль нашего эффекторсвязывающего домена.
С помощью программы pfw добавляем веса.*
Строим профиль командой pfmake.*
Нормируем командой autoscale.* 

Ищем по профилю гомологичные последовательности в протеоме Tolumonas auensis с помощью программы pfsearch (пороговые значения 5, 10 и 30) - 
соответственно получаем 63, 13 и 1 находку.

13 находок, соответствующие среднему значению порога, мы внесли в один fasta-файл c выровненными последовательностями, 
по которым мы строили профиль, и провели ещё одно выравнивание программой clustalw2.256Kb
Заметно, что последовательность под номером 289 сильно походит на уже рассмотренные нами белки семейства frur. 
Общие черты с прочими последовательностями из исследуемого протеома почти не выражены. Позиции, которые мы считали ответственными за специфичность, сохранены только у №289.
Кстати, №289 был единственной находкой при наивысшем пороге - то есть, можно предположить, что в протеоме T. auensis мы нашли белок из нашей группы специфичности.


К перечню исследовательских работ
На главную