Проект "Поиск белка с заданной функциональной специфичностью."

1.Первый этап: описание функциональных особенностей заданной группы.

Мой белок-прототип : FruR_Ecoli.

Так как этот белок из организма кишечной палочки, его описание свойств можно найти на сайте EcoCyc.

FruR_Ecoli:

Функции : репрессор-активатор,первоначально известный как "Репрессор Фруктозы", "FruR";

Двоякодействующий транскрипционный регулятор,который играет плейотропную роль в

модуляции направления превращений углерода через различные метаболичекие пути

энергетического метаболизма,но независимо от CRP-регуляторов. По этой причине регулятор

Frur вовлечён в экспрессию большого числа оперонов, которые кодируют ферменты,

включённые в центральные пути метболизма углерода. FruR действует как активатор генов,

кодирующих ферменты гликонеогенеза, цикла Кребса, шунта глиоксилата; и как негативный

регулятор на гены, кодирующие ферменты Entner-Doudoroff пути и ферменты гликолиза.

FruR формирует комплекс с ДНК в присутствии фруктозы 1-фосфат или фруктозы 1,6-

дифосфат и связывается с неполной палиндромной последовательностью в 18 а.о.

В присутствии глюкозы повышается внутриклеточная концентрация метаболитов:

d-фруктозы-1-фосфат и d-фруктозы-1,6-дифосфат, которые взаимодейтсвуют с FruR,

предотвращая связывание или смещение оперонов-мишеней.

В растворе находится преимущественно в виде тетрамерной структуры.

Принадлежит к семейству GalR-LacI транскрипционных регуляторов,которые являются

ДНК-связывающими белками, имеющими в структуре укладку спираль-поворот-спираль.

Как член этого семейства FruR состоит из двух функциональных доменов:

N-концевой домен содержит мотив спираль-поворот-спираль для связывания с ДНК,

C- концевой эффекторсвязывающий домен,является гомологичным периплазматическим

сахаросвязывающим белкам (эффекторами этих белков являются рибоза,арабиноза и галактоза).

D-fructose - молекула-эффектор приведена ниже (достали из БД KEGG)

Реакция связывания белка с эффектором:

 

Доменная организация,представленная в Pfam :

По терминам GO наблюдается следующий расклад:

Со словарём Biological Process ассоциировано 4 различных термина:

GO:0045449 - регуляция транскрипции;

GO:0006355 - регуляция транскрипции, ДНК-зависимая;

GO:0009750 - ответ на стимулы фруктозы;

GO:0006096 – гликолиз;

GO:0006350 - транскрипция.

Со словарём Molecular Function ассоциировано 2 различных термина :

GO:0003700 - активность транскрипционного фактора;

GO:0003677 - связывание с ДНК.

Со словарём Cellular Component ассоциирован только один термин :

GO:0005622 – обнаружен внутриклеточно;

 GO:0005737 – обнаружен в цитоплазме.

2. Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности.

2.1 Создать хорошее множественное выравнивание эффекторсвязывающих доменов группы специфичности rbsr

С БД Pfam возьмём полное выравнивание эффекторсвязывающих доменов в fasta-формате.

Пропишем скрипт для того,чтобы вытащить необходимые нам последовательности,

ID которых указаны в файле rbsr.

Скрипт:

# !bin/bash

for i in 'cat rbsr'; do

grep -A 30 ${i} PF00532_full.fasta >> PF00532_rbsr.fasta

В файле PF00532_rbsr.fasta сохранено множественное выравнивание

эффекторсвязывающих доменов белков группы специфичности rbsr.

Полученное выравнивание импортировано в GeneDoc и сохранено в файле PF00532_rbsr.msf.

2.2Создать единое множественное выравнивание заданных доменов всех групп специфичности.

Множественное выравнивание заданных доменов сохранено в файле. Графическое изображение.

Моей исследовательской группой специфичности является группа frur. Она первой помещена

в файле с множественным выравниванием заданных доменов и отмечена,соответственно,

ярко-зелёным цветом.

Как видно из выравнивания консервативные участки занимают одну, две и 3-6 позиций.

Причём в таких достаточно больших консервативных участках, как правило, находят место

аминокислоты с похожими свойствами.

Например,рассмотрим такие кластеры:

IVP - все три аминокислоты: изолейцин, валин, пролин - гидрофобны.

EN - глутамат и аспарагин - гидрофильны.

GYQLL - из этого кластера только глутамин (Q) является гидрофильным.

VIAVDR - лишь аспартат и аргинин (D,R) гидрофильны.

  Номерами консервативных позиций, характерных только для группы специфичности frur являются:

59 - за исключением двух последовательностей содержит аргинин (R).(в двух отличающихся

последовательностях находится лизин (K),также как и аргинин : полярная, гидрофильная,

положительно-заряженная аминокислота.); в остальных группах специфичности аргинин не консервативен

в данной позиции.

88 - содержит аспартат (D); эта колонка не является консервативной ни для одной из последовательностей

остальных групп специфичности, поэтому при поиске белка в новом протеоме,обратим внимание на эту

позицию, являющуюся столь специфичной.

120 - содержит серин (S) ; эта колонка не является консервативной ни для одной из последовательностей

остальных групп специфичности, поэтому при поиске белка в новом протеоме,обратим внимание на эту

позицию, являющуюся столь специфичной.

180 - содержит лейцин (L) ; в остальных группах специфичности в этой поциции лейцин не является

консервативным.

209 - содержит лейцин (L); в остальных группах специфичности в этой поциции лейцин не является

консервативным; и вообщем,эта позиция является консервативной только у двух групп: frur и garls.

213 - содержит серин (S); только в ещё одной группе: scrr ,эта позиция содержит серин,

как консервативную позицию у всей группы специфичности.

Кластер GYQLL (72-76) как консервативный участок сохраняется лишь в данной группе,а также в группе scrr,

правда в группе scrr на позиции 73 стоят L/V.

Кластер VIA{L/V/I}DR (145-150) таким целым консервативным участком (то есть не содержит

неконсервативных позиций внутри кластера) является характерным только для группы frur.

2.3 Создайте лого-изображения полного выравнивания заданных доменов и выравнивания доменов заданной группы специфичности.

Лого-изображение выравнивания доменов группы специфичности frur.

Лого-изображение полного выравнивания заданных доменов.

3.Третий этап: поиск белка в заданном протеоме

Воспользуемся программами пакета PFTOOLs.

В предыдущем задании мы получали выравнивания заданных групп специфичности.

Выравнивание эффекторсвязывающих доменов группы frur.

Добавим веса в выравнивание с помощью pwf из пакета PFTOOLs: 

pfw -m PF00532_frur.fasta > frurW.fasta

Создадим профиль выравнивания:

pfmake -m frurW.fasta /usr/share/pftools23/blosum45.cmp > myprofile.prf 

Нормируем профиль относительно случайной базы:

autoscale -m myprofile.prf > myprofile.scaled.prf

Заданный протеом, в котором необходимо провести поиск по профилю: Pantoea.fasta

pfsearch -f myprofile.scaled.prf Pantoea.fasta > Pantoea.search

Файл Pantoea.search содержит информацию такого рода:

Получили находку, возможно подтверждающую существование белка с подобной функцией в

протеоме Pantoea. Но это нужно ещё проверить.

Находим 709 фрагмент в протеоме Pantoea, и проводим его выравнивание с последовательностями

доменов группы специфичности frur. Выравнивание проводим программой muscle.

muscle -in 709frur.fasta -out 709frurAli.fasta

Файл 709frurAli.fasta . Импортируем это выравнивание в GeneDoc : 709frurAli.msf 709frurAli.msf

Графическое изображение.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

©Терешкова Алеся,2010e