В рамках данной работы с помощью программы МЕМЕ, установленной на kodomo, был проведён поиск сайта связывания транскрипционного фактора, регулирующего синтез пуринов у одной из гаммапротеобактерий из прошлого практикума. Была рассмотрена бактерия Haemophilus influenzae
Был составлен запрос:
keyword:"purine biosynthesis" organism:"haemophilus influenzae" |
Таблица 1. Информация о выбранном штамме | |||
Uniprot-мнемоника | Наименование штамма | ||
HAEIN | Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) [71421] |
Для каждого из генов выбранных белков в скачанной записи EMBL AC L42023.1были записаны координаты Upstream-региона из 100 нуклеотидов поиском в EMBL необходимой части - по координатам из файла EMBL.
Таблица 2. Информация о генах апстримов. | ||||
Идентификатор | Мнемоника | Ген | Координаты гена | Координаты апстрима |
P45283 | PURA_HAEIN | purA | 1695071..1696369 | 1694971-1695070 |
P43847 | PUR4_HAEIN | purL | 812967..816929 | 812867-812966 |
P44334 | IMDH_HAEIN | guaB | 248948..250414 | 248848-248947 |
P44313 | FOLD_HAEIN | folD | 640075..640923 | 639975-640074 |
P43854 | PUR1_HAEIN | purF | 1273386..1274903 | 1273286-1273385 |
P43850 | PURK_HAEIN | purK | 1683529..1684617 | 1683429-1683528 |
P44335 | GUAA_HAEIN | guaA | 251125..252696 | 251025-251124 |
P43845 | PUR2_HAEIN | purD | 941550..942839 | 941450-941549 |
P44797 | PUR8_HAEIN | purB | 680324..681694 | 680224-680323 |
ememe -dataset all.fasta -outd align = 'center' ir pr4 -nmotifs 3 -revcomp Y |
Из-за столь малой выборки, мотивы, покрывающие 8/9 и 7/9(третий) последовательностей можно считать консервативными. |
Ниже вы можете видеть обощённые данные выдачи по находкам, в данном случае, нас интересует завышенные значения E-value, которые свидетельствуют о наших мотивах, как о не очень подходящих.
Во всех последовательностях так или иначе представлены мотивы, но присутствует в каждой суммарно от одного до трёх:
| |||||||||||||
Помимо этого, программа в поле "SUMMARY OF MOTIFS" выдала общее расположение мотивов по цепям - то, о чём мы говорили выше. |
Сравнение с LOGO сайта связывания пуринового рецептора purR E.coliДля данного сравнения в базе Uniprot был найден идентификатор пуринового репрессора E.coli PURR_ECOLI гена PurA. На сайте NCBI было найдено несколько подходящих статей про регулоны PurR:
| |||||||||||||
Анализ мотивов с помощью программы emast Далее был проведён поиск подходящих мотивов с помощью программы emast, установленной на kodomo. Для достижения успеха значения e-value для мотивов сразу были выставлены не превышающими "хорошего" 0,001: | ||||||||||||||
Программа обнаружила меньшее количество мотивов, но все они присутствуют в наших upstream регионах и определены emast, как достоверно-хорошие. С полной выдачей emast можно ознакомиться по этой ссылке. Особое внимание предлагаю обратить на параграф SECTION III: ANNOTATED SEQUENCES. В том представлены последовательности изображённых на Рисунке 3 мотивы с p-value находок и поштучным присутствием необходимых нуклеотидов в мотиве. |
На главную страницуВернуться назад
©Solonovich Vera,2017