Работа с ememe
Цель данного практикума: найти с помощью программы MEME сайт связывания транскрипционного фактора, регулирующего синтез пуринов у одной из
гаммапротеобактерий. Требование к находкам: E-value < 0.001
Штамм выданной бактерии: Pasteurella multocida (strain Pm70), для которой было найдено 12 аннотированных записей по keyword "Purine biosynthesis".
AC записи EMBL, описывающей геном: AE004439
Таблица 1. Список выбранных белков. |
Идентификатор |
Идентификатор |
Название белка |
Ген |
Координаты гена |
Q9CLW4 |
PUR4_PASMU |
Phosphoribosylformylglycinamidine synthase |
purL |
complement(1278224..1282117) |
P57889 |
PURA_PASMU |
Adenylosuccinate synthetase |
purA |
1107132..1108430 |
Q9L6B7 |
IMDH_PASMU |
Inosine-5'-monophosphate dehydrogenase |
guaB |
complement(337563..339026) |
Q9L6B8 |
PUR1_PASMU |
Amidophosphoribosyltransferase |
purF |
complement(817002..818516) |
P57829 |
PUR2_PASMU |
Phosphoribosylamine--glycine ligase |
purD |
249672..250961 |
Q9CNX8 |
GUAA_PASMU |
GMP synthase [glutamine-hydrolyzing] |
guaA |
complement(334538..336109) |
P57828 |
PUR9_PASMU |
Bifunctional purine biosynthesis protein PurH |
purH |
246443..248044 |
Q9CN88 |
PURR_PASMU |
HTH-type transcriptional repressor PurR |
purR |
complement(631172..632176) |
По координатам генов были определены координаты 100 нуклеотидов, предшествующих генам, и с помощью descseq Upstream-регионы были собраны в файл
embl.fasta.
Далее с помощью ememe на kodomo были определены мотивы:
ememe embk.fasta -nmotifs 3 -revcomp
Параметры -nmotifs 3 и -revcomp позволяют искать заданное число мотивов (в нашем случае 3) и производить поиск на прямой и обратной цепях (гены
некоторых белков расположены на комплиментарной цепи).
Результат работы ememe.
Обсуждение результатов ememe
В таблице, приведенной ниже содержатся результаты работы MEME
Таблица 2. Результаты работы MEME |
|
Рис. 1. Первый мотив |
|
Длина: 14
Количество сайтов: 5
Количество последовательностей, содержащих мотив: 5
llr: 67
E-value: 2.9e+001
|
|
Рис. 2. Второй мотив |
|
Длина: 8
Количество сайтов: 4
Количество последовательностей, содержащих мотив: 4
llr: 41
E-value: 2.1e+003
|
|
Рис. 3. Третий мотив |
|
Длина: 13
Количество сайтов: 2
Количество последовательностей, содержащих мотив: 2
llr: 34
E-value: 2.2e+003
|
Как видно из таблицы ни один из мотивов, предложенных MEME не может считаться "хорошим" (E-value всех находок больше 0.001, все имеют
низкие информативность и энтропию, а также маленькую длину), к тому же ни один из мотивов не встретился у всех последовательностей.