Учебный сайт Титовой Анастасии
ГЛАВНАЯ СТРАНИЦА
СЕМЕСТРЫ
ОБО МНЕ
КОНТАКТЫ
САЙТ ФББ
Поиск мотивов с помощью MEME

Работа с ememe

Цель данного практикума: найти с помощью программы MEME сайт связывания транскрипционного фактора, регулирующего синтез пуринов у одной из гаммапротеобактерий. Требование к находкам: E-value < 0.001

Штамм выданной бактерии: Pasteurella multocida (strain Pm70), для которой было найдено 12 аннотированных записей по keyword "Purine biosynthesis".

AC записи EMBL, описывающей геном: AE004439

Таблица 1. Список выбранных белков.
Идентификатор Идентификатор Название белка Ген Координаты гена
Q9CLW4 PUR4_PASMU Phosphoribosylformylglycinamidine synthase purL complement(1278224..1282117)
P57889 PURA_PASMU Adenylosuccinate synthetase purA 1107132..1108430
Q9L6B7 IMDH_PASMU Inosine-5'-monophosphate dehydrogenase guaB complement(337563..339026)
Q9L6B8 PUR1_PASMU Amidophosphoribosyltransferase purF complement(817002..818516)
P57829 PUR2_PASMU Phosphoribosylamine--glycine ligase purD 249672..250961
Q9CNX8 GUAA_PASMU GMP synthase [glutamine-hydrolyzing] guaA complement(334538..336109)
P57828 PUR9_PASMU Bifunctional purine biosynthesis protein PurH purH 246443..248044
Q9CN88 PURR_PASMU HTH-type transcriptional repressor PurR purR complement(631172..632176)

По координатам генов были определены координаты 100 нуклеотидов, предшествующих генам, и с помощью descseq Upstream-регионы были собраны в файл embl.fasta. Далее с помощью ememe на kodomo были определены мотивы:

	ememe embk.fasta -nmotifs 3 -revcomp
Параметры -nmotifs 3 и -revcomp позволяют искать заданное число мотивов (в нашем случае 3) и производить поиск на прямой и обратной цепях (гены некоторых белков расположены на комплиментарной цепи). Результат работы ememe.

Обсуждение результатов ememe

В таблице, приведенной ниже содержатся результаты работы MEME

Таблица 2. Результаты работы MEME
Рис. 1. Первый мотив
Длина: 14
Количество сайтов: 5
Количество последовательностей, содержащих мотив: 5
llr: 67
E-value: 2.9e+001
Рис. 2. Второй мотив
Длина: 8
Количество сайтов: 4
Количество последовательностей, содержащих мотив: 4
llr: 41
E-value: 2.1e+003
Рис. 3. Третий мотив
Длина: 13
Количество сайтов: 2
Количество последовательностей, содержащих мотив: 2
llr: 34
E-value: 2.2e+003

Как видно из таблицы ни один из мотивов, предложенных MEME не может считаться "хорошим" (E-value всех находок больше 0.001, все имеют низкие информативность и энтропию, а также маленькую длину), к тому же ни один из мотивов не встретился у всех последовательностей.


Titova Anastasiya, 2018 ©