На данной странице находится отчёт о выполнении мной практикума 5, посвящённого поиску с помощью MEME сайта связывания транскрипционного фактора, регулирующего синтез пуринов у одной из гаммапротеобактерий.
Мне досталась бактерия Xylella fastidiosa. Для неё в базе данных Uniprot нашлось 24 аннотированных (Reviewed) белка. Для дальнейшей работы я выбрала штамм Xylella fastidiosa (strain 9a5c) с мнемоникой XYLFA. Для него в базе имеется ровно 8 аннотированных белков, которые приведены в таблице ниже.
№ | Entry | Entry name | Protein name | Gene name | Gene coordinates |
1 | Q9PG47 | PURA_XYLFA | Adenylosuccinate synthetase | purA XF_0455 | complement(463737..463913) |
2 | Q9PDF6 | PUR4_XYLFA | Phosphoribosylformylglycinamidine synthase | purL XF_1423 | complement(1371728..1372516) |
3 | Q9PAR4 | FOLD_XYLFA | Bifunctional protein FolD | folD XF_2431 | complement(2315651..2316541) |
4 | Q9PC09 | PUR2_XYLFA | Phosphoribosylamine--glycine ligase | purD XF_1976 | 1886692..1887192 |
5 | Q9PAR6 | GUAA_XYLFA | GMP synthase [glutamine-hydrolyzing] | guaA XF_2429 | complement(2312971..2314428) |
6 | Q9PC10 | PUR9_XYLFA | Bifunctional purine biosynthesis protein PurH | purK XFHB_12425 | 1885366..1886679 |
7 | Q9PFS0 | PUR5_XYLFA | Phosphoribosylformylglycinamidine cyclo-ligase | purM XF_0587 | 566263..567435 |
8 | Q9PGU3 | PUR7_XYLFA | Phosphoribosylaminoimidazole- succinocarboxamide synthase | purC XF_0205 | complement(215170..215271) |
AC генома AE003849.
При помощи descseq были вырезаны Upstream-участки длиной 100 нуклеотидов для каждого гена. Они собраны в fasta-файл. Далее в вырезанных последовательностях производился поиск мотивов с помощью MEME. Команда:
ememe seq.fasta meme -nmotifs 3 -revcomp
Результатом работы программы является html-страница. Лого трёх мотивов представлены ниже.
Рис. 1. Мотив 1.
Рис. 2. Мотив 2.
Рис. 3. Мотив 3.
Данные по мотивам собраны в таблице ниже.
№ | Информативность | Энтропия | Длина | Количество белков, в которых встретился | E-value |
1 | 12,7 | 12,8 | 9 | 8 | 6.5e+000 |
2 | 13,2 | 13,2 | 8 | 6 | 5.9e+002 |
3 | 15,0 | 15,4 | 8 | 2 | 1.5e+004 |
Как можно видеть, ни одного хорошего мотива (E-value < 0,001) найдено не было, хотя у последнего мотива достаточно большие значения информативности и энтропии.