Uniprot ID |
Uniprot-мнемоника вида |
Белок |
Имя гена |
Координаты гена |
Координаты Upstream-региона |
Q87Q53 |
PURT_VIBPA |
Formate-dependent phosphoribosylglycinamide formyltransferase |
purT VP1297 |
complement(1376818..1377993) |
complement(1377994..1378094) |
P40607 |
PURA_VIBPA |
Adenylosuccinate synthetase, AMPSase, AdSS, EC 6.3.4.4 |
purA VP2812 |
complement(2975587..2976903) |
complement(2976904..2977004) |
Q87RW0 |
PUR4_VIBPA |
Phosphoribosylformylglycinamidine synthase, FGAM synthase, FGAMS, EC 6.3.5.3 |
purL VP0666 |
695498..699406 |
6954397..6954497 |
Q87RB8 |
FOLD_VIBPA |
Bifunctional protein FolD [Includes: Methylenetetrahydrofolate dehydrogenase, EC 1.5.1.5; Methenyltetrahydrofolate cyclohydrolase, EC 3.5.4.9] |
folD VP0879 |
complement(911485..912345) |
complement(912346..912446) |
Q87KS8 |
PUR2_VIBPA |
Phosphoribosylamine--glycine ligase, EC 6.3.4.13 |
purD VP2898 |
3082360..3083649 |
3082259..3082359 |
Q87KE0 |
PURK_VIBPA |
N5-carboxyaminoimidazole ribonucleotide synthase, N5-CAIR synthase, EC 6.3.4.18 |
purK VP3037 |
3244219..3245352 |
3244118..3244218 |
Q87MH0 |
PUR5_VIBPA |
Phosphoribosylformylglycinamidine cyclo-ligase, EC 6.3.3.1 |
purM VP2285 |
2393407..2394447 |
2393306..2393406 |
Q87KE1 |
PURE_VIBPA |
N5-carboxyaminoimidazole ribonucleotide mutase, N5-CAIR mutase, EC 5.4.99.18 |
purE VP3036 |
3243729..3244214 |
3243628..3243728 |
Для дальнейшей работы в базе данных EMBL была найдена запись полного генома данного штамма (идентификатор: BA000031.2). С помощью команды descseq
'descseq BA000031.2.fasta:[xxxx:xxxx] -name **** -description VP_**** -outseq up*.fasta'
были получены нуклеотидные последовательности upstream-регионов выбранных генов длиной 100 нуклеотидов. Затем полученные последовательности командой
'cat file1>> file2'
были записаны в один общий файл upstream.fasta.
После этого для поиска мотивов была запущена программа MEME
'ememe -nmotifs 3 -revcomp upstream.fasta'
Результат работы программы и html-страница с выдачей.
width = 23
sites = 5
llr = 138
E-value = 1.3e-014
width = 45
sites = 3
llr = 146
E-value = 1.4e-002
width = 15
sites = 2
llr = 41
E-value = 3.1e+003
Два из трёх (2 и 3) мотивов имеют E-value более 0,001. Также можно заметить, что ни один из мотивов не представлен в каждом гене. Мотив 1 был найден в пяти генах: folD, purL, purE, purM, purT и имеет E-value менее 0,001 (1.3e-014), и представляется мне наиболее достоверным.
© Енькова Анна, 2017 |