Сигналы, мотивы, PWM

Задание 1

Для выполнения данного практикума из таблицы мною был выбран организм Vibrio parahaemolyticus.

Параметры поиска в базе данных Uniprot

keyword:"Purine biosynthesis [KW-0658]" organism:"vibrio parahaemolyticus"

Результаты поиска

Всего было обнаружено 243 находки
Reviewd: 12
Unreviewd: 231

Popular organisms

VIBPH (111) "Vibrio parahaemolyticus [670]"

VIBPA (18) "Vibrio parahaemolyticus serotype O3:K6 (strain RIMD 2210633) [223926]"

VIBPQ (18) "Vibrio parahaemolyticus serotype O3:K6 (strain AQ3810) [419109]"

Vibrio parahaemolyticus 863 (18) "Vibrio parahaemolyticus 863 [1288784]"

Vibrio parahaemolyticus O1:Kuk str. FDA_R31 (18) "Vibrio parahaemolyticus O1:Kuk str. FDA_R31 [1338034]"

Все аннотированные записи принадлежали организму Vibrio parahaemolyticus serotype O3:K6 (strain RIMD 2210633), мнемоника PURT_VIBPA, EMBL BA000031.2.

Для выполнения практикума было выбрано 8 белков, информация о которых представлена в таблице 1.

Таблица 1

Uniprot ID

Uniprot-мнемоника вида

Белок

Имя гена

Координаты гена

Координаты Upstream-региона

Q87Q53

PURT_VIBPA

Formate-dependent phosphoribosylglycinamide formyltransferase

purT VP1297

complement(1376818..1377993)

complement(1377994..1378094)

P40607

PURA_VIBPA

Adenylosuccinate synthetase, AMPSase, AdSS, EC 6.3.4.4

purA VP2812

complement(2975587..2976903)

complement(2976904..2977004)

Q87RW0

PUR4_VIBPA

Phosphoribosylformylglycinamidine synthase, FGAM synthase, FGAMS, EC 6.3.5.3

purL VP0666

695498..699406

6954397..6954497

Q87RB8

FOLD_VIBPA

Bifunctional protein FolD [Includes: Methylenetetrahydrofolate dehydrogenase, EC 1.5.1.5; Methenyltetrahydrofolate cyclohydrolase, EC 3.5.4.9]

folD VP0879

complement(911485..912345)

complement(912346..912446)

Q87KS8

PUR2_VIBPA

Phosphoribosylamine--glycine ligase, EC 6.3.4.13

purD VP2898

3082360..3083649

3082259..3082359

Q87KE0

PURK_VIBPA

N5-carboxyaminoimidazole ribonucleotide synthase, N5-CAIR synthase, EC 6.3.4.18

purK VP3037

3244219..3245352

3244118..3244218

Q87MH0

PUR5_VIBPA

Phosphoribosylformylglycinamidine cyclo-ligase, EC 6.3.3.1

purM VP2285

2393407..2394447

2393306..2393406

Q87KE1

PURE_VIBPA

N5-carboxyaminoimidazole ribonucleotide mutase, N5-CAIR mutase, EC 5.4.99.18

purE VP3036

3243729..3244214

3243628..3243728

Для дальнейшей работы в базе данных EMBL была найдена запись полного генома данного штамма (идентификатор: BA000031.2). С помощью команды descseq

'descseq BA000031.2.fasta:[xxxx:xxxx] -name **** -description VP_**** -outseq up*.fasta'

были получены нуклеотидные последовательности upstream-регионов выбранных генов длиной 100 нуклеотидов. Затем полученные последовательности командой

'cat file1>> file2'

были записаны в один общий файл upstream.fasta.

После этого для поиска мотивов была запущена программа MEME

'ememe -nmotifs 3 -revcomp upstream.fasta'

Результат работы программы и html-страница с выдачей.

Анализ найденных мотивов

width = 23

sites = 5

llr = 138

E-value = 1.3e-014

width = 45

sites = 3

llr = 146

E-value = 1.4e-002

width = 15

sites = 2

llr = 41

E-value = 3.1e+003

Два из трёх (2 и 3) мотивов имеют E-value более 0,001. Также можно заметить, что ни один из мотивов не представлен в каждом гене. Мотив 1 был найден в пяти генах: folD, purL, purE, purM, purT и имеет E-value менее 0,001 (1.3e-014), и представляется мне наиболее достоверным.

К семестрам


© Енькова Анна, 2017