Для работы мне был выдан штамм бактерии Vibrio vulnificus. В банке Uniprot мною было найдено 24 аннотированных записей о белках для двух штаммов (мнемоники VIBVY и VIBVU). Мною был выбран штамм Vibrio vulnificus (strain YJ016) (VIBVY), для которого имеется 12 аннотированных белков.
ID | Полный ID | Название белка | Ген | Upstream-регион (100 bp) |
Q7MN70 | PUR4_VIBVY | Phosphoribosylformylglycinamidine synthase (EC 6.3.5.3) | purL VV0847 | 849450-849550 |
Q7MK47 | PURT_VIBVY | Formate-dependent phosphoribosylglycinamide formyltransferase (EC 2.1.2.-) | purT VV1963 | 1954396 1954496 |
Q7MH07 | PURA_VIBVY | Adenylosuccinate synthetase (EC 6.3.4.4) | purA VV3066 | 3148798-3148898 (compl) |
Q7MIX2 | FOLD_VIBVY | Bifunctional protein FolD (EC 1.5.1.5, 3.5.4.9) | folD VV2391 | 2426425-2426525 |
Q7MGT4 | PUR2_VIBVY | Phosphoribosylamine--glycine ligase (EC 6.3.4.13) | purD VV3143 | 3227097-3227197 |
Q7MGL1 | PURK_VIBVY | N5-carboxyaminoimidazole ribonucleotide synthase (EC 6.3.4.18) | purK VV3219 | 3309316-3309416 |
Q7MNE1 | GUAA_VIBVY | GMP synthase (EC 6.3.5.2) | guaA VV0776 | 781982-782082 |
Q7MGT5 | PUR9_VIBVY | Bifunctional purine biosynthesis protein PurH (EC 2.1.2.3, 3.5.4.10) | purH VV3142 | 3225492-3225592 |
Q7MJ57 | PURR_VIBVY | HTH-type transcriptional repressor PurR | purR VV2305 | 2326605-2326705 |
Q7MIK1 | PUR5_VIBVY | Phosphoribosylformylglycinamidine cyclo-ligase (EC 6.3.3.1) | purM VV2515 | 2545264-2545364 |
Q7MGL2 | PURE_VIBVY | N5-carboxyaminoimidazole ribonucleotide mutase (EC 5.4.99.18) | purE VV3218 | 3308827-3308927 |
Q7MLF9 | PUR7_VIBVY | Phosphoribosylaminoimidazole-succinocarboxamide synthase (EC 6.3.2.6) | purC VV1468 | 1506550-1506650 (compl) |
После этого мною был найден полный геном этого штамма на сайте EMBL. Его AC: BA000037.
Мною был написан небольшой скрипт для извлечения Upstream-регионов. Затем, используя команду «meme upstreams.fasta -dna -revcomp -nmotifs 3 -oc meme_hits», я получил веб-страницу с результатами поиска мотивов в данном наборе белков.
Как видно из результатов поиска, алгоритм обнаружил единственный достоверный мотив с E-Value 3.8·10-4. Этот мотив представлен в 6 последовательностях из 12.