1) seqret /home/export/samba/public/tmp/AALF01000001.embl -sask (данная программа использована для получения моего куска последовательности из всего генома Salmonella typhimurium)
2) formatdb -i /home/export/samba/public/tmp/salty_proteome.fasta -p T -n sp (данная программа использована для получения индексных файлов)
3) blastall -p blastx -d sp -i p2.fasta -e 0.001 > blast2.embl (это программа активирует програму бласт для поиска возможных закодированных в последовательности белков)
для поисков оперделения, кодирует ли мой участок последовательности какой-нибудь белок из организма Salmonella typhimurium (или же,что-то похожее на белок) была выбрана програма BLASTX, поскольку эта програма подходит по пробной последовательности и банку данных, в котором она ищет( Пробная последовательность- НК, ищет в банке данных белков), а так же, эта програма часто используется для схожих целей
>Q7CQN8 Q7CQN8_SALTY Putative cytoplasmic protein. Length = 286 Score = 419 bits (1077), Expect = e-118 Identities = 198/284 (69%), Positives = 224/284 (78%) Frame = -1 Query: 1885 MWQAVNRLLGEYFGPAEIRERTELPGGDIHEAWRLSYGESEVFVKCDSREMLPIFTAEAD 1706 MWQA++RLL E G EI R ELPGG++H AW L Y + FVKCD REML FTAEAD Sbjct: 1 MWQAISRLLSEQVGEGEIELRNELPGGEVHAAWHLRYAGHDFFVKCDEREMLRGFTAEAD 60 Query: 1705 QLSLLSRSKTVRVPEVYGVGSDRDYSFLLLEYIPLKPLDAHNAYCLGQQLAHLHQWSEQL 1526 QL LLSRSKTV VP+V+ VGSDRDYSFL+++Y+ +PLDAHNA+ LGQQLA LHQWS+Q Sbjct: 61 QLELLSRSKTVVVPKVWAVGSDRDYSFLVMDYLSPRPLDAHNAFILGQQLARLHQWSDQP 120 Query: 1525 QFGLDFDNDLATTPQPNSWQRRWGQFFAEQRIGWQLQLAAEKGMSFGDIDQITDLVQERL 1346 QFGLDFDN L+TTPQPN+WQRRW FFAEQRIGWQL+LAAEKG++FG+ID I + VQ+RL Sbjct: 121 QFGLDFDNALSTTPQPNTWQRRWSTFFAEQRIGWQLELAAEKGITFGNIDAIVEHVQQRL 180 Query: 1345 QGHQPQPSLLHGDLWPANCAASAQGPVIFDPACYWGDRECDXXXXXXXXXXXAQIYDGYQ 1166 HQPQPSLLHGDLW ANCA GP IFDPACYWGDRECD QIYDGYQ Sbjct: 181 ASHQPQPSLLHGDLWSANCALGPDGPYIFDPACYWGDRECDLAMLPLHTDQPPQIYDGYQ 240 Query: 1165 SVWPLPADFIDRQPIYQLYYLLNRSNLFGGQHWINAQKAVEHLL 1034 SV PLP DF+DRQPIYQLY LLNR+ LFGGQH AQKA++ LL Sbjct: 241 SVSPLPLDFLDRQPIYQLYTLLNRARLFGGQHLATAQKAMDRLL 284
Программа нашла 4 последовательности , у которых E-value<0,001
Q7CQN8 Q7CQN8_SALTY Putative cytoplasmic protein. 419 e-118 Q9XCS0 Q9XCS0_SALTY SitC (Fur regulated Salmonella iron transpor... 298 2e-81 Q9XCR9 Q9XCR9_SALTY SitD (Fur regulated Salmonella iron transpor... 271 3e-73 Q8ZNV6 Q8ZNV6_SALTY ABC superfamily high affinity Zn transport p... 81 5e-16 Ген Q7CQN8 1885..1166 Ген Q9XCS0 4000..3257 Ген Q9XCR9 3194..2415 Ген Q8ZNV6 3982..3317
Именна генов
1. STM1324
2. sitC
3. sitD
4. znuB
Строка запроса с помощью команды LINK:
(((([uniprot-AllText:Q7CQN8*] | [uniprot-AllText:Q9XCS0*]) | [uniprot-AllText:Q9XCR9*]) | [uniprot-AllText:Q8ZNV6*]) > EMBL )
Расположение генов в Salmonella typhimurium(все гены были найднены в разных записях банко EMBL
gene STM1324 complement(15386..16246) в AE008757, сектор 61
gene sitD 2893..3741 в AF128999 ,сектор 134
gene znuB 12623..13408 в AE008784 ,сектор 88
gene sitC 18073..18933 в AE008830 , сектор 134
Гены sitC и sitD распологаются довольно близко в геноме Salmonella typhimurium, при чем, ген sitC неходится в геноме первым, а sitD находитсяот него на расстоянии примерно 800 нк.(оба гена находятся в записях AF128999 и AE008830)
5'-------------------------------[=> ген sitD,2415..3194]-----------[=>ген citC, 3257..4000] 3' 3'-[<= ген STM1324, 1034..1885]--------------------------------------------------------------5'
знаки <= и => обозначают прямую и комплиментарную цепь.