Аннотация генов

Аннотация генов

1. Используемые команды

1) seqret /home/export/samba/public/tmp/AALF01000001.embl -sask (данная программа использована для получения моего куска последовательности из всего генома Salmonella typhimurium)

2) formatdb -i /home/export/samba/public/tmp/salty_proteome.fasta -p T -n sp (данная программа использована для получения индексных файлов)

3) blastall -p blastx -d sp -i p2.fasta -e 0.001 > blast2.embl (это программа активирует програму бласт для поиска возможных закодированных в последовательности белков)

2.Выбор программы

для поисков оперделения, кодирует ли мой участок последовательности какой-нибудь белок из организма Salmonella typhimurium (или же,что-то похожее на белок) была выбрана програма BLASTX, поскольку эта програма подходит по пробной последовательности и банку данных, в котором она ищет( Пробная последовательность- НК, ищет в банке данных белков), а так же, эта програма часто используется для схожих целей

3.Анализ полученного файла

Лучшая находка

>Q7CQN8 Q7CQN8_SALTY Putative cytoplasmic protein.
          Length = 286

 Score =  419 bits (1077), Expect = e-118
 Identities = 198/284 (69%), Positives = 224/284 (78%)
 Frame = -1

Query: 1885 MWQAVNRLLGEYFGPAEIRERTELPGGDIHEAWRLSYGESEVFVKCDSREMLPIFTAEAD 1706
            MWQA++RLL E  G  EI  R ELPGG++H AW L Y   + FVKCD REML  FTAEAD
Sbjct: 1    MWQAISRLLSEQVGEGEIELRNELPGGEVHAAWHLRYAGHDFFVKCDEREMLRGFTAEAD 60

Query: 1705 QLSLLSRSKTVRVPEVYGVGSDRDYSFLLLEYIPLKPLDAHNAYCLGQQLAHLHQWSEQL 1526
            QL LLSRSKTV VP+V+ VGSDRDYSFL+++Y+  +PLDAHNA+ LGQQLA LHQWS+Q 
Sbjct: 61   QLELLSRSKTVVVPKVWAVGSDRDYSFLVMDYLSPRPLDAHNAFILGQQLARLHQWSDQP 120

Query: 1525 QFGLDFDNDLATTPQPNSWQRRWGQFFAEQRIGWQLQLAAEKGMSFGDIDQITDLVQERL 1346
            QFGLDFDN L+TTPQPN+WQRRW  FFAEQRIGWQL+LAAEKG++FG+ID I + VQ+RL
Sbjct: 121  QFGLDFDNALSTTPQPNTWQRRWSTFFAEQRIGWQLELAAEKGITFGNIDAIVEHVQQRL 180

Query: 1345 QGHQPQPSLLHGDLWPANCAASAQGPVIFDPACYWGDRECDXXXXXXXXXXXAQIYDGYQ 1166
              HQPQPSLLHGDLW ANCA    GP IFDPACYWGDRECD            QIYDGYQ
Sbjct: 181  ASHQPQPSLLHGDLWSANCALGPDGPYIFDPACYWGDRECDLAMLPLHTDQPPQIYDGYQ 240

Query: 1165 SVWPLPADFIDRQPIYQLYYLLNRSNLFGGQHWINAQKAVEHLL 1034
            SV PLP DF+DRQPIYQLY LLNR+ LFGGQH   AQKA++ LL
Sbjct: 241  SVSPLPLDFLDRQPIYQLYTLLNRARLFGGQHLATAQKAMDRLL 284

Программа нашла 4 последовательности , у которых E-value<0,001

Q7CQN8 Q7CQN8_SALTY Putative cytoplasmic protein.                     419   e-118
Q9XCS0 Q9XCS0_SALTY SitC (Fur regulated Salmonella iron transpor...   298   2e-81
Q9XCR9 Q9XCR9_SALTY SitD (Fur regulated Salmonella iron transpor...   271   3e-73
Q8ZNV6 Q8ZNV6_SALTY ABC superfamily high affinity Zn transport p...    81   5e-16 


Ген Q7CQN8  1885..1166
Ген Q9XCS0  4000..3257
Ген Q9XCR9  3194..2415
Ген Q8ZNV6  3982..3317

Именна генов

1. STM1324

2. sitC

3. sitD

4. znuB

Гипотетические гены в моем фрагменте (196001-20000)

Строка запроса с помощью команды LINK:

(((([uniprot-AllText:Q7CQN8*] | [uniprot-AllText:Q9XCS0*]) | [uniprot-AllText:Q9XCR9*]) | [uniprot-AllText:Q8ZNV6*]) > EMBL )

Расположение генов в Salmonella typhimurium(все гены были найднены в разных записях банко EMBL

gene STM1324 complement(15386..16246) в AE008757, сектор 61

gene sitD 2893..3741 в AF128999 ,сектор 134

gene znuB 12623..13408 в AE008784 ,сектор 88

gene sitC 18073..18933 в AE008830 , сектор 134

Гены sitC и sitD распологаются довольно близко в геноме Salmonella typhimurium, при чем, ген sitC неходится в геноме первым, а sitD находитсяот него на расстоянии примерно 800 нк.(оба гена находятся в записях AF128999 и AE008830)


5'-------------------------------[=> ген sitD,2415..3194]-----------[=>ген citC, 3257..4000] 3'

3'-[<= ген STM1324, 1034..1885]--------------------------------------------------------------5' 

знаки <= и => обозначают прямую и комплиментарную цепь.

Вернуться на гавную страницу

Третий семестр


©Подковкина Анна