на главную страницу

Что кодирует фрагмент нуклеотидной последовательности?


Использовалась программа blastx, потому что пробная последовательность была в н.к.(kpn.fasta), а тип данных- 
белок(salty_proteome.fasta).
Гипотетические гены во фрагменте 4179583-4184583(здесь 1-5001): 
5'-[<=ген Q8ZMB4, 2295...1]-[<=ген Q8ZMB3, 2631...2320]-[<=ген Q8ZMB2, 3017...2619]-
-[<=ген Q8ZMB1,3565...3023]---[<=ген Q8ZMB0, 4041...3577]---[<=ген TYSY,5001...4312]---3'


Из выравниваний программы blastx:

>Q8ZMB4 Q8ZMB4_SALTY Exonuclease V, subunit (EC 3.1.11.5).
          Length = 1123

 Score = 1204 bits (3115), Expect = 0.0
 Identities = 592/765 (77%), Positives = 665/765 (86%)
 Frame = -1

[Q8ZMB4, 2295...1]


>Q8ZMA9 TYSY_SALTY Thymidylate synthase (EC 2.1.1.45) (TS) (TSase).
          Length = 264

 Score =  469 bits (1207), Expect = e-133
 Identities = 217/230 (94%), Positives = 225/230 (97%)
 Frame = -1

[TYSY,5001...4312]

>Q8ZMB0 Q8ZMB0_SALTY Prepilin peptidase dependent protein A.
          Length = 156

 Score =  132 bits (331), Expect = 3e-31
 Identities = 67/156 (42%), Positives = 89/156 (57%), Gaps = 1/156 (0%)
 Frame = -1

[Q8ZMB0, 4041...3577]

>Q8ZMB1 Q8ZMB1_SALTY Prepilin peptidase dependent protein B.
          Length = 187

 Score =  171 bits (432), Expect = 6e-43
 Identities = 83/181 (45%), Positives = 115/181 (63%)
 Frame = -3

[Q8ZMB1,3565...3023]

>Q8ZMB3 Q8ZMB3_SALTY Prepilin peptidase dependent protein C.
          Length = 106

 Score =  100 bits (249), Expect = 9e-22
 Identities = 54/105 (51%), Positives = 71/105 (67%), Gaps = 1/105 (0%)
 Frame = -1

[Q8ZMB3, 2631...2320]

>Q8ZMB2 Q8ZMB2_SALTY Putative periplasmic protein.
          Length = 135

 Score = 94.7 bits (234), Expect = 5e-20
 Identities = 44/133 (33%), Positives = 68/133 (51%)
 Frame = -2

[Q8ZMB2, 3017...2619]
Cравнение взаимного расположения генов в исследуемом фрагменте и в геноме организма:
141 section of the complete genome of Salmonella typhimurium LT2:
1. Q8ZMB0: в гене ppdA(19641..20111), cds:19641..20111
2. Q8ZMB1: в гене ppdB(19087..19661), cds:19087..19650
3. Q8ZMB2: в гене ygdB(18683..19104), cds:18683..19090
4. Q8ZMB3: в гене ppdC(18378..18709), cds:18378..18698
5. Q8ZMB4: находится в гене recC(14991..18373), сds:14991..18362
142 section of the complete genome of Salmonella typhimurium LT2:
6. Q8ZMA9: в гене thyA(123..925), cds:123..917
5 первых генов находятся в одной секции в полном геноме, причём в той же самой последовательности, что 
и во фрагменте. А ген Q8ZMA9 в другой секции, т.е. отдельно в отличие от фрагмента.
Заметим, что Q8ZMB3 и Q8ZMB2, Q8ZMB2 и Q8ZMB1-перекрываются.

Использованные команды:
-выделение фрагмента:seqret kpn.genome.fasta -sask(причём нужно было указать начало и конец куска, который нужно вырезать, а также выходящий файл)
-создание индексных файлов для salty_proteome.fasta:formatdb -i salty_proteome.fasta -p N -n sp
-построение выравниваний с помощью blastx:blsatall -p blastx -d sp -i kpn.fasta -o result.txt




©Дёмин Олег