Что кодирует фрагмент нуклеотидной последовательности?
Использовалась программа blastx, потому что пробная последовательность была в н.к.(kpn.fasta), а тип данных-
белок(salty_proteome.fasta).
Гипотетические гены во фрагменте 4179583-4184583(здесь 1-5001):
5'-[<=ген Q8ZMB4, 2295...1]-[<=ген Q8ZMB3, 2631...2320]-[<=ген Q8ZMB2, 3017...2619]-
-[<=ген Q8ZMB1,3565...3023]---[<=ген Q8ZMB0, 4041...3577]---[<=ген TYSY,5001...4312]---3'
Из выравниваний программы blastx:
>Q8ZMB4 Q8ZMB4_SALTY Exonuclease V, subunit (EC 3.1.11.5).
Length = 1123
Score = 1204 bits (3115), Expect = 0.0
Identities = 592/765 (77%), Positives = 665/765 (86%)
Frame = -1
[Q8ZMB4, 2295...1]
>Q8ZMA9 TYSY_SALTY Thymidylate synthase (EC 2.1.1.45) (TS) (TSase).
Length = 264
Score = 469 bits (1207), Expect = e-133
Identities = 217/230 (94%), Positives = 225/230 (97%)
Frame = -1
[TYSY,5001...4312]
>Q8ZMB0 Q8ZMB0_SALTY Prepilin peptidase dependent protein A.
Length = 156
Score = 132 bits (331), Expect = 3e-31
Identities = 67/156 (42%), Positives = 89/156 (57%), Gaps = 1/156 (0%)
Frame = -1
[Q8ZMB0, 4041...3577]
>Q8ZMB1 Q8ZMB1_SALTY Prepilin peptidase dependent protein B.
Length = 187
Score = 171 bits (432), Expect = 6e-43
Identities = 83/181 (45%), Positives = 115/181 (63%)
Frame = -3
[Q8ZMB1,3565...3023]
>Q8ZMB3 Q8ZMB3_SALTY Prepilin peptidase dependent protein C.
Length = 106
Score = 100 bits (249), Expect = 9e-22
Identities = 54/105 (51%), Positives = 71/105 (67%), Gaps = 1/105 (0%)
Frame = -1
[Q8ZMB3, 2631...2320]
>Q8ZMB2 Q8ZMB2_SALTY Putative periplasmic protein.
Length = 135
Score = 94.7 bits (234), Expect = 5e-20
Identities = 44/133 (33%), Positives = 68/133 (51%)
Frame = -2
[Q8ZMB2, 3017...2619]
Cравнение взаимного расположения генов в исследуемом фрагменте и в геноме организма:
141 section of the complete genome of Salmonella typhimurium LT2:
1. Q8ZMB0: в гене ppdA(19641..20111), cds:19641..20111
2. Q8ZMB1: в гене ppdB(19087..19661), cds:19087..19650
3. Q8ZMB2: в гене ygdB(18683..19104), cds:18683..19090
4. Q8ZMB3: в гене ppdC(18378..18709), cds:18378..18698
5. Q8ZMB4: находится в гене recC(14991..18373), сds:14991..18362
142 section of the complete genome of Salmonella typhimurium LT2:
6. Q8ZMA9: в гене thyA(123..925), cds:123..917
5 первых генов находятся в одной секции в полном геноме, причём в той же самой последовательности, что
и во фрагменте. А ген Q8ZMA9 в другой секции, т.е. отдельно в отличие от фрагмента.
Заметим, что Q8ZMB3 и Q8ZMB2, Q8ZMB2 и Q8ZMB1-перекрываются.
Использованные команды:
-выделение фрагмента:seqret kpn.genome.fasta -sask(причём нужно было указать начало и конец куска, который нужно вырезать, а также выходящий файл)
-создание индексных файлов для salty_proteome.fasta:formatdb -i salty_proteome.fasta -p N -n sp
-построение выравниваний с помощью blastx:blsatall -p blastx -d sp -i kpn.fasta -o result.txt
©Дёмин Олег