Вариант1


Была выбрана программа blastx из пакета blastall, поскольку на вход подается последовательность нуклеиновой кислоты, содержащая нужный участок из генома Yersinia intermedia бактерии. Тип пробы - нуклеиновая кислота, поиск в БД белков, поскольку индексированные файл содержит протеом.

Команды-
seqret embl:AALF01000002 –sask
formatdb -i salty_proteome.fasta -p T -n sa
(созданы индексные файлы для программы blastx)
blastall -p blastx -d sa -i aalf01000002.fasta -o result.fasta -e 0.001

В результате нашлось множество фрагментов нуклеотида, гомологичных белкам, но большинство из них пересекаются, значит, на фрагменте закодировано всего три белка.

Гипотетические гены во фрагменте 7001-11000

3'-------------------------[<=ген znuC, 8180-8920]-----[<=ген yhiP, 10053-10999]-5'
 

5'-[=>ген znuA, 7151-8116]--------------------------------------------3'


ген znuC, 8180-8920
Соответсвует
Q8ZNV7 Q8ZNV7_SALTY ABC superfamily high affinity Zn transport

ген yhiP, 10053-10999
Соответствует
Q8ZLD6 Q8ZLD6_SALTY Putative POT family peptide transport protein.

Ген znuA 8116-7151
Соответсвует
Q8ZNV8 Q8ZNV8_SALTY ABC superfamily high affinity Zn transport

2 гена кодируют 2 фрагмента того же белка.

Соответсвия в геноме Salmonella typhimurium
1. 1986438-1989193
2. 3760614- 3764083
3. 1985415- 1988416
3'-------------------------[<=ген znuC, 1986438-1989193]-----------------------------5'
 

5'-[=>ген znuA, 1985415-1988416]--------------------------------------------3'