Предсказание генов в участке генома бактерии

    Команды используемые для выполнения задания:

seqret /home/export/samba/public/tmp/AALF01000001.embl -sask
(команда для извлечения из последовательности AALF01000001 4000 нуклеотидов.)

formatdb -i /home/export/samba/public/tmp/salty_proteome.fasta -n st -p t
(команда для создания индексных файлов протеома бактерии Salmonella typhimuriu, по которому будет проводиться поиск)
blastall -p blastx -d st -i aalf01000001.fasta -o results.txt -e 0.001 (программа BLASTX была выбрана по тому, какая пробная последовательность водилась (нуклеотидная) и по типу банка данных (белок), а также т.к. задача, выполняемая этой программой, наиболее соответствовала поставленной перед нами)

Исследование полученного файла
Было получено 8 выравниваний с E-value меньше 0,001. Результаты и выравнивания можно найти в файле:results.txt

Список лучших находок:

Q8ZPZ0 Q8ZPZ0_SALTY Isocitrate dehydrogenase in e14 prophage (EC...   740   0.0
Q8ZPZ1 RLUE_SALTY Ribosomal large subunit pseudouridine synthase...   306   9e-84
Q8ZPZ3 Q8ZPZ3_SALTY Putative MutT-like protein.                       164   3e-41
Q8ZP51 RLUB_SALTY Ribosomal large subunit pseudouridine synthase...   80   1e-15
Q8ZKL1 RLUF_SALTY Ribosomal large subunit pseudouridine synthase...   73   2e-13
P65840 RSUA_SALTY Ribosomal small subunit pseudouridine synthase...   71   6e-13
P37412 LEU3_SALTY 3-isopropylmalate dehydrogenase (EC 1.1.1.85) ...   58   4e-09
Q8ZPV3 Q8ZPV3_SALTY Putative mutator MutT protein.                    46   2e-05


Так как многие находки имеют перекрывающиеся координаты,всего нашлось три предполагаемых гена:


5'--------------------------------------------------[1129-2283 P37412=>]---3'
                                                                              
                                                                    
                                                                    

3'--[<=1-291 Q8ZPZ3]---[<=296-910 Q8ZPZ1]----------------------------------5'

         
Далее введем запрос в SRS: ((([uniprot-AccNumber:Q8ZPZ3*] | [uniprot-AccNumber:Q8ZPZ1*]) | [uniprot-AccNumber:P37412*]) > EMBL )

Получаем такие результаты:

EMBL:AE008699
EMBL:AE008754
EMBL:U20795  
EMBL:X53376  

Изучая полученные документы, находим: 
 AC в UniProt  AC в EMBL  Координаты в геноме Salmonella typhimurium
 Q8ZPZ1  AE008754  ymfC complement(4148..4813) section 58
 Q8ZPZ3  AE008754  ymfB complement(3349..3820) section 58
 P37412  AE008699  leuB 22..1101 section 7

Таким образом из  таблицы можно увидеть,что два гена ymfC и ymfB находятся в одном секторе 
генома и довльно близко друг от друга, что похоже на результаты выравнивания. Третий
же ген найден в совершенно другом секторе и на прямой цепи, тогда как два первых - на комплементарной.

                       




вернуться на главную


©Пономарева Ольга