Программы пакета BLAST




Поиск в геноме участков, кодирующих белки, похожие на заданный

Поиск гомологов белка KPRS_BACSU в геноме S. agalactiae.

Для получения индексных файлов была запущена следующая команда:
formatdb -i sa_genome.fasta -n sa -p F
Поиск в геноме Streptococcus agalactiae участков, кодирующих белки, похожих на KPRS_BACSU:
blastall -d sa -i my_protein.fasta -e 0.001 -p tblastn > kprs.out

Число находок с E-value < 0,001

2

E-value лучшей находки

e-115

Название последовательности с лучшей находкой

Streptococcus agalactiae NEM316 complete genome, segment 1

Координаты лучшей находки (от-до)

30454-31389

Процент последовательности белка, вошедший в выравнивание с лучшей находкой

58%


Нахождение записи EMBL по последовательности программой BLASTN

а) Данная последовательность ENA|AB001031|AB001031.1 Sporosarcina ureae DNA for phenylalanine dehydrogenase, complete cds. присутствует в записи UniProtKB/Swiss-Prot P97014;

б)

Cиним выделена часть последовательности, по коротой производился поиск. Координаты заданной последовательности в записи 658-918; она соответсвует самой записи.
в)

FH   Key             Location/Qualifiers
FH
FT   source          1..1331
FT                   /organism="Sporosarcina ureae"
FT                   /strain="R04"
FT                   /mol_type="genomic DNA"
FT                   /db_xref="taxon:1571"
FT   CDS             178..1317
FT                   /codon_start=1
FT                   /transl_table=11
FT                   /gene="pdh"
FT                   /product="phenylalanine dehydrogenase"
FT                   /db_xref="GOA:P97014"
FT                   /db_xref="InterPro:IPR006095"
FT                   /db_xref="InterPro:IPR006096"
FT                   /db_xref="InterPro:IPR006097"
FT                   /db_xref="InterPro:IPR016040"
FT                   /db_xref="InterPro:IPR016211"
FT                   /db_xref="UniProtKB/Swiss-Prot:P97014"
FT                   /protein_id="BAA19221.1"
FT                   /translation="MILVTLEQTLQDDKASVLDKMVEHEQILFCHDKATGLQAIIAVHD
FT                   TTMGPALGGCRMAPYKTMDLALKDVLRLSKGMTYKCAAADVDFGGGKSVIIGDPLKDKT
FT                   PEKFRAFGQFIESLNGRFYTGTDMGTTLEDFVHAMKETNYIVGKPVEYGGGGDSSIPTA
FT                   LGVFYGIKATNQNLFGDDKVEGRKYSIQGLGKVGYKVAEHIINEGGNVIVTDINEQAIA
FT                   DIQKLGGSAVRVVSSEEIYSQQADVFVPCAFGGVINDDTLKVLKVRGISGSANNQLAES
FT                   RHGELLREKGILYAPDYIVNGGGLIQVADELYGTNPARVLAKTENIYTSLLEVFHQAEQ
FT                   DHMTTATAADRMCEKRIADAKNRNSFFTQSNRPKWNFHQ"

В поле FT описан участок гена pdh, включающий данную последовательность; он имеет прямое направление.


Поиск гомологов гена программой BLASTN

E-value лучшей находки

0,007

Название последовательности с лучшей находкой

embl|AL766843|AL766843 Streptococcus agalactiae NEM316 complete genome

Координаты лучшей находки (от-до)

30844-30866

Идентичность

95%


Последовательности, выданные программой, гораздо короче, и e-value намного меньше, если сравнивать с результатами TBLASTN. Но зато процент идентичности очень большой. Такие короткие выравнивания несут небольшой смысл. Отсюда можно заключить, что выравнивание по аминокислотной последовательности гораздо более осмысленно, так как оно вовлекает информацию о функциональной взаимозаменяемости аминокислот. Сравнивание же нуклеотидов в этом случае работает весьма хуже. Координаты находки пересекаются с координатами поиска TBLASTN (см. первое задание).



© Alisa Garaeva