Для получения индексных файлов была запущена следующая команда:
formatdb -i sa_genome.fasta -n sa -p F
Поиск в геноме Streptococcus agalactiae участков, кодирующих белки, похожих на KPRS_BACSU:
blastall -d sa -i my_protein.fasta -e 0.001 -p tblastn > kprs.out
Число находок с E-value < 0,001 |
2 |
E-value лучшей находки |
e-115 |
Название последовательности с лучшей находкой |
Streptococcus agalactiae NEM316 complete genome, segment 1 |
Координаты лучшей находки (от-до) |
30454-31389 |
Процент последовательности белка, вошедший в выравнивание с лучшей находкой |
58% |
а) Данная последовательность ENA|AB001031|AB001031.1 Sporosarcina ureae DNA for phenylalanine dehydrogenase, complete cds. присутствует в записи UniProtKB/Swiss-Prot P97014;
б) ![]() |
Cиним выделена часть последовательности, по коротой производился поиск.
Координаты заданной последовательности в записи 658-918; она соответсвует самой записи.
в)
FH Key Location/Qualifiers FH FT source 1..1331 FT /organism="Sporosarcina ureae" FT /strain="R04" FT /mol_type="genomic DNA" FT /db_xref="taxon:1571" FT CDS 178..1317 FT /codon_start=1 FT /transl_table=11 FT /gene="pdh" FT /product="phenylalanine dehydrogenase" FT /db_xref="GOA:P97014" FT /db_xref="InterPro:IPR006095" FT /db_xref="InterPro:IPR006096" FT /db_xref="InterPro:IPR006097" FT /db_xref="InterPro:IPR016040" FT /db_xref="InterPro:IPR016211" FT /db_xref="UniProtKB/Swiss-Prot:P97014" FT /protein_id="BAA19221.1" FT /translation="MILVTLEQTLQDDKASVLDKMVEHEQILFCHDKATGLQAIIAVHD FT TTMGPALGGCRMAPYKTMDLALKDVLRLSKGMTYKCAAADVDFGGGKSVIIGDPLKDKT FT PEKFRAFGQFIESLNGRFYTGTDMGTTLEDFVHAMKETNYIVGKPVEYGGGGDSSIPTA FT LGVFYGIKATNQNLFGDDKVEGRKYSIQGLGKVGYKVAEHIINEGGNVIVTDINEQAIA FT DIQKLGGSAVRVVSSEEIYSQQADVFVPCAFGGVINDDTLKVLKVRGISGSANNQLAES FT RHGELLREKGILYAPDYIVNGGGLIQVADELYGTNPARVLAKTENIYTSLLEVFHQAEQ FT DHMTTATAADRMCEKRIADAKNRNSFFTQSNRPKWNFHQ"
В поле FT описан участок гена pdh, включающий данную последовательность; он имеет прямое направление.
E-value лучшей находки |
0,007 |
Название последовательности с лучшей находкой |
embl|AL766843|AL766843 Streptococcus agalactiae NEM316 complete genome |
Координаты лучшей находки (от-до) |
30844-30866 |
Идентичность |
95% |
Последовательности, выданные программой, гораздо короче, и e-value намного меньше, если сравнивать с результатами TBLASTN. Но зато процент идентичности очень большой. Такие короткие выравнивания несут небольшой смысл. Отсюда можно заключить, что выравнивание по аминокислотной последовательности гораздо более осмысленно, так как оно вовлекает информацию о функциональной взаимозаменяемости аминокислот. Сравнивание же нуклеотидов в этом случае работает весьма хуже. Координаты находки пересекаются с координатами поиска TBLASTN (см. первое задание).