1. Поиск в геноме участков, кодирующих белки, похожие на заданный

Число находок с E-value < 0,001

2

E-value лучшей находки

1e-53

Название последовательности с лучшей находкой

Координаты лучшей находки (от-до)

1590426 - 1590944

Процент последовательности белка, вошедшей в выравнивание с лучшей находкой

97.2%=(177-5+1)/178

2. Нахождение записи EMBL по последовательности программой BLASTN

На сайте EBI (http://www.ebi.ac.uk/Tools/) осуществили поиск AC полученной последовательности в банке "EMBL standard prokaryote". AP009380 - AC записи нынешнего релиза EMBL, в которую попадает предложенный фрагмент ДНК
координаты этой последовательности согласно аннотации EMBL 597660-597839, она соответствует самойзаписи.
Участок FT, соответствующий этим координатам:
FT   CDS             597360..597950
FT                   /codon_start=1
FT                   /transl_table=11
FT                   /locus_tag="PGN_0547"
FT                   /product="dTDP-4-dehydrorhamnose 3,5-epimerase"
FT                   /note="similar to dbj|BAD18849.1, percent identity 100.0 in
FT                   196 aa, BLASTP E(): 5.31e-112; may be cytoplasm protein"
FT                   /note="PG1562"
FT                   /db_xref="GOA:B2RI71"
FT                   /db_xref="InterPro:IPR000888"
FT                   /db_xref="InterPro:IPR011051"
FT                   /db_xref="InterPro:IPR014710"
FT                   /db_xref="UniProtKB/TrEMBL:B2RI71"
FT                   /protein_id="BAG33066.1"
FT                   /translation="MNFIPTEIPEVVILEPRLFRDDRGYFFESFSRQEIETGIRPINFV
FT                   QDNESASRYGVLRGLHFQKPPHAQSKLVRVVRGCVIDYAVDIRFGSPTFGKYVAVELSD
FT                   TNFRQLFIPRGFAHGFVVLSDEVVFQYKCDNYYAPQSEGAIAWNDSNLDIDWKIPVEDI
FT                   ILSAKDQANPSWTELISSEDFRNLFPYNQDLYE"
Предложенный фрагмент бактериальной ДНК входит в состав гена Porphyromonas gingivalis, экспрессирующегося с обращованием dTDP-4-dehydrorhamnose 3,5-epimerase. Направление совпадает.

3. Поиск гомологов гена программой BLASTN

Число находок с E-value < 0,001

1

E-value лучшей находки

2e-26

Название последовательности с лучшей находкой

не указано

Координаты лучшей находки (от-до)

1590567 - 1590697



Программа выдала 11 последовательностей vs 4 последовательности в случае TBLASTN, но они гораздо короче, и e-value меньше на 20 порядков для лучшей находки. Появилось много низкокачественных коротких выравниваний, несущих малый смысл.
Отсюда можно заключить, что выравнивание по аминокислотной последовательности гораздо более осмысленно, так как оно вовлекает информацию офункциональной взаимозаменяемости аминокислот, когда же сравнивание нуклеотидов весьма категорично.