Дерево моего сайта

BLAST - инструмент для быстрого поиска последовательностей в банках данных по гомологии


Поиск белка по короткому фрагменту Является ли BLAST инструментом для поиска ортологов?

Программа с которой мы работали:
  • protein BLAST (BLASTP)-сервер NCBI
  • Standard protein-protein BLAST (BLASTP)-сервер GeneBee


  • Поиск белка Урацил-ДНК гликозилаза из Escheria coli по фрагменту его аминокислотной последовательности.

    Поиск вёлся по банку данных Swiss-Prot. Мы брали два фрагмента белка Урацил-ДНК гликозилаза из Escheria coli длиной 30 и 10 аминокислот.

    Фрагмент из 30 аминокислот:MANELTWHDVLAEEKQQPYFLNTLQTVAS
    Фрагмент из 10 аминокислот:RGFFGCNHFV
    Порядковый номер хита Процент совпадающих остатков в выравнивании Вес выравнивания E-value

    Поиск для фрагмента в 30 аминокислот

    1

    30/30 (100%)

    61.2

    4e-10

    Поиск для фрагмента в 10 аминокислот

    1

    10/10(100%)

    28.5

    3.0


    В первом случае (участок в 30 аминокислот) значение "веса выравнивания" и "E-value" оказались хорошими - высокая цена выравнивания и низкое значение количества случайных выравниваний в базе данных.
    Во втором случае (участок в 10 аминокислот) для поиска мы использовали критерий "E-value" до 100. В результате значения "E-value" оказалось высоким а цена "веса выравнивания" оказалась более низкой, чем в первом случае.
    Можно сделать вывод что, чем меньше длина участка последовательности, по которой производится поиск, тем больше вероятность найти случайно похожую последовательность.

    Является ли BLAST инструментом для поиска ортологов?
    (по результатам выполнения задания №3 занятия №21).


    Рассмотрим это на примере поиска по последовательности репрессора рибозного оперона RbsR из Bacillus subtilis.
    Но сперва разберёмся, кто же такие ортологи?
    Ортологи- последовательности, возникшие из одного общего предшественника в процессевидообразования. Ортологи, как правило имеют одну и ту же функцию
    
                                                                      Score    E
    Sequences producing significant alignments:                       (bits) Value
    
    gi|2851638|sp|P36944|RBSR_BACSU   Ribose operon repressor          605   e-173
    gi|20139764|sp|Q9K6K2|RBSR_BACHD  Ribose operon repressor          250   3e-66
    gi|20139702|sp|Q9CF41|RBSR_LACLA  Ribose operon repressor          239   7e-63
    gi|1173387|sp|P43472|SCRR_PEDPE   Sucrose operon repressor (S...   148   2e-35 
    gi|3024530|sp|Q45831|REGA_CLOSA   HTH-type transcriptional re...   145   9e-35 
    gi|115950|sp|P25144|CCPA_BACSU    Catabolite control protein A...  144   3e-34 
    gi|37999777|sp|Q9CPA2|RBSR_PASMU  Ribose operon repressor          143   5e-34
    gi|18202290|sp|P58258|REGA_CLOAB  HTH-type transcriptional r...    134   2e-31 
    gi|26007033|sp|Q54430|SCRR_STRMU  Sucrose operon repressor (...    134   3e-31 
    gi|118189|sp|P06964|CYTR_ECOLI    HTH-type transcriptional rep...  132   8e-31 
    gi|3023459|sp|Q56194|CCPA_STAXY   Probable catabolite control...   130   3e-30 
    gi|1168844|sp|P46828|CCPA_BACME   Glucose-resistance amylase ...   130   3e-30 
    gi|1172870|sp|P44329|RBSR_HAEIN   Ribose operon repressor          130   5e-30
    gi|585043|sp|P37947|DEGA_BACSU    HTH-type transcriptional reg...  130   5e-30 
    gi|38604814|sp|Q8CNV8|CCPA_STAEP  Probable catabolite contro...    127   4e-29 
    gi|400962|sp|P25551|RBSR_ECOLI    Ribose operon repressor          125   1e-28
    gi|7388031|sp|O68446|PURR_SALTY   HTH-type transcriptional re...   124   2e-28
    gi|131650|sp|P15039|PURR_ECOLI    HTH-type transcriptional rep...  124   4e-28 
    gi|119334|sp|P27871|ENDR_PAEPO    Probable HTH-type transcript...  121   3e-27 
    gi|38604906|sp|Q8NW33|CCPA_STAAW  Probable catabolite contro...    120   3e-27 
    
    По результатам поиска видно,что E-Value очень маленький.Он свидетельствует о вероятности возникновения этого белка в результате случайной мутации неродственного белка- т.е. это банальное совпадение аминокислот.
    Если посмотреть на сравнение белков друг с другом (сравниние между белками RbsR).

    Название белка Порядковый номер хита Сходство
    P36944|RBSR_BACSU

    1

    313/326 (96%)

    Q9K6K2|RBSR_BACHD

    2

    129/324 (39%)

    Q9CF41|RBSR_LACLA

    3

    127/326 (38%)

    Q9CPA2|RBSR_PASMU

    7

    95/331 (28%)

    P44329|RBSR_HAEIN

    13

    92/309 (29%)

    P25551|RBSR_ECOLI

    16

    92/324 (28%)


    То можно увидеть, что сходство между ними не очень велико.
    Если посмотреть на систематические группы, в которых находятся данные 6 гомологов, то можно увидеть, что одни принадлежат к Firmicutes, а другие к Gammaproteobacteria. А по определению Ортологи- последовательности, возникшие из одного общего предшественника . Поэтому я считаю, что BLAST нельзя использовать для поиска ортологов.


    Главная страница