BLAST - инструмент для быстрого поиска последовательностей в банках данных по гомологии

Работа велась с программой BlastP

  • Поиск белка P07014 по фрагменту его аминокислотной последовательности

  • Поиск производился по банку данных Swiss-Prot; по двум фрагментам sw:P07014 (DHSB_ECOLI, он же Succinate dehydrohenase iron-sulphur protein). Первый, длиной 30 АКО - PISALNQPGK KIVIRPLPGL PVIRDLVVDM, второй, длиной 10 АКО - YAQYEKIKPY

     Длина фрагмента   Порядковый № хита   % совпадающих остатков   Вес выравнивания   E-value 
    30 Первый 100% 62 3e-10
    10 Не первый 100% 31 0.54

    Как видно из таблицы, результаты различаются лишь весом выравнивания и значением e-value. Первая величина зависит от числа совпадений/несовпадений в последовательностях, а также от числа гэпов в выравнивании. Очевидно, что в данном случае последний фактор влияния не имеет, равно как и число несовпадений, потому как имеется 100% совпадение остатков (ведь сравнивается белок со своим фрагментом). Так как первая последовательность длиннее, то, соответственно, в ней и совпадений получается больше - больше и вес выравнивания.

    E-value - вероятность случайного получения в базе данных этой последовательности. Чем меньше длина последовательности, тем, разумеется, проще найти нечто похожее; значит, тем больше e-value. Результаты в таблице коррелируют с этим утверждением.

  • Является ли BLAST инструментом для поиска ортологов?

  • Ортологи - последовательности, возникшие из одного общего предка в результате процесса видообразования. Ортологи, как правило, имеют одну общую функцию. Для ответа на вопрос был проведён поиск по последовательности репрессора рибозного оперона RbsR из Bacillus subtilis. В результатах, выданных программой, было найдено несколько ортологов RbsR, однако в первой двадцатке их было всего 6; остальные белки представляли из себя или паралоги (имеющие общего предка, но имеющие разные функции), причём как с похожими функциями (например, отличающиеся только типом углеводов), так и с абсолютно разными. Ниже приведена таблица с результатами поиска, в ней ортологи RbsR выделены жирным. Таким образом, blast выдаёт не больше, чем просто гомологичные последовательности, и не годится для поиска слабогомологичных ортологов.

     Sequences producing significant alignments:  Score (bits)  E-value 
    P36944 RBSR_BACSU Ribose operon repressor6053e-66
    Q9K6K2 RBSR_BACHD Ribose operon repressor2507e-63
    Q9CF41 RBSR_LACLA Ribose operon repressor2392e-35
    P43472 SCRR_PEDPE Sucrose operon repressor ...1489e-35
    Q45831 REGA_CLOSA HTH-type transcriptional ...1453e-34
    P25144 CCPA_BACSU Catabolite control protein ...1445e-34
    Q9CPA2 RBSR_PASMU Ribose operon repressor1432e-31
    P58258 REGA_CLOAB HTH-type transcriptional ...1343e-31
    Q54430 SCRR_STRMU Sucrose operon repressor ...1348e-31
    P06964 CYTR_ECOLI HTH-type transcriptional ...1323e-30
    Q56194 CCPA_STAXY Probable catabolite control...1303e-30
    P46828 CCPA_BACME Glucose-resistance amylase ...1305e-30
    P44329 RBSR_HAEIN Ribose operon repressor1305e-30
    P37947 DEGA_BACSU HTH-type transcriptional ...1305e-30
    Q8CNV8 CCPA_STAEP Probable catabolite control...1274e-29
    P25551 RBSR_ECOLI Ribose operon repressor1251e-28
    O68446 PURR_SALTY HTH-type transcriptional ...1242e-28
    P15039 PURR_ECOLI HTH-type transcriptional ...1244e-28
    P27871 ENDR_PAEPO Probable HTH-type transcrip...1213e-27
    Q8NW33 CCPA_STAAW Probable catabolite control...1203e-27