Поиск производился по банку данных Swiss-Prot; по двум фрагментам sw:P07014 (DHSB_ECOLI, он же Succinate dehydrohenase iron-sulphur protein). Первый, длиной 30 АКО - PISALNQPGK KIVIRPLPGL PVIRDLVVDM
, второй, длиной 10 АКО - YAQYEKIKPY
Длина фрагмента | Порядковый № хита | % совпадающих остатков | Вес выравнивания | E-value |
---|---|---|---|---|
30 | Первый | 100% | 62 | 3e-10 |
10 | Не первый | 100% | 31 | 0.54 |
Как видно из таблицы, результаты различаются лишь весом выравнивания и значением e-value. Первая величина зависит от числа совпадений/несовпадений в последовательностях, а также от числа гэпов в выравнивании. Очевидно, что в данном случае последний фактор влияния не имеет, равно как и число несовпадений, потому как имеется 100% совпадение остатков (ведь сравнивается белок со своим фрагментом). Так как первая последовательность длиннее, то, соответственно, в ней и совпадений получается больше - больше и вес выравнивания.
E-value - вероятность случайного получения в базе данных этой последовательности. Чем меньше длина последовательности, тем, разумеется, проще найти нечто похожее; значит, тем больше e-value. Результаты в таблице коррелируют с этим утверждением.
Ортологи - последовательности, возникшие из одного общего предка в результате процесса видообразования. Ортологи, как правило, имеют одну общую функцию. Для ответа на вопрос был проведён поиск по последовательности репрессора рибозного оперона RbsR из Bacillus subtilis. В результатах, выданных программой, было найдено несколько ортологов RbsR, однако в первой двадцатке их было всего 6; остальные белки представляли из себя или паралоги (имеющие общего предка, но имеющие разные функции), причём как с похожими функциями (например, отличающиеся только типом углеводов), так и с абсолютно разными. Ниже приведена таблица с результатами поиска, в ней ортологи RbsR выделены жирным. Таким образом, blast выдаёт не больше, чем просто гомологичные последовательности, и не годится для поиска слабогомологичных ортологов.
Sequences producing significant alignments: | Score (bits) | E-value |
---|---|---|
P36944 RBSR_BACSU Ribose operon repressor | 605 | 3e-66 |
Q9K6K2 RBSR_BACHD Ribose operon repressor | 250 | 7e-63 |
Q9CF41 RBSR_LACLA Ribose operon repressor | 239 | 2e-35 |
P43472 SCRR_PEDPE Sucrose operon repressor ... | 148 | 9e-35 |
Q45831 REGA_CLOSA HTH-type transcriptional ... | 145 | 3e-34 |
P25144 CCPA_BACSU Catabolite control protein ... | 144 | 5e-34 |
Q9CPA2 RBSR_PASMU Ribose operon repressor | 143 | 2e-31 |
P58258 REGA_CLOAB HTH-type transcriptional ... | 134 | 3e-31 |
Q54430 SCRR_STRMU Sucrose operon repressor ... | 134 | 8e-31 |
P06964 CYTR_ECOLI HTH-type transcriptional ... | 132 | 3e-30 |
Q56194 CCPA_STAXY Probable catabolite control... | 130 | 3e-30 |
P46828 CCPA_BACME Glucose-resistance amylase ... | 130 | 5e-30 |
P44329 RBSR_HAEIN Ribose operon repressor | 130 | 5e-30 |
P37947 DEGA_BACSU HTH-type transcriptional ... | 130 | 5e-30 |
Q8CNV8 CCPA_STAEP Probable catabolite control... | 127 | 4e-29 |
P25551 RBSR_ECOLI Ribose operon repressor | 125 | 1e-28 |
O68446 PURR_SALTY HTH-type transcriptional ... | 124 | 2e-28 |
P15039 PURR_ECOLI HTH-type transcriptional ... | 124 | 4e-28 |
P27871 ENDR_PAEPO Probable HTH-type transcrip... | 121 | 3e-27 |
Q8NW33 CCPA_STAAW Probable catabolite control... | 120 | 3e-27 |