BLAST - инструмент для быстрого поиска последовательностей в банках данных по гомологии
Работа с программой blastp (http://www.ncbi.nlm.nih.gov/blast/)
Поиск белка PurR по фрагменту его аминокислотной последовательности
Последовательности, по которым проводился поиск:
длиной 30 аминокислот: PEPLLAMLEEYRHIPMVVMDWGEAKADFTD
длиной 10 аминокислот: ATIKDVAKRA
№ |
Номер хита |
% идентичных остатков в выр-ии |
Вес выравнивания (биты) |
E-value |
1 |
1 |
100 |
68,2 |
4e-12 |
2 |
2 |
100 |
21,6 |
451 |
Высокое значение E-value для короткого участка последовательности объясняется тем, что для программы вероятность найти в БД идентичную короткую последовательность существенно выше, чем более длинную, а E-value определяется именно ей. Счет второго выравнивания, разумеется, выше, поскольку позиций выравнивания меньше. Сходство в значениях идентичности, полагаю, в объяснении не нуждается.
Является ли BLAST инструментом для поиска ортологов?
При поиске гомологов белка RBSR_ECOLI с помощью BLASTp в числе лучших 20 хитов были найдены 5 его ортологов с E-value<=5e-36, т. е. с достаточно высокой степенью гомологии. Еще один ортолог обнаружился в третьем десятке хитов. На первый взгляд мало, но, результаты поиска в БД swissprot белков с ID=rbsr*, принимаемых нами как ортологи, с помощью SRS, дал точно те же 6 белков, что и BLAST:
.Ортологами рибозного репрессора, вероятно, являются и схожие по функции репрессоры синтеза пуриновых нуклеотидов, проявляющие также высокую степень гомологии
Однако это если принимать как ортологи белки с одинаковым началом ID. А остальные хиты выглядят лишними. При взгляде на результаты поиска видно, что "ортологи" у нас получились весьма сомнительные: там есть и амилаза, и регулятор амилазы. Вообще-то по функции большинство хитов схожи, но это может зависеть от запроса. Так что на таком уровне BLAST непригоден для поиска и отбора ортологов, поскольку в его результатах много лишнего в виде обычных гомологов. В нашем случае из 20 хитов только 6 оказались ортологами, и, если судить по этому, вероятность найти ортологи с помощью BLAST равна примерно 30%