BLAST - инструмент для быстрого поиска последовательностей в банках данных по гомологии.
Программa, с которыми мы работали -BLASTp, это oдна из программ для поиска с гомологами, которую предоставляет сервер NCBI (http://www.ncbi.nlm.nih.gov/BLAST) .
Поиск белка ThyA_ECOLI по фрагменту его аминокислотной последовательности.
Поиск по 30 аминокислотам из моего белка
(MKQYLELMQKVLDEGTQKNDRTGTGTLSIFGHQMRFNLQDGFPLVTTKRCHLRSIIHELL
WFLQGDTNIAYLHENNVTIWDEWADENGDLGPVYGKQWRAWPTPDGRHIDQITTVLNQLK
NDPDSRRIIVSAWNVGELDKMALAPCHAFFQFYVADGKLSCQLYQRSCDVFLGLPFNIAS
YALLVHMMAQQCDLEVGDFVWTGGDTHLYSNHMDQTHLQLSREPRPLPKLIIKRKPESIF
DYRFEDFEIEGYDPHPGIKAPVAI)
дал такой результат:
мой белок стоял
3 в списке. Процент совпадений - 26/28 (92%), вес выравнивания = 58.5 bits, E-value = 3e-09.
Эти данные такие же, как у двух первых белков.
Видимо белок с очень похожей последовательностью
(как минимум с такими же 30 аминокислотами) есть еще у
двух организмов (бактерий). Эти белки программа и выдала
мне на первых местах вместе с моим.
Поиск по 10 аминокислотам из моего белка
(WFLQGDTNIA)
дал такой результат:
мой белок стоял
9 в списке. Процент совпадений - 10/10 (100%), вес выравнивания = 26.6 bits, E-value = 93.
Эти данные такие же, как у восьми первых белков.
Естественно, что поиск по такому небольшому участку белка дал такое большое
количество гомологов с такими высокими значениями E-value, что говорит о том,
что очень велика вероятность нахождение этой последовательности случайно - совпадение
10 аминокислот нельзя считать достаточным для определения гомологии.
Является ли BLAST инструментом для поиска ортологов?.
Это первые 20 хитов из поиска гомологов оперона RbsR_BACSU по банку Swiss-Prot. (будем считать, что белки у которых в названии есть RbsR - ортологи RbsR_BACSU) Только 6 белков из 20 имеют в своем названии RBSR. Blastp нельзя считать программой по поиску ортологов (белков, имеющих о динаковую функцию), т.к. многие белки могут иметь схожее строение, но вы полнять разные функции (хлорофилл и гемм (это, конечно не белки, а орга нические молекулы) имеют очень похожие структуры, но функции их абсолют но разные.), или наоборот, обладать разным строением, но выполнять одну и ту же функцию (некоторые белки каскада арахидоновой кислоты).