Поиск велся по базе данных данных Swissprot.
file1 - произвольный участок аминокислотной последовательности OMPF_ECOLI длиной 30 аминокислот.
seq1 GRNYGVVYDALGYTDMLPEFGGDTAYSDDF
file2 - тот же самый участок аминокислотной последовательности,
в который внесите три произвольные аминокислотные замены.
seq2 GRNYGVLYDALGYTDGLPEFGMDTAYSDDF
file3 - произвольный участок аминокислотной последовательности OMPF_ECOLI длиной 10 аминокислот.
seq3 NFQGNNSEGA
В итоге поиска я получил данные:
Описание
В начале, когда я искал в BlastP последовательность из 10 а/к, то ничего не было найдено, если мы посмотрим на E-value,
то поймем почему, дело в том, что случайное совпадение(или похожесть) 10а/к в БД огромна.
Следовательно в списке присутствуют белки, не имеющие ничего общего с моим, у которых просто есть похожая последовательность в 10 а/к.
Во второй последовательность были специально внесены 3 замены, этим и вызвано 90% идентичность, в отличие от 100% 1-й последоваельности.
Примечание. Номер хита вседа был первый, за исключением одного случая.
Во время сравнения последовательности из 10 аминокислот произшла ошибка - белок c данными: gi|2498714|sp|Q12437|ORD2_ASPPA Score = 19.2 bits (38), Expect = 1941 Identities = 6/10 (60%), Positives = 10/10 (100%) Был выгодней чем мой белок: gi|129151|sp|P02931|OMPF_ECOLI Score = 18.9 bits (37), Expect = 2556 Identities = 10/10 (100%), Positives = 10/10 (100%), хотя совпадений в первом белке меньше, следовательно, мой белок должен иметь больший score.
Результата поиска последовательности репрессора рибозного оперона RbsR из Bacillus subtilis в базе данных Swissprot были получены следующие результаты:
Коментарии
В первом приближении будем считать ортологами те последовательности в названии которых стоит слово RbsR.
Посмотрев на рисунок можно заметить, что первые 3 белка являются ортологами(то есть выполняют одну функцию),
а вот следующие 9 белков не ортологи, а гомологи RbsR. А уже после с достаточно низким score удут 2 ортолога(они выделены цветом).
Следовательно, можно утверждать, что BLAST не является подходящем инструментом для поиска ортологов, так как он ориентируется на выравнивание, а аминокислотная последовательность у ортологов может серьезно варьироваться, по сравнению с предполагаемым предком.