BLAST - инструмент для быстрого поиска последовательностей в банках данных по гомологии

работали с программой blastp


I. Поиск белка LacI_ECOLI(P03023) по фрагменту его аминокислотной последовательности

поиск производился в банке данных Swiss-Prot

по какому кусоку искали процент совпадающих остатков в выравнивании порядковый номер хита e-value score
первые 30 аминокислот 100% 1 3*10-9 58.5
аминокислоты с 346-356 100% 12391 18.9

чем больше длина куска по которому мы хотим найти нашу последовательность,тем меньше вероятность найти другую, просто случайно похожую последовательность. это выражается в меньшем E-value. вес отличается так как отличается длина(по идее он должен увеличиваться пропорционально длине,т.е. где-то в 3 раза) процент совпадения одинаков - 100% т.к. куски целиком взяты из последовательности


II.Является ли BLAST инструментом для поиска ортологов?

Blastp не является инструментом для поиска ортологов,т.к. он ищет все последовательности в банке данных , у которых при выравнивании с введенной последовательностью ,e-value меньше заданного.среди них есть и ортологои , и паралоги,и все остальные гомологои ,также могут туда попасть и негомологичные,а случайно похожие белки). Но среди найденных белков будут и ортологи (если они вообще существуют),их можно определить,т.к. они обычно выполняют одинаковую функцию.

при поиске ортологов последовательности репрессора рибозного оперона RbsR из Bacillus subtilis(e-value<10) было получено 20 последовательностей,6 из которых ортологи(та же функция Ribose operon repressor).они шли не по порядку между ними вклиниваются другие гомологи, поэтому определить ортолога кроме как по такой же функции нельзя( по весу или еще как-то),но но искать белки с такой же функцией можно без Blastp

Ортологи выполняют одинаковую функцию в разных организмах,кот. произошли друг от друга в результате дивергентного видообразования. поэтому наиболее вероятно,что чем меньше E-value у ортолога,тем ближе сам организм(из которого белок) к данному по времени


Alignment