Поиск белка индол-3-глицерофосфатсинтетазы и 5-фосфо-рибозилантранилатизомеразы по фрагменту
его аминокислотной последовательности
Поиск проводился в банке данных SwissProt. Были взятыя куски исходного белка длиной 30 и 10 нуклеотидов.
MAHDDLHAAVRRVLLGENKVCGLTRGQDAK
MAHDDLHAAWRRVLLGENKKCGLTRGQDAC
MAHDDLHAAV
Первая последовательность целиком взята из последовательности моего белка. Вторая - из моего белка, но в ней были заменены 3
остатка. Третья взята также из моего белка целиком и без изменений.
По результатам поиска построина таблица:
№ куска последовательности
Порядковый номер хита
Процент совпадающих остатков в выравнивании
Вес выравнивания
E-value
1
1
100%
65
4*e-11
2
1
93%
57.8
5*e-09
3
1
100%
25.0
16
Причины отличия E-value кроются в том, что чем больше этот оказатель тем больше вероятность
того, что такая последовантельость могла сама собой возникнуть. Т.е. чем меньше E-value, тем больше вероятность что мы
нашли по участку последовательности, именно наш белок. Поэтому не удивительно, что в первом случае получено наименьшее
значение. Последовательность длиной в 10 может с большей вероятностью соответствовать множеству белков, а длиной 30
возникает с еньшей вероятностью, поэтому она характерна для моего белка с большей вероятностью. Вес выравнивания так
же целиком зависит от того, какие последовательности выравнивались и чем больше вес тем больше веротность того, что
найденный белок соответствует нашему куску последовательности.
Часть 2:
Является ли BlastP инструментом для поиска ортологов?
В целом власт не является инструментом для поиска гомологов. Это можно увидеть на примере поискадля репрессора
рибозного оперона RbsR из Bacillus subtili. Было принято допущение, что гомологами мы считаем
те последовательности в названии которых стоит слово RbsR. Результаты были таковыми: что между рибозными опероными, если
рассматривать по порядку следовали и дркгие белки. На рисунке оротлоги выделены зеленым цветом. Как видно кроме ортологов в
выборке и другие белки имеют довольно большой вес и E-value.