BLASTP - инструмент для быстрого поиска последовательностей в банках данных по гомологии


На данном этапе работы я познакомился с программой BlastP: http://ncbi.nlm.nih.gov.

Часть 1:

Поиск белка индол-3-глицерофосфатсинтетазы и 5-фосфо-рибозилантранилатизомеразы по фрагменту его аминокислотной последовательности Поиск проводился в банке данных SwissProt. Были взятыя куски исходного белка длиной 30 и 10 нуклеотидов.
  1. MAHDDLHAAVRRVLLGENKVCGLTRGQDAK
  2. MAHDDLHAAWRRVLLGENKKCGLTRGQDAC
  3. MAHDDLHAAV
Первая последовательность целиком взята из последовательности моего белка. Вторая - из моего белка, но в ней были заменены 3 остатка. Третья взята также из моего белка целиком и без изменений.
По результатам поиска построина таблица:
№ куска
последовательности
Порядковый номер хитаПроцент совпадающих
остатков в выравнивании
Вес выравниванияE-value
11 100%654*e-11
21 93%57.85*e-09
31 100%25.016
Причины отличия E-value кроются в том, что чем больше этот оказатель тем больше вероятность того, что такая последовантельость могла сама собой возникнуть. Т.е. чем меньше E-value, тем больше вероятность что мы нашли по участку последовательности, именно наш белок. Поэтому не удивительно, что в первом случае получено наименьшее значение. Последовательность длиной в 10 может с большей вероятностью соответствовать множеству белков, а длиной 30 возникает с еньшей вероятностью, поэтому она характерна для моего белка с большей вероятностью. Вес выравнивания так же целиком зависит от того, какие последовательности выравнивались и чем больше вес тем больше веротность того, что найденный белок соответствует нашему куску последовательности.

Часть 2:

Является ли BlastP инструментом для поиска ортологов?

В целом власт не является инструментом для поиска гомологов. Это можно увидеть на примере поискадля репрессора рибозного оперона RbsR из Bacillus subtili. Было принято допущение, что гомологами мы считаем те последовательности в названии которых стоит слово RbsR. Результаты были таковыми: что между рибозными опероными, если рассматривать по порядку следовали и дркгие белки. На рисунке оротлоги выделены зеленым цветом. Как видно кроме ортологов в выборке и другие белки имеют довольно большой вес и E-value.


Назад.


Главная страница