На главную страницу второго семестра.

PSI-BLAST

1. Поиск гомологов белка LGB1_LUPLU (P02239) в БД SwissProt.


Для поиска использовалась последовательность леггемоглобина LGB1_LUPLU с использованием следующих параметров BLASTP:
Параметры программы blastp:
Таблица отчета 1. Поиск гомологов белка LGB1_LUPLU (P02239) в БД SwissProt

 

Кол-во

E-value лучшей находки

Название лучшей находки (ID)

% идентичности

Длина выравнивания

Всего находок

118

1e-70

LGB2_LUPLU

86

153

В бактериях (Bacteria)

36

1e-06

HMP_RHIME

29

117

В Escherichia coli K-12

Нет данных

Нет данных

Нет данных

Нет данных

Нет данных

В животных (Metazoa)

26

2e-06

NGB_BRARE

25

141


Судя по результатам поиска:
  1. гомологов среди ECOLI k-12 найдено не было,
  2. в протеоме человека было найдено три белка, правда E-value которых больше единицы, поэтому считать эти последовательности гомологами не стоит.

2.Поиск с помощью программы PSI-BLAST гомологов LGB1_LUPLU (P02239) в БД SwissProt.


Таблица 2. Итерационный поиск гомологов LGB1_LUPLU (P02239) в БД SwissProt с помощью программы PSI-BLAST
Параметры программы blastp:
Номер итерации
Бактерии
Животные
Характеристика лучшей находки среди белков
Escherichia coli, K-12
Homo sapiens sapiens
Кол-во
Новые
Кол-во
Новые
Название
E-value
% идентичности
Длина выравнивания
Название
E-value
% идентичности
Длина выравнивания
1
21 нет 5 нет нет нет нет нет нет нет нет нет
2
38 17 332 327 HMP_ECOLI 1е-29 20 148 NGB_HUMAN 2е-19 21 143
3
38 нет 878 есть HMP_ECOLI 7е-28 20 148 HBG2_HUMAN 4е-45 18 150
4
38 есть 884 есть HMP_ECOLI 1е-22 20 143 HBG2_HUMAN 3е-53 17 154
5
38 нет 884 нет HMP_ECOLI 2е-22 19 143 HBG2_HUMAN 9е-54 17 154

Ответы на вопросы:
  1. У лучшей находки в протеоме ECOLI K-12: HMP_ECOLI, значение e-value увеличивается, причем одновременно уменьшается % идентичности и длина выравнивания.
  2. У лучшей находки в протеоме человека: HBG2_HUMAN, начиная со второй итерации (в первой была найдена другая находка, не соответствующая дальнейшим: NGB_HUMAN) видна иная картина: значение e-value уменьшается, а длина выравнивания увеличивается (процент идентичности фактически не меняется).

Такие результаты можно объяснить особенностями алгоритма программы PSI-BLAST: как я уже писал выше, PSI-BLAST первую итерацию проводит обычным алгоритмом BLASTP: сканирует БД "хитами" длиной в три аминокислоты, которые затем выравниваются с задаваемой последовательностью белка с помощью используемой матрицы замен (по умолчанию BLOSUM62), но только если вес выравнивания не ниже определенного значения. Причем длина этого "хита" ответственна за скорость, а вес микровыравнивания - за чувствительность поиска. По полученным результатам (имеются ввиду находки с e-value меньше 0,005) PSI-BLAST строит множественное выравнивание, по которому уже составляется матрица PSSM, используемая в третьей итерации. Таким образом, в каждой итерации используется своя матрица PSSM, составленная по данным нового множественного выравнивания (если, конечно, появляются новые белки, включаемые в выравнивание). Таким образом, каждой аминокислотной паре замен приписывается новое значение, отражающее специфику последовательности данного белка и возможного семейства белков в целом (это как в случае с парой S-T и S-C: в матрице BLOSUM62 первая пара имеет высокое значение замены, но в случае семейства сериновых/цистеиновых протеаз уже вторая пара имеет высокое значение замены). Поэтому, с использованием "лабильных" матриц замен, в случае HMP_ECOLI происходит уменьшение выравненных остатков (видимо происходит нечто похожее на "стабилизирующий отбор" - нерелевантные остатки в четвертой итерации вычеркиваются) и логично происходит увеличение e-value: статистически из-за уменьшения длины выравнивания вероятность нахождения похожей последовательности белка с заданным значением веса выравнивания увеличивается. Для гомолога из протеома человека HBG2_HUMAN мы видим противоположную картину: длина выравнивания увеличивается ("движущий отбор" - число релевантных остатков с высокими значениями замен увеличивается) отчего e-value уменьшается: вероятность случайных находок уменьшается.

Ответы на дополнительные вопросы:
©Володя Рудько