На главную страницу
На главную страницу второго семестра

PSI-BLAST

Поиск гомологов белка LGB1_LUPLU (P02239) в БД SwissProt

Параметры программы BLAST:
   учет особенностей аминокислотного состава (Compositional adjustments) – "No adjustment";
   фильтр на области низкой сложности – есть;
   максимальное значение E-value – 0.005;
   максимальное количество находок (Number of Descriptions) – 1000.

  Кол-во E-value лучшей находки Название лучшей находки (ID ) % идентичности Длина выравнивания
Всего находок 117 5x10-82 LGB1_LUPLU 100% 154
В бактериях (Bacteria) 36 1x10-6 HMP_RHIME 29% 117
В Escherichia coli K-12 0
В животных (Metazoa) 26 2x10-6 NGB_BRARE 25% 141
В человеке 3 5.8 CRNL1_HUMAN 28% 78

Удалось обнаружить 3 возможных гомолога среди белков человека (но все они имеют очень большое E-value, и их нельзя считать гомологами), но ни одного у кишечной палочки.

Итерационный поиск гомологов LGB1_LUPLU (P02239) в БД SwissProt с помощью программы PSI-BLAST

Параметры программы PSI-BLAST
   учет особенностей аминокислотного состава (Compositional adjustments) – "No adjustment";
   фильтр на области низкой сложности – есть;
   максимальное значение E-value – 0.005;
   максимальное количество находок (Number of Descriptions) – 1000.

Номер
итера-
ции
Бактерии
Животные
Характеристика лучшей находки среди белков
Escherichia coli K-12
Человек
Коли-
чество
Новые
Коли-
чество
Новые
Название
e-value
% идентич-
ности
Длина вырав-
нивания
Название
e-value
% идентич-
ности
Длина вырав-
нивания
1
21
+
5
+
CRNL1_HUMAN
5.8
28%
78
2
38
+
332
+
HMP_ECOLI
10-29
20%
148
NGB_HUMAN
2x10-19
21%
143
3
38
879
+
HMP_ECOLI
6x10-28
20%
148
HBG2_HUMAN
8x10-45
18%
150
4
38
884
+
HMP_ECOLI
2x10-22
20%
143
HBE_HUMAN
5x10-54
17%
154
5
38
884
HMP_ECOLI
2x10-22
19%
143
HBE_HUMAN
7x10-54
17%
154

  1. PSI-BLAST можно использовать для поиска гомологов. Такой поиск более чувствительный, чем поиск при помощи BLAST. Так как при каждой итерации (начиная со второй) создается PSSM-профиль, то после новой итерации появлется больше белков. Таким образом, поиск PSI-BLAST дает более далекие гомологи.
  2. Результат первой итерации PSI-BLAST – совпадает с результатом поиска BLAST
  3. В результате упражнения №2 удалось найти гомологи исходного белка LGB1_LUPLU. Их больше, чем при поиске BLAST (первая итерация), есть более далекие белки.
  4. "Лучшие находки" в E. Coli K-12 на разных итерациях совпадали, но E-Value увеличивается, так как меняется число находок. У человека меняется и сама находка, кроме последней итерации. Первая "Лучшая находка" (CRNL1_HUMAN) имеет E-Value, превосходящее пороговое значение 0.005, поэтому далее не рассматривается.

  5. (*)Возможны 2 стратегии. Первая состоит в том, чтобы на каждой итерации вести поиск по всем организмам. Вторая состоит в том, чтобы после первой итерации отфильтровать находки по интересному для Вас таксону, и затем запустить следующие итерации.
    Разница в том, что во втором случае профиль создается по выбранному таксону, и если затем провести поиск по полученному профилю во всех организмах, то многие из гомологов в других таксонах, найденные первым способом, не будут найдены. Профиль получается более специализированным на выбранном таксоне. Поэтому среди организмов выбранного таксона при первом способе будет меньше гомологов.
  6. (*) Рассмотрим "лучшие находки" среди белков человека и E. Coli K-12.
    Остатки, контактирующие с гемом (поле FT документов UniProt):
    Белок Остаток
    LGB1_LUPLU Hys63, Hys97
    NGB_HUMAN Hys64, Hys96
    HBG2_HUMAN Hys63, Hys92
    HBE_HUMAN Hys63, Hys92
    HMP_ECO57 Hys85
    Перечисленные остатки у человека отвечают за связывание гема, поэтому они очень консервативны. Из таблицы видно, что номера эти остатков близки. Они также сохраняются в LGB1_LUPLU. Белок E. Coli K-12 содержит только один остаток, контактирующий с гемом. Поэтому, вероятнее всего, он наиболее далек от остальных последовательностей. Таким образом, этот белок наименее гомологичен исходному.
  7. (**) Получим файл с PSSM-профилем: PSSM.htm. По идее, в нем должна быть написана таблица частот (20 остатков, для каждого частота его встречаемости в данной колонке множественного выравнивания), но он закодирован. Его можно использовать для поиска гомологов в PSIBLAST.


©Семенюк Павел