PSI-BLAST

На главную страницу второго семестра

 

Поиск гомологов белка LGB1_LUPLU (P02239) в БД SwissProt

 

Параметры программы:

-учет особенностей аминокислотного состава (Compositional adjustments) - No adjustment (значение по умолчанию

-фильтрование областей низкой сложности - фильтр Low complexity (значение по умолчанию);

-максимальное значение E-value -10 (значение по умолчанию)

Максимальное количество находок (Number of Descriptions) - 1000

 
  Кол-во E-value лучшей находки Название лучшей находки (ID ) % идентичности Длина выравнивания
Всего находок 117 5e-82 LGB1_LUPLU 100% 154
В бактериях (Bacteria) 36 1e-06 HMP_RHIME 29% 116
В Escherichia coli K-12 - - - - -
В животных (Metazoa) 26 2e-06 NGB_BRARE 25% 141
В человеке 3 5,8 CRNL1_HUMAN 28% 78
  Как видим, гомологи среди белков кишечной палочки не нашлись, среди человеческих белков нашлось 3 сходных последовательности, однако при таком высоком e-value о гомологии вряд ли можно говорить.  

Итерационный поиск гомологов LGB1_LUPLU (P02239) в БД SwissProt с помощью программы PSI-BLAST

 

Параметры программы:

-учет особенностей аминокислотного состава (Compositional adjustments) - No adjustment

-фильтрование областей низкой сложности - фильтр Low complexity

-максимальное значение E-value -10

Максимальное количество находок (Number of Descriptions) - 1000

 
Номер итерации
Бактерии
Животные
Характеристика лучшей находки среди белков
Escherichia coli, K-12
Homo sapiens sapiens
Кол-во
Новые
Кол-во
Новые
Название
E-value
% идентичности
Длина выравнивания
Название
E-value
% идентичности
Длина выравнивания
1
21   5   - - - - CRNL1_HUMAN Crooked neck-like protein 5,8 28% 78
2
38 + 332 + HMP_ECO57 Flavohemoprotein NO 1e-29 20% 148 NGB_HUMAN Neuroglobin 2e-19 21% 143
3
38 - 879 + -//- 5e-28 -//- -//- HBG2_HUMAN Hemoglobin gamma-2 subunit 8e-45 18% 150
4
-//- -//- 884 + -//- 8e-23 -//- -//- HBE_HUMAN Hemoglobin epsilon subunit 7e-54 17% 154
5
-//- -//- -//- - -//- -//- 19% -//- -//- 2e-53 -//- -//-

Какие выводы мы можем сделать из этих результатов? Первая итерация PSI-BLAST представляет собой то же самое, что и обычный BLAST. В дальнейшем при составлении матрицы PSSM на основе все более разнообразных последовательностей в каждой итерации отфильтровывались случайные и неконсервативные участки с одной стороны, и, с другой стороны, выявлялись характерные особенности семейства. С этим и связано то, что изначально лучшие находки не всегда сохранялись в последующх итерациях (так мы получили последовательность с e-value 5,8 в качестве ближайшей находки). Их выбор мог быть вызван случайными причинами при недостаточной селективности PSSM. Поэтому с каждой следующей итерацией находок становилось больше, при этом они становились осмысленнее. Любопытное наблюдение - с увеличением номера итерации увеличивался скачок в e-value между последовательностями, прошедшими и не прошедшими под порог 0,005. Это значит, что большинство белков, степень сходства которых может быть выявлена методом PSI-BLAST, уже найдено, и в дальнейшем будет происходит уточнение особенностей этой группы (а именно, обширного семейства глобинов). На пятой итерации матрица PSSM становится селективной именно к глобинам и перестает находить новые белки - возможности метода исчерпаны, более низкая степень родства уже не выявится.

Еще одно наблюдение. С увеличением номера итерации увеличивается e-value бактериальных находок, но уменьшается - человеческих. Видимо, это связано с тем, что PSSM становится более чувствительной к животным белкам, т. к. в ее создании задействуется огромное количество последовательностей разнообразных гемоглобинов. В первых итерациях они еще не появляются (их родство с растительным белком LGB1_LUPLU не очень близко). И благодаря этому бактериальные находки все же есть. Но когда гемоглобины появляются, они появляются сразу в большом количестве благодаря своему высокому сходству между собой.

Как видим, PSI-BLAST удобно использовать для поиска далеких родственнков известной последовательности или для изучения представителей семейства белков в разных эволюционно далеких друг от друга таксонах. Можно обнаружить изначальное родство белков, для которых мы его изначально не предполагали.

Еще одно наблюдение. В человеческих белках, оказавшихся лучшими находками на последних итерациях (HBE_HUMAN и HBG2_HUMAN) в связывании металла участвуют 2 остатка гистидина (63 и 92). Еще лучшей находкой седичеловеческих белков был белок NGB_HUMAN, в его молекуле металл связывают остатки гистидина пд номерами 64 и 96, что практически то же самое. Конечно, не выравнивая достаточно большой участок последовательности мы не можем судить только по этому признаку, ведь совпадение могло быть вызвано чисто случай ными причинами, однако сам факт того, что сайт связывания металла (по данным Swissprot) находится в одном и том же месте, наводит на размышления. Достаточно близок тот же признак белка LGB1_LUPLU (63 и 97). Зато в молекуле белка CRNL1_HUMAN вообще нет сайта связывания металла. В молекуле лучшей бактериальной находки металл связывает только 1 остаток гистидина под номером 85. То есть сайт тоже есть, но устроен по-другому.


©Петрова Ирина