PSI-BLAST

На главную страницу второго семестра

PSI-BLAST

  1. Упражнение 1.
    С помощью программы blastp был проведен поиск гомологов белка LGB1_LUPLU (P02239) в базе данных SwissProt. На вход пошел код доступа UniProt. После получения результатов и использования фильтра по таксонам (кнопка "Limit results by select form") была заполнена таблица 1.


    Таблица отчета 1. Поиск гомологов белка LGB1_LUPLU (P02239) в БД SwissProt
    Параметры программы blastp:
    учет особенностей аминокислотного состава (Compositional adjustments) — no adjustments;
    максимальное значение E-value — 10;
    максимальное количество находок (Number of Descriptions) — 1000;
    фильтрование областей низкой сложности (Low complexity) — да.


      Кол-во E-value лучшей находки Название лучшей находки (ID ) % идентичности Длина выравнивания
    Всего находок 117 5e-82 LGB1_LUPLU 100% 154 aa
    В бактериях (Bacteria) 36 1e-06 HMP_RHIME 29% 117 aa
    В Escherichia coli K-12 0
    В животных(Metazoa) 26 2e-06 NGB_BRARE 25% 141 aa
    В человеке 3 5,8 CRNL1_HUMAN 28% 78 aa

    Гомологов белка LGB1_LUPLU среди белков кишечной палочки найти не удалось, так как blastp - не самая лучшая программа для поиска далеких гомологов. При поиске среди белков человека выдается 3 находки, но с e-value 5.8 и выше.

  2. Упражнение 2.
    Поиск гомологов белка LGB1_LUPLU (P02239) был проведен с помощью программы psi-blast, но с параметрами, совпадающими с параметрами программы blastp. Всего было проведено 5 итераций: на пятой новых последовательностей по всем организмам программа не выдала. Результаты поиска - в таблице 2.


    Таблица 2. Итерактивный поиск гомологов LGB1_LUPLU(P02239) в БД SwissProt с помощью программы PSI-BLAST
    Параметры программы psi-blast:
    учет особенностей аминокислотного состава (Compositional adjustments) — no adjustments;
    максимальное значение E-value — 10;
    максимальное количество находок (Number of Descriptions) — 1000;
    фильтрование областей низкой сложности (Low complexity) — да.


    Номер итерации
    Бактерии
    Животные
    Характеристика лучшей находки среди белков
    Escherichia coli, K-12
    Homo sapiens sapiens
    Кол-во
    Новые
    Кол-во
    Новые
    Название
    E-value
    % идентичности
    Длина выравнивания
    Название
    E-value
    % идентичности
    Длина выравнивания
    1
    21 + 5 + CRNL1_HUMAN 5.8 (<0.005) 28% 78
    2
    38 + 332 + HMP_ECO57 1e-29 20% 148 NGB_HUMAN 2e-19 21% 143
    3
    38 878 + HMP_ECO57 7e-28 20% 148 HBG2_HUMAN 4e-45 18% 150
    4
    38 885 + HMP_ECO57 1e-22 20% 143 HBG1_HUMAN 3e-53 17% 154
    5
    38 885 HMP_ECO57 2e-22 19% 143 HBG1_HUMAN 9e-54 17% 154

  3. Комментарии.
    По результатам поисков можно прийти к заключению, что программа psi-blast приспособлена для нахождения далеких гомологов каких-либо белков, зачастую даже из других царств. Программа же blastp для таких целей малопригодна. Основным отличием psi-blasta является возможность построения нового протокола по найденным выравниваниям и не один раз. Таким образом, первая итерация данной программы представляет собой то же, что и поиск по blastp - создается обычный профиль PSSM. Если нажать "Run PSI_BLAST iteration" (на странице выдачи результатов), а затем нажать на страничке "formatting Blast" кнопку "Format", то программа построит новый профиль по найденным последовательностям (очень удобно, что при этом можно выбирать таксоны организмов, где требуется произвести поиск белков) и на его основе находит новые, более отдаленные гомологи, которые отбрасывались при предыдущем поиске. Это мы наблюдаем при выполнении второго упражнения: количество гомологов заданного белка с итерациями увеличивается. Так, например, даже удалось обнаружить несколько гомологов заданного белка у кишечной палочки, хотя программа blastp их не выдавала. С каждой итерацией мы наблюдаем увеличение числа находок (но оно правда конечно), может сменятся лучшая находка, значение e-value лучшей находки уменьшается (положительный признак).


    * Если после первой итерации отфильтровать находки по какому-либо таксону, а затем запустить следующие итерации, то на выходе мы получим больше гомологичных белков, принадлежащих организмам данного таксона, чем если бы мы проводили итерацию по всем организмам, но только их. В лучших находках среди человека с гемом контактируют следующие остатки:

    • HBG1_HUMAN - 63 и 92 остаток, оба гистидины,
    • NGB_HUMAN - 64 и 96 гистидиновые остатки,
    • HBG2_HUMAN - 63 и 92 гистидиновые остатки,
    • LGB1_LUPLU - 63 и 97 гистидиновые остатки,
    • HMP_ECO57 - 85 остаток - гистидин,
    • CRNL1_HUMAN - —.

    Таким образом, мы видим, что функциональная и важнейшая часть белка, а именно область контактирования с гемом, практически не изменяется, что еще раз подтверждает гомологичность всех этих белков. Такая консервативность также указывает на то, что мутации, затрагивающие область контакта (в частности гистидины), ведут к нежизнеспособности организма.


    ©Куликовский, Алексей