PSI-BLAST

На главную страницу второго семестра
BLASTP
  Кол-во E-value лучшей находки Название лучшей находки (ID ) % идентичности Длина выравнивания
Всего находок 117 5e-82 LGB1_LUPLU 100% 154
В бактериях (Bacteria) 36 1e-06 HMP_RHIME 29% 403
В Escherichia coli K-12 0 - - - -
В животных (Metazoa) 26 2e-06 NGB_BRARE 25% 159
В человеке 3 5.8 CRNL1_HUMAN 28% 848
PSI-BLAST
Номер итерации
Бактерии
Животные
Характеристика лучшей находки среди белков
Escherichia coli, K-12
Homo sapiens sapiens
Кол-во
Новые
Кол-во
Новые
Название
E-value
% идентичности
Длина выравнивания
Название
E-value
% идентичности
Длина выравнивания
1
22 + 5 + - - - - CRNL1_HUMAN 5.8 28% 78
2
39 + 333 + HMP_ECO57 1e-29 20% 148 NGB_HUMAN 2e-19 21% 143
3
39 - 880 + HMP_ECO57 6e-28 20% 148 HBG2_HUMAN 8e-45 18% 150
4
39 - 885 + HMP_ECO57 6e-28 20% 148 HBE_HUMAN 5e-54 17% 154
5
39 - 885 - HMP_ECO57 6e-28 20% 148 HBE_HUMAN 7e-54 17% 154
  1. Для решения каких задач нужно использовать PSI-BLAST?

  2. Для поиска функциональных гомологов. Т.к. PSI-BLAST ищет последовательности по консервативным позициям белка, то можно говорить, что находит он белки со сходными мотивами.

  3. Что представляет собой первая итерация PSI-BLAST?

  4. Это программа BLASTP.

  5. Что удалось найти, по Вашему мнению, в результате упражнения №2?

  6. То, что не удалось найти c помощью BLASTP.

  7. Что происходило с "лучшими находками" на разных итерациях? Предложите объяснения.

  8. На каждой итерации, в которой были новинки, лучшая находка отличалась от лучшей находки предыдущей итерации. это можно объяснить тем, что поиск велся каждый раз по новому профилю и последовательность, лучше всех под этот профиль подходящая, тоже была новая.

  9. Возможны 2 стратегии. Первая состоит в том, чтобы на каждой итерации вести поиск по всем организмам. Вторая состоит в том, чтобы после первой итерации отфильтровать находки по интересному для Вас таксону, и затем запустить следующие итерации. Какие отличия можно ожидать в результатах?

  10. Вот таблица, заполненная с использованием второй стратегии:
    Номер итерации
    Бактерии
    Животные
    Характеристика лучшей находки среди белков
    Escherichia coli, K-12
    Homo sapiens sapiens
    Кол-во
    Новые
    Кол-во
    Новые
    Название
    E-value
    % идентичности
    Длина выравнивания
    Название
    E-value
    % идентичности
    Длина выравнивания
    1
    22 + 5 + CRNL1_HUMAN 5.8 28% 78
    2
    39 + 95 + FRAP_HUMAN 4e-42 22% 140
    3
    39 - 644 + FRAP_HUMAN 4e-42 22% 140
    4
    875 +
    5
    875 -
    Очевидно, что с использованием второй стратегии ведется поиск гомологов последовательностей, похожих на исходную только в данном таксоне. Отсюда можно сделать вывод, что если эволюционное расстояние до этого таксона невелико, то поиск будет более точным, т.к. не мешает эволюционный шум других таксонов. Но, в обратном случае, возможно, от второй стратегии толку будет меньше, чем от первой.

  11. Определите, какие остатки контактируют с гемом в "лучших находках" среди белков человека (см. поле особенностей документов UniProt). Проверьте, сохраняются ли эти аминокислотные остатки в LGB1_LUPLU, а также в "лучшей" находке среди белков кишечной палочки. Сделайте выводы из полученных результатов.
    Человеческие "лучшие находки":
    нет в CRNL1_HUMAN
    64,96 в NGB_HUMAN
    63,92 в HBG2_HUMAN
    63,92 в HBE_HUMAN

    63,97 в LGB1_LUPLU

    "Лучшая" находка среди белков кишечной палочки:
    85 в HMP_ECO57

    Несмотря на то, что в LGB1_LUPLU и в HBG2_HUMAN с гемом контактирует 63й остаток, по номерам остатков нельзя судить о консервативности, т.к. в результате не влияющих на консервативность делеций и инсерций может меняться длина последовательности и, соответственно, номера остатков.

  12. Сохраните файл с профилем PSSM. Объясните, что в нем написано, как это можно использовать.
    PSSM В этом файле содержится таблица, показывающая, с какой вероятностью любая из 20ти а.к. может оказаться на каждой позиции последовательности. Этот файл можно использовать в программе PSI-BLAST.


©Кармушаков Азар