Программа BLASTP.


На главную страницу второго семестра
  1. Поиск белка по его последовательности.

    i) На сервере NCBI — http://www.ncbi.nlm.nih.gov/BLAST/ — проведен поиск последовательности ASPG2_ECOLI программой BLASTP в банке swissprot (используемая матрица замен а.о. – BLOSSUM62, штраф за открытие гэпа 11, за его продолжение 1). В выдаче программы найден искомый белок. Вот его «характеристики»:
    Порядковый номер в выдаче 1
    Score 655 bits (1690)
    E-value 0.0

    ii) Повторен поиск с той же входной последовательностью, но в качестве банка указан pdb.

    Первая в списке находка - gi|29726729|pdb|1NNS|B (т.е. цепь B L-аспарагиназы E. Coli (димер) в разрешении 1.95 A).Для нее указано следующее:
    Идентификатор PDB-кода 1NNS
    Идентификаторы цепей B (указана единственная цепь)
    Score 615 bits (1586)
    E-value 4e-177 ( 4*10-177)
    Начало и конец выравнивания во входной последовательности (Query) 23-348
    Начало и конец выравнивания в находке (Subject) 1-326
    Процент совпадений (Identity) 326/326 (100%)

    Комментарии к увиденному:

  2. Поиск белка по его гомологу.

    Проведен поиск в банке swissprot программой BLASTP по входящей последовательности из файла Q8ZGB7_YERPE.fasta. В выдаче оказался «мой белок» (ASPG2_ECOLI). Характеристики:
    Порядковый номер 1
    Score 471 bits (1212)
    E-value 1e-132 (10-132)
    Начало и конец выравнивания во входной последовательности (Query) 1-345
    Начало и конец выравнивания в находке (Subject) 1-348
    Процент совпадений (Identity) 73%

    Первая находка не является белком Q8ZGB7_YERPE (т.е. тем, чья последовательность была подана на вход). Как сделать белок, поданный на вход, первым из списка? Для этого нужно поменять тип банка с swissprot на nr. Объяснить это можно различиями баз данных nr и swissprot: первый включает в себя пересмотренный GenBank CDS+ PDB+SwissProt+PIR+PRF, а второй – SwissProt – последнее обновление; т.о., возможно отсутствие белка Q8ZGB7_YERPE в SwissProt, поэтому он не первый (точнее, в SwissProt-овском варианте его вовсе нет).

    А белок с pdb-кодом 1NNS (см. пункт 1 данной работы) в базе данных nr оказывается 18м.

    Информация о банках данных, используемых BLASTP на сервере NCBI - http://www.ncbi.nlm.nih.gov/blast/blast_databases.shtml.

  3. Поиск белка по фрагментам его последовательности.

    Проведен поиск в банке swissprot программой BLASTP (матрица BLOSSUM62, штраф за открытие гэпа 11, за его продолжение 1) по входящей последовательности из файла thirdprot.fasta:

    В общем, «глобальный» вывод такой: при поиске белков по каким-либо критериям (по фрагментам его последовательности, по его полной последовательности, по его гомологу) нужно внимательно выбирать параметры поиска для получения оптимальных результатов в соответствие с поставленной задачей.

  4. Разные пользовательские интерфейсы BLAST.

    Повторяю задание 1 (поиск по входной последовательности белка ASPG2_ECOLI), пользуясь программой BLASTP на сервере EBI и на сервере Пастеровского института. Результаты получены «сходящиеся».

    Мои впечатления:

  5. Является ли BLAST инструментом для поиска ортологов?

    Через SRS в БД Swiss-Prot найдена последовательность репрессора рибозного оперона RbsR из Bacillus subtilis (AC P36944). Для этого в соответствующих графах Gen Name, Organism Name было внесено RbsR и Bacillus subtilis. С помощью программы BLASTP (интерфейс EBI) проведен поиск по банку данных Swiss-Prot для найденного белка - здесь.

    В первом приближении считаю ортологами те последовательности, в названии которых стоит слово RbsR. В числе первых 20 находок это: RBSR_BACSU, RBSR_BACHD, RBSR_LACLA , RBSR_PASMU, RBSR_SHIFL, RBSR_ECOLI (всего 6). Оставшиеся 14 находок, ортологами не яляются (исходя, хотя бы, из первого приближения); их последовательности сходны с последовательностью, поданной на вход, они близки по функциям. Что точно можно об этом сказать: в приведенный список входят гомологи (для этих целей BLAST является отличным инструментом); это могут быть как ортологи, так и паралоги. Значит использоваться BLAST для поиска ортологов может, но со значительными оговорками и дополнительными условиями (в рассматриваемом примере таким условием стало наличие RbsR в названии).

Здесь можно посмотреть исходную версию протокола.


©NADEZDA TUKHTUBAEVA,2006