Программы пакета BLAST для работы с нуклеотидными последовательностями

  1. Поиск в геноме бактерии Pasteurella multocida участков, кодирующих белки, похожие на CLPB_ECOLI из Escherichia coli K-12.

    Дана аминокислотная последовательность белка. Задача — определить, закодированы ли похожие белки в геноме другого организма (Pasteurella multocida), не пользуясь аннотацией генома.

    Таблица 1. Результаты поиска гомологов белка CLPB_ECOLI в геноме Pasteurella multocida
    Число находок с Е-value<0,001 2
    Характеристика лучшей находки:
       E-value находки 0.0
    Название геномной последовательности AE006206
    Координаты выравнивания(-ий) в найденной последовательности Query:1-857
    Sbjct:9541-12105
  2. Нахождение записи EMBL по последовательности с помощью программы BLASTN

    Необходимо было определить AC записи нынешнего релиза EMBL по последовательности старого AE006206. Им оказался участок, являющийся частью аннотированной кодирующей последовательности AC - AE004439.

    Ген clpB. CDS - 1910791..1913358.
    UniProtKB/Swiss-Prot:Q9CKC0

  3. Нахождение записи EMBL по последовательности с помощью программы BLASTN

    Таблица 2. Результаты поиска гомологов белка CLPB_ECOLI в геноме Pasteurella multocida при помощи программы BLASTN
    E-value находки 3e-41
    Название геномной последовательности AE006206
    Координаты выравнивания в найденной последовательности Query:1349-2052
    Sbjct:10763-10060


    Таблица 3. Сравнение результатов,
    полученных при помощи TBLASTN и BLASTN
    tblastn blastn
    Score 1274 167
    Expect 0.0 3e-41
    Identities 73% 77%
    Positives 83% -

    Различия в результатах, вероятно, связаны с вырожденностью генетического кода. blastn работает непосредственно с нуклеотидной последовательностью, в отличии от tblastn. Если в последовательности были единичные мутации типа замены нуклеотида, то это могло отразиться на выравнивании при помощи blastn, а tblastn – нет.