Программы пакета BLAST для работы с нуклеотидными последовательностями

  1. Поиск в геноме участков, кодирующих белки, похожие на заданный
  2. Задача состояла в том, чтобы определить не закодированы ли белки, похожие на HSLU_ECOLI, в неаннотированном геноме бактерии Pasteurella multocida. Для решения данной задачи была выбрана программа TBLASTN из пакета BLAST, с помощью которой было построено выравнивание, отображающее нужную информацию.

    Поиск гомологов HSLU_ECOLI Геном бактерии Pasteurella multocida
    Число находок с Е-value<0,001 4
    Характеристика лучшей находки:  
       E-value находки 0
      AC соответствующей записи EMBL AE006212
      координаты выравнивания(-ий) в записи EMBL 4424-3096
      Координаты CDS в записи EMBL (если они есть) 3093-4424 (компл.)
      AC UniProt в записи EMBL P57968

    Описание соответствующего белка HSLU_PASMU: ATP-dependent hsl protease ATP-binding subunit hslU (АТФ-зависимая hsl протеаза субъединицы hslU, требующая АТФ для связывания)
    Описание HSLU_ECOLI: ATP-dependent hsl protease ATP-binding subunit hslU (Heat shock protein hslU).
    Поскольку у белков похожее описание, это означает, что они выполняют схожие функции. К тому же, посмотрев на выравнивание, можно судить о том, что белки являются гомологами.
    Команды, использовавшиеся при выполнении задания:
     formatdb -i pm_genome.fasta -p F -n pm
     blastall -p tblastn -d pm -i hslu_ecoli.fasta -o pm.txt -e 0.001 
    Выравнивание см. здесь>>

  3. Аналогичный поиск сразу в нескольких геномах
  4. С помощью программы TBLASTN был проведен поиск сразу по трем геномам (Salmonella typhimurium, Xanthomonas campestris, Pasteurella multocida). Общее число находок с E-value < 0,001: 12. E-value находки, которая была лучшей, не изменилось. Количество находок увеличилось, поскольку был расширен диапазон поиска, а E-value лучшей находки не изменился, потому что был равен 0.

    Команды для выполнения задания:
    genpath=/home/export/samba/public/tmp
    genomes="$genpath/st_genome.fasta $genpath/xc_genome.fasta $genpath/pm_genome.fasta"
    formatdb -i "$genomes" -p F -n st_pm_xc
    blastall -p tblastn -d st_pm_xc -i hslu_ecoli.fasta -o pm_st_xc.txt -e 0.001

  5. Поиск гомологов с помощью программы BLASTN
  6. С помощью программы BLASTN был произведен поиск гомологов гена (см. предыдущее занятие) в трёх геномах. E-value лучшей находки: 0.0, а e-value вышеописанной находки изменилось и стало 1e-12. Это объясняется тем, что программа BLASTN выровняла небольшой участок последовательности длиной 113 bp. Выравнивание можно посмотреть здесь>>. Находок значительно больше, поскольку увеличился порог e-value, а находок с порогом 0.001 всего 3.

| на главную
| назад


© Smirnova Alexandra