на главную страницу

Программы пакета BLAST для работы с нуклеотидными последовательностями


  • Создание индексных файлов для работы с локальными версиями программ семейства BLAST

    Параметры formatdb:"-i"- полное имя файла подаваемого на вход, "-p"- тип последовательности в файле(T-аминокислотная, F- нуклеотидная), "-n"- базовое имя для файлов BLAST

    Используя команду:

    formatdb -i vc_genome.fasta -p F -n vc

    Были получены индексные файлы:vc.nhr,vc.nin,vc.nsq

    Также были введены команды:"formatdb -i pm_genome.fasta -p F -n pm", "formatdb -i pa_genome.fasta -p F -n pa". И были получены ещё 6 индексных файлов.

  • Поиск в неаннотированном геноме генов, кодирующих белки, похожие на заданный

    Чтобы получить выравнивания, были использованы команды:

    blsatall -p tblastn -d vc -i dcd_ecoli -o result.txt  -  для Vibrio cholerae
    blsatall -p tblastn -d pa -i dcd_ecoli -o result1.txt -  для Pseudomonas aeruginosa
    blsatall -p tblastn -d pm -i dcd_ecoli -o result2.txt -  для Pasteurella multocida 
    blsatall -p tblastn -d 3g -i dcd_ecoli -o result3.txt -  для трёх геномов
    

    Поиск гомологов DCD_Ecoli Геном Vibrio cholerae *Геном Pseudomonas aeruginosa *Геном Pasteurella multocida
    Характеристика лучшей находки:      
         E-value находки 3.7 3e-09 3e-81
      координаты выравнивания(-ий)
    в записи генома
    1627-1728 264-674 10265-10843
    AC соответствующей записи EMBL AE004411 AE004769 AE006134
      Координаты CDS в записи EMBL (если они есть) 110..2059 complement(10259..10843)
      AC UniProt в записи EMBL (если есть) Q9KLB7 нет данных P57891
    Число находок с Е-value<0,01
    0 1 1
    Число находок с Е-value<0,01 при поиске по трём геномам0 1 1
    Изменение E-value лучшей находкинету 6e-09 2e-80
  • Поиск гомологов с помощью программы BLASTN

    Чтобы получить выравнивания, была выполнена команда:blastall -p blastn -d 3g -i dcdgen.fasta -o result24.txt. В итоге лучшая находка выглядит так:

    >embl|AE004680|AE004680 Pseudomonas aeruginosa PAO1, section 241 of
                529 of the complete genome.
              Length = 12370
    
     Score = 42.1 bits (21), Expect = 0.001
     Identities = 24/25 (96%)
     Strand = Plus / Minus
    
                                         
    Query: 259  gagctggcgctggcggtgacgctgg 283
                |||||||||||||||||| ||||||
    Sbjct: 6942 gagctggcgctggcggtggcgctgg 6918
    

    Как видно E-value лучшей находки равно 0.001. Лучшей находкой стала нуклеотидная последовательность Pseudomonas aeruginosa PAO1, section 241 of 529 of the complete genome.


    ©Дёмин Олег