Программы пакета BLAST для работы с нуклеотидными последовательностями

  1. Поиск в геноме участков, кодирующих белки, похожие на заданный
  2.     Поиск гомологов белка CLPS_ECOLI в геноме возбудителя чёрной гнили капусты Xanthomonas campestris с помощью TBLASTN:
    Число находок с Е-value<0,001 1
    Характеристика лучшей (и единственной) находки:  
       E-value находки 2e-29
    AC соответствующей записи EMBL AE012301; AE008922
    Координаты выравнивания(-ий) в записи EMBL Query: 13 - 106; Sbjct: 213 - 494
    Координаты CDS в записи EMBL (если есть) 641 - 2923
    AC UniProt для этого CDS (если есть) Q8P998

  3. Аналогичный поиск сразу в нескольких геномах
  4. Создав необходимые индексные файлы и используя ту же программу, я получила следующие результаты:
    1. Находок теперь три
    2. E-value находки из прошлого задания изменилось, теперь оно равно 4е-29
    3. не обнаружено находок для Pasteurella multocida
    4. E-value лучшей находки составляет 1е-56

  5. Поиск гомологов с помощью BLASTN
  6. C помощью команды seqret я вырезала из генома E.coli последовательность, кодирующую аминокислотную последовательность, заданаого мне белка p0a8q6 и с помощью программы BlastN провела поиск гомологов этого гена по всем трём геномам:
    1. Обнаружено 3 находки, среди них по прежнему нет Pasteurella multocida
    2. Если по прошлому запросу была выдана одна запись по Xanthomonas campestris и две по Salmonella typhimurium, то теперь всё наоборот.
    3. E-value лучшей находки составляет 0,00
    4. Записи EMBL: AE012421; AE008740 (в пердыдущем задании те же)

    Хочется отметить быстроту и удобство работы с программами пакета Blastall, так как команды, которые были введены мной для получения результатов довольно просты, особенно, если не лениться и читать руководство к программе+). Итак, я использовала следующие команды: > formatdb -i xc_genome.fasta -p F -n xc - для получения индексого файла к первому заданию;
    >blastall -p tblastn -d xc -i clps_ecoli.fasta -o xc1 -e 0.001 - для получения файла с результатами по поиску гомологов с использованием tblastn;
    > fg=/home/export/samba/public/y07/Term3/EMBL
    >genomes="$fg/st_genome.fasta $fg/xc_genome.fasta $fg/pm_genome.fasta"
    >formatdb -i "$genomes" -p F -n genomes
    Эти команды были использованы для получения индексных файлов сразу для трёх геномов (сначала были заданы переменные, затем уже использовавшаяся команда);
    >blastall -p tblastn -d genomes -i clps_ecoli.fasta -o gens -e 0.001 - с помощью этой команды я получила выходной файл ко второму заданию;
    >blastall -p blastn -d genomes -i genome.fasta -o gen -e 0.001 - а с помощью этой команды я провела поиск гомологов программой blastn, те на вход подавался ген, который кодирует мой белок.

    Третий семестр
    Главная страница
    ©

    Гардиева Алиса,2007