Занятие 3. Программы пакета BLAST для работы с нуклеотидными последовательностями

 
     

  1. Создание индексных файлов для работы с локальными версиями программ семейства BLAST
  2. Создайте директорию BLAST для работы на этом и следующем занятиях. В ней создайте файл отчета report.doc или *report.html.

    На компьютере kodomo (и kodomo-count) в директории /home/export/samba/public/tmp лежат 3 файла:

    • vc_genome.fasta включает последовательности из EMBL, составляющие полный геном холерного вибриона (Vibrio cholerae) для группы П1;
    • pa_genome.fasta — полный геном синегнойной палочки (Pseudomonas aeruginosa) для группы П2;
    • pm_genome.fasta — полный геном бактерии Pasteurella multocida для группы П3.

    Создайте в своей рабочей директории индексные файлы пакета BLAST для поиска по заданному геному или *3 индексных файла для поиска по каждому из геномов..

  3. Поиск в неаннотированном геноме генов, кодирующих белки, похожие на заданный
  4. Вы знаете аминокислотную последовательность Вашего белка из Escherichia coli K-12.
    Ваша задача — определить, не закодированы ли похожие белки в неаннотированном геноме другого организма,

    Выберите подходящую для решения данной задачи программу из пакета BLAST ( cм. подсказки. ) и проведите с ее помощью поиск.
    По результатам поиска заполните таблицу.

    Поиск гомологов xxx_Ecoli Геном.... *Геном.... *Геном....
    Характеристика лучшей находки:      
         E-value находки      
      координаты выравнивания(-ий)
    в записи генома
         
    AC соответствующей записи EMBL      
      Координаты CDS в записи EMBL (если они есть)      
      AC UniProt в записи EMBL (если есть)      
    Число находок с Е-value<0,01
         

  5. Аналогичный поиск сразу в нескольких геномах
  6. Создайте в своей директории индексные файлы BLAST для поиска по всем трем геномам сразу. С помощью выбранной ранее программы проведите поиск по трем геномам. Отметьте в отчете, как изменился E-value лучшей находки (-ок), сделанной при выполнении предыдущего упражнения, а также общее число находок с E-value < 0,01. Для этого добавьте к ранее созданной таблице 2 новые строки.

  7. Поиск гомологов с помощью программы BLASTN
  8. Скопируйте в свою рабочую директорию fasta-файл с гeном своего белка (см. предыдущее занятие). Поищите гомологов этого гена в трёх геномах программой BLASTN. Опишите результаты в протоколе: укажите E-value лучшей находки, приведите соответствующее выравнивание и аннотацию соответствующего фрагмента генома (если она, конечно, есть в записи EMBL) .
См. подсказки.