Занятие 3. Программы пакета BLAST для работы с нуклеотидными последовательностями

  1. Создание индексных файлов для программ пакета BLAST
  2. Создайте директорию BLAST для работы на этом и следующем занятиях. В ней создайте файл отчета report.doc или *report.html.

    На компьютере kodomo (и kodomo-count) в директории /home/export/samba/public/tmp лежат 3 файла:

    Создайте в своей рабочей директории индексные файлы пакета BLAST для поиска по заданному геному.
     

  3. Поиск в геноме участков, кодирующих белки, похожие на заданный
  4. Вы знаете аминокислотную последовательность Вашего белка из Escherichia coli K-12. Ваша задача — определить, не закодированы ли похожие белки в неаннотированном геноме другого организма.

    Выберите подходящую для решения данной задачи программу из пакета BLAST (cм. подсказки) и проведите с ее помощью поиск с порогом на E-value 0,001.

    По результатам поиска заполните таблицу.
    Поиск гомологов XXX_ECOLI Геном <такой-то бактерии>
    Число находок с Е-value<0,001  
    Характеристика лучшей находки:  
       E-value находки  
      AC соответствующей записи EMBL  
      координаты выравнивания(-ий) в записи EMBL  
      Координаты CDS в записи EMBL (если они есть)  
      AC UniProt в записи EMBL (если есть)  

  5. Аналогичный поиск сразу в нескольких геномах
  6. Создайте в своей директории индексные файлы BLAST для поиска по всем трем геномам сразу. С помощью выбранной ранее программы проведите поиск по трем геномам. Отметьте в отчете, как изменился E-value той находки, которая была лучшей по результатам предыдущего упражнения, а также общее число находок с E-value < 0,001. Для этого добавьте к ранее созданной таблице 2 новые строки.

  7. Поиск гомологов с помощью программы BLASTN
  8. Скопируйте в свою рабочую директорию fasta-файл с гeном своего белка (см. предыдущее занятие). Поищите гомологов этого гена в трёх геномах программой BLASTN. Опишите результаты в протоколе: укажите E-value лучшей находки, приведите соответствующее выравнивание и аннотацию соответствующего фрагмента генома (если она, конечно, есть в записи EMBL). Сравните результаты с результатами предыдущего упражнения, ваши наблюдения изложите в отчёте.
См. подсказки.