|
|
|
- Создание индексных файлов для работы с локальными версиями программ
семейства BLAST
Создайте директорию BLAST для работы на этом и следующем занятиях. В ней
создайте файл отчета report.doc или *report.html.
На компьютере kodomo (и kodomo-count) в директории /home/export/samba/public/tmp
лежат 3 файла:
- vc_genome.fasta включает последовательности из EMBL, составляющие
полный геном холерного вибриона (Vibrio cholerae) для группы П1;
- pa_genome.fasta — полный геном синегнойной палочки (Pseudomonas
aeruginosa) для группы П2;
- pm_genome.fasta — полный геном бактерии Pasteurella multocida для
группы П3.
Создайте в своей рабочей директории индексные файлы пакета BLAST для поиска
по заданному геному или *3
индексных файла для поиска по каждому из геномов..
- Поиск в неаннотированном геноме генов, кодирующих белки, похожие
на заданный
Вы знаете аминокислотную последовательность Вашего белка из Escherichia
coli K-12.
Ваша задача определить, не закодированы ли похожие белки в неаннотированном
геноме другого организма,
Выберите подходящую для решения данной задачи программу из пакета BLAST
( cм. подсказки. ) и проведите с ее помощью поиск.
По результатам поиска заполните таблицу.
Поиск гомологов xxx_Ecoli |
Геном.... |
*Геном.... |
*Геном.... |
Характеристика лучшей находки: |
|
|
|
|
E-value находки |
|
|
|
|
координаты выравнивания(-ий)
в записи генома |
|
|
|
AC соответствующей записи EMBL |
|
|
|
|
Координаты CDS в записи EMBL (если они есть) |
|
|
|
|
AC UniProt в записи EMBL (если есть) |
|
|
|
Число находок с Е-value<0,01
|
|
|
|
- Аналогичный поиск сразу в нескольких геномах
Создайте в своей директории индексные файлы BLAST для поиска по всем
трем геномам сразу. С помощью выбранной ранее программы проведите поиск
по трем геномам. Отметьте в отчете, как изменился E-value лучшей находки
(-ок), сделанной при выполнении предыдущего упражнения, а также общее
число находок с E-value < 0,01. Для этого добавьте к ранее созданной
таблице 2 новые строки.
- Поиск гомологов с помощью программы BLASTN
Скопируйте в свою рабочую директорию fasta-файл с гeном своего белка (см.
предыдущее занятие). Поищите гомологов этого гена в трёх геномах программой
BLASTN. Опишите результаты в протоколе: укажите E-value лучшей находки,
приведите соответствующее выравнивание и аннотацию соответствующего фрагмента
генома (если она, конечно, есть в записи EMBL) .
См. подсказки. |
|