На компьютере kodomo в директории /home/export/samba/public/y09/Term_3/Block_2/Pr_7 лежат 3 файла:
Создайте в своей рабочей директории индексные файлы пакета BLAST для поиска по геному вашего организма.
Выберите подходящую для решения данной задачи программу из пакета BLAST (cм. материалы) и проведите с ее помощью поиск с порогом на E-value 0,001.
По результатам поиска заполните таблицу.
Число находок с Е-value<0,001 | ||
Характеристика лучшей находки: | ||
E-value находки | ||
Нормализованный вес (Bit score) | ||
Идентификатор записи, содержащей фрагмент генома.
(В файле геном не склеен в одну последовательность a представлен набором фрагментов) |
||
Координаты выравнивания в найденной нуклеотидной последовательности | (От ... до ... ориентация)||
Координаты выравнивания в последовательности белка, поданной на вход | (От ... до ... )||
Процент совпадающих букв в выравнивании | ||
Число гэпов (gap opening) |
Для этого создайте в своей директории файл с последовательностью того участка генома, который был найден в предыдущем упражнении как лучший. На сайте EBI (http://www.ebi.ac.uk/Tools/) запустите поиск этой последовательности в банке "EMBL standard prokaryote". Укажите в отчёте, какая информация имеется о соответствующем участке в поле FT. Если участок является частью аннотированной кодирующей последовательности (CDS), укажите координаты CDS и какой записи банка UniProt она соответствует.
Поищите гомологов этого гена в том же геноме, что в упражнении 1, но программой BLASTN. Опишите результаты в отчёте: укажите E-value лучшей находки, приведите название геномной последовательности в файле и координаты находки в этой последовательности. Сравните результаты (количество находок, E-value и длины соответствующих друг другу находок и т.п.) с результатами поиска по последовательноси белка.