== Материалы к практикуму 6 == === Краткая характеристика некоторых программ пакета BLAST === ||'''Программа'''||'''Пробная посл-ть'''||'''Где ищет (тип данных банка)'''||'''Для чего служит'''||'''Примечание'''|| ||BLASTN||НК||НК||Поиск последовательности в банке; предсказание транскрибируемых участков (проба — участок генома; банк — транскрипты)||Последние версии позволяют достаточно эффективно искать гомологи при надлежащем выборе параметров|| ||BLASTP||Белок||Белки||Поиск гомологов|| ||BLASTX||НК||Белки||Эта программа часто используется на первом этапе анализа новых нуклеотидных последовательностей для предсказания кодирующих участков||Проба транслируется в 6 рамках|| ||TBLASTN||Белок||НК||Поиск гомологов белка в неаннотированных нуклеотидных последовательностях||Банк транслируется в 6 рамках|| ||TBLASTX||НК||НК||Поиск гомологов к кодирующим участкам. Полезна, если в пробной последовательности много ошибок.||6×6=36. Работает долго. Применяется редко.|| Про программы пакета BLAST и их установку на своем компьютере читайте [[http://www.ncbi.nlm.nih.gov/books/NBK1762/|здесь]]. ---- '''Внимание!''' Для выполнения заданий Вам понадобится не менее 5Mb дискового пространства. Рекомендуется проверить, не превысили ли Вы [[http://kodomo.fbb.msu.ru/FBB/year_08/term3/quota.html|квоту]], и если да, то почистить свой диск. ---- === Как создать индексные файлы для программ пакета BLAST === Зайдите на kodomo, перейдите в свою рабочую директорию и вызовите подсказку к программе `makeblastdb`, набрав {{{makeblastdb -help}}} (если подсказка не умещается в окне, организуйте конвейер к программе `more`, внутри программы `more` пользуйтесь клавишами "пробел" и "Enter". Другой вариант — перенаправить выдачу в файл, пользуясь спецсимволом ">"). Вам понадобятся параметры `-in`, `-out` и `-dbtype`, остальные не нужны. Изучите их смысл и придайте им правильные значения. Программа `makeblastdb` создает в текущей директории три файла с расширениями (для нуклеотидной базы) `nhr`, `nin` и `nsq`; первая часть имен этих трех файлов одинаковая, это и есть "Name of BLAST database". Рекомендуется сделать это имя коротким (например, "pp" для генома ''P. polymyxa''). Для запуска программы командная строка должна содержать для каждого из задаваемых параметров его название, а затем после пробела -- его значение. Это стандартный способ указывать значения параметров в консольных приложениях UNIX. Выглядит это так: {{{ program -param1 value1 -param2 -value2}}} (параметров может быть сколько угодно; их порядок, как правило, неважен). === Как запустить выбранную программу из пакета BLAST === Чтобы запустить одну из программ поиска пакета BLAST, нужно иметь в своей директории файл с пробной последовательностью в fasta-формате и индексные файлы "банка последовательностей". Названия программ (`blastp` и д.т.) набираются строчными буквами. Чтобы получить подсказку, запустите выбранную программу с опцией `-help`. Вам понадобятся следующие параметры: `-query`, `-db` (базовое имя индексных файлов), `-out`, `-evalue`. Для программы `blastn` при поиске гомологов необходимо также указать `-task blastn` (иначе будет запущен megablast, для поиска гомологов не пригодный уже по замыслу). === Как запустить поиск программой BLASTN на сайте EBI и воспользоваться результатом === На головной странице EBI (http://www.ebi.ac.uk/) в меню '''Tools''' выберите "Similarity&Homology" → "NCBI BLAST", затем пройдите по гиперссылке "Nucleotide Databases". Поскольку вам известно, что последовательность -- из бактерии и описана в одной из стандартных записей, '''снимите''' галочку против "EMBL Release"; после чего щёлкните сначала по треугольнику возле "EMBL Release", затем по треугольнику возле "EMBL Prokaryote" и поставьте галочку против "EMBL Standard Prokaryote". Последующие действия по запуску BLASTN понятны. Получив результат (это может занять несколько минут), нажмите "Show alignments", чтобы увидеть не только ID записей, но и кооординаты находок в ней. Запишите координаты одной из находок, в которой в выравнивание попала вся пробная последовательность, а совпадение -- 100%. Если концу пробной последовательности соответствует большее число, чем началу, значит, направление последовательности совпадает с направлением записи; если наоборот -- значит для записи выбрано противоположное направление (комплементарная последовательность). Посмотрите саму запись (это можно сделать непосредственно со странички с результатами, пройдя сначала по гиперссылке с ID записи, затем по гиперссылке "Text"). Найдите в поле FT, описан ли как-либо участок записи EMBL, с которой совпала заданная последовательность.