Учебная страница курса биоинформатики,
год поступления 2012
Указания
- Как выбрать случайную последовательность
- в Excel: функция СЛУЧМЕЖДУ(1;15)/RANDBETWEEN(1,15)
- на языке Python:
python в командной строке; открывается окно с приглашением ввести команду ">>>"
- выполняете команды
- import random (читается библиотека random)
- random.randint(1,15) (выдает случайное число между 1 и 15 вкл.)
- exit()
- Зайдите на сайт BLAST в NCBI, выберите protein blast (белок против белковой БД)
- Параметры:
- входная последовательность,
- БД где искать - refseq_protein
- PSI-BLAST в разделе Algorithm. Может понадобиться (а может и не понадобиться)также изменение следующих параметров из раздела Algorithm parameters:
Max target sequences - ограничение максимального числа находок, вместе "хороших" и "плохих". "Хорошие" - это те, для которых E-value>0.005 (по умолчанию), на странице с результатом они приводятся в первом блоке находок; "плохие" приводятся во втором блоке
- PSI-BLAST treshold - порог E-value для отделения хороших находок, E=0.005 по умолчанию
- На странице с результатом два блока - хорошие находки и плохие находки. А также два столбца для галочек, левый и правый.
- В правом отмечаются те последовательности, по которым будет выполнена очередная итерация поиска PSI-BLAST: построены PSSM (позиционные матрицы весов) и выполнен поиск.
- В левом отмечаются последовательности, для которых можно построить выравнивание (кнопка Multiple alignment сверху блока (и другие операции)
- При выборе последовательностей для очередной итерации имеет смысл обращать внимание на
- E-value находок, точнее на ступеньку в значениях E-value. Например, если после находки с E=2E-10 идет находка E=0.001 (разница в 7 порядков), то стоит попробовать отключить вторую находку (и те, что ниже) от очередной итерации
- описание находок, хотя стоит помнить что в описаниях могут быть ошибки;
- таксономию находок: если все, кроме одной, принадлежат роду Bacillus, а одна - из эукариот, то стоит задуматься, не ошибочна ли исключительная находка
- выравнивание, которое легко получить (кнопка Multiple alignment сверху блока; кнопка выше блоков находок - для выравнивания всех хороших находок)
Выравнивание представлено не так, как в других местах В Америке - все по-своему :).
- для выделения консервативных позиций используйте Conservation settings; при умолчательном параметре "2 Bit" получается, что почти все позиции консервативны - не зависимо от того, какие остатки стоят в колонке, поэтому замените на "3 Bits" или больше
- числа в квадратных скобках показывают сколько остатков не показано в данной последовательности - это удобно!
- можно перевыровнять часть последовательностей, для этого против ненужных следует отключить галочки; это стоит делать, например, для удаления фрагментов - заведомо неполных последовательностей
- Для сохранения выравнивания откройте его и используйте кнопку Download на странице выравнивания