Учебная страница курса биоинформатики,
год поступления 2012
Подсказки к занятию 7
К упражнению 1
Банк nr (Non-redundant protein sequences) — своеобразный "виртуальный" банк, существующий только как область поиска программой BLAST на сайте NCBI. По замыслу, включает в себя все белковые последовательности из всевозможных источников (в первую очередь Swiss-Prot и аннотации кодирующих участков генов в GenBank). При этом как nr, так и другие банки последовательностей на сайте NCBI подвергнуты "кластеризации": записи с одинаковой последовательностью (часто таковыми являются, например, белки из разных штаммов одного вида бактерий) объединены в одну и будут показаны в списке находок одной строкой. Тем самым, указанный в первом столбце таблицы находок "Accession" может не совпасть с AC белка, поданного на вход. Чтобы понять, найден ли исходный белок, часто имеет смысл посмотреть в той части выдачи BLAST, где приведены выравнивания — там будут приведены все ID и AC записей, попавших в кластер. Если же кластер очень большой, то часть идентификаторов последовательностей может быть даже скрыта в выпадающем меню!
- Чтобы узнать номер находки в списке описаний, наведите курсор мыши на "Accession" (гиперссылку в правом столбце таблицы). В "строке состояния" (внизу окна браузера) отобразится гиперссылка, в которой среди прочего будет указано "blast_rank=19", значит, курсор на 19-ой находке.
- Для перехода со списка находок к конкретному выравниванию можно щёлкнуть по гиперссылке в первом столбце.
- Для ответа на последний вопрос надо знать, каковы по умолчанию пороговое значение E-value и предельный размер выдачи. Чтобы узнать это, на странице запроса щёлкните по "Algorithm parameters": появятся список параметров и значения по умолчанию.
К упражнению 2
Проведите поиск гомологов заданного белка по Swiss-Prot, при этом введите название таксона в окошко "Organism".
Если начать набирать название таксона, то интерфейс тут же начнёт подсказывать варианты; чтобы согласиться с одним из них, просто щёлките по нужному названию.
Если гомолог не найден, то вернитесь на страницу запроса (гиперссылка "blastp suite" в левом верхнем углу), введите название следующего таксона и т.д.
К упражнению 3
Для выравнивания двух последовательностей при задании параметров поиска отметьте галочку "Align two or more sequences". Вместо меню выбора банка данных появится окошко для ввода второй последовательности. Карту локального сходства можно найти на странице результатов в разделе "Dot Matrix View".
К упражнению 4
Задать матрицу, которую будет использовать BLAST при поиске, можно в разделе "Scoring Parameters" стандартного интерфейса.