Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2019

Указания к практикуму 11

Задания 1–3 делаются на сайте NCBI: https://blast.ncbi.nlm.nih.gov/, там пройдите по ссылке Protein BLAST.

В окошко "Enter query sequence" можно вставлять как последовательность в fasta-формате, так и коды доступа (AC) Swiss-Prot или Refseq Protein (но, к сожалению, не TrEMBL, поэтому если ваш белок не из раздела Reviewed, то придётся всё же вставлять саму последовательность). Можно вместо этого подгрузить файл.

Результата иногда приходится ждать довольно долго (в рабочее на территории США время, то есть примерно с трёх-четырёх дня до двух ночи по Москве, сервер NCBI бывает перегружен).

Чтобы сохранить текстовую выдачу программы, найдите на странице с результатом меню Download и там выберите Text.

Когда будете использовать фильтр по организмам, набирайте латинское название таксона не торопясь, в какой-то момент покажутся подсказки с полными названиями таксонов с данным началом, нужно будет выбрать нужную строку.

E-value иногда бывает равным 0.0, что означает "машинный ноль" (число, меньшее, чем самое маленькое из тех, что может хранить программа). Это, естественно, свидетельствует о запредельной достоверности находки. Но для упражнения 3 такая находка не годится, выберите что-нибудь похуже.

Работа с историей запросов BLAST

BLAST очень востребованная программа, поэтому сервер NCBI часто бывает перегружен запросами. Иногда результатов своего поиска можно ждать десятки минут, или еще дольше. К счастью, BLAST хранит результаты всех запросов 36 часов и каждому запросу присваивает специальный идентификатор, по которому можно получить результаты поиска в течение этого времени.

Идентификатор называется Request ID (RID) и отображается в первой строке окошка ожидания результатов запроса. По этому идентификатору можно получить результаты поиска на страничке Recent results (на нее есть ссылка в верхнем правом углу на большинстве страниц BLAST). Если Вы закроете страницу ожидания результатов поиска, то запрос от этого не отменяется. Поэтому можно скопировать Request ID запроса, закрыть страницу и получить результаты по идентификатору через какое-то время.

Внимание: результаты поиска удаляются через 36 часов, поэтому нет смысла указывать в своих отчетах идентификаторы запросов или ссылки на страницы с результатами, во время проверки они уже не будут работать! Обязательно сохраняйте текстовую выдачу для отчета.