Цель заданий: Попробовать разные алгоритмы поиска BLAST через веб-интерфейс и локально.
Результат: Два новых раздела на странице с отчетом, которые Вы будете сдавать на коллоквиуме. Условия такие же как и в прошлый раз: рисунки должны быть подписаны подробной подписью, текст остается на Ваше усмотрение (если он будет плохой, или если Вы будете плохо понимать что написано, это может сыграть в минус).
"Эукариот" тут и далее = выбранный Вами на прошлом практикуме эукариотический организм.
См. также советы и указания к выполнению заданий.
1. Найдите в геноме эукариота ген, кодирующий δ-субъединицу АТФ-синтазы
С помощью текстового поиска найдите в файле с последовательностями белков эукариота белок, аннотированный как δ-субъединица АТФ-синтазы. Сохраните последовательность этого белка в формате FASTA отдельно.
Найдите идентификатор нуклеотидной записи, к которой относится ген, кодирующий данный белок.
Получите последовательность ДНК, непосредственно содержащую кодирующую белок часть гена δ-субъединицы АТФ-синтазы (ограниченную началом и концом области CDS - вырезать экзоны не нужно).
Приведите в отчете изображение окрестности этого участка из геномного браузера, на котором были бы видны соседние гены, с объяснением, что на рисунке показано (должно быть понятно, где ген δ-субъединицы; по пониманию того что показано на рисунке могут спрашивать на коллоквиуме).
- В подписи к рисунку не забудьте указать;
Идентификатор белка, ссылку на его последовательность..
Идентификатор нуклеотидной записи, к которой относится ген, кодирующий данный белок.
Координаты кодирующей белок части гена.
Ссылку на файл с последовательностью кодирующей белок части в FASTA-формате.
2. Попробуйте разные варианты BLAST для фрагмента ДНК
Выберите одно из четырех семейств, в которых вы будете проводить дальнейший поиск BLAST, достаточно удаленное от исходного организма. Если выбранный Вами ранее эукариот относился к вторичноротым животным, то для этого задания нужно выбрать из таксонов первичноротых: либо Пауки (Araneae), либо Пчёлы (Apoidea). Если же выбранный эукариот относился к первичноротым, то Вам на выбор - Кошачьи (Felidae) или Собачьи (Canidae). Если же Ваш эукариот ни такой, ни такой, то - берите любой таксон из четырех! Они все подойдут.
Осуществите поиск BLAST через сайт NCBI по последовательностях геномов из выбранного таксона для последовательности белок-кодирующей области δ-субъединицы АТФ-синтазы.
В качестве базы данных для поиска выбирайте вариант refseq_genomes.
Поиск проведите двумя методами BLAST: blastn\megablast (на выбор), tblastn\tblastx (на выбор).
Для каждого использованного метода приведите на странице графический результат поиска BLAST. Не забудьте в подписи указать:
- Что на рисунке показано.
Выбранный таксон для поиска (с объяснением, почему Вы выбрали именно его – понятным для читателя, который не знает задания).
- Использованную базу данных и число сборок в ней, входящих в выбранный таксон.
- Длину слова, которую использовали в каждом случае, а также другие параметры, которые по каким-то соображениям вы решили изменить.
- Алгоритм, который Вы выбрали из предложенных вариантов в каждом случае, с обоснованием.
- На коллоквиуме ожидайте вопросов:
- сколько находок вы бы ожидали увидеть априори;
- сколько находок обнаружено каждым из методов (конечно, с каким-то разумным порогом значимости);
- одни и те же это находки или разные;
- справился ли алгоритм с поиском (обоснуйте свой ответ с помощью графического изображения результатов BLAST и / или текстового вида результатов).
3. Найдите в геноме эукариота гены основных рибосомальных РНК по далекому гомологу
Проиндексируйте последовательности генома вашего эукариота для работы локального BLAST (см. подсказки по BLAST) на своем компьютере или на сервере Kodomo (если объем генома позволяет) с помощью makeblastdb. Приведите команду, которой это было сделано в протоколе (пользуйтесь тэгом <PRE> или другим способом выделить, что это не обычный текст).
Скачайте последовательности рРНК Escherichia coli из файла.
Проведите локальный поиск BLAST отдельно для каждой рРНК по полученной базе данных с помощью подходящего для данной задачи варианта BLAST. Приведите в протоколе команды, которыми это было сделано.
Приведите на странице ссылку на файл с результатами BLAST для каждого поиска.
Чтобы разобраться с результатами BLAST, настоятельно советую нарисовать в любом графическом редакторе, которым владеете, схематическое изображение находок относительно геномных фрагментов Вашего эукариота (пример см. в презентации). Приведите схему на странице для любой из двух рРНК (можно и для обеих...).
4. Подберите пару геномов и постройте карты их локального сходства
Подберите пару нуклеотидных последовательностей, для которых карты локального сходства, построенные Megablast и BLASTN, заметно различаются (примеры из презентации не засчитываются!). Постройте карты этими программами, а также программой TBLASTX. Отчёт — на сайте со ссылкой со страницы семестра, проверяется в вашем присутствии на коллоквиуме. В отчёте напишите, что это за последовательности, каким запросом на каком сайте вы их нашли, приведите три карты и свои комментарии.
Рекомендуется брать полные геномы или отдельные полностью собранные хромосомы прокариот или вирусов. Не возбраняется подобрать что-то другое, но тоже интересное (например, плазмиды бактерий или участки эукариотических геномов, кодирующие рибосомальную РНК, или ещё что-нибудь).
В комментариях желательно описать всё, заслуживающее внимания (в частности, про глобальные перестройки между последовательностями, которые можно видеть на картах).
См. указания
На коллоквиуме будьте готовы к вопросам:
- Как называются последовательности рРНК, по которым вы проводите поиск? Какова их функция?
Какой вариант BLAST вы выбрали и почему для решения поставленной задачи?
- Какие использовали параметры и почему?
- Получилось ли найти гомологов выданных последовательностей рРНК? Сколько гомологов было найдено для каждой из них? Какова функция этих гомологов?
Есть ли аннотация у найденных участков в сборке? Если да, то какая – совпадает ли она с ожидаемой вами исходя из результатов поиска?
- Какие эволюционные события отразились на карте, построенной MegaBLAST? Какую дополнинтельную информацию можно почерпнуть из карты, построенной BLASTN? А на карте, построенной TBLASTX?

2025
2023
2022
2021
2020
2019
2018
2017