Учебная страница курса биоинформатики,
год поступления 2017
Задания по BLAST
Отчёт о задании — на сайте со ссылкой со страницы семестра.
Срок без штрафа: 30 октября, с минимальным штрафом — до начала второй пары 13 ноября.
1. Определите таксономию и функцию прочтённой вами нуклеотидной последовательности (из практикума 6)
В отчете укажите (i) предполагаемую функцию или аннотацию последовательности; (ii) предполагаемую таксономию; (iii) обоснования своих решений.
Замечание. По моему (С.А.С.) недосмотру в последовательности действий для задания 1 практикума 6 выпал пункт получения консенсусной последовательности из двух прочтений. В отчёте по практикуму 6 я засчитываю пару последовательностей, но для этого задания придётся всё же сгенерировать консенсус из выравнивания программой consambig пакета EMBOSS.
Подумайте или посмотрите в презентации: (i) какой вариант алгоритма BLAST использовать и в какой базе данных искать; (ii) какие находки и сколько достаточно для аннотации; (iii) как решить, к какому уровню таксономии — виду, роду, семейству,... — возможно отнесение находки (см. подсказки); (iv) какие данные стоит привести в отчете (см. подсказки).
2. Сравните списки находок нуклеотидных последовательностей тремя разными вариантами blast
Один из вариантов — megablast, второй — blastn с параметрами по умолчанию, третий — blastn с максимально чувствительными параметрами. В отчете напишите, что демонстрирует сравнение трех вариантов. Возьмите сначала ту же последовательность, что в задании 1, затем — последовательность какой-нибудь некодирующей РНК из "своего" митохондриального генома (см. предыдущий практикум). Каждый раз ограничивайте область поиска так, чтобы результат сравнения был показателен (и чтобы не ждать слишком долго, см. подсказки). Подробнее об оформлении отчета см. в подсказках.
3. Проверьте наличие гомологов трех белков в неаннотированном геноме
Организм Amoeboaphelidium protococcarum (примитивный родственник грибов). Сборка генома лежит на kodomo в файле /P/y17/term3/block2/X5.fasta.
Задание следует выполнить три раза, для любых трёх белков.
Белки можно (но не обязательно) взять из списка:
- HSP71_YEAST, шаперон HSP70, белок теплового шока;
- TERT_SCHPO, теломераза,восстанавливающая длину хромосомы при репликации; имеется у большинства (но не всех) эукариот;
- PRPC_EMENI, митохондриальная цитратсинтаза;
- EIF3G_SCHPO, фактор инициации трансляции eIF3g, содержит также РНК связывающий домен;
- HIS31_HUMAN, гистон H3, белок, участвующий в образовании нуклеосомы;
- TBB_NEUCR, тубулин, белок, участвующий в образовании микротрубочек.
Можно выбрать на свое усмотрение из тех, которые, по вашему мнению, должны быть почти у всех эукариот.
4. Найдите какой-нибудь ген белка в одном из контигов
Для поиска выберите один контиг Amoeboaphelidium protococcarum длины порядка десятков тысяч пар нуклеотидов. Интроны у амебоафилидиума короткие, так что ген может поместиться в одном таком контиге.
Описать в отчете нужно ОДИН наиболее правдоподобный ген, найденный с помощью BLAST. Едва ли получится найти точные границы гена, но это и не требуется.
5. Карта локального сходства геномов двух бактерий
Выберите две бактерии одного рода, для которых доступны полные геномы. Постройте их карту локального сходства с помощью подходящего варианта BLAST. В отчёте приведите изображение карты и описание наиболее заметных перестроек, отличающих один геном от другого.
Важно: нужно подобрать пару, для которой есть что описывать! Если геномы практически идентичны, возьмите другие бактерии.