Учебная страница курса биоинформатики,
год поступления 2014
Банки нуклеотидных последовательностей
Часть I. Deadline 20 окт.
1. Охарактеризуйте качество сборки генома эукариотического организма
- Организм - на ваш выбор; используйте NCBI Genome, Browse by organism или поиск по БД Genome
- В отчёте укажите
- число сборок генома; выберите одну
- число проектов по секвенированию организма и число образцов
- для одной сборки
- приведите описание образца (BIOSAMPLE ID и перевод описания)
- приведите описание проекта (BIOPROJECT)
- число контигов/скэффолдов сборки
- таблицу контигов/скэффолдов (контиг, длина, ...) - ссылка на файл с веб-страницы
- N50 и L50, самый длинный и самый короткий контиг
- сделайте ссылку на последовательность одного из контигов (на ваш выбор)
2. Составьте таблицу митохондриальных генов указанного мха
Вид мха см. в в таблице
- Поиск по полям в БД Nucleotide (NCBI). Составьте и включите в протокол запрос, результатом которого является только нужный геном.
- По ссылке со страницы с записью генома можно перейти к списку всех генов, включая гены РНК, и сохранить его.
- В отчете должно быть, кроме названия мха (и желательно, фотографии!):
- число генов РНК и белков
- ссылка на файл со списком генов, отсортированным по началу в геноме
- ....
3. Опишите десять ключей, используемых в таблицах особенностей
- Найдите страницу help'а; можно искать на сайте NCBI, EBI или (что самое простое!) INSDC
- Выбирайте ключи поинтереснее! Впрочем, выбор за вами.
- На каждый ключ приведите пример.
Часть II. Deadline 27 окт.
4. (blastn) Установите какому гену принадлежит последовательность, полученная в практикуме 6, и таксономию организма
- используйте BLASTN ("samewhat similar sequences", а не что иное!) по банку nr
- выберите несколько лучших из достоверных находок, охарактеризуйте гены и таксономию (способ документации - на ваше усмотрение)
- постройте выравнивание входной последовательности с находками (должно быть доступно по ссылке с веб-страницы)
- напишите вывод: какой ген, какой таксон, какой уровень сходства с лучшей находкой (в числе замен на 100 п.н.)и с лучшей находкой из другого вида или таксона более высокого уровня
''Пояснение.'' * под геном понимается не только ген, кодирующий белок, но и ген, кодирующий РНК, и любой участок, имеющий наименование в связи с использованием в штрихкодировании ДНК * во многих случаях не удастся определить принадлежность вашей последовательности определенному виду; в зависимости от находок определите таксон более высокого порядка * оставляю способ документации результатов (т.е. как продемонстрировать данные, подтверждающие выводы) на ваше усмотрение; однако результат не будет защитан, если вы напишете правильные выводы, но не приведете данные, достаточные проверяющему чтобы убедиться в их правильности; (например, напишете "BLAST не нашел ни одной находки с E<0.001" и не приведете скриншот результата поиска)
Перенесем?