Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2020

Упражнения

Упражнения нужно выполнить обязательно, но в отчете их отражать не нужно.

Задания практикума 7

Отчёт – страница со ссылкой со страницы семестра. Мягкий дедлайн – 23:59 26 октября, жесткий дедлайн – 01:00 2 ноября. После мягкого дедлайна штраф 0.5 балла, после жесткого – 2 балла.

1. Опишите сборку генома эукариотического организма

Организм (точнее, вид) – на ваш выбор, но это должен быть многоклеточный эукариот.

В отчёте укажите:

Потом выберите одну "лучшую" сборку и для нее привидите следующую информацию:

Для поиска используйте ссылку "Browse by Organism" на странице NCBI Genome, или просто поиск по NCBI Genome (примерно то же самое). Лучшая сборка – это, в первом приближении, самая свежая сборка с самым высоким уровнем (Genome > Chromosome > Scaffold > Contig). Однако надо критически относиться к приведенной информации (особенно в NCBI Genome).

Добыть последовательность контига (не хромосомы!) можно разных источников. Можно либо просмотреть проект WGS в NCBI Sequence Set Browser и далее выбрать один из контигов во вкладке Contigs. Либо сначала найти "master record" проекта WGS в базе Nucleotide, перейти из нее по ссылке на список контигов и выбрать один из них. Со страницы нуклеотидной записи контига получить файл .fasta довольно просто. Ключевая фраза: "send to file". Не выбирайте контиги большого размера! Возьмите маленький. Если в сборке все контиги большие (> 500 kb), то возьмите другую (более плохую) сборку.

2. Скачайте последовательности CDS одного из прокариотических вирусов

Для этого сначала получите список полных геномов прокариотических вирусов, удовлетворяющих персональным условиям из таблицы. Поиск нужно производить по базе Nucleotide на сайте NCBI. В отчете обязательно нужно привести текст запроса и количество находок в GenBank и RefSeq.

Потом выберите один геном и для него приведите:

Как получить файл разберитесь сами. Ключевые фразы: "send to file", "coding sequences". Кратко опишите в отчете, как получили файл.

3. Опишите пять ключей, используемых в таблице локальных особенностей

Описывать нужно именно ключи таблицы локальных особенностей (Feature keys), а не ключи-квалификаторы (Qualifiers). Проще всего найти описание ключей на сайте INSDC, но эта информация есть и на сайтах нуклеотидных архивов.

Выбирайте ключи поинтереснее! Для каждого ключа приведите описание (на русском) и пример использования (AC и фрагмент реальной записи, в которой встречается такой ключ, не забывайте про нормальное форматирование, например с помощью <pre>). Пример использования найдите самостоятельно, не копируйте примеры из документации!

2020/3/pr7 (последним исправлял пользователь is_rusinov 2021-10-20 03:53:18)