Учебная страница курса биоинформатики,
год поступления 2015
Банки нуклеотидных последовательностей
1. Охарактеризуйте качество сборки генома эукариотического организма
- По ссылке Browse by organism на странице базы данных Genome на сайте NCBI открывается таблица со списком организмов. Используйте фильтры или поиск, чтобы выбрать нужный организм.
- В таблице для каждого организма есть две ссылки - одна в названии, вторая в столбце "Assemblies". Если сборок несколько, то выберите самую полную (колонка Level) из списка по второй ссылке.
- Перейдите по ссылке в описание сборки (Assembly), там найдете нужные цифры.
- Список контигов можно получить в таблице сборок по ссылке в столбце WGS, или со страницы сборки по ссылке "WGS Project", а далее по ссылке в поле WGS.
- Если у вас нет каких-то из описанных ссылок, то попробуйте найти обходные пути сами.
2. Опишите десять ключей, используемых в таблицах особенностей (Feature Key или Feature table)
Если возникают трудности, можете начать с поиска описания базы данных GenBank (можно даже просто попробовать ввести GenBank в окошко поиска на NCBI).
- Найдите ссылку на сайт INSDC, там все действительно просто найти.
4. Составьте таблицу митохондриальных генов одного из организмов указаного таксона
Главное в задании - составить правильный запрос.
- Пример запроса к Nucleotide: dnaK[GENE] AND "bacillus subtilis"[Organism]
Cписок полей, по которым можно искать, см.здесь. Найти его на сайте NCBI не так просто(((
- Находки должны быть ПОЛНЫМИ (complete) МИТОХОНДРИАЛЬНЫМИ ГЕНОМАМИ. Найдите как-нибудь один митохондриальный геном, и посмотрите в каких полях записи и как записывается нужная информация. Используйте кавычки "... ..." - как в примере - для словосочетания, и OR, так как в одних записях пишут "полный геном" в других - "полная последовательность".
- Из записи с выбранной последовательностью генома можно перейти на страницу генов по ссылке gene в разделе Related information.
- Чтобы сохранить список всех генов используйте "send to" и Excel. Редактирование файла Excel в соответствии с заданием не является обязательным для зачета, но желательным. Интересно сравнить митохондриальные геномы из разных типов по составу генов.