Учебная страница курса биоинформатики,
год поступления 2016
Банки нуклеотидных последовательностей
1. Охарактеризуйте качество сборки генома эукариотического организма
- На головной странице NCBI выберите БД Assembly и перейдите на нее. Составьте запрос. Пример:
"brucella abortus"[organism] AND 10000:1000000[contig N50] AND 20:100[coverage]
- Можете воспользоваться Advanced search. Но всегда проверяйте какой запрос составился, а то это поиск может придумать что вы хотите и добавить в запрос
- Другой вариант выбора сборки - через Browse by organism на странице базы данных Genome на сайте NCBI. Открывается таблица со списком организмов. Используйте фильтры или поиск, чтобы выбрать интересный вам организм.
- В таблице для каждого организма есть две ссылки - одна в названии, вторая в столбце "Assemblies". Если сборок несколько, то выберите самую полную (колонка Level) из списка по второй ссылке.
- Перейдите по ссылке в описание сборки (Assembly), там найдете нужные цифры.
- Список контигов можно получить в таблице сборок по ссылке в столбце WGS, или со страницы сборки по ссылке "WGS Project", а далее по ссылке в поле WGS.
- Если у вас нет каких-то из описанных ссылок, то попробуйте найти обходные пути сами.
2. Опишите семь ключей, используемых в таблицах особенностей (Feature Key или Feature table)
Если возникают трудности, можете начать с поиска описания базы данных GenBank (можно даже просто попробовать ввести GenBank в окошко поиска на NCBI).
- Лучше зайдите на сайт INSDC, там все действительно просто найти.
- Выбирайте такие ключи, смысл которых вам понятен или вы можете его понять используя интернет и литературу
4. Составьте таблицу митохондриальных генов одного из организмов указаного таксона
Главное в задании - составить правильный запрос.
- Пример запроса к Nucleotide: dnaK[GENE] AND "bacillus subtilis"[Organism]
Cписок полей, по которым можно искать, см.здесь. Найти его на сайте NCBI не так просто(((
- Находки должны быть ПОЛНЫМИ (complete) МИТОХОНДРИАЛЬНЫМИ ГЕНОМАМИ. Найдите как-нибудь один митохондриальный геном, и посмотрите в каких полях записи и как записывается нужная информация. Используйте кавычки "... ..." - как в примере - для словосочетания, и OR, так как в одних записях пишут "полный геном" в других - "полная последовательность".
- Из записи с выбранной последовательностью генома можно перейти на страницу генов по ссылке gene в разделе Related information.
- Чтобы сохранить список всех генов используйте "send to" и Excel. Редактирование файла Excel в соответствии с заданием не является обязательным для зачета, но желательным. Интересно сравнить митохондриальные геномы из разных типов по составу генов.