Учебная страница курса биоинформатики,
год поступления 2014
Банки нуклеотидных последовательностей
Часть I
1. Охарактеризуйте качество сборки генома эукариотического организма
- По ссылке Browse by organism на странице базы данных Genome на сайте NCBI открывается таблица со списком организмов. Используйте фильтры или поиск, чтобы выбрать нужный организм.
- В таблице для каждого организма есть две ссылки - одна в названии, вторая в столбце "Assemblies". Если сборок несколько, то выберите самую полную (колонка Level) из списка по второй ссылке.
- Перейдите по ссылке в описание сборки (Assembly), там найдете нужные цифры.
- Список контигов можно получить в таблице сборок по ссылке в столбце WGS, или со страницы сборки по ссылке "WGS Project", а далее по ссылке в поле WGS.
- Если у вас нет каких-то из описанных ссылок, то попробуйте найти обходные пути сами.
2. Составьте таблицу митохондриальных генов указанного мха
- Из записи с последовательностью генома можно перейти на страницу описания генома по ссылке Genome в разделе Related information.
- Оттуда же можно получить список всех генов, это ссылка Gene в разделе Related information, чтобы его загрузить, используйте ссылку "send to".
NCBI, help'ы, которые не просто разыскать
[список полей, по которым можно искать]
Пример запроса к Nucleotide: dnaK[GENE] AND "bacillus subtilis"[Organism] (Organism можно сократить до ORGN)
3. Опишите десять ключей, используемых в таблицах особенностей (Feature Key или Feature table)
Если возникают трудности, можете начать с поиска описания базы данных GenBank (можно даже просто попробовать ввести GenBank в окошко поиска на NCBI).
- Найдите ссылку на сайт INSDC, там все действительно просто найти.
Часть II
4. (blastn) Установите какому гену принадлежит последовательность, полученная в практикуме 6, и таксономию организма
- Пользоваться Blast вы уже должны уметь.
- Получить выравнивание можете как угодно, учитывая то, что узнали в прошлом семестре в блоке 3.