#pragma css /css/2017.css
<<BI>>

== Подсказки к заданию по банкам нуклеотидных последовательностей ==

=== 1. Как найти информацию о сборке генома ===

* На головной странице NCBI выберите БД Assembly и перейдите на нее. Составьте запрос. Пример:
{{{
"brucella abortus"[organism] AND 10000:1000000[contig N50] AND 20:100[coverage]
}}}
* Можете воспользоваться Advanced search. Но всегда проверяйте, какой запрос составился, а то этот поиск может сам придумать, что вы хотите, и добавить в запрос.
* Другой вариант выбора сборки &mdash; через Browse by organism на странице базы данных Genome на сайте NCBI. Открывается таблица со списком организмов. Используйте фильтры или поиск, чтобы выбрать интересный вам организм.
* В таблице для каждого организма есть две ссылки, одна в названии, вторая в столбце "Assemblies". Если сборок несколько, то выберите самую полную (колонка Level) из списка по второй ссылке.
* Перейдите по ссылке в описание сборки (Assembly), там найдете нужные цифры.
* Список контигов можно получить в таблице сборок по ссылке в столбце WGS, или со страницы сборки по ссылке "WGS Project", а далее по ссылке в поле WGS.
* Если у вас нет каких-то из описанных ссылок, то попробуйте найти обходные пути сами.

=== 2. Ключи (Feature Keys) таблиц особенностей (FT или Feature table) ===
* Если возникают трудности, можете начать с поиска описания базы данных !GenBank (можно даже просто попробовать ввести !GenBank в окошко поиска на NCBI) или EMBL.
* Лучше зайдите на сайт INSDC, там все действительно просто найти.
* Выбирайте такие ключи, смысл которых вам понятен или вы можете его понять, используя интернет и литературу.

=== 4. Как найти описание митохондриального генома и составить таблицу закодированных там белков ===
Главное в задании &mdash; составить правильный запрос.
Здесь написано, как составить запрос на сайте ENA.
Если захотите работать на сайте NCBI, то разбирайтесь сами (или смотрите подсказки прошлого года).
* С головной страницы ENA пройдите на Advanced search в разделе Text search.
* Отметьте Sequence.
* В поле Taxon name начните набирать латинское название таксона. В какой-то момент система подскажет возможные продолжения, выберите одно из них.
* Поставьте галочку в чекбокс "Include subordinate taxa" (иначе может ничего не найтись).
* Теперь нужно ограничить запрос так, чтобы были выданы только полные митохондриальные геномы. Один из вариантов:
* в поле Molecule type выбираете genomic DNA;
* в поле Topology выбираете CIRCULAR (большинство митохондриальных геномов кольцевые, таким образом этот выбор сразу отбросит фрагменты);
* ищете поле Organelle и в меню выбираете mitochondrion.
* Нажимаете кнопку Search. Появляется запрос, затем результат: сколько находок в Update и в Release. Чтобы увидеть список находок, щёлкните по View all results.
* Щёлкнув по AC, попадаете на страницу отдельной записи, с неё по ссылке Text получаете текст полной записи. Оттуда можно добыть координаты белок-кодирующих участков (CDS) и информацию о соответствующих белках.