#pragma css /css/2017.css
<<BI>>

== Подсказки к заданию по банкам нуклеотидных последовательностей ==

=== 1. Как найти информацию о сборке генома ===

  * На головной странице NCBI выберите БД Assembly и перейдите на нее. Составьте запрос. Пример:
{{{
"brucella abortus"[organism] AND 10000:1000000[contig N50] AND 20:100[coverage] 
}}}
  * Можете воспользоваться Advanced search. Но всегда проверяйте, какой запрос составился, а то этот поиск может сам придумать, что вы хотите, и добавить в запрос.
  * Другой вариант выбора сборки &mdash; через Browse by organism на странице базы данных Genome на сайте NCBI. Открывается таблица со списком организмов. Используйте фильтры или поиск, чтобы выбрать интересный вам организм.
  * В таблице для каждого организма есть две ссылки, одна в названии, вторая в столбце "Assemblies". Если сборок несколько, то выберите самую полную (колонка Level) из списка по второй ссылке.
  * Перейдите по ссылке в описание сборки (Assembly), там найдете нужные цифры.
  * Список контигов можно получить в таблице сборок по ссылке в столбце WGS, или со страницы сборки по ссылке "WGS Project", а далее по ссылке в поле WGS.
  * Если у вас нет каких-то из описанных ссылок, то попробуйте найти обходные пути сами.

=== 2. Ключи (Feature Keys) таблиц особенностей (FT или Feature table) ===
  * Если возникают трудности, можете начать с поиска описания базы данных !GenBank (можно даже просто попробовать ввести !GenBank в окошко поиска на NCBI) или EMBL.
  * Лучше зайдите на сайт INSDC, там все действительно просто найти.
  * Выбирайте такие ключи, смысл которых вам понятен или вы можете его понять, используя интернет и литературу.

=== 4. Как найти описание митохондриального генома и составить таблицу закодированных там белков ===
Главное в задании &mdash; составить правильный запрос. 
Здесь написано, как составить запрос на сайте  ENA. 
Если захотите работать на сайте NCBI, то разбирайтесь сами (или смотрите подсказки прошлого года). 
  * С головной страницы ENA пройдите на Advanced search в разделе Text search.
  * Отметьте Sequence.
  * В поле Taxon name начните набирать латинское название таксона. В какой-то момент система подскажет возможные продолжения, выберите одно из них.
  * Поставьте галочку в чекбокс "Include subordinate taxa" (иначе может ничего не найтись).
  * Теперь нужно ограничить запрос так, чтобы были выданы только полные митохондриальные геномы. Один из вариантов:
    * в поле Molecule type выбираете genomic DNA;
    * в поле Topology выбираете CIRCULAR (большинство митохондриальных геномов кольцевые, таким образом этот выбор сразу отбросит фрагменты);
    * ищете поле Organelle и в меню выбираете mitochondrion.
  * Нажимаете кнопку Search. Появляется запрос, затем результат: сколько находок в Update и в Release. Чтобы увидеть список находок, щёлкните по View all results.
  * Щёлкнув по AC, попадаете на страницу отдельной записи, с неё по ссылке Text получаете текст полной записи. Оттуда можно добыть координаты белок-кодирующих участков (CDS) и информацию о соответствующих белках.