Учебная страница курса биоинформатики,
год поступления 2021
Указания к заданию практикума 10
Геномы можно искать несколькими способами:
со страницы "геномы NCBI". Там можно воспользоваться обычным поиском или (на мой вкус, лучше) сервисом "Browse by Organism". В последнем, впрочем, всё равно нужно будет поискать по названию бактерии или вируса. Берите только геномы, собранные до хромосом.
поиском в "сборном" банке "Nucleotides" на NCBI: https://www.ncbi.nlm.nih.gov/nuccore/advanced . Укажите организм и затем постарайтесь разобраться в выдаче. Лучше сразу щёлкнуть по слову RefSeq в левой части окна.
поиском в ENA. Там Search → Advanced Search → в поле "Data type" отмечаете "Nucleotide sequences" и нажимаете Next. Организм вводите в категории "Taxonomy and related", там в поле "NCBI taxonomy" начните набирать латинское название и дождитесь появления подсказок, потом щёлкните по нужному названию. Стоит отметить галочку "Include subordinate taxa". Затем в категории "Titles, aliases and descriptions" выберите "Description" (там больше и нечего выбирать) и введите либо "* complete*", либо "* chromosome*, либо "* genome*". Пробуйте разные варианты, в разных случаях могут сработать разные. Звёздочка и пробел до слова и звёздочка после обязательны! Полистайте выдачу и подберите две подходящих записи.
- поиском на сайте DDBJ (есть мнение, что он устроен понятнее, чем в ENA, разберитесь сами)
Возможно, придётся перебрать несколько пар. Варианты для геномов (хромосом) такие: разные штаммы одного вида, разные виды одного рода. Из разных родов вряд ли найдётся хорошая пара, хотя бывают исключения.
Карту локального сходства нужно построить посредством BLAST 2 sequences на сайте NCBI (на странице нуклеотидного BLAST отметить галочку "Align two or more sequences", после чего появится второе окошко). В оба окошка можно вводить Accession записей GenBank, ENA (они точно такие же, как в GenBank) или RefSeq. Сама карта — по ссылке DotPlot на странице с результатом. Чтобы скачать графический файл с картой, щёлкните по изображению правой кнопкой мыши.
Не возбраняется менять "Advanced" параметры: порог на e-value, у BLASTN также длину слова (c 11 на 7) и Match/mismatch (в некоторых случаях имеет смысл поставить 1/–1). Если меняете, обязательно указывайте это в комментариях.