Указания к практикуму 3
Как найти последовательность РНК митохондриальной рибосомы
Сначала надо найти запись ENA, GenBank или Refseq, описывающую митохондриальный геном животного. Для большинства животных достаточно зайти в Uniprot на страницу, описывающую цитохром B (например, CYB_FELCA), и найти там гиперссылку на запись EMBL или GenBank, где описана CDS, соответствующая белку. Очень часто это гиперссылка (или хотя бы одна из нескольких гиперссылок) ведёт на полную последовательность митихондриального генома. Нередко, однако, все ссылки на EMBL (а тем самым и на GenBank) ведут на фрагменты генома с данным геном. В это случае придётся поискать полный геном в NCBI или ENA. Ниже — пример такого поиска для случая индийского слона (Elephas maximus).
Зайдите на сайт ENA, в меню Search выберите Advanced search
- В окошке Data type выберите Nucleotide sequences (этот пункт в середине списка, не наверху!), нажмите Next
- Нажмите на кнопку "Taxonomy and related". В левом окошке выберите "NCBI Taxonomy", в среднем — "=", в правом наберите название рода Elephas и в открывшемся меню щёлкните по нужному пункту. Обязательно отметьте чекпойнт "Include subordinate taxa" (не очень понятно, что это значит, но без этого обычно ничего не находится)
- Нажмите на кнопку Sequenced molecule. В левом меню выберите "Topology", в среднем "=", в правом "Circular" (митохондриальная ДНК — единственная кольцевая ДНК животных, поэтому указанный способ отобрать нужную запись — самый простой). Нажмите кнопку Search
- Найдите в списке нужную запись (в данном случае это "AJ428946 Elephas maximus complete mitochondrial genome"), щёлкните по AC
- Справа вверху найдите гиперссылку "View: EMBL"
Когда полная запись митохондриального генома найдена, нужно отыскать в поле FT координаты гена 12S rRNA (в некоторых записях он называется "small subunit ribosomal RNA") и вырезать его последовательность в отдельный файл. В данном случае координаты 70..1031 и на kodomo сработает команда:
seqret embl:AJ428946[70:1031] ELEMA_12S_rRNA.fasta
Внимание: если ген находится на цепи, комплементарной к представленной в записи, надо "перевернуть" последовательность, для этого можно добавить в USA, в квадратные скобки, ":r" (например, embl:AY569552[9620:10344:r]).
Как запустить FastME на нуклеотидном выравнивании
Не забудьте выровнять последовательности! Настоятельно рекомендуется ещё до выравнивания переименовать последовательности мнемониками организмов (пользуясь текстовым редактором или программой descseq).
Чтобы указать программе FastME, что на вход подано нуклеотидное выравнивание, нужно запустить её с опцией -d
Как задать число бутстреп-реплик и отобразить поддержку на ветвях дерева
К командной строке fastme надо добавить -b 100, чтобы программа сделала 100 реплик. После загрузки дерева в iTOL надо во вкладке Advanced нажать Display против "Bootstraps / metadata", а затем переключить отображение поддержки с графического (синие кружочки) на текстовый. Очень рекомендую ещё увеличить шрифт для чисел поддержки с 10 pt до 12 pt и немного сдвинуть их вниз (Vertical shift).
Отображение поддержки, разумеется, не отменяет необходимости переукоренения дерева. Если вы не переименовали последовательности мнемониками, можно переименовать листья уже на дереве (сами разберитесь, как это делается в iTOL)