Дополнение к занятию 4.

Данное дополнение является обязательным для всех, кроме тех, кому первое задание занятия 4 не было зачтено с первой попытки!

Дополните отчёт по заданию 1 занятия 4 следующими сведениями:

  1. Для каждой из бактерий своего списка (можно привести эти сведения в виде списка или же в виде таблицы):
  2. Какой командой вы получили выравнивание и как называется файл с выравниванием? Сам файл должен находиться в директории H:\Term4\Practice4; как вариант можно выложить его на свой сайт и включить в отчёт гиперссылку на него.
  3. Какой программой вы получили дерево по рРНК?
  4. Насколько больше (меньше) правильных ветвей имеет полученное дерево по сравнению с каждым из деревьев, полученных по белкам? Есть ли общие для данного дерева и какого-либо из белковых деревьев ошибки?
Замечание. В записи EMBL, описывающей полный геном одной из бактерий, рРНК не аннотированы. Можно поступить двумя способами:
Первый вариант: исключить эту бактерию из списка; в этом случае необходимо привести "правильное" (полученное из образца) дерево для нового сокращённого списка, и такие же ограничения полученных ранее белковых деревьев.
Второй вариант: всё же найти 16S РНК в геноме этой бактерии. Для этой цели хорошо подходит программа bl2seq (BLAST двух последовательностей – в данном случае генома и 16S РНК какой-либо близкородственной бактерии). Запустите bl2seq без параметров, чтобы получить подсказку.

Подсказка по выделению данного участка из длинной последовательности. Если нужно вырезать участок с 15476 по 16003 нуклеотиды из записи EMBL с AC X000000, то это проще всего сделать программой seqret:

seqret embl:x000000[15476:16003] my_sequence.fasta
Если необходимо к тому же "перевернуть" последовательность (то есть взять компрлементарную к ней), то надо добавить опцию -sreverse.

Другой вариант – вместо квадратных скобок с координатами и -sreverse запустить seqret с опцией -sask, тогда программа задаст вопросы о начале, конце и направлении нужной последовательности.