Дополнение к занятию 4.
Данное дополнение является обязательным для всех, кроме тех, кому первое задание
занятия 4 не было зачтено с первой попытки!
Дополните отчёт по заданию 1 занятия 4 следующими сведениями:
- Для каждой из бактерий своего списка (можно привести эти сведения в виде списка или же в виде таблицы):
- Каков AC записи EMBL, описывающий её полный геном?
- Каковы координаты особенности (FT), в которой описано 16S рРНК этой бактерии?
Соответствует ли направление этой РНК направлению, выбранному для записи,
или РНК "лежит на комплементарной цепи"?
- Приведите команду EMBOSS, которой вы создавали файл с последовательностью рРНК
данной бактерии.
- Какой командой вы получили выравнивание и как называется файл с выравниванием?
Сам файл должен находиться в директории H:\Term4\Practice4; как вариант можно
выложить его на свой сайт и включить в отчёт гиперссылку на него.
- Какой программой вы получили дерево по рРНК?
- Насколько больше (меньше) правильных ветвей имеет полученное дерево по сравнению с каждым из деревьев,
полученных по белкам? Есть ли общие для данного дерева и какого-либо из белковых деревьев ошибки?
Замечание. В записи EMBL, описывающей полный геном одной из бактерий, рРНК не аннотированы.
Можно поступить двумя способами:
Первый вариант: исключить эту бактерию из списка; в этом случае необходимо привести "правильное" (полученное
из образца) дерево для нового сокращённого списка, и такие же ограничения
полученных ранее белковых деревьев.
Второй вариант: всё же найти 16S РНК в геноме этой бактерии. Для этой цели хорошо подходит
программа bl2seq (BLAST двух последовательностей – в данном случае генома и 16S РНК
какой-либо близкородственной бактерии). Запустите bl2seq без параметров, чтобы получить подсказку.
Подсказка по выделению данного участка из длинной последовательности.
Если нужно вырезать участок с 15476 по 16003 нуклеотиды из записи EMBL с AC X000000, то это проще всего сделать
программой seqret:
seqret embl:x000000[15476:16003] my_sequence.fasta
Если необходимо к тому же "перевернуть" последовательность (то есть взять компрлементарную к ней),
то надо добавить опцию -sreverse.
Другой вариант – вместо квадратных скобок с координатами и -sreverse
запустить seqret с опцией -sask, тогда программа задаст вопросы
о начале, конце и направлении нужной последовательности.