Материалы к зачетному заданию 1

  1. Общие подсказки, а точнее советы
  2. Перед началом работы проверьте свою квоту и, если она превышена, просто перенесите энное количество файлов в директорию E:\Public (а после окончания работы — обратно :).

    Напоминаем, что диску P на kodomo-count соответствует директория /home/export/samba/public

    Программа seqret имеет опцию -sask, позволяющую вырезать нужный участок из длинной последовательности.

    Используйте подсказки к занятиям 1–4. В частности, вспомните, что такое индексные файлы и как их получать.

    Чем больше вы успеете, тем выше будет оценка. Но не надо торопиться за счет снижения качества!

  3. Подсказки для варианта 2
    1. Как получить полный протеом кишечной палочки в fasta-формате?
    2. Используйте возможности EMBOSS. Команда

       seqret sw:*_ABCDE
      
      вытащит из банка SwissProt и поместит в указанный Вами файл последовательности всех белков, имеющих ID, заканчивающееся на ABCDE. Поскольку кишечная палочка — хорошо изученный организм, практически весь её протеом помещён в SwissProt. Вспомните, как устроены ID записей SwissProt, описывающих белки кишечной палочки!

      Если на вход программе seqret дать последовательность в любом формате (в том числе в формате EMBL), на выход она (по умолчанию) выдаст ту же последовательность в fasta-формате.

    3. Как получить последовательности открытых рамок?
    4. Программа getorf пакета EMBOSS предназначена для поиска открытых рамок считывания в заданной нуклеотидной последовательности. Запустите команду
       getorf -help
      
      и изучите, что означают значения, которые можно придавать параметрам find, table и minsize. Продумайте, какими должны быть эти значения в нашем случае.

      Чтобы придать параметру программы заданное значение, надо в командной строке после названия параметра (начинающегося с "–"), поставить пробел, а затем — значение. Например, команда

       getorf -minsize 1000
      
      запустит программу getorf, придав параметру minsize значение 1000. Параметров и их значений может быть сколько угодно (но, естественно, каждый конкретный параметр должен встречаться не более одного раза).

      Есть другой способ — запустите getorf с опцией -opt, тогда программа сама спросит о значениях всех параметров.

    5. Как получить требуемую таблицу в Excel
    6. Примерная последовательность действий: