Занятие 5. Работа в командной строке Linux. Программы выравнивания последовательностей пакета EMBOSS.

Ваша рабочая директория — H:\Term2\Practice5.
Форма отчета — HTML-страничка c описанием сравнения построенных выравниваний, на которую должна вести гиперссылка со страницы второго семестра.

Указания и подсказки

Обязательные задания

  1. Работа в командной строке Linux
    1. Смена активной директории и просмотр содержимого директорий.
    2. Создание и просмотр файлов.
    3. Внимание! Все дальнейшие упражнения следует выполнять, имея в качестве активной директорию Practice5.

    4. Некоторые способы облегчения работы в командной строке.

  2. Построить и сравнить оптимальные глобальное и оптимальное локальное выравнивание 2-х последовательностей
    1. Построить полное (глобальное) оптимальное выравнивание с помощью программы needle пакета EMBOSS
    2. Пользуясь программой seqret, создайте файл с последовательностью белка, родственного вашему (см. упр. 2 выше).

      Постройте полное оптимальное выравнивание двух белков — вашего и родственного. Для этого выполните команду:

       needle x.fasta y.fasta z.needle -auto
      
      где вместо x.fasta и y.fasta должны стоять имена файлов с последовательностями белков, вместо z.needle — какое-нибудь новое имя файла (желательно окончание .needle). Файл с этим именем должен появиться в соответствующей директории диска H. Просмотрите его содержимое и опишите в протоколе, какого рода информацию содержит этот файл.

      Задание штрафов за гэпы, отличных от заданных по умолчанию. Повторите предыдущую команду (можно воспользоваться клавишей "стрелка вверх"), но измените имя выходного файла и опустите опцию "-auto". Программа спросит Вас о значениях параметров. Дайте параметрам вдвое большие значения, чем заданные по умолчанию (сообщаются в квадратных скобках). Изменилось ли выравнивание из-за изменения параметров?

      Получение выдачи в формате, пригодном для импорта в GeneDoc. Запустите программу needle (см. выше), добавив опцию "-aformat msf"; название выходного файла должно кончаться на .msf. Откройте полученный файл программой GeneDoc.

    3. Построить локальное (частичное) оптимальное выравнивание тех же последовательностей с помощью программы water пакета EMBOSS
    4. Синтаксис такой же как при вызове программы needle. Не забывайте при изменении параметров сохранять результат в файле с новым именем.

    5. Сравнить полученные выравнивания
    6. Вы получили несколько разных выравниваний для двух последовательностей.
      Сравнение выравниваний — это не только и не столько сравнение количественных параметров выравниваний, сколько выяснение того, насколько одинаково сопоставление остатков одной последовательности остаткам второй.
      Поэтому прежде всего ответьте на следующие вопросы
      В отчете приведите конкретные ответы на вопросы, указывайте №№ позиций в последовательностях (их легко определить с помощью GeneDoc).
      Прикрепите к тексту выходные файлы с выравниваниями, хорошо также, если прямо в текст вставлены выравнивания, иллюстрирующие ответ. Это можно легко сделать с помощью тега преформатированного текста (<PRE>... </PRE>).
      Не требуется описание всех различий, достаточно примеров, иллюстрирующих выводы и наблюдения.
      Не забудьте указывать тип выравнивания и параметры!
      Любые дополнительные наблюдения, соответствующие полученным данным, только приветствуются!


    Дополнительные задания

    1. Построить карту локального сходства заданных последовательностей с помощью программы dotmatcher пакета EMBOSS
    2. Получить несколько субоптимальных локальных выравниваний заданных последовательностей с помощью программы matcher пакета EMBOSS. Выбрать лучшие из них, в которых фрагменты последовательностей не совпадают с выровненными фрагментами в оптимальном выравнивании.
    При выполнении дополнительных упражнений используйте подсказки EMBOSS
     команда -help
    Результаты и их обсуждение представить на страничке отчета.