Занятие 8. Множественное выравнивание последовательностей.

Ваша рабочая директория — H:\Term2\Block2\Practice8, в ней храните все рабочие файлы.
Формат отчета — HTML-страничка со ссылкой со страницы второго семестра.
Срок — утро дня следующего занятия.

  1. Muscle и GeneDoc
  2. Задача – получить выравнивание вирусных белков, называемых "малыми дельта-антигенами", посредством программы muscle (читается "масл") и посмотреть на него в GeneDoc.
    1. Используя SRS, получите файл с последовательностями малых дельта-антигенов в формате fasta, см. указания.
    2. Импортируйте файл в GeneDoc. Это невыровненные последовательности. Попробуйте на глаз определить, где нужно вставить пробелы, чтобы гомологичные остатки оказались в одной колонке.
    3. Постройте выравнивание, см. указания. Посмотрите на содержимое полученного файла (например, <F3> в Far manager), чтобы представлять, как выглядит выравнивание в fasta-формате.
    4. В GeneDoc заведите новый проект (File→New) и импортируйте выравнивание. Подберите по своему вкусу раскраску консервативных и функционально консервативных позиций. В отчёте приведите изображение выравнивания (из GeneDoc), с описанием того, что это такое и как получено, а также что означают цвета, цифры, звёздочки, большие и малые буквы внизу. Сохраните в рабочей директории выравнивание с раскраской GeneDoc в файле delta.msf.

  3. Выравнивание набора гомологов своего белка
  4. Получите 5–10 гомологов своего белка, используя BLAST на NCBI, см. указания. Выборка должна быть достаточно представительной, то есть не состоять только из очень похожих последовательностей.

    Постройте множественное выравнивание своего белка и всех найденных гомологов. Импортируйте выравнивание в GeneDoc. Постарайтесь описать в отчёте структуру выравнивания: есть ли участки с повышенной долей консервативных позиций? Где они находятся (нужно указать координаты как по столбцам выравнивания, так и по остаткам вашего белка)? Есть ли участки, где выравнивание недостоверно, то есть скорее всего не имеет биологического смысла (если есть, укажите их координаты)?

    Укажите также, какие группы сходных аминокислот образуют в вашем выравнивании функционально консервативные позиции. Какая группа (или какие две-три группы) встретилась среди функционально консервативных позиций больше всего раз? Добавьте к группам новую, состоящую из аспартата и глутамата. Появились ли новые функционально консервативные позиции?

    Файл в формате msf должен остаться в рабочей директории.
     

  5. (* дополнительное) Другие программы множественного выравнивания
  6. Попробуйте разобраться с другими программами выравнивания, установленными на kodomo, а именно mafft и/или edialign. Чтобы получить подсказку по mafft, достаточно выполнить команду
     mafft -help
    
    для edialign можно поступить аналогично (только имейте в виду, что help длинный и обычно его начало, то есть самая нужная часть, вылезает за пределы окна Putty), а можно просто выполнить команду "edialign" без параметров и ответить на задаваемые программой вопросы. Программа edialign принимает один входной файл и выдаёт два выходных файла, из который первый содержит "текст для чтения", а второй — выравнивание в fasta-формате (поэтому только второй пригоден для обработки другими программами, например для импорта в GeneDoc).

    Сравните выравнивания, выданные разными программами – совпали ли они?
     

  7. (* дополнительное) Знакомство с некоторыми программами обработки множественных выравниваний
  8. Попробуйте самостоятельно освоить программы consambig, distmat и plotcon. Все эти программы входят в пакет EMBOSS (как и needle, water, edialign, но не muscle и mafft), поэтому их можно запускать в интерактивном режиме (выполнить соответствующую команду без параметров и затем отвечать на вопросы). Чтобы прочитать подробное описание программы из EMBOSS, выполните команду tfm с параметром — именем программы, например
     tfm distmat
    
    описание листается как выдача программы more — клавишами "пробел" и "Enter", выход — клавиша "q".

    Если дойдёте до программы "plotcon", то имейте в виду, что это программа с графической выдачей, поэтому на вопрос "Graph type" нужно отвечать не по умолчанию ("x11", в этом случае программа попытается выдать картинку на экран монитора, но не сможет этого сделать, так как связь посредством Putty этого не позволяет), а указать один из возможных форматов выходного файла: "data", "ps", "gif", "png", "pdf". Если указать "data", программа сформирует текстовый файл с таблицей, пригодный для импорта в Excel. В остальных случаях будет создан графический файл соответствующего формата.

    Посмотреть список программ пакета EMBOSS, имеющих отношения к выравниваниям, можно, выполнив команду

     wossname alignment