Занятие 9. Множественное выравнивание последовательностей.

Ваша рабочая директория — H:\Term2\Practice9, в ней храните все рабочие файлы.
Формат отчета — HTML-страничка со ссылкой со страницы второго семестра.
Срок — утро дня следующего занятия.

  1. Вспоминаем Muscle и GeneDoc
  2. Задача – получить выравнивание вирусных белков, называемых "малыми дельта-антигенами", посредством программы muscle (читается "массл") и посмотреть на него в GeneDoc.
    1. Получите файл с последовательностями малых дельта-антигенов в формате fasta, см. указания.
    2. Импортируйте файл в GeneDoc. Это невыровненные последовательности. Попробуйте на глаз определить положение пары-тройки пробелов в нескольких последовательностях.
    3. Постройте выравнивание, см. указания. Посмотрите на содержимое полученного файла (например, <F3> в Far manager), чтобы представлять, как выглядит выравнивание в fasta-формате.
    4. В GeneDoc заведите новый проект (File→New) и импортируйте выравнивание. Опишите свои впечатления от сравнения двух картинок.

  3. Выравнивание набора гомологов своего белка
  4. Получите 5–10 гомологов своего белка посредством BLAST на NCBI, см. указания. Выборка должна быть достаточно представительной, то есть не состоять только из очень похожих последовательностей.

    Постройте множественное выравнивание своего белка и всех найденных гомологов. Импортируйте выравнивание в GeneDoc. Постарайтесь описать в отчёте структуру выравнивания: есть ли участки с повышенной долей консервативных позиций? Где они находятся (нужно указать координаты как по столбцам выравнивания, так и по остаткам вашего белка)? Есть ли участки, где выравнивание недостоверно, то есть скорее всего не имеет биологического смысла (если есть, укажите их координаты)?
     

  5. (* дополнительное) Другие программы множественного выравнивания
  6. Попробуйте разобраться с другими программами выравнивания, установленными на kodomo-count, а именно mafft и/или edialign. Чтобы получить подсказку по mafft, достаточно выполнить команду
     mafft -help
    
    для edialign можно поступить аналогично (только имейте в виду, что help длинный и обычно его начало, то есть самая нужная часть, вылезает за пределы окна Putty), а можно просто выполнить команду "edialign" без параметров и ответить на задаваемые программой вопросы. Программа edialign принимает один входной файл и выдаёт два выходных файла, из который первый содержит "текст для чтения", а второй — выравнивание в fasta-формате (поэтому только второй пригоден для обработки другими программами, например для импорта в GeneDoc).

    Сравните выравнивания, выданные разными программами – совпали ли они?
     

  7. (* дополнительное) Знакомство с некоторыми программами обработки множественных выравниваний
  8. Попробуйте самостоятельно освоить программы consambig, distmat и plotcon. Все эти программы входят в пакет EMBOSS (как и needle, water, edialign, но не muscle и mafft), поэтому их можно запускать в интерактивном режиме (выполнить соответствующую команду без параметров и затем отвечать на вопросы). Чтобы прочитать подробное описание программы, выполните команду tfm с параметром — именем программы, например
     tfm distmat
    
    описание листается как выдача программы more — клавишами "пробел" и "Enter", выход — клавиша "q".

    Если дойдёте до программы "plotcon", то имейте в виду, что это программа с графической выдачей, поэтому на вопрос "Graph type" нужно отвечать не по умолчанию ("x11", в этом случае программа попытается выдать картинку на экран монитора, но не сможет этого сделать, так как связь посредством Putty этого не позволяет), а "ps". В этом случае программа сформирует графический файл в формате "PostScript", который можно, например, импортировать в Word.

    Посмотреть список программ пакета EMBOSS, имеющих отношения к выравниваниям, можно, выполнив команду

     wossname alignment
    
    Описание конкретной программы выдаёт программа tfm.