Подсказки к занятию 10

 
     

  1. Как получить эталонное выравнивание из БД SMART?
  2. С главной странички SMART пойдите по гиперссылке "NORMAL" (голубой прямоугольник в левой части страницы).

    Введите в нужное поле код доступа Вашего белка в банке UniProt, затем нажмите кнопку Sequence SMART. Появится страничка со схематичным изображением доменной структуры Вашего белка. Если в Вашем белке несколько доменов, подведите курсор к каждому и оцените длины доменов. Желательно выбрать домен длиной не менее 50 и не более 200 остатков.

    Щелчок по изображению выбранного домена откроет следующую страничку. Она может быть одного из двух типов — со ссылкой на запись самого банка SMART или же со ссылкой на запись банка Pfam.

    В первом случае нажмите кнопку "Family alignment in", предварительно выбрав из меню "MSF format". Во втором случае перейдите по гиперссылке "Pfam entry ...", в разделе "Alignment" выберите "Seed" и "GCG MSF format", затем нажмите "Retrieve alignment".

    Скопируйте из окна браузера текст выравнивания в файл xxx.msf, где xxx - название выбранного Вами домена.

  3. Как сделать свое выравнивание?
  4. В базах SMART и Pfam приведены ID белковых последовательностей, которые могли устареть. Если SRS не находит последовательность по ID, придется взять достаточно длинный кусок последовательности и найти ее в Swiss-Prot с помощью BLASTP.

    Удобно дать на вход SRS все пять ID разом, разделив их знаком | ("или"), а получив таблицу с результатом поиска, воспользоваться кнопкой Save.

    Чтобы выровнять последовательности, находящиеся в файле full_seq.fasta, выполните

     emma full_seq.fasta
    
    после чего отвечайте на вопросы, задаваемые программой. Программа emma по умолчанию выдает выравнивание в формате Fasta (несмотря на то, что расширение выходного файла по умолчанию — ".aln"!). Другой выходной файл (с расширением ".dnd") вам не нужен, можно согласиться с его названием по умолчанию.

  5. Как с помощью GeneDoc быстро создать файл с фрагментом выравнивания?
  6. Внимание! GeneDoc не имеет опции "Undo"! Постоянно сохраняйте Ваш файл!

    Откройте файл benchmark.msf программой GeneDoc. Нажмите <Ctrl+Q> (или в меню: Project → Edit sequence list). Появится окошко для работы со списком последовательностей выравнивания. Выделите и переместите вверх списка понравившиеся Вам названия, а остальные последовательности удалите.

    Возможно, что в выравнивании появятся колонки из одних гэпов. Их можно удалить с помощью кнопок Edit→Clear Gap Columns. Сохраните выравнивание.

    Затем выберите фрагмент выравнивания длиной в 50–80 а.о. Остальные колонки выделите и удалите: Edit→Select Columns; Edit→Delete All Data. Сохраните выравнивание.

  7. Другие подсказки по работе с GeneDoc
  8. Чтобы импортировать в GeneDoc выравнивание из файла в Fasta-формате, выполните File→New, затем File→Import, отмечаете формат Fasta (Pearson), затем Import, Done.

    Чтобы найти нужный участок нужной последовательности, воспользуйтесь Edit→Find

    Чтобы выделить цветом часть последовательности, воспользуйтесь Shade→Manual shade.

    Чтобы экспортировать один или несколько блоков выравнивания, выделите их (Edit→Select Blocks for Copy) и сохраните из в желаемом формате (Edit→Copy Selected Blocks to).