Занятие 8. Множественное выравнивание последовательностей




Множественное выравнивание последовательностей

  1. Muscle и GeneDoc
  2. Выравнивание вирусных белков, называемых "малыми дельта-антигенами",
    полученное посредством программы muscle

    Этапы получения выравнивания:

    1. В SRS создается запрос к банку Swiss-Prot:
      Taxonomy:Deltavirus
      Description:small&delta&antigen
      Сохраняются найденные последовательности в формате fasta (в файле delta.fasta).
    2. Выравниваются импортированные последовательности программой muscle:
      muscle -in delta.fasta -out delta.afa
    3. Импортирование fasta-файла в GeneDoc:
      File→Import→Fasta→Import→delta.afa→Done
    4. Подбор раскраски консервативных и функционально консервативных позиций
      Настрой раскраски:
      Project→Configure→Shade
      Выбрано 4 уровня консервативности:
      Чем темнее оттенок синего цвета, тем более консервативный участок: Primary Colors(100% консервативных остатков)
      Secondary Colors(80% консервативных остатков)
      Tertiary Colors(60% консервативных остатков)
      Base Colors(>60% консервативных остатков)
      Комментарий к выравниванию:
      Над выравниванием цифры обозначают номера столбцов, причем именно последняя цифра в номере стоит напротив указываемого столбца (отмечают каждый двадцатый столбец). Символы "*", расположенные также над выравниванием, указывают на каждый десятый столбец выравнивания. Цифры справа от выравнивания отмечают реальный номер последнего остатка в каждой строке. А цифры под некоторыми консервативными столбцами - функционально консервативные позиции. Под выравниванием заглавными буквами отмечены столбцы с консервативностью в них, равной 100%, а малыми буквами соответственно с консервативностью в данном столбце, равной 80% (в данном выравнивании при соотношении числа одинаковых букв к отличным от них 14:3).
    5. Настройка ширины блоков:
      Project→Configure→Seq Block Sizing→Screen Size
    6. Копирование блоков в буфер как картинку:
      Edit→Select Blocks for Copy→Edit→Copy Selected Blocks to MetaFile→Paint or etc.(окончательный вид изображения в Gene1.msf)

  3. Выравнивание набора гомологов своего белка
  4. В результате отбора наиболее подходящих гомологов моего белка, не из слишком родственных организмов, были найдены 9 белков с E-value <0.001 и процентами идентичности из интервала 80-40%, и было построено множественное выравнивание их последовательностей с последовательностью моего белка посредством программы muscle:

    Описание структуры выравнивания:

    1. Участки с повышенной долей консервативных позиций:
      столбцы с 13 по 29, остатки моего белка с G по Y;
      а также столбцы с 43 по 56, остатки с V по I
    2. Участок с высоко консервативными позициями, расположенными через небольшой интервал:
      столбцы с 62 по 78, остатки с I по L моего белка
    3. В качестве участка с недостоверным выравниванием, не имеющим биологического смысла, можно выделить:
      столбцы 38 и 90, где в последовательности моего белка стоит гэп и выравнивание осуществляется между гомологами
    4. Группы сходных аминокислот, образующих в моем выравнивании функционально консервативные позиции:
      ароматические ак: F-Y;Y алифатические, гидрофобные ак: V-I-L(3);A(5);I-V-L-M;I-L(2);V(2);G(5);I-M;M;L-M;V-L гидрофильные ак: S-T(3);P;Q;T(2);S(2);D-N;K(2);E(3)
    5. Группы, встретившиеся среди функционально консервативных позиций больше всего раз:
      из гидрофобных:Val-Ile-Leu;Ala;Gly
      из гидрофильных:Ser-Thr;Glu
    6. При добавлении к группам новой, состоящую из аспартата и глутамата, появились новые функционально консервативные позиции с координатами: 10-11;61;67;72-73;89

  5. *Другие программы множественного выравнивания
    1. Выравнивание последовательностей моего белка и его гомологов с помощью программы mafft немного, но отличается от выравнивания программой muscle на следующих участках: столбцы с 36 по 38, где просто отличается положение гэпов, но на консервативность участка не влияет, а также столбцы с 85 по 90, где помимо изменения положения гэпов меняется и консервативность участка: появляется столбец с 60%-ой консервативностью за счет E-Glu
    2. Тоже операции, но с помощью программы edialign выдали выравнивание, которое отличается от результата программы mafft следующим: 1.расположение гэпов в столбцах с 36 по 38 без изменения консервативности; 2.смещение к С-концу всех последовательностей, кроме 7-ой - там К(Lys) остается на месте, следоваетельно появляется почти целая колонка гэпов и увеличивается длина выравнивания с 90 до 91, а также исчезает столбец с 60%-ой консервативностью соответственно из Lys и меняется состав такого же консервативного столбца теперь на 88-ой позиции: вместо V(Val) стоит I(Ile)
      По сравнению с выравниванием программой muscle по первому пункту они идентичны с программой edialign, а по второму отличаются также, как и с результатом программы mafft

    ©Андреянова Екатерина