Занятие 8. Множественное выравнивание последовательностей
Множественное выравнивание последовательностей
- Muscle и GeneDoc
Выравнивание вирусных белков, называемых "малыми дельта-антигенами",
полученное посредством программы muscle
Этапы получения выравнивания:
- В SRS создается запрос к банку Swiss-Prot:
Taxonomy:Deltavirus
Description:small&delta&antigen
Сохраняются найденные последовательности в формате fasta
(в файле delta.fasta).
- Выравниваются импортированные последовательности программой
muscle:
muscle -in delta.fasta -out delta.afa
- Импортирование fasta-файла в GeneDoc:
File→Import→Fasta→Import→delta.afa→Done
- Подбор раскраски консервативных и функционально консервативных позиций
Настрой раскраски:
Project→Configure→Shade
Выбрано 4 уровня консервативности:
Чем темнее оттенок синего цвета, тем более консервативный участок:
Primary Colors(100% консервативных остатков)
Secondary Colors(80% консервативных остатков)
Tertiary Colors(60% консервативных остатков)
Base Colors(>60% консервативных остатков)
Комментарий к выравниванию:
Над выравниванием цифры обозначают номера столбцов, причем именно
последняя цифра в номере стоит напротив указываемого столбца
(отмечают каждый двадцатый столбец). Символы "*", расположенные
также над выравниванием, указывают на каждый десятый столбец
выравнивания. Цифры справа от выравнивания отмечают реальный
номер последнего остатка в каждой строке. А цифры под некоторыми
консервативными столбцами - функционально консервативные позиции.
Под выравниванием заглавными буквами отмечены столбцы с консервативностью
в них, равной 100%, а малыми буквами соответственно с консервативностью
в данном столбце, равной 80% (в данном выравнивании при соотношении
числа одинаковых букв к отличным от них 14:3).
- Настройка ширины блоков:
Project→Configure→Seq Block Sizing→Screen Size
- Копирование блоков в буфер как картинку:
Edit→Select Blocks for Copy→Edit→Copy Selected Blocks
to MetaFile→Paint or etc.(окончательный вид изображения в Gene1.msf)
- Выравнивание набора гомологов своего белка
В результате отбора наиболее подходящих гомологов моего белка,
не из слишком родственных организмов, были найдены 9 белков с
E-value <0.001 и процентами идентичности из интервала 80-40%, и
было построено множественное выравнивание их последовательностей
с последовательностью моего белка посредством программы muscle:
Описание структуры выравнивания:
- Участки с повышенной долей консервативных позиций:
столбцы с 13 по 29, остатки моего белка с G по Y;
а также столбцы с 43 по 56, остатки с V по I
- Участок с высоко консервативными позициями, расположенными
через небольшой интервал:
столбцы с 62 по 78, остатки с I по L моего белка
- В качестве участка с недостоверным выравниванием,
не имеющим биологического смысла, можно выделить:
столбцы 38 и 90, где в последовательности моего
белка стоит гэп и выравнивание осуществляется между гомологами
- Группы сходных аминокислот, образующих в моем выравнивании
функционально консервативные позиции:
ароматические ак: F-Y;Y
алифатические, гидрофобные ак: V-I-L(3);A(5);I-V-L-M;I-L(2);V(2);G(5);I-M;M;L-M;V-L
гидрофильные ак: S-T(3);P;Q;T(2);S(2);D-N;K(2);E(3)
- Группы, встретившиеся среди функционально консервативных позиций
больше всего раз:
из гидрофобных:Val-Ile-Leu;Ala;Gly
из гидрофильных:Ser-Thr;Glu
- При добавлении к группам новой, состоящую из аспартата и глутамата,
появились новые функционально консервативные позиции с координатами:
10-11;61;67;72-73;89
- *Другие программы множественного выравнивания
- Выравнивание последовательностей моего белка и его гомологов
с помощью программы mafft немного, но отличается от выравнивания
программой muscle на следующих участках: столбцы с 36 по 38,
где просто отличается положение гэпов, но на консервативность
участка не влияет, а также столбцы с 85 по 90, где помимо изменения
положения гэпов меняется и консервативность участка: появляется
столбец с 60%-ой консервативностью за счет E-Glu
- Тоже операции, но с помощью программы edialign выдали выравнивание,
которое отличается от результата программы mafft следующим:
1.расположение гэпов в столбцах с 36 по 38 без изменения консервативности;
2.смещение к С-концу всех последовательностей, кроме 7-ой - там К(Lys)
остается на месте, следоваетельно появляется почти целая колонка гэпов
и увеличивается длина выравнивания с 90 до 91, а также исчезает
столбец с 60%-ой консервативностью соответственно из Lys и меняется
состав такого же консервативного столбца теперь на 88-ой позиции:
вместо V(Val) стоит I(Ile)
По сравнению с выравниванием программой muscle по первому пункту
они идентичны с программой edialign, а по второму отличаются
также, как и с результатом программы mafft
©Андреянова Екатерина