- Muscle и GeneDoc
Задача – получить выравнивание вирусных белков, называемых "малыми дельта-антигенами", посредством программы muscle (читается "масл") и посмотреть на него в GeneDoc.
Легенда:
Колонка слева - AC антигена, справа - номер последнего остатка в строке выравнивания.
Цвет указывает процент сходных остатков в столбце:
тёмно-зелёный - 100%,
зелёный - 80%,
желто-зелёный - 60%.
Каждый десятый столбец маркируется. Чётные - номером, нечётные - звёздочкой. Это по умолчанию, но можно и по-другому настроить.
Большая буква под столбцом указывает на 100% идентичность, маленькая на ≥ 80%, цифры - на принадлежность всех остатков в столбце одной группе сходства(1: DN, 2: EQ, 3: ST, 4: KR, 5: FYW, 6: LIVM)
- Выравнивание набора гомологов DhbE
Легенда:
Гомологи:
Цвет указывает процент сходных остатков в столбце:
тёмно-зелёный - 100%,
зелёный - 80%,
желто-зелёный - 60%.
a.Структура выравнивания.
Участки с повышенной долей консервативных позиций (в координатах выравнивания/координатах DhbE):
198-220/189-211
α-спираль, соединяющая 2 домена и петля, закрывающая вход в активный центр.
278-299/265-286,
311-321/296-306
Участки β-листа недалеко от активного центра
346-358/330-338
Контактирующий с лигандом β-поворот
397-548/376-526
Маленький домен, контактирующий петлёй с активным центром.
Участок, где выравнивание недосоверно и, скорее всего, не имеет биологического смысла (в координатах выравнивания/координатах DhbE):
122-189/120-180
Так как в белке DhbE это петля, идущая по поверхности.
b.Консервативные аминокислоты.
В данном выравнивании все группы сходных аминокислот образуют функционально консервативные позиции(1: DN, 2: EQ, 3: ST, 4: KR, 5: FYW, 6: LIVM). Больше всего раз среди функционально консервативных позиций встретилась группа 6(LIVM) - 73%, встречаемость других групп не превышает 7%. Всего функционально консервативных позиций позиций: 58.
Круговая диаграмма встречаемости групп сходных аминокислот в выравнивании
При добавлении новой сходной группы 7: DE образовались 4 функционально консервативные позиции в координатах выравнивания/координатах DhbE:
225/206,
441/420,
451/430,
532/510
- Другие программы множественного выравнивания: edialign и mafft
Полученные мной выравнивания примерно совпадают только на первых двух сотнях остатков, а дальше отличаются как друг от друга, так и от выравнивания, выданного muscle (хотя в mafft я поставила такие же значения штрафоф за гэпы)
Выдача edialign:
Выдача mafft:
- Знакомство с некоторыми программами обработки множественных выравниваний: consambig, distmat и plotcon.
a. Consambig: анализирует консервативность выравнивания.
Анализ консервативности выравнивания.
Маленькие буквы там, где в выравнивании есть гэпы, большие буквы из однобуквенных названий а. к. - 100% консервативности, не Х и не обозначения а.к( Z, J, B и т. д) - разные группы сходных аминокислот на консервативных позициях, Х - другое.
b. Distmat: рисует матрицу расстояния межру семи последовательностями из выравнивания попарно.
Расстояние измеряется в количестве замен на 100 остатков.
c. Plotcon: рисует график степени консервативности вдоль выравнивания.