Практикум 11

Практикум по множественному эволюционному выравниванию белковых доменов

Для проведения выравнивания было выбрано семейство белковых доменов из базы данных Pfam с AC PF01585 (G-patch domain). Результаты анализа множественного выравнивания приведены в таблице 1.

Таблица 1. Данные множественного выравнивания белковых доменов из семейства тРНК-синтетаз второго класса.
Название Информация Комментарии
Выравнивание seed sequences: 45 columns: 59 Количество последовательностей в этом семействе белковых доменов равно 45, количество колонок в выравнивании равно 59
All 52k Число всех белков с доменом семейства равно 52
Swissprot 184 Число белков с доменом Swissprot равно 184
architectures 1018 Число разных доменных архитектур равно 1018
3D 17 Число доменов с известной 3D структурой.
Taxonomy eukaryota: 51945 archaea: 0 bacteria: 0 viruses: 54 Число всех белков с доменом семейства по супер-царствам. Делки с данным доменом известны только среди эукариот и вирусов.

Описание выравнивания белковых доменов

Данные приведены в таблице 2.

Таблица 2. Данные множественного выравнивания белковых доменов из семейства тРНК-синтетаз второго класса.
Название Информация Комментарии
Выравнивание seed sequences: 45 columns: 59 Количество последовательностей в этом семействе белковых доменов равно 45, количество колонок в выравнивании равно 59
Максимальный достоверный блок, включающие все последовательности (МДБ-all) columns: 3-14 Максимальный достоверный блок данного выравнивания выделяется между 3-14 колонками.
100% консервативные колонки в МДБ-all 13:G, 24:G 13-ая и 24-ая колонки выравнивания являются абсолютно (100%) консервативными и состоят только из гилцина.
Максимальный достоверный блок, включающий не все последовательности (МДБ-notAll) columns: 5-13 sequences: 1-32 Максимальный достоверный блок, включающий не все последовательности, состоит из колонок 5-13 включительно, а также из последовательностей 1-32 включительно
100% консервативные колонки в МДБ-notAll 5:[G], 13:[G], 24:[G] В МДБ-notAll указаны только 100%-консервативные колонки, в скобках указана соответствующая единственная аминокислота, из которой состоит колонка выравнивания
Участок выравнивания, в котором нет никаких достоверных подблоков, и потому маловероятно, что выравнивание на этом участке отражает ход эволюции. columns: 25-54 Такой блок состоит, например, из колонок с 25 по 54 включительно. По результатам сортировки по группам в нём не было выявлено ни одной группы, состоящей более чем из одной последовательности, следовательно, данный блок является недостоверным
Ссылка на проект в Jalview.

Карта локального сходства (dotplot)

Данные приведены в таблице 3.

Таблица 3. Таблица локальных свойств двух последовательностей с одним и тем же доменом, но с разной доменной архитектурой.
Название Информация Комментарии
Доменная архитпектура 1 PF01585 - PF13821 Последовательность AC доменов, входящих в состав доменной архитектуры.
Белок с архитектурой 1 DUF4187 AC белка для данной доменной архитектуры
Доменная архитпектура 2 PF12457 - PF01585 - PF07842 Последовательность AC доменов, входящих в состав доменной архитектуры.
Белок с архитектурой 2 Q9Y103 AC белка для данной доменной архитектуры

Представленный график Dot Plot подтверждает гомологию исследуемых белков по ключевому домену, что отражено в виде основной длинной диагонали. Наличие небольшого разрыва в этой линии свидетельствует о локальной инсерции или делеции в одной из последовательностей. При этом наличие второй короткой параллельной линии в нижней части графика прямо указывает на различия в доменной архитектуре: данный участок свидетельствует о повторе мотива или наличии дополнительного сходного фрагмента, который отсутствует в том же месте у второй последовательности. Значительная разница в масштабах осей подтверждает, что один из белков обладает большей длиной и, вероятно, содержит дополнительные структурные элементы, что полностью соответствует условию задачи о сравнении белков с разной архитектурой при наличии общего домена.