Практикум 11. Гомология и выравнивание


Выбор семейства доменов из Pfam для анализа


Семейство PAN Domain


Семейство PAN содержит консервативный участок из трех дисульфидных мостиков. У некоторых представителей семейства имеется дополнительный четвертый дисульфидный мостик, который соединяет N- и C-концы домена. Эти домены содержатся в различных белках, которые принимают участие в межбелковых и белково-углеводных взаимодействиях. Белки доменов PAN обладают значительной функциональной универсальностью, выполняя различные биологические функции. Домены содержат структуру, напоминающую петлеобразную шпильку.


Репрезентативная структура семества — N-концевой фрагмент (31-127) фактора роста гепатоцитов мыши (3HMR). Структура представляет собой ассиметричный мономер, в качестве лиганда имеется сульфат-группа.

Не
удалось загрузить картинку
Рис. 1. Структура репрезентативного белка 3HMR

Описание выравнивания seed

Выравнивание включает 86 последовательностей и 159 колонок. Максимальный достоверный блок, найденный в выравнивании — 105-107. Он имеет полностью консервативный столбец в начале. Все консервативные на 100% колонки содержат аминокислоту цистеин (48, 52, 72, 105: C). Эта особенность свойственна данным доменам (дисульфидные мостики), что говорит о биологической правильности данных участков выравнивания. Максимальный достоверный блок не по всем последовательностям — 153-155, от 41-й до 86-ой. Первые две колонки блока содержат аминокислоту Y (тирозин), а последняя — аминокислоту Е (глутаминовая кислота). Прочие консервативные колонки: (1:[CG]) (21:L) (44:[ST]) (61:P) (75:F) (77:[YF]) (107:L) (140:[LVI]) (159:[YC]). В колонках 2-12, 24-34, 53-60, 62-71, 80-104, 114-136, 141-149 присутствует большое количество гэпов (длинные индели), а также в них наблюдается очень низкое сходство между аминокислотами. Это говорит о низкой достоверности выравнивания (слабо отражает ход эволюции). Лучше всего данное выравнивание отражает гомологию последовательностей в середине.

Построение карты локального сходства


Я построил локального сходства для белков из разных доменных архитектур: TGF-beta family profile domain-containing protein паразитической нематоды Ancylostoma ceylanicum (ДА: PF00019) и Cytochrome b-c1 complex subunit 8 лучепёрой рыбы Collichthys lucidus (ДА: PF00019 - PF02939). График представляет собой прямую, содержащую два участка разрыва и сдвига, ассоциированных с участками гэпов. Судя по всему, график отражает выравнивание только доменов между собой. Судя по продолжительному линейному участку можно предполагать высокую степень схожести доменов белков, однако это следует проверить, просмотрев выравнивание последовательностей (например, при помощи Jalview.)

  • Таблица
  • Не
удалось загрузить картинку
    Рис. 2. Карта локального сходства.

    Источнки информации

    1. PDB
    2. Pfam
    Контакты: geonosianin@fbb.msu.ru Светлая тема Тёмная тема Классическая тема