Домены. Pfam. HMM профиль.

Задание 1. Построить выравнивание представителей домена Pfam белков с разной доменной архитектурой.

Характеристика рассматриваемого домена:
  • ID: ADAM_CR

  • AC: PF08516

  • описание домена: ADAM cysteine-rich
    (сокр. A Disintegrin And Metalloproteinase).

    Домен ADAM-протеаз, которые отщепляют внеклеточный фрагмент мембранных белков. ADAM-протеазы участвуют в протеолизе, слиянии клеток, адгезии и передаче сигналов между клетками.

    Домен ADAM_CR усиливает связывающую способность дизинтегринового домена, а также регулирует металлопротеазную активность белка ADAM13.


Рис.1. Строение мембранных белков, содержащих
домен ADAM_CR (cysteine-rich)

В программе Jalview было скачано выравнивание всех последовательностей (File > Fetch Sequences > БД - Pfam (Full) > AC - PF08516). Далее выравнивание было раскрашено по консервативности, а также была добавлена одна 3D-модель (вот полученный проект, а вот он же в fasta-формате).

Доменные архитектуры

В Pfam нашлось 67 доменных архитектур, куда входит ADAM_CR

Характеристика некоторых доменных архитектур:
Доменная архитектура,
её обозначение в выравнивании
Число представителей Характеристика других доменов
Disintegrin,
ADAM_CR

X

55
  • Disintegrin - короткие пептиды (45-84 а.к.о.) из яда змей семейства Гадюковых. Эти пептиды способны ингибировать агрегацию тромбоцитов, тем самым нарушая свёртывание крова, а также ингибируют интегрин-зависимую клеточную адгезию за счёт связывания с интегрином на поверхности клетки.
Pep_M12B_propep,
Reprolysin,
Disintegrin,
ADAM_CR,
EGF_2

Y

160
  • Pep_M12B_propep - пропептид представителей семейства пептидаз М12В.
  • Reprolysin (М12В, также известны как адамализины) - семейство цинк-зависимых металлопептидаз. В основном, представлено эндопептидазами из яда змей семейства Гадюковых, однако есть и некоторые белки млекопитающих (однако их ферментативная активность не доказана).
  • Disintegrin - см. выше
  • EGF_2 - эволюционно консервативный домен, впервые обнаруженый в эпидермальом факторе роста (epidermal growth factor - отсюда название). Встречается в большом количестве белков, в основном, секретируемых в организме животного, или составляют внеклеточные участки мембранных белков.

С помощью скрипта swisspfam_to_xls.py с сайта kodomo был получен файл с информацией о доменной архитектуре каждой из последовательностей.
Командная строка: python swisspfam_to_xls.py -z /srv/databases/pfam/swisspfam.gz -p PF08516 -o ok.xlsx

Далее с помощью различных фильтров доменов были выделены лишь белки, соответствующие выбранным архитектурам. Затем через функцию Retrieve в Uniprot был скачен text-файл, с помощью которого в дальнейшем была найдена таксономия организмов, которым принадлежит белок.
Командная строка: python uniprot_to_taxonomy.py -i fixed.txt -o taxon.txt

Данные из этого файла были добавлены на страницу таблицы Excel с отобранными белками.

Далее от каждого домена было отобрано ~ по 15 белков от типов Ecdysozoa и Chordata (в финальном варианте таблицы Excel зелёным выделены Ecdysozoa, а сиреневым - Chordata). Их последовательности были скачены также через Retrieve в Uniprot.
Итоговый файл Excel: тут.

С помощью программы JalView было построено выравнивание выбранных белков, обрезаны только участки, соответствующие желаемому домену, для наглядности аминокислотные остатки были раскрашены по консервативности. В выравнивании я не стала удалять концевые участки, так как для представителей группы X|Ecdys (белков Ecdysozoa с доменной архитектурой X), если верить выравниванию, характерны протяжённые индели в этих позициях. Эта закономерность показалась мне интересной, поэтому концевые участки остались нетронутыми.
Проект выравнивания выбранных белков: тут.

Задание 2. Построить филогенетическое дерево последовательностей домена.

На основе выравнивания в программе MEGA было построено дерево методом Minimum-Evolution с дополнительным параметром Bootstrap method: 100 реплик.


Рис.2. Филогенетическое дерево

Скобочная формула дерева: здесь.

По полученному дереву сложно однозначно судить о ходе эволюции домена. Однако заметно, что всё дерево можно разделить на клады, составленные, за редким исключением, белками одной доменной архитектуры. Клады с доменной архитектурой Х выделены на Рис.2 зелёным цветом, клады с архитектурой Y - голубым. Можно предположить, что разделение двух доменных архитектур произошло у общего предка Ecdysozoa и Chordata, и эволюция домена шла независимо в рамках своей доменной архитектуры.


© Svetlana Kozyulina 2018