Отчёт по практической работе №10

Для изучения было выбрано семейство белков, содержащих цинковый палец C3HC4-типа - RING-finger (Pfam AC: PF00097, ID: zf-C3HC4, полное название: Zinc finger, C3HC4 type (RING finger)). Домены этого семейства представляют собой цистеин-богатые цинковые пальцы, содержащие мотив C3HC4 и позиционирующие 2 иона цинка. Этот домен обеспечивает белок-белковые взаимодействия и многие белки, содержащие его, участвуют в процессе убиквитинирования белков. Так, большая часть убиквитинлигаз человека представлена белками, содержащими этот домен. В Pfam выравнивание seed этого домена содержит 26 последовательностей, а выравнивание full - 53842 (при этом всего этот домен содержат примерно 95000 белков).

В данном семействе было выбрано подсемейство белков с доменной архитектурой PF18044 - PF14608 - PF00097 - PF14608 - PF15815. Репрезентативным белком этого подсемейства является MKRN3 человека (UniprotKB AC: Q13064) - РНК-связывающая E3 убиквитинлигаза, обеспечивающая непосредственно перенос полиубиквитиновой цепи на мишень и играющая ключевую роль в регуляции инициации полового созревания.

Последовательности 37 белков этого подсемейства были выровнены с помощью программы MAFFT. Построенное выравнивание позволило определить последовательности домена RING, характерные для данного подсемейства (см. рис. 1).

Рис. 1. Выравнивание последовательностей белков выбранного подсемейства позволило выделить последовательности, присущие цинковым пальцам C3HC4-типа белков из данного подсемейства. RING-домену соответствуют позиции 428-535 выравнивания

По выделенному выравниванию доменов с помощью программы hmmbuild был построен HMM-профиль RING-домена данного подсемейства. Использовалась следующая команда:

hmmbuild --amino hmm.res ring_domain.fasta

Рассматриваемое семейство включает примерно 95000 белков. Interpro не способен сгенерировать fasta-файл, содержащий всех их. Поэтому поиск было решено провести по белкам млекопитающих (белки выбранного подсемейства присущи лишь млекопитающим). Таких последовательностей нашлось 10912. Поиск по ним был осуществлен с помощью программы hmmsearch:

hmmsearch -o ring_res.out hmm.res ring_mammals.fasta

В результате были найдены все 37 белков, по которым было построено выравнивание последовательностей домена (см. табл. 1). Их веса варьируются от 215.4 до 231.1 (находки с максимальным весом - 232.4 - не было в изначальном выравнивании). Всего находок с весом 215.4 и меньше - 112. Белки с нашей доменной архитектурой составляют менее трети от этого количества. При этом большая часть находок из изначального выравнивания (35) имеет вес больше или равный 221.4. Именно такой порог наиболее оптимален для выделения нашего подсемейства, т.к., с одной стороны, он ввключает подавляющее число его представителей (94.6%), с другой - выделяет группу находок, на 61.4% состоящую из белков изучаемого подсемейства.

Табл. 1. Численные характеристики выделения подсемейства построенным HMM-профилем
Реальная принадлежность подсемейству
+ -
Предсказанная принадлежность подсемейству (вес >= 221.4) + 35 22
- 2 751

Стоит отметить, что результаты поиска можно объяснить присутствием в базе данных Uniprot избыточных (нереференсных) записей и записей с неполными последовательностями белков. Они не попали в выделенное по доменной архитектуре подсемейство, но могут содержать домен, идентичный изучаемому, т.к., опять же, являются продуктами одного и того же гена (или, по крайней мере, гена, гомологичного изучаемому) или фрагментом какого-либо из рассмотренных белков.