Практикум 11. Гомология и выравнивание

1. Выбор семейства белковых доменов из базы Pfam

Для выполнения практикума мне было необходимо выбрать семейство белковых доменов из базы Pfam. У выбираемого домена должно быть более 20 последовательностей в выравнивании seed и хотя бы 3 структуры.

Я выбрала семейство белковых доменов со следующими характеристиками (характеристики заполнены по таблице 2023 года, из которой нужно было выбрать семейство):

AC: PF00105

ID: zf-C4

Summary name: Zinc finger, C4 type (two domains)

Pfam summary: In nearly all cases, this is the DNA binding domain of a nuclear hormone receptor. The alignment contains two Zinc finger domains that are too dissimilar to be aligned with each other.

Seed: 26

Structure: 212

2. Описание выравнивания белковых доменов с точки зрения гомологичности всех последовательностей или их подмножества

Информация Комментарий
Выравнивание seed число последовательностей - 26; число колонок - 74; минимальная длина последовательности - 69, максимальная - 72, а средняя - 70;
Максимальный достоверный блок, включающие ВСЕ последовательности (МДБ-all) 56 - 72
100% консервативные колонки в МДБ-all 56:R, 59:C, 62:C, 63:R, 66:[KR], 67:C, 71:G, 72:M
Максимальный достоверный блок, включающий НЕ ВСЕ последовательности. (МДБ-notAll)
Если есть другие максимальные блоки с тем же подмножеством последовательностей, то опишите их.
Коордтинаты: 3 - 29
Все последовательности, кроме:
TLL_DROME/32-103
EGON_DROME/3-73
KNIR_DROME/3-73
Нет, там мешает гэп (в это подмножество входит последовательность, которую нужно было бы удалить из выборки, чтобы строить блок сопоставимой с уже описанным блоком длины по тому же подмножеству последовательностей). Второй блок в любом случае будет короче чем приведенный МДБ (not all). Так как первая и последняя колонки должны быть абсолютно (функционально) консервативны, то границы любого МДБ можно довольно быстро прикинуть. Если бы не было блока с координатами 3-29, то это был бы блок с координатами 49-72 и другим набором последовательностей.
100% консервативные колонки в МДБ-notAll (3:C), (5:[VI]), (6:C), (8:D), (14:H), (20:C), (23:C), (24:R), (26:F), (27:F), (28:[KR]), (29:R)
Участок выравнивания, в котором нет никаких достоверных подблоков, и потому маловероятно, что выравнивание на этом участке отражает ход эволюции. 30-49 Проверка сработала (да, каждая группа состоит из индивидуальной последовательности).

Проект jalview доступен по ссылке.