Практикум 11.

1. Выбор семейства доменов.

Выбор был сделан случайным образом. Все ограничения соблюдены.

2. Описание семейства доменов

  1. Название: AbiJ N-terminal domain 3
    ID: AbiJ_NTD3
    AC: PF18860
    Функция домена: Присутствует в огромном разнообразии систем защиты и реагирования на стресс в организме; выполненяет основные функции, в частности обработывает эукариотический рРНК.[1]
  2. Full: 195
    Seed: 63
  3. Число доменных архитектур: 11
  4. Две доменные архиектуры:
    • Q99QL8_STRCO, 102 белка.
    • F3Z3D4_DESAF, 62 белка.
  5. Число белков с 3D структурой: 0
  6. Таксономия: все белки домена принадлежат 4 типам:
    • тип Actinobacteria (45 белков)
    • тип Proteobacteria (48 белков)
    • тип Bacteroidetes (21 белок)
    • тип Firmicutes (19 белков)
  7. Дата создания: Wed Oct 13 18:10:51 2021
    Число позиций: 167

3. Карта локального сходства(Dot Plot) двух белков.

Были выбраны два белка: F3Z3D4_DESAF и Q99QL8_STRCO. По результатам работы программы BLAST можно предположить, что в эволюции от последнего общего предка произошел ряд вставок и/или делций.

Белочки
Рис.1 Карта локального сходства двух белков (F3Z3D4_DESAF и Q99QL8_STRCO) с разной доменной архитектурой

4. Выделение на основании сходства двух подгрупп доменов Pfam.

Сначало было скачано выравнивание содержащее 195 последовательностей (full) формата FASTA. Потом были убраны избыточные последовательности (порог идентичности 90%), всего осталось 155.
Далее было построено филогенетическое дерево белков вравнивания. Из этого дерева были выбраны две сестренские ветви — зеленого и розового цвета. Стоит уточнить, что всего получилось 2-е больших группы и 6 маленьких (3 и менее белков).

Зеленая группа отличается от розовой тем, что на 34, 94, 119, 155, 175, 190, 230 позициях содержит положительно заряженую аминокислоту- аргинин(R); на 38, 82, 83, 99, 145, 148, 164, 165, 191, 194, 219 позициях включает отрацательно заряженные аминокислоты (E, D); на 115, 135, 138 позициях находятся полярные аминокислоты (N,Q,S,T).

Розовая же группа, в свою очередь, отличается от зеленой, тем что содержит аргинин (R) на 161, 256 и 268 позициях; на 35, 270, 275 позициях находятся отрацательно заряженные аминокислоты (E, D); на 138, 145, 162, 195, 225, 257, 264 позициях у этой группы располагаются полярные аминокислоты (N,Q,S,T). Еще одна особенность этой группы заключается в том, что ее белки самые короткие из всего выравнивания.

Следует также обратить внимание на участок с 115 по 120 позиции. В этом месте в состав розовой группы входят пролины и цистеины, а все остальное выравнивание на этом промежутке содержит такие аминокислоты, как аргнин(R), серин(S), лейцин(L), тирозин(Y), фенилаланин(F) и аспаргиновую кислоту(D).

Сылка на проект Jalview

5. Таблица со всеми белками из Uniprot.

В поисковой системе Uniprot был создан запрос: database:(type:pfam pf18860). В качестве последней колонки было выбрано Taxonomic lineage (PHYLUM), т.к. все белки семейства принадлежат бактериям, а на уровне вида начинают быть видны таксономические различия. В резульате были найдены белки с доменом семейства (ознакомится с таблицой можно по ссылке).

Список литературы

  1. Comprehensive analysis of the HEPN superfamily: identification of novel roles in intra-genomic conflicts, defense, pathogenesis and RNA processing Vivek Anantharaman 1, Kira S Makarova, A Maxwell Burroughs, Eugene V Koonin, L Aravind. [https://pubmed.ncbi.nlm.nih.gov/23768067/]