1. Выбор семейства белковых доменов из базы Pfam.
Критерии выбора:
- Более 20 последовательностей в выравнивании seed (колонка #seed).
- Хотя бы 3 структуры (колонка #structures).
- Желательно подробное саммари (колонка #pfam summary).
Руководствуясь этими критериями отбора, из списка доменов Pfam на апрель 2023 был выбран домен
со следующими AC и Summary name:
AC: PF00072; Summary name:
Response regulator receiver domain (домен регулятора отклика).
Этот домен принимает сигнал от сенсорного партнера в бактериальных двухкомпонентных системах.
Обычно он находится на N-конце ДНК-связывающего эффекторного домена. Он имеет 52 последовательности
в выравнивании seed, 145 колонок и 790 структур.
2. Скачивание выравнивания домена.
Чтобы скачать выравнивание домена, я выполнила следующую последовательность действий:
В JalView выполнить File → Fetch sequences → в меню Select Database выбрать PFAM (Seed) →
ввести в окошко AC домена (PF15005) → OK.
3. Описание выравнивания белковых доменов с точки зрения гомологичности всех последовательностей.
1. Выбор максимально достоверного блока (МДБ) на всех последовательностях.
Можно предположить, что МДБ этого выравнивания, включающий все последовательности, находится от
1 колонки до 6-ой. К сожалению, в блоке нет абсолютно консервативных колонок, однако есть следующие
колонки с высокой косервативностью:
- В шестой колонке в 48 из 52 позиций аспарагиновая кислота (D).
- В пятой колонке в 51 из 52 позиций аспарагиновая (D) и глутаминовая кислота (E).
- В первой колонке в 46 из 52 позиций валин (V) и изолейцин (I).
Поэтому можно утверждать, что блок является достоверным:
первая и последняя колонки консервативны, отсутствуют гэпы.
Блок максимален - его нельзя расширить без потери достоверности.
2. Выбор максимально достоверного блока (МДБ) не на всех последовательностях.
Я заметила подходящий консервативный участок из 8 колонок с номерами 125-133. Среди них была абсолютно консервативная колонка 132,
в ней на всём выравнивании был лизин. Путём выделения последовательностей и их передвижением вверх/вниз стрелками, я отделила те последовательности,
которые содержали в 125 колонке глицин, а в 133 пролин, чтобы расширить блок. В получившимся МДБ с 19 по 52 последовательность
в колонках 125-133 не было гэпов, а несколько
колонок "внутри" блока были функционально консервативными, о чем можно судить по окрашиванию Clustal блока.
3. Выбор участка выравнивания, на котором нет оснований считать, что выравнивание отражает ход эволюции.
В блоке на всех последовательностях из колонок 49-61 полностью отсутствуют консервативные участки (а именно участки, которые бы покрасились при
Color → Percentege Indentity → Above identity threshold (0%))
а так же есть множество гэпов в колонках 49-52 и 57-61. Есть все основания полагать, что выравнивание на данном участке
не отражает ход эволюции.
4. Ссылки