1. Выбор семейства доменов
Для выполнения практикума было выбрано семейство гемопексинов. Его характеристики представлены в таблице ниже:
AC pfam | ID pfam | SEED | All | SW | architectures | 3D | eukaryota | bacteria |
---|---|---|---|---|---|---|---|---|
PF00045 | Hemopexin | 76 | 22k | 100 | 486 | 36 | 21787 | 596 |
Гемопексин представляет собой сывороточный гликопротеин, который связывает гем и транспортирует его в печень для расщепления и восстановления железа, после чего свободный белок возвращается в кровоток. Гемопексин связывает гем с наибольшим сродством из всех известных белков. Его основная функция заключается в улавливании гема, высвобождаемого или теряемого в результате оборота гем-белков, таких как гемоглобин, и, таким образом, защищает организм от окислительного повреждения, которое может вызвать свободный гем. Кроме того, гемопексин сохраняет в организме железо.
Структурно гемопексин состоит из двух похожих половинок примерно из двухсот аминокислотных остатков, соединенных богатой гистидином шарнирной областью.
Можно заметить, что это семейство доменов встречается в основном в эукариотических белках, что неудивительно, поскольку гемопексины играют важную роль в организации газообмена и дыхания в живых организмах, а эти процессы более характерны именно для эукариот.
3. Описание выравнивания seed
В выравнивании seed (число последовательностей - 76, число колонок - 57) нет консервативных (как абсолютно, так и функционально) позиций, что говорит об отсутствии максимально достоверного блока для всех последовательностей. Полагаю, это можно объяснить тем, что в выравнивании достаточно много белков из организмов с разрозненным систематическим положением. В качестве максимального достоверного блока (учитывая, что абсолютного нет) я выбрала участок с координатами 20-21. В него входят фрагменты из 63 последовательностей с консервативными позициями: 20:[FLIV], 21:F. Поскольку консервативность позиций не абсолютная, состав последовательностей в участке может варьироваться в зависимости от строгости фильтров.
5. Dot Plot белков с разной доменной архитектурой
Для выполнения данного задания были скачаны последовательности репрезентативных белков Q9W789 и Q4SY27. С помощью BLAST был получен Dot Plot (карта их локального сходства) - Рис. 2. На графике видно попарное сходство доменов PF00413 – диагональ в левом нижнем углу. Также можно увидеть 2 диагонали, которые отражают попарное сходство 3 доменов PF00045 из белка с первой архитектурой и 2 таких же доменов из белка со второй архитектурой. Небольшие разрывы на графике – это индели (делеция в одной последовательности, либо инсерция в другой).