Для практикума я выбрал семейство доменов NACHT_sigma.
Карта локального сходства белков с разной доменной архитектурой.
Для построения карты я выбрал белки G9MXQ8_HYPVG (вертикальная ось) и F9G5Y8_FUSOF (горизонтальная ось). На позиции 357 имеется единственный гэп, который свидетельствует об однонуклеотидной делеции (в G9MXQ8_HYPVG) или инсерции (в F9G5Y8_FUSOF).
Для определения подгрупп доменов я использовал метод построения филогенетического дерева и объединения близкородственных белков. Практически все из 180 последовательностей распределились по двум группам. В проекте первая группа выделена голубым цветом, вторая — розовым.
Таблица с белками, содержащими домен PF17106, доступна по ссылке.
Нетрудно заметить, что из 338 белков только для девяносто восьми, исходя из названия, показано присутствие NACHT-домена; из них 76 имеют полную сигма-форму домена и 2 — фрагментарную. К слову, среди всех этих белков для 16 экземпляров характерно наличие доменов с анкириновыми повторами. Эти повторы в норме встречаются в белках-анкиринах, участвующих в присоединении других белков к клеточной мембране. Кроме того, в выборке содержатся 180 неохарактеризованных белков (Uncharacterized protein).