Для данной работы выбрала YodA липокаин-подобный домен. Его Pfam AC PF09223, Pfam ID YodA. Ниже приведено изображение каталитической субъединицы, содержащий данный домен (рис. 1). Страница домена в Pfam. Точная функция домена остается пока неизвестной, но предполагается, что белок является частью бактериальной стресс-системы. Может связываться с кадмием, цинком, никелем и ртутью.
С помощью Jalview загрузила выравнивание домена. Ассоциировала структуру 1OEE c ZINT_ECOLI. Сделала раскраску по ClustalX и консервативность 30. Сохранила выравнивание в формате .fasta и .jar.
Выбрала две доменные архитектуры для дальнейшего изучения - белок с одним доменом YodA, другой - YodA+TroA, TroA - домен, связывающийся с периплазматическим раствором.
Получила таблицу с информацией об архитектуре всех последовательностей, содержащих выбранный домен с помощью скрипта swisspfam_to_xls.py. Составила список последовательностей с указанием доменной архитектуры. Использовала сводную таблицу в Excel: строки – AC последовательностей, столбцы – домены Pfam. Скачала полные записи всех последовательностей из Uniprot, запустила скрипт uniprot_to_taxonomy.py. Перенесла таксономию с основную таблицу. Далее в качестве таксона выбрала царство Bacteria, а в качестве его подтаксонов - Proteobacteria, Firmicutes и Spirochaetes.
Выбрала по 25 последовательностей из каждой выбранной выше архитектуры. С помощью скрипта filter_alignment.py оставила только выбранные последовательности из выравнивания. Далее открыла проект в JalView, удалила пустые колонки, создала группы по архитектурам (сверху находятся последовательности, взятые из белков с одним доменом, внизу - последовательности в архитектуре YodA+TroA), удалила плохо выровненные участки. Сохранила выравнивание в формате .jar. Ниже привожу изображение выравнивания (ClustalX, консервативноcть 9) (рис. 2).
Исходя из выравнивания, можно понять, что наблюдается большая консервативность в значимых участках - альфа-спиралях и бета-тяжах. В однодоменных белках консервативность последовательнстей меньше.