Изучение гомологии выбранного семейства белков
Описание выбранного семейства белков
Для исследования я выбрал семейство белков, содержащих домен связывающий цинк (Zinc binding domain). AC семейства: PF18423, ID в базе данных Pfam: zf_CopZ. В выборке seed содержится 61 последовательность, в выборке full - 269. Число доменных архитектур семейства - 18.
Интересно, что в доменных архитектурах семейства почти всегда содержатся домены, так или иначе связанные со взаимодействием с тяжелыми металлами, в частности со ртутью. Семейство белков распространено среди разнообразных бактерий и архей, особенную распространенность среди архей семейство получило среди метаногенов, что интересно. Действительно, часто исследуемый домен соседствует в доменных архитектурах с лиазами метилпроизводных тяжелых металлов. Предположу, что такой белок может использоваться метаногенными археями в процессе метаболизма. Также в описании домена написано о том, что белок содержится в медных шаперонах (Copper chaperone) - белках, переносящих ионы меди к мембране. Ион цинка, связанный с трансмембранным переносчиком CopA или CopY, заменяется ионом меди из белка содержащего исследуемый домен. Затем ион меди выносится из клетки.
Исследование гомологии выборки seed
Выборка seed исследуемого семейства была скачана в формате FASTA, и открыта в программе JalView. Ссылка на выравнивание. Самые консервативные остатки - три цистеина. В выравнивании видно несколько эволюционных блоков, включающих все последовательности: 4-7 небольшой блок с крайне консервативным первым остатком, наименее достоверный - 14-19 и самый, на мой взгляд, достоверный 45-50. По достоверным участкам можно судить о ходе эволюции домена. Также есть крайне достоверный блок включающий все последовательности кроме трех - 37-40. Но есть и блок, практически без идентичности, - 55-57, похоже, он совем не отражает хода эволюции.