Гомология и выравнивания

Описание выбранного семейства белков

Я выбрал семейство белков, содержащих домен фаговой Барназо-EndoU-ColicinE5/D-RelE-подобной нуклеазы 3 (phage-Barnase-EndoU-ColicinE5/D-RelE like nuclease3). AC семейства- PF18812, ID в базе данных PFAM- PBECR3. В seed содержится 83 последовательности, в full- 207. Число доменных архитектур- 26.

Интересно строение второй по популярности архитектуры, для которой найдено 29 сиквенсов в разных организмах. В этой архитектуре домен фаговой нуклеазы следует за доменом фагового F-белок-подобного Mu белка (Phage Mu protein F like protein). Этот домен необходим для сборки головки бактериофага. Стоит отметить, что данная архитектура встречается в бактериях, куда она скорее всего попала в результате встраивания в нее ДНК некоего фага.

Функция данного домена, как следует из названия, состоит в том, чтобы осуществлять нуклеазную активность. Он часто встречается в белках в геноме фагов, а также в геноме бактерий в составе интегративных конъюгативных элементов (ICE). Его активный сайт содержит консервативные остатки гистидина и треонина.

Что касается таксономии, данный домен встречается у бактерий и вирусов. Среди бактерий- это представители типа Firmicutes и типа Proteobacteria, среди вирусов- это представители порядка Caudovirales.

Исследование выравнивания seed

Я скачал выравнивание seed со страницы семейства в Pfam в формате fasta и открыл его в Jalview. Вы можете скачать проект Jalview по ссылке. Максимальные достверные блоки, включающие все последовательности, отсутствуют. У первых 8 последовательностей можно выделить максимально достоверные блоки: 3-4, 37-40, 42-43, 147-148. Участок, который не содержит ни одного достоверного подблока- 48-51. По достоверным участкам можно судить о ходе эволюции домена. Хоть в нашем случае и нет максимально достоверных блоков, самые достоверные блоки из имеющихся и включающие все последовательности находятся на участках 42-46 и 78-83. Из имеющихся он позволяет лучше всего судить об эволюции, хотя он не идеален для этого.