учебная страничка Маши Смирновой

практикум 9. поиск предков антифризов: белок jingwei у дрозофилы

исходный белок и постановка задачи

для анализа взята алкогольдегидрогеназа Drosophila yakuba (P26719, ADH_DROYA, 256 а.к.о.). Ген jingwei возник в линии D. yakuba / D. teissieri путём ретропозиции дупликата гена Adh и слияния с экзонами другого гена, то есть предковый белок для jingwei - это алкогольдегидрогеназа с каталитической активностью в отношении этанола. Нужно было через итеративный поиск PSI-BLAST найти белки, чья функция совпадает с предсказанной предковой.

поиск проводился по базе Swiss-Prot на сервере NCBI BLAST, параметры по умолчанию (порог включения в профиль E-value = 0.005).

итерация 1

первая итерация - это по сути обычный blastp. нашлось 355 последовательностей, из них 277 выше порога включения. среди них можно выделить несколько групп.

первая - алкогольдегидрогеназы других двукрылых, то есть именно те белки, которые соответствуют предсказанной предковой функции: ADH Ceratitis capitata (P48814, E = 1e-48, идентичность 39%), ADH Bactrocera oleae (Q9NAR7, E = 4e-42, 33%), Development-specific 25 kDa protein из Sarcophaga peregrina (P23170, E = 5e-39, 35%). все они принадлежат к суперсемейству коротких дегидрогеназ/редуктаз (SDR) и сохраняют алкогольдегидрогеназную или близкую к ней активность.

вторая - более далёкие члены суперсемейства SDR: 15-гидроксипростагландиндегидрогеназа человека (P15428, E = 3e-14, ~23%), FabG-редуктазы бактерий, ацетоацетил-CoA редуктазы.

рис1
рис. 1. выравнивание ADH_DROYA (P26719) с алкогольдегидрогеназой Ceratitis capitata (P48814), итерация 1. E-value = 1e-48, идентичность 39%. видны консервативные участки, соответствующие сайту связывания кофактора NAD+ и каталитическому центру.
рис2
рис. 2. выравнивание ADH_DROYA (P26719) с 15-гидроксипростагландиндегидрогеназой человека (P15428), итерация 1. E-value = 3e-14, идентичность ~23%. процент идентичных позиций невысок, но мотивы связывания NAD+ сохранены - это говорит об общей принадлежности к суперсемейству SDR.

итерация 2

число находок достигло лимита программы - 500 последовательностей. из новых белков появились глюкозодегидрогеназы бактерий (Bacillus subtilis P12310, Priestia megaterium P39483), тропинонредуктазы растений (Datura stramonium P50162, несколько белков Arabidopsis thaliana), разные SDR-белки из грибов и позвоночных.

рис3
рис. 3. выравнивание ADH_DROYA (P26719) с 3-оксоацил-ACP редуктазой FabG Escherichia coli K-12 (P0AEK2), итерация 2. E-value = 1e-60, идентичность ~22%. FabG работает в синтезе жирных кислот и структурно принадлежит к тому же суперсемейству SDR.

итерация 3

снова 500 последовательностей. новых находок заметно меньше, профиль стабилизировался, поиск остановлен.

сводная таблица итераций

итерация всего находок выше порога примечание
1 355 277 ADH двукрылых, дальние SDR-гомологи
2 500 (лимит) 500 глюкозодегидрогеназы, тропинонредуктазы, FabG
3 500 (лимит) 500 новых мало, профиль стабилен, поиск остановлен

вывод

уже в первой итерации нашлись алкогольдегидрогеназы двукрылых насекомых - белки с той самой функцией, которая предсказана как предковая для jingwei. это хорошо согласуется с литературными данными о происхождении гена jingwei из гена Adh. то, что в следующих итерациях круг гомологов расширился до бактерий, растений и позвоночных, говорит о принадлежности ADH_DROYA к суперсемейству SDR - одному из самых древних и распространённых семейств NAD(P)H-зависимых оксидоредуктаз.