Поиск предков белка-антифриза MpAFP
Белки-антифризы выполняют структурные и защитные функции, препятствуя росту кристаллов льда. Целью является поиск предковых форм белка-антифриза MpAFP из бактерии Marinomonas primoryensis (идентификатор TrEMBL: A0A075B5G5).
Для поиска предков была использована база данных Swiss-Prot и запущен алгоритм PSI-BLAST. Начальный порог E-value был повышен до 0.1 - ниже ничего не находилось.
1. Ход итерационного поиска
Динамика поиска и изменения состава выдачи по итерациям представлены в таблице ниже. Полный лог финальной шестой итерации сохранен в файле: table.txt
| Итерация |
Новые находки |
Всего белков |
Лучший E-value |
Характерные типы найденных белков |
| 1 | 1 | 1 | 0.076 | Putative cell agglutination protein pfl5 (Адгезин) |
| 2 | 8 | 9 | 1e-06 | Кальций-зависимые бактериальные адгезины, RTX-белки |
| 3 | 25 | 34 | 4e-15 | Бактериальные хитиназы ChiA, интимины, аггреканы |
| 4 | 56 | 90 | 9e-60 | Эукариотические повтор-содержащие белки (аггреканы, муцины) |
| 5 | 79 | 169 | 2e-45 | Ice nucleation proteins (белки льдообразования) |
| 6 | 102 | 271 | 7e-40 | Флокулины грибов (FLO1), муциноподобные белки человека |
2. Анализ множественного выравнивания
Для филогенетического анализа и верификации предковой формы были отобраны биологически обоснованные находки с ранних итераций, а также функциональный аналог со схожей укладкой. Полный файл выравнивания: alignment.fa
- MpAFP/1-417 - белок-запрос (антифриз Marinomonas primoryensis).
- PFL5_SCHPO/1-1283 - белок клеточной агглютинации (адгезин) из дрожжей Schizosaccharomyces pombe, обнаруженный на 1-й итерации.
- Ice/1-407 - белок льдообразования (Ice nucleation protein) из бактерии Pseudomonas syringae, обнаруженный на 4-й итерации.
- Adhesin/1-3420 - RTX - белок (предок) из бактерии E.coli, обнаруженный на 2-й итерации.
- Intimin/1-935 - RTX - белок (предок) из бактерии Brucella suis, обнаруженный на 2-й итерации.
Рис 1. Участок множественного выравнивания MpAFP с потенциальным структурным предком (PFL5) и аналогом (Ice).
Рис 2. Участок множественного выравнивания MpAFP с RTX-предками.
3. Выводы
- Эффективность алгоритма:проведение большого числа итераций PSI-BLAST для белков такого типа избыточно - наиболее достоверный потенциальный структурный предок (адгезин
pfl5) успешно обнаруживается стандартным blastp на первой же итерации.
- Эволюционное происхождение: Полученные данные свидетельствуют о том, что биологически к MpAFP близки поверхностные бактериальные адгезины.
- Поздние находки (артефакты PSI-BLAST): Лавинообразное появление эукариотических муцинов человека (Mucin-19, Mucin-22) и флокулинов дрожжей (FLO1) на 4–6 итерациях - это артефакт. Программа включает их в профиль из-за обилия характерных повторов, а не из-за реального эволюционного родства. По этой причине они были исключены из финального выравнивания.
- Функциональная конвергенция: Обнаружение на 5-й итерации бактериальных белков льдообразования (Ice nucleation proteins) представляет собой пример белков с противоположными функциями (один препятствует росту льда, другой - инициирует его) используют гомологичную предковую архитектуру.
- RTX-предки: Обнаружение на 2-й итерации, являются настоящими предками MpAFP - они в грамм-отрицательных бактериях, а не грибах. Вывод - избыточное количество итераций может привести к ложноположительным находкам предков.