Поиск предков белка-антифриза MpAFP

Белки-антифризы выполняют структурные и защитные функции, препятствуя росту кристаллов льда. Целью является поиск предковых форм белка-антифриза MpAFP из бактерии Marinomonas primoryensis (идентификатор TrEMBL: A0A075B5G5).

Для поиска предков была использована база данных Swiss-Prot и запущен алгоритм PSI-BLAST. Начальный порог E-value был повышен до 0.1 - ниже ничего не находилось.

1. Ход итерационного поиска

Динамика поиска и изменения состава выдачи по итерациям представлены в таблице ниже. Полный лог финальной шестой итерации сохранен в файле: table.txt

Итерация Новые находки Всего белков Лучший E-value Характерные типы найденных белков
1110.076Putative cell agglutination protein pfl5 (Адгезин)
2891e-06Кальций-зависимые бактериальные адгезины, RTX-белки
325344e-15Бактериальные хитиназы ChiA, интимины, аггреканы
456909e-60Эукариотические повтор-содержащие белки (аггреканы, муцины)
5791692e-45Ice nucleation proteins (белки льдообразования)
61022717e-40Флокулины грибов (FLO1), муциноподобные белки человека

2. Анализ множественного выравнивания

Для филогенетического анализа и верификации предковой формы были отобраны биологически обоснованные находки с ранних итераций, а также функциональный аналог со схожей укладкой. Полный файл выравнивания: alignment.fa

Множественное выравнивание MpAFP с адгезином и белком льдообразования
Рис 1. Участок множественного выравнивания MpAFP с потенциальным структурным предком (PFL5) и аналогом (Ice).
Множественное выравнивание MpAFP с RTX
Рис 2. Участок множественного выравнивания MpAFP с RTX-предками.

3. Выводы

  1. Эффективность алгоритма:проведение большого числа итераций PSI-BLAST для белков такого типа избыточно - наиболее достоверный потенциальный структурный предок (адгезин pfl5) успешно обнаруживается стандартным blastp на первой же итерации.
  2. Эволюционное происхождение: Полученные данные свидетельствуют о том, что биологически к MpAFP близки поверхностные бактериальные адгезины.
  3. Поздние находки (артефакты PSI-BLAST): Лавинообразное появление эукариотических муцинов человека (Mucin-19, Mucin-22) и флокулинов дрожжей (FLO1) на 4–6 итерациях - это артефакт. Программа включает их в профиль из-за обилия характерных повторов, а не из-за реального эволюционного родства. По этой причине они были исключены из финального выравнивания.
  4. Функциональная конвергенция: Обнаружение на 5-й итерации бактериальных белков льдообразования (Ice nucleation proteins) представляет собой пример белков с противоположными функциями (один препятствует росту льда, другой - инициирует его) используют гомологичную предковую архитектуру.
  5. RTX-предки: Обнаружение на 2-й итерации, являются настоящими предками MpAFP - они в грамм-отрицательных бактериях, а не грибах. Вывод - избыточное количество итераций может привести к ложноположительным находкам предков.