Информационное содержание мотива. PSSM. PSI-BLAST

Выбор белка

В этом практикуме я буду искать родственные последовательности для белка-антифриза IV типа (Type IV AFP), также известного как LS-12. Этот белок открыт позднее других его форм (в 1997 году) у длиннорогого бычка (Long-horn sculpin), он представляет собой глобулярную структуру из 4 спиралей, состоит из 128 аминокислотных остатков, содержит повторы из 22 аминокислот, соединённых пролинами. Роль AFP состоит в связывании с поверхностью кристаллов льда и препятствовании присоединению дополнительных молекул воды, тем самым понижая температуру макроскопического роста льда ниже коллигативной точки замерзания. У рыб и насекомых антифризы обеспечивают избегание замерзания, сохраняя жидкости организма в жидком состоянии; у холодостойких растений они повышают толерантность к замерзанию, ограничивая рост мелких кристаллов льда в крупные повреждающие. AFP типа IV длиннорогого бычка является новейшим рыбьим AFP и демонстрирует ~20% идентичности последовательности с представителями суперсемейства обменных аполипопротеинов: apoA, apoC, apoE и их гомологов. Эти белки способны переносить липиды, собирать липополипротеины, активировать или выключать ключевые ферменты жирового обмена, а также служат сигнальными молекулами. При изучении аполипопротеинов было обнаружено, что остатки 28-104 соответствуют структуре 22-мерного повтора AFP типа IV, и три из четырех возможных повторов несут консервативный Pro, что подтверждает их гомологию.

В UniProtKB нашли антифризный белок IV типа длиннорогого бычка:

UniProt ID: P80961

Uniprot Entry: AFP4_MYOOC

Поиск родственных последовательностей

Таблица 1. Находки PSI-BLAST.
Итерация PSI-BLAST Всего находок Находок с E-value < 0.005 Новые находки
1 15 5 Type IV AFP - белок-антифриз IV типа у японской камбалы [Paralichthys olivaceus] и атлантической трески [Gadus morhua]
Apolipoprotein E (ApoE) - аполипопротеины E у различных Грызунов
2 82 9 Apolipoprotein E (ApoE) - аполипопротеины E у различных позвоночных
Apolipoprotein A-I (ApoA-I) - аполипопротеины A-I у различных позвоночных
Apolipoprotein A-IV (ApoA-IV) - аполипопротеины A-IV у различных позвоночных, в том числе у человека
3 141 14 Apolipoprotein A-I (ApoA-I) - аполипопротеины A-I у различных позвоночных
Apolipoprotein A-IV (ApoA-IV) - аполипопротеины A-IV у различных позвоночных
Apolipoprotein A-V (ApoA-V) - аполипопротеины A-V у различных позвоночных
4 167 15 Apolipoprotein A-I (ApoA-I) - аполипопротеины A-I у различных позвоночных
Apolipoprotein A-IV (ApoA-IV) - аполипопротеины A-IV у различных позвоночных
Apolipoprotein A-V (ApoA-V) - аполипопротеины A-V у различных позвоночных
RING finger protein unkempt homolog (UNK) - RING-пальцевый белок, гомолог unkempt
Одиночные находки белков человека и мыши с плохим e-value
5 172 11 Apolipoprotein E (ApoE) - аполипопротеин E у Danio rerio
E3 ubiquitin-protein ligase UNKL (UNKL) - E3 убиквитин-протеинлигаза UNKL
Reticulocyte-binding protein homolog 2a - ретикулоцит-связывающий белок-гомолог 2a малярийного плазмодия
Serine/threonine-protein kinase MRCK beta (DMPK-like beta) - серин/треониновая протеинкиназа MRCK бета
Rho guanine nucleotide exchange factor 18 (ARHGEF18) - фактор обмена гуаниновых нуклеотидов Rho/Rac 18
RIMS-binding protein 3 (RIM-BP3) - RIMS-связывающий белок 3A
Ski oncogene (SKI) - протоонкоген Ski
Dynactin subunit 1 (DCTN1) - динактин субъединица 1
Peripheral-type benzodiazepine receptor-associated protein 1 (TSPOAP1) - периферический бензодиазепиновый рецептор-ассоциированный белок 1
Endonuclease MutS2 (mutS2) - Эндонуклеаза MutS2 у бактерии Ruminiclostridium cellulolyticum и Symbiobacterium thermophilum
Syntaxin-binding protein 4 (STXBP4) - синтаксин-связывающий белок 4
TBC1 domain family member 31 (TBC1D31) - белок семейства TBC1 31
Guanylate-binding protein 3 (GBP3) - гуанилат-связывающий белок 3

После пятой итерации нашлось много разных белков, которые имеют мало отношения к белкам-антифризам, поэтому поиск был прекращён.

В результате 5 итераций PSI-BLAST с запросом Type IV AFP длиннорогого бычка были найдены прямые гомологи антифриза (камбала, треска), а затем — семейство обменных аполипопротеинов (ApoE, ApoA-I, ApoA-IV, ApoA-V) у широкого круга позвоночных. Этот результат полностью подтверждает гипотезу Cheng (Evolution of the diverse antifreeze proteins, 1998) о происхождении Type IV AFP от аполипопротеиновой предковой молекулы.

Стоит отметить, что на первой итерации PSI-BLAST были обнаружены только наиболее консервативные аполипопротеины E (ApoE) грызунов. Это объясняется тем, что в swissprot широко представленны именно грызуны, и данным по ним гораздо больше, а также высокой эволюционной консервативностью ApoE по сравнению с ApoA-I, ApoA-IV или ApoA-V.

Многие нахоки на 5 итерации объясняются схожими структурными мотивами белков. Так, многие найденные белки имеют в своей структуре амипатическую α-спираль - универсальную структуру, необходимую для функций, связанных с взаимодействием с мембранами, липидами и другими молекулами. Например, UNKL - взаимодействуют с клеточными мембранами и участвуют в сигнальных каскадах, меняя активность других белков, как аполипопротеин ApoE служит «ключом» для рецепторов; DCTN1, STXBP4, TBC1D31 - эти белки собирают большие белковые комплексы на мембранах, а у аполипопротеина ApoA-I такая же роль — он собирает липопротеиновую частицу на поверхности клетки; GBP3 - нарушает целостность мембран, что похоже на взаимодействие с поверхностью липидного бислоя; RH2a - помогает паразиту проникать в эритроцит, белок использует свою α-спираль, чтобы прикрепиться к изогнутой поверхности мембраны эритроцита, а белок-антифриз использует свою α-спираль, чтобы прикрепиться к ровной плоскости кристалла льда.