Я выбрал белок из базы данных Swiss-Prot с идентификатором доступа (AC): Q01758. Данный белок является структурным белком антифризом второго типа (Type II AFP) у азиатской корюшки Osmerus mordax (rainbow smelt). Основной принцип работы антифризов – это связывание водородными связями с водой, что мешает ей формировать кристаллы. Данный белок выделяется во внеклеточную среду и понижает температуру замерзания крови; в отличие от некоторых других антифризных белков белки антифризы второго типа не имеют повторяющихся последовательностей и имеют глобулярную структуру. В статье сказано, что было доказано, что данные белки произошли от лектинов C-типа (кальций зависимый структурный домен, отвечающий за специфическое связывание с углеводами) [1].
В данной практической работе я постараюсь удостовериться в этом и, может быть, найти ещё что-нибудь интересное.
Белок антифриз 2-го типа имеет следующую аминокислотную последовательность. Чтобы найти дальних родственников по данному антифризу следует использовать PSI-BLAST.
Первая итерация
Поиск при помощи PSI-BLAST осуществлялся с параметрами по умолчанию. Среди самых близких гомологов были найдены белки-антифризы 2-го типа лучеперых рыб (к которым и относится азиатская корюшка). Также даже на первой итерации PSI-BLAST смог найти предположительный предковый белок – лектин C-типа. Среди находок были также асиалогликопротеиновый рецептор, который распознает старые белки по обнажившимся остаткам галактозы. Он также относится к лектинам С-типа. Среди других интересных лектинов были обнаружены:
•Конвульксин - мощный гемотоксин тропической гремучей змеи, он связывается с гликопротеиновыми рецептороми тромбоцитов, что приводит к их слипанию и нарушению свертываемости крови. Некоторые другие гематотоксины также относятся к лектинам C-типа.
•Коллектин-12 - связывается с углеводными антигенами микроорганизмов и способствует их распознаванию, а кроме этого участвует в удалении окисленных липопротеинов низкой плотности в сосудах, которые транспортируют холестерин и могут вызывать атеросклероз.
•Рецепторы на поверхности лимфоцитов, макрофагов и др. имунных клеток часто являются лектинами C-типа (CD23 - регулирует уровень IgE + усиливает антительный ответ; CD209 - разпознает маннозные остатки в составе гликопротеинов патогенов, участвует в разпознавании опухолевых клеток дендритными клетками).
•Ладдерлектин - способен формировать олигомерные структуры, разпознает паттерны углеводов на поверхности патогенов.
Также стоит сказать, что большинство гомологичных белков были найдены среди позвоночных (96). Два гомолога было найдено среди иглокожих (гомологом оказался узнающий N-ацетилгалактозамин (GalNAc) лектин, который важен в защитных реакциях иглокожих), один гомолог среди ракообразных (обеспечивает врожденный иммунитет) и один гомолог у брюхоногого моллюска (перлюцин, который участвует в росте кристаллов кальция и обеспечивает иммунную защиту).
Вторая итерация
При второй итерации не нашлось ничего. Тогда я увеличил Max target sequences до 1000 и понизил Expect threshold до 0.001 в первой итерации и получил 303 схожих с моей последовательностей. При первой итерации было найдено только только 16 последовательностей предположительных гомологичных белков, не принадлежащих позвоночным. Что составляет 5.3% от всех найденных схожих последовательностей.
При второй итерации PSI-BLAST количество последовательностей увеличилось до 664, то есть позиционная весовая матрица позволила нам найти ещё 361 новых потенциальных гомоломов белка антифризу 2-го типа. При этом доля последовательностей, не принадлежавших позвоночным увеличилась с 5.3% до 10.4%. То есть даже на второй итерации очевидно увеличение кол-во гомологичных последовательностей в выдаче PSI-BLAST среди дальних родственников.
Среди новых белков много Snaclec - гематотоксинов змей, относящихся к лектинам C-типа; белков легочного сурфактанта (тоже защищает от патогенов и относится к лектину C-типа); Однако эти белки встречались и при первой итерации
Абсолютно новыми белками стали:
• Тетранектины – белок из семейства лектинов С-типа, образует гомотетрамеры. Активируя плазминоген, способствует растворению тромбов. Участвует в минерализации хрящевой ткани.
• Конглютинин – представитель семефства коллектинов (которые также относятся к лектинам С-типа), характерный только для жвачных животных
• Лайилин – лектин C-типа, связывающий гиалуроновую кислоту вместо типичного сахара.
• CD94 – лектин C-типа, который связываясь с другими молекула либо ингибирует иммунный ответ для защиты здоровых клеток, либо активирует уничтожение целей (инфицированные или опухолевые ткани), которые стали невидимыми для обычного иммунитета.
• KLRG1 и KLRG2 – также относящиеся к C-лектинам и подавляющие иммунный ответ по отношению к здоровым клеткам.
• Полицистин-1-подобный белок 2 – лектин C-типа (в человеческой популяции может быть как функциональным геном, так и псевдогеном), компонент ионных каналов (Ca2+ связывающая активность)
• Селектины (P, L и E типов) – лектины C-типа, направляют лимфоцитов в очаг воспаления.
• Овоклеидин-17 – формирование яичной скорлупы (кристаллизация кальцита) и т.д.
Из интересного: стоит отметить то, что среди предположительных гомологов оказались лектиноподобные белки вирусов, они могут выполнять функции подавления иммуного ответа и проникновения в клетку. Но это не означает что вирусы - настолько близкие родственники азиатской корюшки, это пример приобретения ими данного белка путем горизонтального переноса генов.
Третья итерация
На третьей итерации PSI-BLAST смог найти ещё 4 последовательности и кол-во последовательностей увеличилось до 668. Две из этих последовательностей принадлежат вирусам, одна морскому ежу, две позвоночным. Это ещё раз доказывает, что PSI-BLAST позволяет находить гомологов среди дальних родственников.
Четвертая итерация
Нашлась одна гомологичная последовательность у мыши. В итоге 669 последовательностей.
Пятая итерация
Алгоритм не нашёл ни одной гомологичной последовательности.
Примеры выравнивания
Если рассмотреть внимательно эти выравнивания, можно увидеть консервативные функциональные аминокислоты:
Триптофан 59 + гидрофобная небольшая аминокислота на 62-ой позиции (номера позиций запроса)
Цистеин 66
Лейцин 73 и два идущих подряд глутамата 80-81 - очень консервативны
W-x-G (где x-небольшая гидрофоная аминоксилота) 97-99
W-N-D-T-P-C (WND - немного консервативны, C консервативен)
К какому вообще можно прийти выводу? Лектин C-типа – это достаточно распространённое среди живых существ семейство белков, отвечающее за связывание с сахарами. Однако в процессе эволюции белков, содержащих этот домен, они часто утрачивают функцию связывание с сахарами и начинают связывать с белками, водой, солями и т.д. Это приводит к тому, что домен этого семейства находится в белках, выполняющих самые разные функции:
Препятствование кристаллизации (воды, солей); способствование минерализации и кристаллизации (в яичной скорлупе или хряще); гематоксин вызывающий свертывание крови; активатор плазминогена, который наоборот разжижает кровь; активатор иммунного ответа; ингибитор имунного ответа; межклеточные контакты и наверное многое другое.
PSI-BLAST - может выделить основные консервативные позиции, построить на основе них весовые матрицы и найти последовательности, которые вроде имеют абсолютно другую аминокислотную последовательность но при этом имеют те же консервативные позиции. Это помогает найти не только гомологичные белки у дальних родственников, но и белки, которые претерпев изменения, стали выполнять немного другие функция.
Ссылки на статьи
1. Cheng CH. Evolution of the diverse antifreeze proteins. Curr Opin Genet Dev. 1998 Dec