Гомология и выравнивание

Петренко Павел

Факультет биоинженерии и биоинформатики, Московский Государственный Университет имени М.В.Ломоносова

Выбор семейства белковых доменов из базы Pfam

Из списка доменов Pfam за 2023 год мной был выбран следующий домен: Renin receptor-like protein, со следующими характеристиками:

AC: PF07850

ID: Renin_r

Summary name: Renin receptor-like protein

Seed: 28

Full: 785

Structures: 17

Species: 443

Architectures: 23

Описание выравнивания seed

Таблица 1. Изучение и описание выбранного белкового домена
Информация Комментарии
Выравнивание seed Число последовательностей - 20, число колонок - 88 Заметно, что значения отличаются от приведённых в таблице 2023 года
Максимальный достоверный блок, включающие ВСЕ последовательности (МДБ-all) 70-80 Помимо данного блока в выравнивании также есть консервативные колонки 41 и 45, однако их недостаточно для того, чтобы сказать, что на данном участке выравнивания есть максимальный достоверный блок (поэтому данные колонки я решил рассмотреть далее, разбив их на отдельные блоки). Также есть последняя 88-ая колонка, являющаяся консервативной, но в 12-ой последовательности присутствуют гэпы, поэтому я не могу продлить максимальный достоверный блок до этой колонки (к тому же между ближайшими абсолютно консервативными колонками тогда бы получилось достаточно большое расстояние без хорошего выравнивания и сходства, что ставит под сомнение достоверность данного блока)
100% консервативные колонки в МДБ-all 70:D
71:P
74:D
78:Y
79:R
80:M
Я выбирал те колонки, которые при параметре conservation 100% были полностью окрашены
Максимальный достоверный блок, включающий НЕ ВСЕ последовательности (МДБ-notAll) Первый блок:37-50:1-7
Второй блок:37-50:15-20
Я решил рассмотреть блоки, выбранные около абсолютно консервативных колонок 41 и 45, про которые говорилл раннее, тем более, что радом с ними много функционально консервативных колонок, поэтому блоки с большей вероятностью достоверны
100% консервативные колонки в МДБ-notAll Первый блок:
Абсолютно консервативные колонки: 37:Y, 41:Y, 45:F, 46:N, 47:I, 49:L, 50:W
Функционально консервативные колонки: 43[VA], 44[IV], 48[IV]
Второй блок:
Абсолютно консервативные колонки: 37:Y, 41:Y, 45:F, 46:N, 50:W
Функционально консервативные колонки: 43[VA], 44[IV], 47[IM], 49[LF]
В данном случае я рассматривал абсолютно консервативные и функционально консервативные позиции в выбранных блоках. Также стоит заметить, что в колонке 38 и в первом, и во втором блоке происходят замены таких аминокислот, как аспарагин, серин и треонин, и при их замене значение по матрице замены аминокислот является нулевым (треонин и аспарагин) или даже положительным (серин и треонин, серин и аспарагин),что также подтверждает достоверность данных блоков
Участок выравнивания, в котором нет никаких достоверных подблоков, и потому маловероятно, что выравнивание на этом участке отражает ход эволюции 5-24 После выставления порога в 35% (о чём было сказано на лекции), я выбрал блок, содержащий много гэпов и не имеющий окрашенных участков (вес матрицы отрицательный), границы этого блока я выбрал исходя из того, что в соседних от блока колонках уже есть функционально схожие группы в части последовательностей

Проект JalView