Поиск по сходству и домены белков.

Поиск по сходству и проверка гомологии

Поиск производился по сходству с белком E8YFS1 (гликозилтрансфераза первого семейства) при использовании базы данных non-rebundant protein seqences за исключением модельных организмов, некультивируемых представителей и образцов из окружающей среды. Для последних трех представлены идентификаторы uniprot.
ID/AC Название белка Coverage Identity (%) E-value Гомологичность
KHL12647.1Glycosyl transferase family 186496e-103Да
CEJ46846.1Glycosyltransferase (Uncharacterized protein)87405e-85Да
BAB75398.1Alr3699 protein85406e-82Да
OBQ42993.1Glycosyl transferase family 184399e-82Да
OBQ36960.1Glycosyl transferase family 185407e-84Да
ABA23179.1Glycosyl transferase, group 1 (EC 2.4.1.56)85409e-84Да
AFY87793.1Glycosyl transferase group 189413e-83Да
Q42652.1Sucrose synthase19286e-05Нет
O84804.1Glycogen synthase40220.028Нет
Q2HR64.1Large tegument protein deneddylase25291.5Нет

Jalview-проект с выравниваниями доступен по ссылке. Против гомологичности трех последних белков свидетельствуют маленькие величины выравненных фрагментов, низкие значения E-value, большое количество гэпов в последовательностях и низкое взаимосоответствие выравненных последовательностей. В отличие от них, первые семь последоваельностей достаточно однозначно выравниваются с исходным белком. Так же в их множественном выравнивании отлично видны блоки, три из которых размечены в jalview. Дополнительно стоит объяснить названия белков. Первые семь являются гликозилтрансферазами(даже Alr3699) первого семейства, а остальные, несмотря на связанную с углеводородами функцию, занимаются синтезом не липополисахаридов, а просто полисахаридов.

Домены и крупные перестройки

Исходный белок(E8YFS1) содержит два домена, обозначнные в базе pfam как Glycosyltransferase Family 4 и Glycosyl transferases group 1(от N к С концу). При просмотре на странице первого домена вариантов архитектуры, включающих его, был выбран белок CUH77801.1, в котором эти домены представлены, а на N-конце имеется ещё один домен Glycosyltransferase family 4, за которым идет домен Glycosyl transferases group 1, который обозначн в pfam как Glyco_trans_1_4 и имеет другой id, не совпадающий с id других таких доменов этих двух белков. Это не помешало Blast распознать гомологию последнего домена второго белка второму домену исходного. В построенной карте локального сходства две крупных диагонали, то есть произошла дупликация этих доменов. Данный факт не вызывает удивления, поскольку гомологичный исходному белку BAB75398.1, для которого была изучена трехмерная структура, работает именно в состоянии гомодимера. То есть имеет смысл предположение о димеризации исходного белка для выполнения им своей функции. Ещё стоит отметить склонность доменов Glycosyltransferase Family 4 и Glycosyl transferases group 1 к тесному контакту именно в таком порядке(от N к С концу), что затрудняло поиск белков с серьезными доменными перестройками. Ниже представлена карта локального сходства.


© Бусыгин Сергей, 2017