Поиск производился по сходству с белком E8YFS1 (гликозилтрансфераза первого семейства) при использовании базы данных non-rebundant protein seqences за исключением модельных организмов, некультивируемых представителей и образцов из окружающей среды. Для последних трех представлены идентификаторы uniprot.
ID/AC | Название белка | Coverage | Identity (%) | E-value | Гомологичность |
KHL12647.1 | Glycosyl transferase family 1 | 86 | 49 | 6e-103 | Да |
CEJ46846.1 | Glycosyltransferase (Uncharacterized protein) | 87 | 40 | 5e-85 | Да |
BAB75398.1 | Alr3699 protein | 85 | 40 | 6e-82 | Да |
OBQ42993.1 | Glycosyl transferase family 1 | 84 | 39 | 9e-82 | Да |
OBQ36960.1 | Glycosyl transferase family 1 | 85 | 40 | 7e-84 | Да |
ABA23179.1 | Glycosyl transferase, group 1 (EC 2.4.1.56) | 85 | 40 | 9e-84 | Да |
AFY87793.1 | Glycosyl transferase group 1 | 89 | 41 | 3e-83 | Да |
Q42652.1 | Sucrose synthase | 19 | 28 | 6e-05 | Нет |
O84804.1 | Glycogen synthase | 40 | 22 | 0.028 | Нет |
Q2HR64.1 | Large tegument protein deneddylase | 25 | 29 | 1.5 | Нет |
Jalview-проект с выравниваниями доступен по ссылке. Против гомологичности трех последних белков свидетельствуют маленькие величины выравненных фрагментов, низкие значения E-value, большое количество гэпов в последовательностях и низкое взаимосоответствие выравненных последовательностей. В отличие от них, первые семь последоваельностей достаточно однозначно выравниваются с исходным белком. Так же в их множественном выравнивании отлично видны блоки, три из которых размечены в jalview. Дополнительно стоит объяснить названия белков. Первые семь являются гликозилтрансферазами(даже Alr3699) первого семейства, а остальные, несмотря на связанную с углеводородами функцию, занимаются синтезом не липополисахаридов, а просто полисахаридов.
Исходный белок(E8YFS1) содержит два домена, обозначнные в базе pfam как Glycosyltransferase Family 4 и Glycosyl transferases group 1(от N к С концу). При просмотре на странице первого домена вариантов архитектуры, включающих его, был выбран белок CUH77801.1, в котором эти домены представлены, а на N-конце имеется ещё один домен Glycosyltransferase family 4, за которым идет домен Glycosyl transferases group 1, который обозначн в pfam как Glyco_trans_1_4 и имеет другой id, не совпадающий с id других таких доменов этих двух белков. Это не помешало Blast распознать гомологию последнего домена второго белка второму домену исходного. В построенной карте локального сходства две крупных диагонали, то есть произошла дупликация этих доменов. Данный факт не вызывает удивления, поскольку гомологичный исходному белку BAB75398.1, для которого была изучена трехмерная структура, работает именно в состоянии гомодимера. То есть имеет смысл предположение о димеризации исходного белка для выполнения им своей функции. Ещё стоит отметить склонность доменов Glycosyltransferase Family 4 и Glycosyl transferases group 1 к тесному контакту именно в таком порядке(от N к С концу), что затрудняло поиск белков с серьезными доменными перестройками. Ниже представлена карта локального сходства.