В данной работе с помощью BLAST - базовый инструмент локальных выравниваний - к последовательности белка α-L-фукозидазе (ID - A0A0U3QKR4_9MICC, AC - ALV47246.1), которая неоднократно изучалась ранее, были подобраны девять последовательностей, далее исследовавшиеся на гомологию с α-L-фукозидазой. Для процесса отбора были заданы следующие параметры: последовательность белка в fasta-формате, база данных Swiss-Prot, алгоритм protein-protein BLAST, а также параметры, задающиеся по умолчанию - максимальный размер выдачи (100), размер анализируемого участка (6) и порог на E-value (10). Чтобы получить информацию о находках можно сохранить результат поиска в BLAST в разных форматах. Так, сохраняя в формате Hit Table (text), можно получить часть данных, приведенных в Таблице 1. В Таблице 1 представлена информация об анализируемых белках.
Таблица 1. Характеристики находок BLAST. | |||||
ID/AC (UniProt) | Название белка | Coverage, % | Identity, % | E-value | Гомологичность |
A0A0U3QKR4_9MICC/P10901.1 | Alpha-L-fucoside fucohydrolase | 96 | 25 | 4e-35 | + |
FUCO_RAT/P17164.1 | Alpha-L-fucoside fucohydrolase 1 | 80 | 26 | 3e-34 | + |
FUCO2_MOUSE/Q99KR8.1 | Alpha-L-fucoside fucohydrolase 2 | 92 | 26 | 2e-33 | + |
FUCO2_PONAB/Q5RFI5.1 | Alpha-L-fucoside fucohydrolase 2 | 72 | 28 | 8e-33 | + |
FUCO_BRAFL/C3YWU0.2 | Alpha-L-fucoside fucohydrolase | 80 | 27 | 8e-33 | + |
FUCO2_RAT/Q6AYS4.1 | Alpha-L-fucoside fucohydrolase 2 | 92 | 27 | 3e-32 | + |
FUCO_DROME/Q9VTJ4.2 | Alpha-L-fucoside fucohydrolase | 74 | 27 | 2e-28 | + |
LIPA_CHLL7/Q3B3Y5.1 | Lipoyl synthase | 25 | 29 | 0.85 | - |
LIPA_BAUCH/Q1LTM3.1 | Lipoyl synthase | 12 | 31 | 4.4 | - |
Последняя колонка в Таблице 1 говорит о гомологии находок BLAST с исходным белком, для оопределения гомологичности было построено множественное локальное выравнивание из 10 последовательностей: исходная + 9 находок. Затем в данном выравнивании осуществлялся поиск блоков достоверного выравнивания. В случае если последовательность входила в несколько блоков, то её можно было считать гомологичной, в противном случае - негомологичной. Блок выделялся по следующим параметрам: отсутствие гэпов, абсолютно или абсолютно функционально консервативные концевые позиции, присутствие в достаточном количестве абсолютно консервативных позиций (примерно 3 к 5). На Рисунке 1 представлен результат такого выравнивания и дан комментарий к нему.
![]() |
|
Рис 1. Выравнивание исходной последовательности и находок. |
|
|
Ссылка на проект с выравниванием.
Для выполнения данной работы были выбраны последовательности белков ферментов из класса гликозил-гидролаз, которые катализируют гидролиз гликозидных связей в молекулах углеводов, приводя к образованию двух молекул сахаров, обладающих меньшим, чем исходная молекула, размером [1]. Для данного задания были выбраны данные белки, исходя из предпположения о том, что белки, входящие в один домен будут иметь гомологичные участки. Одна последовательность белка - 6-фосфо-beta-гидролаза (ID: W7CQR8_9LIST) с длиной равной 464 аминокислотных остатка и молекулярной массой 53409 kDa, которая катализирует реакцию гидролиза 6-phospho-beta-D-glucosyl-(1,4)-D-glucose в D-glucose и D-glucose-6-phosphate [2]. Этот белок характерен для бактерии Brochothrix campestris FSL F6-1037 относится к роду Brochothrix, семейству Listeriaceae, порядку Bacillales, классу Bacilli, типу Firmicutes, царству Bacteria [3]. А вторая последовательность белка - лактаза-флоризин гидролаза (ID: V8P3R2_OPHHA), или LCT, длина которого равна 1866 аминокислотным остаткам и молекулярной массой равной 212689 kDa, которая гидролизирует реакцию гидролиза лактозы в D-galactose и D-glucose [4]. Этот белок характерен для организма Ophiophagus hannah, или королевская кобра, и является предсказанным (цифра 4) [5].
С помощью BLAST было осуществлено сравнение двух последовательностей и получена карта локального сходства (Рисунок 1). Для этого задавались следующие параметры: E-value - 1e-05, размер анализиромого участка - 2. Для данных последовательностей покрытие составляет 99% (так как на карте отображаются лишь отдельные участки последовательности лактаза-флоризин гидролазы, то такое значение вполне реально), идентичность 31%, а E-value 9e-62.
![]() |
Рисунок 3. Карта локального сходства. |
На Рисунке 3 по горизонтальной оси располагается последовательность белка 6-фосфо-beta-гидролазы, а по вертикальной - лактаза-флоризин гидролазы. Серым цветом показаны гомологичные участки этих двух последовательностей. Красным и синим цветами отмечены участки последовательностей, которые являются идентичными и полученными в процессе эволюции в результате дупликации участков последовательности. Литерой А обозначены участки в последовательности лактаза-флоризин гидролазы, где в ней произошла дупликация в участке, гомологичном участку, обозначенному литерой B последовательности 6-фосфо-beta-гидролазы. Литерой C обозначены участки в последовательности лактаза-флоризин гидролазы, где в ней произошла дупликация в участке, гомологичном участку, обозначенному литерой D последовательности 6-фосфо-beta-гидролазы. В желтый круг обведён участок выравнивания, где произошла делеция (обозначен только один, но в тех местах, где в диагонали нет серой линии, нет гомологии).
[1] Гликозил-гидролазы - wikipedia.org [2] 6-фосфо-beta-гидролаза - wikipedia.org [3] 6-фосфо-beta-гидролаза - UniProt [4] Лактаза-флоризин гидролаза - wikipedia.org [5] Лактаза-флоризин гидролаза - UniProt |