Сравнение программ для выполнения множественного выравнивания

В данной работе с помощью BLAST к последовательности белка α-L-фукозидазе (ID - A0A0U3QKR4_9MICC, AC - ALV47246.1) были подобраны четыре последовательности, из которых затем с помощью различных программ построены множественные выравнивания. Для данного белка ранее уже строились парные выравнивание с использованными в этом множественном выравнивании последовательностями. В Таблице 1 представлена информация об анализируемых белках, гомологичных α-L-фукозидазе.

Таблица 1. Характеристики находок BLAST.
ID/AC (UniProt) Название белка Coverage, % Identity, % E-value
FUCO_RAT/P17164.1 Alpha-L-fucoside fucohydrolase 1 80 26 3e-34
FUCO2_PONAB/Q5RFI5.1 Alpha-L-fucoside fucohydrolase 2 72 28 8e-33
FUCO_BRAFL/C3YWU0.2 Alpha-L-fucoside fucohydrolase 80 27 8e-33
FUCO_DROME/Q9VTJ4.2 Alpha-L-fucoside fucohydrolase 74 27 2e-28

На данном ресурсе были найдены и испробованы различные программы для множественного выравнивания. В частности:

  1. Kalign - быстрый инструмент для множественного выравнивания, работа которого связана с отдельными участками последовательностей; хорошо подходит для большого выравнивания.

  2. Clustal Omega - относительно новый инструмент для множественного выравнивания, использующий построение деревьев для генерирования выравнивания; подходит для средних и больших последовательностей.

  3. MAFFT - инструмент для множественного выравнивания, использующий бвстрые преобразования Фурье; подходит для средних и больших последовательностей.

  4. MUSCLE - точный инструмент для множественных выравниваний, особенно подходящий для выравниваний белковых последовательностей среднего размера.

  5. WebPRANK - программа для множественного выравнивания последовательностей, учитывающая филогению и использующая эволюционную информацию для размещения инсерций и делеций.

  6. MView - преобразовывает результат поиска сходства последовательностей во множественное выравнивание нескоьких последовательностей.

На Рисунке 1 представлены множественнные выравнивания, выполненные с помощью программ Kalign и WebPRANK, для удобство на рисунке в первом блоке выделено выравнивание Kalign, а во втором - WebPRANK.

Рис 1. Множественное выравнивание Kalign и WebPRANK.

Комментарии к выравниванию

Как видно из Рисунка 1, различия в работе программ выравнивания наблюдаются в местах, где происходит добавление гэпов, а также в концевых и начальных участках. Самы большой участок с различиями располагается в позициях 164-232. Ниже приведено несколько таких различий:

  1. В первом выравнивании в позициях 139-141 гэп вставлен в 141 позиции, а во втором - в 139, при полном сохранении остальной последовательности.

  2. В позициях 192-200 программа WebPRANK приводит большее число консервативных посзиции в выравнивании, в отличие от Kalign, которая в этих же позициях ставит гэпы.

  3. В позициях 173-187 в первом выравнивании располагаются аминокислотные остатки, однако эот участок лишен большого числа консервативных позиций, и как следствие, во втором выравнивании в этом участке стоят гэпы.

  4. В позициях 284-287 во второй последовательности вставлен индель длины в четыре пары нуклеотидов, при этом в первой последовательности индель такой же длины присутствует дальше, в позициях 288-291.

  5. В позициях 263-268 в первом выравнивании наблюдается индель длины 6, а во второй последовательности индель длины 5 в позициях 259-263.

Помимо этого в Таблице 2 приведена информация о множественных выравниваниях, выполненных Kalign и WebPRANK.

Таблица 2. Характеристики программ Kalign и WebPRANK.
Название программы Максимальная и минимальная длины выравниваний Абсолютно консервативные позиции % Функционально консервативные % Число инделей
Kalign 478, 354 65 13.6 128 26.8 13
WebPRANK 478, 354 65 13.6 131 27.4 12

Как видно из Таблицы 2, при одинаковой длине выравниваний и совпадающем значении абсолютно консервативных позиций, число и процент функционально консервативных позиций превалирует при использовании програмы WebPRANK, а также в результате её работы во множественном выравнивании число инделей меньше, чем по результатам работы Kalign.

Доменные архитектуры

В данной работе была проанализирована доменная архитектура белка α-L-фукозидазы (ID - A0A0U3QKR4_9MICC, AC - ALV47246.1), который неоднократно изучался ранее. Данный белок является ферментом (EC 3.2.1.51), катализирующим реакцию гидролиза an alpha-L-fucoside в L-fucose и спирт; относится к семейству гидролаз [1].
В базе данных Pfam, был найден домен этого белка. Результат данного поиска представлен на Рисунке 2. В состав данного белка входит один домен - Alpha_L_fucos (PF01120) - в позициях 2-335.

Рис 2. Доменная архитектура α-L-фукозидазы.

В данной работе были рассмотрены три наиболее часто встречающиеся доменные архитектуры, содержащие Alpha_L_fucos.

  1. Данный домен входит в белок Ricin-type beta-trefoil lectin domain protein (ID - L7F604_9ACTN) в позициях 34-392. Помимо этого в позициях 497-616 располагается домен F5_F8_type_C - главный белковый домен многих факторов коагуляции крови; в позициях 621-703 - домен RicinB_lectin_2 - доменом белка, являющегося высокотоксичным природным лектином (углеводсвязывающим белком), вырабатываемым в семенах растения касторового масла Ricinus communis.

    Рис 3. Доменная архитектура Ricin-type beta-trefoil lectin domain protein.

  2. В состав белка Glycoside hydrolase family 29 (Alpha-L-fucosidase) (ID - A0A068NVX1_9BACT) в позициях 4-343 располагается домен Alpha_L_fucos, а в позициях 477-534 - домен Fn3_assoc, в позициях 548-680 - домен PA14.

    Рис 4. Доменная архитектура Putative Alpha-L-fucosidase.

  3. В белке Glycoside hydrolase (ID - B5I4T8_9ACTN) можно выделить 3 домена: в позициях 4-315 стоит домен Glyco_hydro_28, входящий в семейство гликозид гидролаз; в позициях 414-640 - Alpha_L_fucos; в позициях 834-965 - F5_F8_type_C.

    Рис 5. Доменная архитектура Glycoside hydrolase.

Источники:

[1] Alpha-L-fucosidase