Алгоритмы выравнивания

Различие результатов выравнивания разными программами

Были проведены 3 выравнивания 2 белков: факторa совмещения репарации с транскрипцией бактерий Escherichia coli (UniProt AC P30958) и Mycobacterium bovis (UniProt AC P64327), - с помощью программ needle, water и Clustal Omega (последнее - на сайте UniProt). Получившиеся выравнивания были последовательно выровнены программой muscle, результат представлен в виде проекта JalView.

Обнаруженные различия в выравниваниях:

  • Программа water, осуществляющая локальное выравнивание, обрезает плохо выравнивающиеся концевые участки белков: выравнивание начинается только с Glu(21) для E.coli, Glu(39) для M.bovis и заканчивается на Ile(1075) для E.coli, Ile(1129) для M.bovis. В то же время другие програмы их оставляют (начало в Met(1) для E.coli, Met(1) для M.bovis, конец в Ala(1148) для E.coli, Pro(1234) для M.bovis), хотя по получающимся выравниваниям также хорошо видна негомологичность этих участков:



  • Программы needle и ClustalO оставляют негомологичные концевые участки в выравнивании, но по-разному их выравнивают. needle выравнивает Met(1) E.coli с Arg(36) M.bovis, ClustalO выравнивает Met(1) E.coli с Ser(22) M.bovis, причём далее идёт блок из 19 аминокислотных остатков без гэпов, но с низким процентом совпадения:

  • Явно гомологичные участки выравниваются программами needle и water одинаково, c выравниванием программой ClustalO находятся отдельные несоответствия вследствие иной постановки гэпов. Например, и needle, и water выравнивают Glu(977) E.coli с Glu(1029) M.bovis, в то же время ClustalO выравнивает Glu(977) E.coli с Arg(1025) M.bovis, происходит это из-за отсутствия инделя из 4 гэпов между Met(976) и Glu(977) E.coli в последнем выравнивании:

Выравнивание программой water выглядит более надёжным при применении к гомологичным белкам, так как в его вес не включаются случайные совпадения на как правило вариабельных концевых доменах белков.

Главная страница


© Степан Пухов

2018