Различие результатов выравнивания разными программами
Были проведены 3 выравнивания 2 белков: факторa совмещения репарации с
транскрипцией бактерий Escherichia coli (UniProt AC P30958) и
Mycobacterium bovis (UniProt AC P64327), - с помощью программ
needle, water и Clustal Omega
(последнее - на сайте UniProt).
Получившиеся выравнивания были последовательно выровнены программой
muscle, результат представлен в виде
проекта JalView.
Обнаруженные различия в выравниваниях:
-
Программа water, осуществляющая локальное выравнивание, обрезает плохо
выравнивающиеся концевые участки белков: выравнивание начинается только с
Glu(21) для E.coli, Glu(39) для M.bovis и заканчивается на
Ile(1075) для E.coli, Ile(1129) для M.bovis.
В то же время другие програмы
их оставляют (начало в Met(1) для E.coli, Met(1) для M.bovis,
конец в Ala(1148) для E.coli, Pro(1234) для M.bovis), хотя по
получающимся выравниваниям также хорошо видна негомологичность этих участков:
-
Программы needle и ClustalO оставляют негомологичные
концевые участки в выравнивании, но по-разному их выравнивают.
needle выравнивает Met(1) E.coli с Arg(36) M.bovis,
ClustalO выравнивает Met(1) E.coli с Ser(22) M.bovis,
причём далее идёт блок из 19 аминокислотных остатков без гэпов, но с низким
процентом совпадения:
-
Явно гомологичные участки выравниваются программами needle и
water одинаково,
c выравниванием программой ClustalO находятся отдельные несоответствия
вследствие иной постановки гэпов. Например, и needle, и water
выравнивают Glu(977) E.coli с Glu(1029) M.bovis, в то же время
ClustalO выравнивает Glu(977) E.coli с Arg(1025) M.bovis,
происходит это из-за отсутствия инделя из 4 гэпов между Met(976) и Glu(977)
E.coli в последнем выравнивании:
Выравнивание программой water выглядит более надёжным при применении к
гомологичным белкам, так как в его вес не
включаются случайные совпадения на как правило вариабельных концевых доменах
белков.
|