На главную страницу второго семестра

Программы выравнивания.

  Для построения выравнивания использовалисб три последовательности: последовательность белка DEOC_ECOLI (1*), его гомолога DEOC_VIBCH (2*) и последовательность, составленная из первых 12 и последних 12 остатков последовательности 1* (3*).

  1.   Построение выравнивания (1*)-(2*) программами needle и water.
      Программа needle выполняет глобальное выравнивание, а water - локальное. В water выравнивание обрывается, когда тот или иной кусок с конца начинает вносить отрицательный вклад в выравнивание, поэтому возникает разница в длине последовательностей, взятых на выравнивание разными программами (260/255). В water последние 4 остатка из первой последовательности и 5 из второй выброшены => возникают отличия в идентичности (80/81.2), схожести (90/90.6), проценте гэпов (0.8/0.4) и счете выравнивания (1055/1057) в пользу локального выравнивания.

  2.   Построение выравнивания (1*)-(3*) программами needle, water и matcher.
      При локальном выравнивании последовательностей (1*) и (3*) программа matcher в первом случае построла выравнивание второй части искусственной последовательности с концом рельной последовательности, во втором случае - начала искусственной последовательности с началом реальной, в третьем случае - куска из середины одной последовательности с куском из середины другой. Программа needle провела глобальное выравнивание: всю искусственную последовательность выровняла с последним куском из реальной. Программа water провела локальное выравнивание: сделала то же самое, что и needle, только отбросила первую аминокислоту из искусственной последовательности и все начало из реальной. Программа matcher продемонстрировала лучший результат, т.к. восстановила "историю создания" последовательности (3*), но в другом случае она могла выдать выравнивания, не согласующиеся с "историей возникновения" последовательности.

  3.   Чем ниже штраф, тем больше вес выравнивания. При системе штрафов 10-1 и 5-1 выравнивается вся последовательность (3*) без разрывов с концом последовательности (1*). При штрафе=1 меняется вид последовательности: искусственная последовательность рвется - в первой половине появляютя гэпы. При обоих штрафах=0 первую половину рвет и выравнивает с ближайшими к концу последовательности (1*) совпадающими аминокислотами. Ни при одной из систем штрафов "историю создания" последовательности восстановить не удалось; также видно, что предпочтительность той или иной системы штрафов не обратно пропорциональна величинам штрафов: очень низкие значения (0-0) приводят к полному бреду.

  4.   Карта локального сходства. При выравнивании с предлагаемыми значениями (ws=10, th=23) конец и начало последовательности (3*) выравниваются с началом и концом последовательности (1*). При выравнивании с высоким порогом (50) находится соответствие только для конца последовательности (вероятно выравнивание последних 12 аа весит больше первых 12), при очень высоких значениях порога (100) программа не находит соответствий. При выравнивании с низким порогом (10) - находит соответствия с последовательностями из середины, при пороге=0 получается частокол. При увеличении размера окна (12, 20) - выравнивает бо'льшие куски при том же (23) значении порога, а вот для 24 (вся посл. (3*) => глобальное выравнивание) выравнивает только начало (в отличие от needle, значит программы устроены по-разному). При значении окна = 30 глючит: выравнивает все по всему.


©Хайруллин Альберт