На главную страницу второго семестра
Программы выравнивания.
Для построения выравнивания использовалисб три
последовательности: последовательность белка DEOC_ECOLI (1*), его гомолога
DEOC_VIBCH (2*) и последовательность, составленная из первых 12 и последних 12
остатков последовательности 1* (3*).
-
Построение выравнивания (1*)-(2*) программами needle и water.
Программа needle выполняет глобальное
выравнивание, а water - локальное. В water
выравнивание обрывается, когда тот или иной кусок с конца начинает вносить
отрицательный вклад в выравнивание, поэтому возникает разница в длине
последовательностей, взятых на выравнивание разными программами (260/255).
В water последние 4 остатка из первой последовательности и 5 из второй
выброшены => возникают отличия в идентичности (80/81.2), схожести (90/90.6),
проценте гэпов (0.8/0.4) и счете выравнивания (1055/1057) в пользу локального
выравнивания.
- Построение выравнивания (1*)-(3*) программами needle,
water и matcher.
При локальном выравнивании
последовательностей (1*) и (3*) программа matcher в первом случае построла
выравнивание второй части искусственной последовательности с концом рельной
последовательности, во втором случае - начала искусственной последовательности
с началом реальной, в третьем случае - куска из середины одной
последовательности с куском из середины другой. Программа needle провела
глобальное выравнивание: всю искусственную последовательность выровняла с
последним куском из реальной. Программа water провела
локальное выравнивание:
сделала то же самое, что и needle, только отбросила первую аминокислоту из искусственной
последовательности и все начало из реальной. Программа matcher
продемонстрировала лучший результат, т.к. восстановила "историю создания"
последовательности (3*), но в другом случае она могла выдать выравнивания,
не согласующиеся с "историей возникновения" последовательности.
- Чем ниже штраф, тем больше вес выравнивания. При
системе штрафов 10-1 и
5-1 выравнивается вся последовательность (3*)
без разрывов с концом последовательности (1*). При
штрафе=1 меняется вид последовательности: искусственная последовательность
рвется - в первой половине появляютя гэпы. При обоих
штрафах=0 первую половину рвет и выравнивает с
ближайшими к концу последовательности (1*) совпадающими аминокислотами. Ни при
одной из систем штрафов "историю создания" последовательности восстановить не
удалось; также видно, что предпочтительность той или иной системы штрафов не
обратно пропорциональна величинам штрафов: очень низкие значения (0-0) приводят
к полному бреду.
- Карта локального сходства. При выравнивании с
предлагаемыми значениями (ws=10, th=23) конец и начало последовательности (3*)
выравниваются с началом и концом последовательности (1*). При выравнивании с
высоким порогом (50) находится соответствие только для конца последовательности
(вероятно выравнивание последних 12 аа весит больше первых 12), при очень
высоких значениях порога (100) программа не находит соответствий. При
выравнивании с низким порогом (10) - находит соответствия с
последовательностями из середины, при пороге=0 получается частокол. При
увеличении размера окна (12, 20) - выравнивает бо'льшие куски при том же (23)
значении порога, а вот для 24 (вся посл. (3*) => глобальное выравнивание)
выравнивает только начало (в отличие от needle, значит программы устроены
по-разному). При значении окна = 30 глючит: выравнивает все по всему.
©Хайруллин Альберт