Главная страница > Второй семестр > Выравнивание вручную
Проведено выравнивание искусственной последовательности и последовательности, состоящей из первых 60-ти аминокислотных остатков GLMS_ECOLI. Выравнивание осуществлялось вручную. Результат приведен ниже (см. first_aln.txt), звездочка соответствует паре одинаковых аминокислотных остатков, точка паре различных аминокислотных остатков, минус гэпу:
0 10 20 30 40 50 GLMS_ECOLI MCGI--------------VGAIAQ-----------------RDVAEILLEGLRRLEYRGY Artificial -CGITRANKRPTGAYMWPIGAIAQITITWIWIDTASRACIPRDVAYILLEGLRRLEYVGY -***--------------.*****-----------------****.***********.** 60 70 80 90 100 GLMS_ECOLI ---------DSAGLAVVDAEGHMT-----RLRRLGKVQMLAQAAE- Artificial FHAGCSYNDDSAGLAVVDAEGHMTHFHRPRLRRLGKVQMLAQAAEE ---------***************-----****************- |
Вес выравнивания W был вычислен по формуле:
W = M X G,
где M число позиций выравнивания, в которых оба аминокислотных остатка
одинаковы, X число позиций выравнивания, в которых аминокислотные
остатки различны, G число гэпов. Таким образом,
W = 56 3 47 = 6.
Для увеличения веса выравнивания необходимо либо повысить значение M (что приведет
к уменьшению X), либо понизить значение G.
Единственная возможность увеличения M изменение позиции трех аминокислотных остатков GLMS_ECOLI (V, E, R),
которые не совпадают с соответствующими остатками последовательности Artificial. Однако, это не принесло желаемого результата, поскольку
при попытке перемещения E и R уменьшилось количество пар совпадающих аминокислот, а остаток V
отсутствовал в составе близлежащего участка последовательности Artificial.
Увеличение веса выравнивания за счет уменьшения значения G также не представляется возможным. В данном случае
количество гэпов превышает минимальное количество, равное разности длин последовательностей, на 2 (за счет концевых гэпов, выделеных красным).
Попытка убрать любые два гэпа приведет к понижению веса выравнивания за счет уменьшения количества пар совпадающих
аминокислотных остатков (значение M).
Таким образом, при внесении любых изменений вес выравнивания либо уменьшится, либо останется неизменным.
Следует отметить, что приведенная выше формула для вычисления веса выравнивания недостаточно точно характеризует степень
гомологии последовательностей. Во-первых, она не учитывает то, насколько сильно могут отличаться аминокислотные остатки одной позиции выравнивания по
физико-химическим своствам. Во-вторых, она не позволяет различать выравнивания, которые содержат одинаковое количество гэпов,
образующих разное число групп.
Проведено выравнивание последовательности GLMS_ECOLI и ее гомолога из Vibrio cholerae (GLMS_VIBCH). Выравнивание осуществлялось вручную с помощью редактора GeneDoc. Результат представлен в файле second_aln.msf (пары совпадающих аминокислотных остатков выделены цветом, внизу приведена консенсусная последовательность).
© Куравский Михаил Львович