Одна из последовательностей – последовательность из 60 а.о. исследуемого белка, другая – взята из задания.
Результаты – см. файл first_aln.txt
Добавляю к выравниванию, полученному при выполнении задания 1, третью строчку, содержащую следующие символы: звездочку *, если буквы в данной позиции совпали; точку, если они разные; минус-, если одна из последовательностей содержит гэп.
Вычисляю число, называемое "весом", для полученного выравнивания. Вес вычисляется по формуле:
W = M – X – G
где M — число позиций выравнивания, в которых обе буквы одинаковы; X — число позиций выравнивания, в которых буквы разные, G — число гэпов. Значение веса указано в файле first_aln.txt (ниже самого выравнивания).
Можно ли изменить выравнивание так, чтобы вес увеличился? Для ответа следует проанализировать формулу, предложенную выше. Чтобы значение увеличить, следует:
Возможные решения данной задачи (возникающие на этот счет идеи):
Но применимы ли данные рассуждения конкретно к МОЕМУ случаю?
Наблюдения и дальнейшие рассуждения:
ВЫВОД: увеличить массу выравнивания не удалось.
С помощью редактора GeneDoc построено выравнивание аминокислотных последовательностей белка ASPG2_ECOLI и его гомолога из генома Yersinia pestis (это белок Q8ZGB7_YERPE, предшественник L-аспарагиназы II; данный белок был найден в поисковой системе SRS).
Совпадающие остатки выделены цветом: темно-синим — буквы, красным — фон. Помечены позиции выравнивания через каждые 5. Указана консенсусная последовательность. Указаны номера остатков в начале и конце блоков.
Результат работы сохранен в файле second_aln.msf. Кроме того, имеется еще 1 файл - second_aln(variation).msf. Этот файл содержит выравнивание с меньшим числом совпадений, но и с меньшим числом гэпов (это снова «размышления» к вопросу об увеличении массы выравнивания… Что лучше?..).
Исходную версию протокола ("Потокол занятия 3 2 семестра") можно посмотреть здесь.