Построение парных выравниваний. Поиск по сходству

Ссылка на параметры поиска

Так как в поиске "по умолчанию" в выдаче находилось слишком много результатов, рамки поиска были сильно сужены: поиск проходил только в роде (Pseudo)pedobacter. Всего найденных последовательностей - 68, из них с Query cover > 80% - 45. В принципе, гомологичными можно считать и белки с Query cover > 65%, так как все эти белки принадлежат одному роду, выполняют схожие функции (гликозидазы) и имеют E-value << 0.001. Также в качестве лучшего выравнивания был взят не первый результат, а следующий после него, так как первый результат был выравниванием последовательности с ней же.

Таблица 1. Параметры найденных белков

Организм Белок Длина выравнивания Bit score Процент совпавших остатков Процент схожих остатков E-value Выравнивание
Pedobacter arcticus alpha-glucosidase 716 1146 bits(2964) 75% 86% 0.0 Лучшее
Pedobacter antarcticus alpha-xylosidase 539 131 bits(330) 24% 42% 3e-31 Случайное
Pedobacter sp. Leaf176 9-O-acetylesterase 40 31.2 bits(69) 35% 60% 7.1 Худшее

Ссылка на проект

Указания к проекту

  1. multiple.fasta - выравнивание 20 гомологов (задание 2)
  2. twosequences.fasta - выравнивание белка с худшим результатом различными методами (задание 3-4)

Задание 4

Есть участок, который целиком содержат все выравнивания, но присутствуют небольшие отличия в дальных от центрального места.

Рис. 1. Сравнение участков выравниваний, построенных muscle (сверху) и needle (снизу).

Ссылка на проект выравнивания произвольных последовательностей

Как в предыдущем случае, глобальное выравнивание (построенное needle) почти целиком содержит в себе локальное (построенное water), за исключением небольшого С-концевого участка.


© Котюргин Александр, 2015