Программы глобального и локального выравнивания.


На страницу 2-го семестра
В упражнении производились выравнивания следующих последовательностей:
  1. моего белка (myprot.fasta):
    >sw|Q46857|DKGA_ECOLI 2,5-diketo-D-gluconic acid reductase A (EC 1.1.1.274) (2,5-DKG reductase A) (2,5-DKGR A) (25DKGR-A) (AKR5C).
    MANPTVIKLQDGNVMPQLGLGVWQASNEEVITAIQKALEVGYRSIDTAAAYKNEEGVGKA
    LKNASVNREELFITTKLWNDDHKRPREALLDSLKKLQLDYIDLYLMHWPVPAIDHYVEAW
    KGMIELQKEGLIKSIGVCNFQIHHLQRLIDETGVTPVINQIELHPLMQQRQLHAWNATHK
    IQTESWSPLAQGGKGVFDQKVIRDLADKYGKTPAQIVIRWHLDSGLVVIPKSVTPSRIAE
    NFDVWDFRLDKDELGEIAKLDQGKRLGPDPDQFGG
    
  2. белка с той же функцией из Yersinia pestis (secondprot.fasta):
    >uniref100|UniRef100_Q8ZI40|UniRef100_Q8ZI40 2,5-diketo-D-gluconic acid reductase A
    MTMQPLIKLYDGRLMPQLGLGVWQASIQETELAVSKALEVGYRSIDTAAIYKNEEGVGKA
    LKAAAVARDELFITTKLWNDDQHNPQQALETSLQKLQLDYVDLYLIHWPDPKQDHYVSAW
    RELVTLKEQGLIRSIGVCNFHIPHLQRLIDETGIAPTVNQIELHPLLQQRQLHAWNATHH
    IATESWSPLAQGGKGVFDQEIIRKLAQQYNKTPAQIVIRWHLDSGLIVIPKSVTPARIRE
    NFEVFDFKLQKEELLAITKLDCGKRLGPDPEVFGSDR
    
  3. последовательности, слепленной из маленьких кусочков моего белка (thirdprot):
    ASNEEVITAIQIQTESWSPLA
    
  1. Выравнивание myprot.fasta и secondprot.fasta (возможных гомологов).
    Вот что получилось: Выравнивания почти совпадают (отличия в конце вызваны тем, что DKGA_ECOLI на две аминокислоты короче). Таким образом, для выравнивания гомологов лучше использовать needle. В случае гомологов лучше видеть всю последовательность, а не наилучший кусок. Я уверена, что для белка из другого царства water выдаст очень маленький участок с наилучшим локальным выравниванием, по которому ничего не понятно.
  2. Выравнивание myprot.fasta и thirdprot.fasta (последовательностей, содержащих общие участки). Результаты: Needle для такого типа выравнивания не подходит. Слишком большой штраф за открытие гэпа после первого отрезка последовательности тормозит выравнивание, поэтому программе выгодно оставить последовательность целой. С помощбю water получилось очень хорошее выравнивание, но всё же одна ошибка допущена. Достоинство matcher состоит в том, что она выдала выравнивание обоих кусочков последовательности. Причём второй был выравнен абсолютно верно. Третье выравнивание не информативно.
  3. Выравнивания myprot.fasta и thirdprot.fasta при различных значениях за открытие гэпа Результаты: Все выравнивания не удались. В первых двух случаях повторилась картина предыдущего выравнивания в needle. При g=1 запаса веса, наконец, хватило, чтобы сделать выравнивание первого куска, но зато не выравнялся первый. Вывод: для поиска небольших участков сходста следует использовать алгоритм локального выравнивания.
  4. Построение карты локального сходства В dotmatcher несколько другой принцип выравнивания. Он берёт все возможные отрезки длины window size и выравнивает его с каждым участком такой же длины выравниваемой последовательности. Получается много выравниваний с различными весами. Лишние можно отбросить, поставив какой-то определённый порог. Отличается и формат выдавемого результата. Он представлен в виде графика, диагональные черточки на котором показывает промежутки выравненных участков. Карты сходства последовательностей из myprot.fasta и thirdprot.fasta при различных параметрах.
    Карта Комментарий
    dotmatcher1.ps Карта сходства при исходных параметрах (window size=10, threshold=23)
    dotmatcher2.ps уменьшен размер окна, а значит стала уже черта
    dotmatcher3.ps выравниваемый кусок стал длиннее из-за увеличения размера окна
    dotmatcher4.ps уменьшен порог выравнивания: сразу появилось много лишних
    dotmatcher5.ps увеличение порога выдержало только одно выравнивание

    © Моросанова Мария