Построение парных выравниваний. Поиск по сходству


Создание выборки гомологов белка декстрансукразы L. citreum KM20

Для нахождения гомологов анализируемого белка использовалась программа protein BLAST. Некоторые настройки были изменены для лучшего представления результатов, сами настройки можно посмотреть здесь (файл с сохранёнными настройками).
Так как программа выдавала много потенциальных последовательностей-гомологов (12.395), некоторые настройки были изменены, например бактерии рода Streptococcus не показываются. Из такой небольшой выборки белков (229), белки с покрытием >80% нашлись, причём довольно большое количество, - 89. Единственное, что стоит отметить, - это то, что некоторые белки 'повторяются', так как до сих пор в базах данных остались данные о декстрансукразе, как о гликозил гидролазе, поэтому первые результаты с покрытием в 99% и идентичностью в 99% в той же бактерии, L. citreum, по сути являются старыми артефактами, которые не были удалены.

Таблица 1. Краткое сравнение белков
ОрганизмДлина выравниванияBit scoreПроцент идентичных/сходных остатков, %E-valueВыравнивание
Leuconostoc gelidum17913661 bits(9493)99/990.0Лучшее
Leuconostoc fallax11631077 bits(2785)51/630.0Случайное
Oenococcus oeni1040859 bits(2220)47/610.0Случайное
Weissella cibaria20332.3 bits(72)25/377.3Худшее

Множественное выравнивание 24 последовательностей

Для выполнения этого задания были взяты 24 последовательности. В этом fasta-файле лежат все последовательности. Сам jvp-проект находится здесь. Блоки отмечены 'B'. На N- и C-концах были длинные невыровненные участки, которые впоследствии были вырезаны, осталась часть с консервативными колонками, блоками. Наличие гэпов на N- и C-концах никак не говорит о том, что последовательности не гомологичны.

Глобальное и локальное выравнивания

Чтобы выполнить это задание, нужно было воспользоваться программами Needle и Water через сервер Kodomo с помощью Putty. Входные файлы: две последовательности в fasta-формате, величины штрафов за первый гэп (10.0) и за продление гэпа (0.5), также имя выходного файла.
Отличия Needle и Water:
  • Needle строит глобальные выравнивания двух последовательностей
  • Water строит локальные выравнивания
  • По умолчанию Needle выдает файлы формата .needle, а water - файлы формата .water, содержащие выравнивание и аннотацию. Чтобы получить выходной файл в fasta-формате, необходимо в качестве опции указать {имя файла}.fasta. Особенность файлов данного вида в том, что в них указывается не только совпадение цепочек, но и сходство аминокислот (ставятся соответственно одна или две точки).
    Использованные последовательности: WP_041761905.1 (мой белок) и WP_063083270.1.

    Глобальное парное выравнивание, построенное с помощью Needle



    Глобальное парное выравнивание, вырезанное из множественного



    Локальное парное выравнивание, построенное с помощью Water



    Локальное парное выравнивание, построенное с помощью Blast



    4 выравнивания, объединённых в группы



    {ссылка на jalview-проект с 4 окнами, выравниваниями}
    {ссылка на jalview-проект с объединёнными выравниваниями}

    Выравнивание полученных выравниваний

    Участки, найденные программами BLAST и Water совпадают почти полностью. Также на рис. 1 представлен участок, на котором выравнивания различаются.


    Рис. 1. Участок несовпадающих выравниваний.

    {ссылка на jalview-проект с выровненными выравниваниями}

    Парные выравнивания двух заведомо негомологичных белков

    Для выполнения этого задания были взяты два белка: NP_953118.2 и WP_041761905.1.
    Ниже представлены выравнивания заведомо негомологичных белков с использованием программ Water и Needle. Видно, что выравнивания, полученные 2 программами в целом совпадают. Что касается отдельных выравниваний, можно сказать, что совпадения нашлись, но как таковые блоки отсутствуют. Иными словами полученные данные в результате выравниваний не информативны.



    {ссылка на jalview-проект с выравниванием заведомо негомологичных поледовательностей}

    Финальный Jalview-проект

    {cсылку на jalview-проект с тремя окнами (множественное выравнивание, парные выравнивания моего белка с гомологом, парные выравнивания моего белка с белком, заведомо негомологичным ему)}