Построение парных выравниваний. Поиск по сходству.

Дана последовательность белка эндонукдеазы рестрикции из Mycobacterium sp. JLS. AC: YP_001069123.1

1. Выборка гомологов.

На сайте NCBI Был выбран алгоритм blastp (protein-protein BLAST), база данных - Reference proteins (refseq_protein). При стандартной выдаче поиска в 100 гомологов минимальное e-value

Ссылка на итоговые параметры поиска

Всего гомологов 231. Используя условный критерий гомологичности (E-value<0.001 и Query cover не менее 70%), можно заключить, что в базе данных найдено 114 гомоглогов целой исходной последовательности.

В таблице представлены ключевые параметры нескольких находок:

Организм Длина выравнивания Bit score% идентичных% сходныхE-valueВыравнивание
Mycobacterium sp. JLS 456 922 bits(2382)1001000.0выравнивание
Amycolatopsis orientalis 322 121 bits(303)31454e-27выравнивание
Legionella pneumophila 168 38.5 bits(88)24449.5выравнивание

Сохраненная выборка 26 последовательностей [fasta]

2. Построние множественного выравнивания последовательностей из полученной выборки.

В редакторе JalView с помощью программы Muscle было построено множественное выравнивание 26 гомологов данного мне белка. Вертикальные блоки отмечены символом B. На N- и C- концах многих последовательностей присутствовали длинные невыровненные участки, различные у разных находок, что не свидетельствует об отсутствии гомологии между последовательностями в целом. Эти участки были удалены.


Изображение множественного выравнивания гомологов.

3-4. Глобальное и локальное парные выравнивания.

Для этого задания были взяты следующие последовательности WP_014565448.1(изначальный белок) и его гомолог - WP_011854641.1. Последовательности были выровнены четырмя разными способами.

Для построения 2 из выравниваний использовались программы needle и water на kodomo.

Needle строит глобальные выравнивания двух последовательностей (выравнивания полных последовательностей белков относительно друг друга, имеющее по возможности максимальный счет). Water строит локальные выравнивания (выравнивания неполных последовательностей, имеющие максимальный счет). По умолчанию needle выдает файлы формата .needle, а water - файлы формата .water, содержащие выравнивание и аннотацию. Особенность файлов данного вида в том, что в них указывается не только прямое совпадение, но и сходство аминокислот (проставляются соответственно одна или две точки).

Затем было произведено выравнивание четырех выравниваний таким образом, чтобы одинаковые колонки из разных выравниваний оказались друг под другом.


Парные выравнивания.

Проект JalView.

5.Парные выравнивания последовательностей двух заведомо негомологичных белков.

Для этого выравнивания использовалась последовательность данного мне белка и белка WP_006422648 cysteine desulfurase [delta proteobacterium NaphS2]. С помощью программ needle и water на kodomo были получены два парных выравнивания, глобальное и локальное, которые затем были выровнены друг отнистельно друга.


Парные выравнивания.

Полный проект JalView.