Дана последовательность белка эндонукдеазы рестрикции из Mycobacterium sp. JLS. AC: YP_001069123.1
На сайте NCBI Был выбран алгоритм blastp (protein-protein BLAST), база данных - Reference proteins (refseq_protein). При стандартной выдаче поиска в 100 гомологов минимальное e-value
Ссылка на итоговые параметры поиска
Всего гомологов 231. Используя условный критерий гомологичности (E-value<0.001 и Query cover не менее 70%), можно заключить, что в базе данных найдено 114 гомоглогов целой исходной последовательности.
В таблице представлены ключевые параметры нескольких находок:
Организм | Длина выравнивания | Bit score | % идентичных | % сходных | E-value | Выравнивание |
Mycobacterium sp. JLS | 456 | 922 bits(2382) | 100 | 100 | 0.0 | выравнивание |
Amycolatopsis orientalis | 322 | 121 bits(303) | 31 | 45 | 4e-27 | выравнивание |
Legionella pneumophila | 168 | 38.5 bits(88) | 24 | 44 | 9.5 | выравнивание |
Сохраненная выборка 26 последовательностей [fasta]
В редакторе JalView с помощью программы Muscle было построено множественное выравнивание 26 гомологов данного мне белка. Вертикальные блоки отмечены символом B. На N- и C- концах многих последовательностей присутствовали длинные невыровненные участки, различные у разных находок, что не свидетельствует об отсутствии гомологии между последовательностями в целом. Эти участки были удалены.
Для этого задания были взяты следующие последовательности WP_014565448.1(изначальный белок) и его гомолог - WP_011854641.1. Последовательности были выровнены четырмя разными способами.
Для построения 2 из выравниваний использовались программы needle и water на kodomo.
Needle строит глобальные выравнивания двух последовательностей (выравнивания полных последовательностей белков относительно друг друга, имеющее по возможности максимальный счет). Water строит локальные выравнивания (выравнивания неполных последовательностей, имеющие максимальный счет). По умолчанию needle выдает файлы формата .needle, а water - файлы формата .water, содержащие выравнивание и аннотацию. Особенность файлов данного вида в том, что в них указывается не только прямое совпадение, но и сходство аминокислот (проставляются соответственно одна или две точки).
Затем было произведено выравнивание четырех выравниваний таким образом, чтобы одинаковые колонки из разных выравниваний оказались друг под другом.
Для этого выравнивания использовалась последовательность данного мне белка и белка WP_006422648 cysteine desulfurase [delta proteobacterium NaphS2]. С помощью программ needle и water на kodomo были получены два парных выравнивания, глобальное и локальное, которые затем были выровнены друг отнистельно друга.