Практикум 9. Выравнивание последовательностей

Глобальное парное выравнивание гомологичных белков

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
ATP synthase epsilon chain ATPE_ECOLI ATPE_BACSU 213.0 30.9% 55.4% 5.0% 3
Deoxyribose operon repressor DEOR_ECOLI DEOR_BACSU 30.0 12.6% 24.1% 51.7% 15
DNA polymerase III subunit delta HOLA_ECOLI HOLA_BACSU 73.0 18.2% 33.8% 27.5% 19
Таблица 1. Характеристики глобального парного выравнивания гомологичных белков

Локальное парное выравнивание гомологичных белков (water)

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
ATP synthase epsilon chain ATPE_ECOLI ATPE_BACSU 220.0 33.6% 60.2% 0.8% 1 92.1% 96.2%
Deoxyribose operon repressor DEOR_ECOLI DEOR_BACSU 37.0 19.0% 34.9% 35.3% 14 90.1% 71.2%
DNA polymerase III subunit delta HOLA_ECOLI HOLA_BACSU 92.0 19.5% 37.5% 19.5% 14 96.2% 96.2%
Таблица 2. Характеристики локального парного выравнивания гомологичных белков (water)

Комментарии к выравниваниям

ATPE (ATP synthase epsilon chain)

Глобальное выравнивание показывает умеренное сходство белков (~31% identity), при этом присутствует небольшое количество гэпов, что указывает на общую гомологию по всей длине последовательности.

Локальное выравнивание подтверждает наличие высококонсервативного участка (identity ~34%), при этом покрытие обеих последовательностей высокое (более 90%). Это означает, что белки гомологичны практически по всей длине, а различия в глобальном выравнивании обусловлены накоплением замен и небольшими вставками/делециями.

DEOR (Deoxyribose operon repressor)

Глобальное выравнивание демонстрирует низкий уровень идентичности (~13%) и большое количество гэпов (~52%), что указывает на слабую гомологию по всей длине белков.

Локальное выравнивание выявляет более консервативный участок с повышенной идентичностью (~19%) и существенно более высоким покрытием белков (особенно для первого белка). Это свидетельствует о том, что гомология ограничена отдельным функционально важным доменом, тогда как остальная часть последовательности существенно различается.

HOLA (DNA polymerase III subunit delta)

Глобальное выравнивание показывает низкую идентичность (~18%) и значительное количество гэпов (~27%), что говорит о частичной гомологии белков.

Локальное выравнивание выявляет более качественное совпадение (identity ~19%) при высоком покрытии обеих последовательностей (~96%). Это указывает на наличие консервативного участка белка при значительной вариативности дополнительных участков.

Результат применения программ выравнивания к неродственным белкам

Alignment Score % Identity % Similarity Gaps Indels
Global (needle) 33.5 12.4% 21.0% 63.1% 17
Local (water) 51 23.3% 39.5% 27.9% 8
Таблица 3. Характеристики выравнивания неродственных белков

Для анализа были выбраны белки FLIM и RIMM.

Глобальное выравнивание показало низкий уровень сходства. Это свидетельствует об отсутствии выраженной гомологии по всей длине белков.

Локальное выравнивание позволило обнаружить отдельные участки сходства между последовательностями. Вероятно, такие совпадения связаны либо со случайным сходством аминокислотных последовательностей, либо с наличием коротких консервативных мотивов, характерных для различных бактериальных белков.

В целом результаты выравнивания соответствуют ожиданиям для неродственных белков: локальное выравнивание оказалось более информативным для поиска коротких сходных участков, однако полученные значения identity и similarity недостаточны для вывода о гомологии белков.

Множественное выравнивание белков и импорт в Jalview

(а) Мнемоника и выбранные белки Для анализа была выбрана мнемоника ATPE - рекомендованное название для белка из E. coli - ATP synthase epsilon chain. В базе Swiss-Prot было найдено 1305 белков с данной мнемоникой по запросу: ATPE_ AND (reviewed:true)

Для множественного выравнивания были выбраны 7 последовательностей: ATPE_CHLRE, ATPE_SYNY3, ATPE_AQUAE, ATPE_XYLFA, ATPE_FUSNN, ATPE_ECOLI, ATPE_BACSU

(б) Проведение выравнивания Последовательности были загружены из базы Swiss-Prot и сохранены в формате FASTA. Множественное выравнивание было выполнено с использованием программы MUSCLE с параметрами по умолчанию. Полученный файл выравнивания был импортирован в программу Jalview. Для визуализации и анализа использовалась раскраска Percentage Identity.

(в) Jalview Проект Jalview сохранён и доступен по ссылке: Проект Jalview

(г) Комментарии к выравниванию Полученное множественное выравнивание показывает, что все выбранные белки в целом хорошо выровнены и являются гомологичными, что подтверждается наличием консервативных участков по длине последовательности.

Наиболее консервативные области наблюдаются в центральной части выравнивания (колонки: 31-42, 46, 49, 51, 73-78, 83-90), где большинство позиций совпадают или содержат аминокислоты со сходными свойствами. Эти участки, вероятно, связаны с функционально важными регионами белка.

Концевые участки (N- и C-концы) различаются больше и содержат больше замен и гэпов, что может быть связано с меньшей функциональной значимостью или адаптацией к различным организмам.