Выравнивания. Программы парного выравнивания. Jalview


Подсчёт инделей

Команда на вычисление инделей в выравнивании:

python indels.py {acca,ch60,fadr,ex3_bipa}.{needle,water}

Программа принимает на вход только по одному файлу. Программа находится в папке ~/term2/indels вместе с собственно выравниваниями.


Выравнивания белков бактерий Escherichia coli (strain K12) и Bacillus subtilis (strain 168)

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков


Таблица 2. Характеристики локального парного выравнивания трёх пар белков


Таблица 3. Характеристики глобального и локального выравнивания пары случайных белков - EX3_ECOLI (Exodeoxyribonuclease III) и BIPA_BACSU (Large ribosomal subunit assembly factor BipA). Сравнение проведено с помощью команд needle и water, параметры -auto

Скорее всего, данные белки не гомологичны, хотя 21 % идентичности по алгоритму water даёт основания предполагать, что существуют гомология на уровне отдельных доменов. В результате эмпирического анализа данного выравнивания выявить повторяющиеся мотивы не удалось.

EX3_ECOLI - белок, удаляющий повреждённую ДНК в цитозинах и гуанинах (аннотация в записи UniProt). Фрагмент, сравненный в выравнивании, содержит несколько связывающих и активных центров.

BIPA_BACSU - фактор сборки крупных рибосомных субъединиц BipA, может участвовать в трансляции (UniProt). Для этого белка фрагмент в выравнивании не имеет каких-либо интересных особенностей.

Любопытно, что оба белка работают с нуклеиновыми кислотами в той или иной степени, а по каталитической активности относятся к третьему классу - гидролазы. Если локальное выравнивание действительно выявило гомологию (что в целом не противоречит здравому смыслу, ведь оба белка - бактериальные гидролазы нуклеиновых кислот) в некоторых доменах этих белков, то возможно обнаружение каталитических центров у BIPA_BACSU через гомологию с каталитическими центрами EX3_ECOLI.


Множественное выравнивание белков и импорт в Jalview

Мнемоника - CH60, полное название (E. coli - есть некоторое разночтение) - Chaperonin GroEL. По запросу было найдено 791 белок.


Выравнивание

Выравнивание белков 7 видов (человека, курицы, глаук. и крипт. водоросли и трёх бактерий) CH60: fasta, скачать проект Jalview.

Выбор организмов случаен. В данном выравнивании представлены 60-килодальтоновые шаперонины (различия указаны ниже в скобках):

Выравнивание было получено с помощью команды EMBOSS muscle со ссылкой на список выбранных организмов в формате USA. Полученный файл был скачан и портирован в Jalview.


Комментарии

Белки удачно выравнялись, гомология легко прослеживается - встречаются целые множества консервативных последовательностей (к примеру: 108-120, 300-328, 389-442), много похожих по свойствам аминокислот участков. Однако встречаются и вариативные участки - начала и концы белков, к примеру.

Общая черта - все данные шаперонины принадлежат бактериям или митохондриям, цианеллам и хлоропластам, т. е. бактериям и от них происходящих орагнеллам.

Митохондриальные шаперонины человека и курицы несколько длиннее чем GroEL шаперонины представленных одноклеточных эукариот и бактерий - разница в 25 аминокислотных остатков в начале белка сверх того, что имеют одноклеточные. Кроме того, Guillardia theta выделяется среди остальных отсутствием у её шаперона около 20 аминокислот с конца.

В целом заметно, что шапероны позвоночных, водорослей и бактерий заметно отличаются друг от друга. У представленных трёх групп не редко встречаются места в выравнивании, когда две группы имеют одну общую консервативную аминокислоту, а третья - другую. Впрочем, имеют место быть и свойственные сугубо одному виду особенности (к примеру, делеции ближе к концу выравнивания у некоторых организмов).