Практикум 9. Выравнивание последовательностей

Для выполнения заданий практикума были выбраны мнемоники АРТ_ (Adenine phosphoribosyltransferase, аденинфосфорибозилтрансфераза), URK_ (Uridine kinase, уридинкиназа), UXAB_ (Altronate oxidoreductase, альтронатная оксидоредуктаза) у бактерий Escherichia coli (кишечная палочка, штамм 12) и Bacillus subtilis (сенная палочка, штамм 168).

ГЛОБАЛЬНОЕ ПАРНОЕ ВЫРАВНИВАНИЕ ГОМОЛОГИЧНЫХ БЕЛКОВ

Глобальное парное выравнивание для каждой пары белков было проведено с помощью программы needle с параметрами по умолчанию (опция -auto). Результаты выравниваний приведены в таблице 1.

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков.


Protein Name

ID 1

ID 2

Score
% Identity % Similarity
Gaps

Indels
Adenine phosphoribosyltransferase APT_ECOLI APT_BACSU 441.5 50.3 61.2 13 3
Uridine kinase URK_ECOLI URK_BACSU 572.5 51.4 66.5 12 3
Altronate oxidoreductase UXAB_ECOLI UXAB_BACSU 1058.5 43.4 61.6 33 8

ЛОКАЛЬНОЕ ПАРНОЕ ВЫРАВНИВАНИЕ ГОМОЛОГИЧНЫХ БЕЛКОВ

Локальное парное выравнивание для каждой пары белков было проведено с помощью программы water с параметрами по умолчанию (опция -auto). Результаты выравниваний приведены в таблице 2.

Таблица 2. Характеристики локального парного выравнивания трёх пар белков.


Protein Name

ID 1

ID 2

Score
% Identity % Similarity
Gaps

Indels

Coverage 1

Coverage 2
Adenine phosphoribosyltransferase APT_ECOLI APT_BACSU 450.0 56.2 66.7 0 0 88.5 95.3
Uridine kinase URK_ECOLI URK_BACSU 576.5 54.6 70.7 4 1 96.2 95.3
Altronate oxidoreductase UXAB_ECOLI UXAB_BACSU 1058.5 44.0 62.5 26 7 100.0 98.5

КОММЕНТАРИИ К ВЫРАВНИВАНИЯМ

Белки APT_ECOLI и APT_BACSU: глобальное выравнивание показало довольно высокий процент идентичности (50.3%) и сходных аминокислот (61.2%), а также небольшое число гэпов (13) и инделей (3). Можно считать, что белки гомологичны по всей длине, так как процент идентичности больше 25%.
При локальном выравнивании идентичность возросла примерно на 6%, покрытие составило 88.5% для APT_ECOLI и 95.3% для APT_BACSU, а гэпы и индели исчезли. Это связано с тем, что локальное выравнивание охватило большую часть обоих белков, кроме их концов. Это указывает на то, что у белков есть длинный гомологичный участок, возможно, важный для выполнения каталитических функций, а их концы различаются.
В данном случае локальное выравнивание оказалось более информативным, так как с помощью него удалось обнаружить длинный гомологичный участок.

Белки URK_ECOLI и URK_BACSU: оба выравнивания показали хорошие проценты идентичности и подобия. Глобальное выравнивание показало идентичность 51.4%, что больше 25%, поэтому белки можно считать гомологичными.
Проценты покрытия в локальном выравнивании больше 95% для обоих белков. Это означает, что локальное выравнивание практически совпало с глобальным и белки схожи по всей длине, но есть вставки или делеции в определенной области последовательности (так как при локальном выравнивании остался один индель из четырех гэпов в белке URK_BACSU). Однако концы белков тоже различаются, так как они не учитывались в локальном выравнивании.
В этом случае локальное выравнивание оказалось более информативным, но ненамного.

Белки UXAB_ECOLI и UXAB_BACSU: оба выравнивания показали проценты индентичности больше 25%. В локальном выравнивании проценты подобия и идентичности почти не изменились, а покрытие составило 100% для UXAB_ECOLI и 98.5% для UXAB_BACSU, что означает, что локальное выравнивание охватило белки почти полностью и практически совпало с глобальным. Также в локальномы выравнивании уменьшилось число гэпов и инделей. Можно считать, что белки гомологичны по всей длине, а важные для функционирования гомологичные участки распределены по всей длине последовательности, как и точечные мутации.
В этом случае оба выравнивания оказались достаточно информативными.

РЕЗУЛЬТАТ ПРИМЕНЕНИЯ ПРОГРАММ ВЫРАВНИВАНИЯ К НЕРОДСТВЕННЫМ БЕЛКАМ

Для выполнения задания были выбраны белки Ribonuclease E (рибонуклеаза Е, ID: RNE_ECOLI) у Escherichia coli и Alanine dehydrogenase (аланиндегидрогеназа, ID: DHA_BACSU) у Bacillus subtilis.
Выравнивания выполнялись с помощью программ needle и water с параметрами по умолчанию (опция -auto). Результаты выравниваний приведены в таблицах 3 и 4.

Таблица 3. Характеристики применения программ глобального парного выравнивания к двум неродственным белкам.


Protein Name 1

Protein Name 2

ID 1

ID 2

Score
% Identity % Similarity
Gaps

Indels
Ribonuclease E Alanine dehydrogenase RNE_ECOLI DHA_BACSU 53.5 7.2 11.9 899 28

Таблица 4. Характеристики применения программ локального парного выравнивания к двум неродственным белкам.


Protein Name 1

Protein Name 2

ID 1

ID 2

Score
% Identity % Similarity
Gaps

Indels

Coverage 1

Coverage 2
Ribonuclease E Alanine dehydrogenase RNE_ECOLI DHA_BACSU 69.5 19.9 32.5 157 24 30.4% 79.9%

Белки не являются гомологичными, что подтверждается результатами выравниваний. Глобальное выравнивание показало всего лишь 7.2% идентичности, что намного меньше 25%, а также 899 гэпов. При этом длины последовательностей белков отличаются почти в 3 раза (1061 а. о. у рибонуклеазы Е и 378 а. о. у аланиндегидрогеназы), поэтому большей части белка RNE_ECOLI ничего не было сопоставлено. У локального выравнивания процент идентичности лучше (19.9), но все еще меньше 25%, а также большое число гэпов (157).

МНОЖЕСТВЕННОЕ ВЫРАВНИВАНИЕ БЕЛКОВ И ИМПОРТ В JALVIEW

Для выполнения задания была выбрана мнемоника АРТ_, которая соответствует белку под названием Adenine phosphoribosyltransferase (аденинфосфорибозилтрансфераза). С такой мнемоникой с помощью команды infoseq 'sw:APT_*' -only -name -nohead | wc -l нашлось 634 белка. Среди них было выбраны следующие семь:
APT_ECOLI (белок Escherichia coli)
APT_BACSU (белок Bacillus subtilis)
APT_HYDCU (белок Hydrogenovibrio crunogenus)
APT_FRAAA (белок Frankia alni)
APT_SALTO (белок Salinispora tropica)
APT_CLONN (белок Clostridium novyi)
APT_LACLA (белок Lactococcus lactis)

В директории ~/term2/pr9 был создан текстовый файл apt.txt с идентификаторами записей о белках. Затем при помощи команды seqret @apt.txt apt.fasta был создан файл в формате fasta и запущена программа muscle: muscle -align apt.fasta -output apt_alignment.fasta.

Файл apt_alignment.fasta с полученным выравниванием был загружен в программу Jalview.

Файл с проектом Jalview

Белки выровнялись корректно и имеют гомологичные участки в разных областях последовательности. Например, столбцы 22, 33-35, 39-46, 60, 70, 72-81, 85-87, 94-99, 101-104 довольно консервативны, а столбцы 25-38, 52-56, 181-186 и др. - неконсервативны. Также все консервативные участки собраны в основном в середине последоватльности, а не на ее концах. В последовательностях есть гэпы, они в выравнивании тоже сосредоточены по краям последовательности.