Для выполнения заданий практикума были выбраны мнемоники АРТ_ (Adenine phosphoribosyltransferase, аденинфосфорибозилтрансфераза), URK_ (Uridine kinase, уридинкиназа), UXAB_ (Altronate oxidoreductase, альтронатная оксидоредуктаза) у бактерий Escherichia coli (кишечная палочка, штамм 12) и Bacillus subtilis (сенная палочка, штамм 168).
Глобальное парное выравнивание для каждой пары белков было проведено с помощью программы needle с параметрами по умолчанию (опция -auto). Результаты выравниваний приведены в таблице 1.
Таблица 1. Характеристики глобального парного выравнивания трёх пар белков.
| Protein Name |
ID 1 |
ID 2 |
Score |
% Identity | % Similarity | Gaps |
Indels |
|---|---|---|---|---|---|---|---|
| Adenine phosphoribosyltransferase | APT_ECOLI | APT_BACSU | 441.5 | 50.3 | 61.2 | 13 | 3 |
| Uridine kinase | URK_ECOLI | URK_BACSU | 572.5 | 51.4 | 66.5 | 12 | 3 |
| Altronate oxidoreductase | UXAB_ECOLI | UXAB_BACSU | 1058.5 | 43.4 | 61.6 | 33 | 8 |
Локальное парное выравнивание для каждой пары белков было проведено с помощью программы water с параметрами по умолчанию (опция -auto). Результаты выравниваний приведены в таблице 2.
Таблица 2. Характеристики локального парного выравнивания трёх пар белков.
Protein Name |
ID 1 |
ID 2 |
Score |
% Identity | % Similarity | Gaps |
Indels |
Coverage 1 |
Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| Adenine phosphoribosyltransferase | APT_ECOLI | APT_BACSU | 450.0 | 56.2 | 66.7 | 0 | 0 | 88.5 | 95.3 |
| Uridine kinase | URK_ECOLI | URK_BACSU | 576.5 | 54.6 | 70.7 | 4 | 1 | 96.2 | 95.3 |
| Altronate oxidoreductase | UXAB_ECOLI | UXAB_BACSU | 1058.5 | 44.0 | 62.5 | 26 | 7 | 100.0 | 98.5 |
Белки APT_ECOLI и APT_BACSU: глобальное выравнивание показало довольно высокий процент идентичности (50.3%) и сходных аминокислот (61.2%), а также небольшое число гэпов (13) и инделей (3). Можно считать, что белки гомологичны по всей длине, так как процент идентичности больше 25%.
При локальном выравнивании идентичность возросла примерно на 6%, покрытие составило 88.5% для APT_ECOLI и 95.3% для APT_BACSU, а гэпы и индели исчезли. Это связано с тем, что локальное выравнивание охватило большую часть обоих белков, кроме их концов. Это указывает на то, что у белков есть длинный гомологичный участок, возможно, важный для выполнения каталитических функций, а их концы различаются.
В данном случае локальное выравнивание оказалось более информативным, так как с помощью него удалось обнаружить длинный гомологичный участок.
Белки URK_ECOLI и URK_BACSU: оба выравнивания показали хорошие проценты идентичности и подобия. Глобальное выравнивание показало идентичность 51.4%, что больше 25%, поэтому белки можно считать гомологичными.
Проценты покрытия в локальном выравнивании больше 95% для обоих белков. Это означает, что локальное выравнивание практически совпало с глобальным и белки схожи по всей длине, но есть вставки или делеции в определенной области последовательности (так как при локальном выравнивании остался один индель из четырех гэпов в белке URK_BACSU). Однако концы белков тоже различаются, так как они не учитывались в локальном выравнивании.
В этом случае локальное выравнивание оказалось более информативным, но ненамного.
Белки UXAB_ECOLI и UXAB_BACSU: оба выравнивания показали проценты индентичности больше 25%. В локальном выравнивании проценты подобия и идентичности почти не изменились, а покрытие составило 100% для UXAB_ECOLI и 98.5% для UXAB_BACSU, что означает, что локальное выравнивание охватило белки почти полностью и практически совпало с глобальным. Также в локальномы выравнивании уменьшилось число гэпов и инделей. Можно считать, что белки гомологичны по всей длине, а важные для функционирования гомологичные участки распределены по всей длине последовательности, как и точечные мутации.
В этом случае оба выравнивания оказались достаточно информативными.
Для выполнения задания были выбраны белки Ribonuclease E (рибонуклеаза Е, ID: RNE_ECOLI) у Escherichia coli и Alanine dehydrogenase (аланиндегидрогеназа, ID: DHA_BACSU) у Bacillus subtilis.
Выравнивания выполнялись с помощью программ needle и water с параметрами по умолчанию (опция -auto). Результаты выравниваний приведены в таблицах 3 и 4.
Таблица 3. Характеристики применения программ глобального парного выравнивания к двум неродственным белкам.
Protein Name 1 |
Protein Name 2 |
ID 1 |
ID 2 |
Score |
% Identity | % Similarity | Gaps |
Indels |
|---|---|---|---|---|---|---|---|---|
| Ribonuclease E | Alanine dehydrogenase | RNE_ECOLI | DHA_BACSU | 53.5 | 7.2 | 11.9 | 899 | 28 |
Таблица 4. Характеристики применения программ локального парного выравнивания к двум неродственным белкам.
Protein Name 1 |
Protein Name 2 |
ID 1 |
ID 2 |
Score |
% Identity | % Similarity | Gaps |
Indels |
Coverage 1 |
Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|---|
| Ribonuclease E | Alanine dehydrogenase | RNE_ECOLI | DHA_BACSU | 69.5 | 19.9 | 32.5 | 157 | 24 | 30.4% | 79.9% |
Белки не являются гомологичными, что подтверждается результатами выравниваний. Глобальное выравнивание показало всего лишь 7.2% идентичности, что намного меньше 25%, а также 899 гэпов. При этом длины последовательностей белков отличаются почти в 3 раза (1061 а. о. у рибонуклеазы Е и 378 а. о. у аланиндегидрогеназы), поэтому большей части белка RNE_ECOLI ничего не было сопоставлено. У локального выравнивания процент идентичности лучше (19.9), но все еще меньше 25%, а также большое число гэпов (157).
Для выполнения задания была выбрана мнемоника АРТ_, которая соответствует белку под названием Adenine phosphoribosyltransferase (аденинфосфорибозилтрансфераза). С такой мнемоникой с помощью команды infoseq 'sw:APT_*' -only -name -nohead | wc -l нашлось 634 белка. Среди них было выбраны следующие семь:
APT_ECOLI (белок Escherichia coli)
APT_BACSU (белок Bacillus subtilis)
APT_HYDCU (белок Hydrogenovibrio crunogenus)
APT_FRAAA (белок Frankia alni)
APT_SALTO (белок Salinispora tropica)
APT_CLONN (белок Clostridium novyi)
APT_LACLA (белок Lactococcus lactis)
В директории ~/term2/pr9 был создан текстовый файл apt.txt с идентификаторами записей о белках. Затем при помощи команды seqret @apt.txt apt.fasta был создан файл в формате fasta и запущена программа muscle: muscle -align apt.fasta -output apt_alignment.fasta.
Файл apt_alignment.fasta с полученным выравниванием был загружен в программу Jalview.
Белки выровнялись корректно и имеют гомологичные участки в разных областях последовательности. Например, столбцы 22, 33-35, 39-46, 60, 70, 72-81, 85-87, 94-99, 101-104 довольно консервативны, а столбцы 25-38, 52-56, 181-186 и др. - неконсервативны. Также все консервативные участки собраны в основном в середине последоватльности, а не на ее концах. В последовательностях есть гэпы, они в выравнивании тоже сосредоточены по краям последовательности.