2. Глобальное парное выравнивание гомологичных белков

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков (needle, параметры по умолчанию)

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Superoxide dismutase [Mn] SODM_ECOLI SODM_BACSU 639.5 58.9% 66.5% 10 3
Aminodeoxychorismate synthase component 2 PABA_ECOLI PABA_BACSU 640.0 58.2% 77.8% 7 1
Chromosomal replication initiator protein DnaA DNAA_ECOLI DNAA_BACSU 990.0 42.3% 61.9% 43 9

3. Локальное парное выравнивание гомологичных белков

Таблица 2. Характеристики локального парного выравнивания трёх пар белков (water, параметры по умолчанию)

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Superoxide dismutase [Mn] SODM_ECOLI SODM_BACSU 639.5 59.1% 66.8% 8 3 100.0% 100.0%
Aminodeoxychorismate synthase component 2 PABA_ECOLI PABA_BACSU 641.0 61.1% 81.6% 0 0 98.9% 95.4%
Chromosomal replication initiator protein DnaA DNAA_ECOLI DNAA_BACSU 994.0 43.6% 63.5% 33 8 97.2% 98.4%

4. Комментарии к выравниваниям

1) Белки SODM_ECOLI и SODM_BACSU. Белки гомологичны по всей длине: глобальное выравнивание даёт 58.9% идентичности. Локальное выравнивание покрывает 100% обоих белков, поэтому дополнительной информации не добавляет - результаты практически идентичны. В локальном выравнивании число гэпов (8) меньше, чем в глобальном (10), это, скорее всего, связано с тем, что локальное выравнивание расставляет гэпы иначе, избегая лишних разрывов на концах последовательностей.

2) Белки PABA_ECOLI и PABA_BACSU. Белки гомологичны по всей длине: глобальное выравнивание даёт 58.2% идентичности. Локальное выравнивание покрывает 98.9% и 95.4%, что лишь незначительно меньше 100%, поэтому дополнительной информации практически не добавляет. В локальном выравнивании гэпы отсутствуют (0 против 7), а идентичность выше (61.1% против 58.2%) - это связано с тем, что локальное выравнивание расставляет гэпы иначе и исключает небольшие концевые фрагменты с более низкой гомологией.

3) Белки DNAA_ECOLI и DNAA_BACSU. Белки гомологичны по всей длине: глобальное выравнивание даёт 42.3% идентичности. Локальное выравнивание покрывает 97.2% и 98.4% - почти полностью, поэтому дополнительной информации практически не добавляет. Однако разница в числе гэпов (33 против 43) более выражена, чем у SODM, что связано с наличием у DNAA длинных неконсервативных вставок, которые локальное выравнивание частично исключает.

5. Результат применения программ выравнивания к неродственным белкам

Таблица 3. Характеристики глобального парного выравнивания пары белков c разными мнемониками функций (needle, параметры по умолчанию)

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Bifunctional protein GlmU / Signal peptidase I GLMU_BACSU LEP_ECOLI 19.0 6.2% 11.2% 472 19

Таблица 4. Характеристики локального парного выравнивания пары белков c разными мнемониками функций (water, параметры по умолчанию)

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Bifunctional protein GlmU GLMU_BACSU LEP_ECOLI 46.0 16.0% 34.0% 59 7 30.0% 39.5%

Белки негомологичны: при глобальном выравнивании идентичность 6,2% (ниже 20–25%) и 472 гэпа. При локальном выравнивании идентичность выше (16%), но это достигнуто лишь на коротких участках (покрытие 30% и 39,5%), что не свидетельствует об эволюционной связи. Таким образом, в данном случае локальное выравнивание информативнее глобального.

6. Множественное выравнивание белков и импорт в Jalview

а) Для мнемоники (DNAA_) в Swiss-Prot был произведен поиск белков, начинающихся с этой мнемоники. Их оказалось 575. Полное имя белка: Chromosomal replication initiator protein DnaA. Белки, выбранные для множественного выравнивания (помимо DNAA_BACSU, DNAA_ECOLI): DNAA_MYCTU, DNAA_AQUAE, DNAA_DEIRA, DNAA_STRP2, DNAA_STAA8.

б) Создан списочный файл dnaa.txt с идентификаторами семи белков DnaA, затем он был переведен в формат FASTA через программу seqret, выполнено выравнивание muscle -align dnaa.fasta -output dnaa_aligned.fasta. Результат был импортирован в Jalview, раскрашен по проценту идентичности и сохранён как dnaa.jvp.

в) С множественным выравниванием можно ознакомиться тут

г) Несмотря на наличие гэпов в начале выравнивания, все семь белков можно считать гомологичными благодаря наличию большого числа консервативных участков в их последовательностях (203–210, 213–219, 286–294, 373–378, 475–482).