
В данном практикуме мы изучали процесс выравнивания аминоксилотных последовательностей. Этот процесс помогает установить гомологичны ли данные последовательности, или нет и найти процент их схожести. В процессе работы я использовал программы needle, water и Jailview (который не хотел устанавливаться).
1. Глобальное парное выравнивание гомологичных белков
В этом разделе я провёл глобальное выравнивание 3-х пар гомологичных белков. Глобальное выравнивание (*) использует полную длину обеих последовательностей, и может быть использовано для проверки последовательностей на гомологию (общность происхождения) по всей длине. Однако, если последовательности имеют мало участков гомологии (или просто схожести), то не всегда можно хорошо определить эти участки. Задача глобального выравнивания: найти выравнивание с наибольшим весом.
Чтобы провести его я скачал из UniProt два списка идентификаторов записей: всех аннотированных записей, чей идентификатор кончается на _ECOLI (штамма K12) и всех аннотированных записей, чей идентификатор кончается на _BACSU (штамм 168 сенной палочки). При помощи программы Excel я объединил эти два списка в один и отсортировал по Entry name. Затем необходимо было выбрать 3 пары белков, чьи идентификаторы Swiss-Prot имеют одинаковую мнемонику функции. Я выбрал 6PGD, ACCD, SYA. Результаты, полученные при использовании программы needle, приведены в Таблице 1.
В данной работе мы считаем, что gap это единичный пропуск, то есть -- это два gap. Чтобы указать, что gap идут подряд (что более вероятно, чем несколько раздельных gap) было использовано понятие Indels или индели (от инсерция и делеция). Это поможет более чётко оценивать полученные результаты.
Protein Name | ID 1 | ID 2 | Score | Identity (%) | Similarity (%) | Gaps | Indels |
---|---|---|---|---|---|---|---|
6-phosphogluconate dehydrogenase, decarboxylating ссылка | 6PGD_ECOLI | 6PGD_BACSU | 1718.0 | 70% | 83.4% | 3 (0.6%) | 3 |
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta ссылка | ACCD_ECOLI | ACCD_BACSU | 597.0 | 41.3% | 58.4% | 36 (11.4%) | 7 |
Alanine--tRNA ligase ссылка | SYA_ECOLI | SYA_BACSU | 1982.5 | 44.7% | 63.0% | 36 (4.0%) | 12 |
Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
2. Локальное парное выравнивание гомологичных белков
В этой части практикума я изучал локальное выравнивание. Локальное выравнивание (**) использует части последовательностей, на которых прогнозируется максимальная гомология. Оно отлично подходит, если лишь части последовательностей похожи, например в ходе рекомбинации или конвергентной эволюции. В локальном выравнивании мы выбираем не только как выравнивать, но и что. Чтобы выполнить это выравнивание я воспользовался программой water. Результаты приведены в Таблице 2.
Protein name | ID 1 | Id 2 | Score | Identity (%) | Similarity (%) | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
6-phosphogluconate dehydrogenase, decarboxylating ссылка | 6PGD_ECOLI | 6PGD_BACSU | 1719.0 | 70.1% | 83.6% | 0.6% | 3 | 99.78% | 99.78% |
Acetyl-coenzyme A carboxylase carboxyl transferase subunit beta ссылка | ACCD_ECOLI | ACCD_BACSU | 614.0 | 48.5% | 66.5% | 5 (1.9%) | 3 | 85.2% | 88.27% |
Alanine--tRNA ligase ссылка | SYA_ECOLI | SYA_BACSU | 1986.5 | 44.9% | 63.4% | 34 | 13 | 99.54% | 99.54% |
Таблица 2. Характеристика локального выравнивания трёх пар белков
Хочется отметить, что для первого измерения длина уменьшилась только на 1 и вес вырос тоже только на 1, что неудивительно, учитывая, что глобальное выравнивание в этом случае тоже показало хорошие результаты. В третьем случае ситуация аналогична, хоть и немного лучше. Максимальную результативность из всех попыток можно наблюдать во втором случае. Длина уменьшилась примерно на 55, а вес вырос на 17. В общем, кардинальной разницы между water и needle в данных случаях не наблюдается, хоть water и даёт немного больший вес, но здесь мы сравнивали гомологичные белки, которые и должны быть схожи.
3. Выравнивание неродственных белков.
В данной части практикума я сравнивал негомологичные белки. Были проведены глобальное и локальное выравнивания, при помощи программ needle и water соотвественно. Я взял ALDB_ECOLI и AMPA_BACSU. Результаты приведены в Таблице 3.
Protein name 1 | Protein name 2 | ID 1 | Id 2 | Score | Identity (%) | Similarity (%) | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|---|
Aldehyde dehydrogenase B | Probable cytosol aminopeptidase | ALDB_ECOLI | AMPA_BACSU | 39.5 | 14.2% | 24.4% | 326 | 31 | ||
Aldehyde dehydrogenase B | Probable cytosol aminopeptidase | ALDB_ECOLI | AMPA_BACSU | 50.5 | 18.8% | 34.3% | 113 (29.1%) | 19 | 64.06% | 66.8% |
Таблица 3. Результат применения программ выравнивания к неродственным белкам
4. Множественное выравнивание белков и импорт в Jalview
В данной части практикума я изучал множественное выравнивание. Множественное выравнивание (***) — это выравнивание трёх и более последовательностей. Применяется для нахождения консервативных участков в наборе гомологичных последовательностей. В большинстве случаев построение множественного выравнивания — необходимый этап реконструкции филогенетических деревьев.
По запросу sya_* было найдено 698 аннотированных записей, но очень странно что в них были включены записи наподобии SYAC_*. Данную проблему мне устранить не удалось. Я взял: SYA_PYRHO, SYA_AQUAE, SYA_YERPE, SYA_SALTY, SYA_VIBCH, SYA_ECOLI, SYA_BACSU. Рекомендованное полное имя у E.coli Alanine--tRNA ligase. При помощи программы Jailview было проведено множественное выравнивание.
Изображение приведено ниже, если надо, вы сами можете его скачать

По результатам выравнивания стало видно, что наибольшую схожесть имеют SYA_ECOLI, SYA_YERPE и SYA_SALTY. Самый консервативный участок, как мне кажется, захватывает в себя столбцы с 1 по 116. На протяжении этого участка все белки, кроме SYA_PYRHO и SYA_BACSU, очень хорошо коррелируют. Из этих данных, скорее всего, SYA_PYRHO и SYA_BACSU не гомологичны остальным, а SYA_ECOLI, SYA_YERPE и SYA_SALTY, скорее всего, гомологичны между собой.
Источники
• Презентация от С.А.Спирина скачать
• Само задание ссылка
• * и ** Valery O Polyanovsky, Mikhail A Roytberg, Vladimir G Tumanyan. Comparative analysis of the quality of a global algorithm and a local algorithm for alignment of two sequences (англ.) // Algorithms for Molecular Biology. — 2011. — Vol. 6, iss. 1. — P. 25. — ISSN 1748-7188. — doi:10.1186/1748-7188-6-25. ссылка
• *** Множественное выравнивание ссылка (простите за википедию)