Практикум 11. Алгоритмы выравнивания. Программы. Множественные выравнивания
Выравнивания гомологичных и негомологичных белков
В ходе работы были произведены выравнивания гомологичных и негомологичных белков. В кажестве организмов были предложены Кишечная палочка(Escherichia coli strain K12) и Сенная палочка (Bacillus subtilis strain 168). В качестве гомологичных белков были выбраны ГТФ-связывающий белок TypA/BipA, префенат дегидрогеназа, ксилозоизомераза, ксилулозокиназа, ксилозный репрессор. Белки выбирались по общей мнемотике.
Негомологичные белки:
У сенной палочки [Аминофосфорибозилтрансфераза, фосфорибозиламин--глицин лигаза, фосфорибозилглицинамид формилтрансфераза, фосфорибозилформилглицинамидин цикло-лигаза, фосфорибозиламиноимидазол-сукцинокарбоксамид синтаза]
У кишечной палочки [АТФ фосфорибозилтрансфераза, биофункциональный протеин биосинтеза гистидина, 1-(5-фосфорибозил)-5-[(5-фосфорибозиламино)метилдиенамино] имидазол-4-карбоксамид изомераза, субъединицы HisH и HisF имидазол глицерол фосфат синтазы].
Выравнивания белков были получены при помощи алгоритмов Нидельмана-Вунша (глобальное выравнивание) и Смита-Вотермана (локальное выравнивание). Была использована реализация этих алгоритмов через программы needle и water из пакета Emboss.
Гомологичные белки
Глобальное выравнивание
Имя белка | Программа | ID 1 | ID 2 | Score | % идентичности | % схожести | Количество гэпов | Количество инделей | Покрытие 1 белка | Покрытие 2 белка |
GTP-biding protein TypA/BipA | needle | TYPA_ECOLI | TYPA_BACSU | 1746 | 53,9 | 74 | 5 | 2 | 100,0 | 100,0 |
Prephenate dehydrogenase | needle | TYRA_ECOLI | TYRA_BACSU | 84 | 14,9 | 28,9 | 212 | 22 | 100,0 | 100,0 |
Xylose isomerase | needle | XYLA_ECOLI | XYLA_BACSU | 1187 | 50,1 | 66,2 | 9 | 3 | 100,0 | 100,0 |
Xylulose kinase | needle | XYLB_ECOLI | XYLB_BACSU | 791 | 34,7 | 52,2 | 37 | 9 | 100,0 | 100,0 |
Xylose repressor | needle | XYLR_ECOLI | XYLR_BACSU | 26 | 11,5 | 21,6 | 318 | 25 | 100,0 | 100,0 |
Для гомологичных белков в глобальном выравнивании процент идентичности колеблется между 11,5(для ксилозного репрессора) и 53,9(для ГТФ-связывающего белка TypA/BipA). Процент схожести для этих белков также был крайним(21,6 и 74 соответственно). В целом если сравнивать с выравниваниями для заведомо непохожих белков, процент схожести будет выше.
Локальные выравнивания
Имя белка | Программа | ID 1 | ID 2 | Score | % идентичности | % схожести | Количество гэпов | Количество инделей | Покрытие 1 белка | Покрытие 2 белка |
GTP-biding protein TypA/BipA | water | TYPA_ECOLI | TYPA_BACSU | 1751 | 54,9 | 75,2 | 0 | 0 | 99,0 | 98,2 |
Prephenate dehydrogenase | water | TYRA_ECOLI | TYRA_BACSU | 95,5 | 20,2 | 39,7 | 65 | 14 | 56,3 | 67,1 |
Xylose isomerase | water | XYLA_ECOLI | XYLA_BACSU | 1195 | 51,4 | 67,9 | 2 | 2 | 99,1 | 97,5 |
Xylulose kinase | water | XYLB_ECOLI | XYLB_BACSU | 796 | 35,9 | 54,1 | 27 | 7 | 97,3 | 96,0 |
Xylose repressor | water | XYLR_ECOLI | XYLR_BACSU | 44,5 | 20,3 | 35,1 | 71 | 12 | 51,3 | 49,5 |
Для гомологичных белков в локальном выравнивании процент идентичности колеблется между 20,2(для префенат дегидрогеназы) и 54,9(для ГТФ-связывающего белка TypA/BipA). Процент схожести же был минималным у ксилозного репрессора(35,1) и максимальным у все того-же ГТФ-связывающего белка TypA/BipA(75,2). В целом если сравнивать с выравниваниями для заведомо непохожих белков, процент схожести будет выше. Также стоит заметить, что все характеристики локальных выравниваний выросли, по сравнению с глобальными. Интересно, что в данном случае белки с минимальной идентичностью и схожестью разные.
Негомологичные белки
Глобальные выравнивания
Имя белка | Программа | ID 1 | ID 2 | Score | % идентичности | % схожести | Количество гэпов | Количество инделей | Покрытие 1 белка | Покрытие 2 белка |
Amidophosphoribosyltransferase, ATP phosphoribosyltransferase | needle | PUR1_BACSU | HIS1_ECOLI | 64 | 11,6 | 20,5 | 359 | 22 | 100,0 | 100,0 |
Phosphoribosylamine--glycine ligase, Histidine biosynthesis bifunctional protein | needle | PUR2_BACSU | HIS2_ECOLI | 38,5 | 9,0 | 16,8 | 329 | 15 | 100,0 | 100,0 |
Phosphoribosylglycinamide formyltransferase, 1-(5-phosphoribosyl)-5-[(5-phosphoribosylamino)methylideneamino] imidazole-4-carboxamide isomerase | needle | PUR3_BACSU | HIS4_ECOLI | 13,5 | 4,0 | 7,5 | 310 | 5 | 100,0 | 100,0 |
Phosphoribosylformylglycinamidine cyclo-ligase, Imidazole glycerol phosphate synthase subunit HisH | needle | PUR5_BACSU | HIS5_ECOLI | 33 | 8,8 | 15,1 | 278 | 10 | 100,0 | 100,0 |
Phosphoribosylaminoimidazole-succinocarboxamide synthase, Imidazole glycerol phosphate synthase subunit HisF | needle | PUR7_BACSU | HIS6_ECOLI | 27 | 10,8 | 17,0 | 243 | 13 | 100,0 | 100,0 |
Для негомологичных белков в глобальном выравнивании процент идентичности колеблется между 4(для фосфорибозилглицинамид формилтрансферазы) и 11,6(для аминофосфорибозилтрансферазы). Процент схожести для этих белков также был крайним(7,5 и 20,5 соответственно). В целом о гомологии не может идти и речи.
Локальные выравнивания
Имя белка | Программа | ID 1 | ID 2 | Score | % идентичности | % схожести | Количество гэпов | Количество инделей | Покрытие 1 белка | Покрытие 2 белка |
Amidophosphoribosyltransferase, ATP phosphoribosyltransferase | water | PUR1_BACSU | HIS1_ECOLI | 73 | 24,5 | 45,7 | 27 | 9 | 27,1 | 48,8 |
Phosphoribosylamine--glycine ligase, Histidine biosynthesis bifunctional protein | water | PUR2_BACSU | HIS2_ECOLI | 51 | 32,8 | 46,3 | 18 | 4 | 13,5 | 29,0 |
Phosphoribosylglycinamide formyltransferase, 1-(5-phosphoribosyl)-5-[(5-phosphoribosylamino)methylideneamino] imidazole-4-carboxamide isomerase | water | PUR3_BACSU | HIS4_ECOLI | 27 | 16,8 | 31,7 | 48 | 6 | 65,6 | 59,6 |
Phosphoribosylformylglycinamidine cyclo-ligase, Imidazole glycerol phosphate synthase subunit HisH | water | PUR5_BACSU | HIS5_ECOLI | 46 | 20,7 | 32,9 | 43 | 7 | 38,7 | 77,0 |
Phosphoribosylaminoimidazole-succinocarboxamide synthase, Imidazole glycerol phosphate synthase subunit HisF | water | PUR7_BACSU | HIS6_ECOLI | 39 | 21,4 | 37,8 | 28 | 4 | 30,7 | 43,0 |
Для негомологичных белков в локальном выравнивании процент идентичности колеблется между 16,8(для фосфорибозилглицинамид формилтрансферазы) и 32,8(для фосфорибозиламин--глицин лигазы). Процент схожести для этих белков также был крайним(31,7 и 46,3 соответственно). Белок с наибольшим сходством сменился, но целом все так же о гомологии не может идти и речи.
Выводы по выравниваниям гомологичных и негомологичных белков
Итак, с помощью выравниваний можно установить гомологичность белков. Для гомологичных белков процент идентичности в идеале должен быть больше 50%. В крайнем случае больше 30%. У взятых мною белков не всегда такое получалось, но я все же оставил эти неудачные примеры, чтобы показать, что даже функционально идентичные белки не всегда будут гомологичными. Также отметим, что гомологичные белки набирают 700 и более "попугаев" счета. Для негомологичных белков этот показатель не превосходит 70 очков.
Если для казалось бы гомологичных белков глобальное выравнивание показывает низкий процент гомологии, стоит посмотреть на локальное(там прирост схожести в процентах может достигать двух раз по сравнению с глобальным).
Поиск отличий в парных выравниваниях последовательностей одних и тех же белков, построенных разными программами
Для выполнения задания 2 мною был выбран σ-фактор инициации транскрипции(мнемоника RPOD). Это белок, необходимый для инициации транскрипции у бактерий. Это бактериальный фактор инициации транскрипции, который обеспечивает специфическое связывание РНК-полимеразы (RNAP) с промоторами генов. Так как этот белок очень важен для жизнедеятельности бактерии, было выдвинуто предположение о его высокой консервативности у разных групп.
Были выбраны белки RPOD_BUCAI, RPOD_ECOLI, RPOD_PSEPU, RPOD_SALTI, RPOD_SHEVD, RPOD_XYLFA.
Результаты выравнивания
По выравниванию видно высокий процент сходства у разных организмов. Заметна вставка после 73 позиции у XYLFA, а также вставка аланина в 7 позиции у него же.
Сравнение множественного и парных выравниваний.
Из 6 белков было выбранно два, которые по субъективной оценке были наиболее далекими друг от друга: RPOD_ECOLI и RPOD_XYLFA. Для них были получены выравнивания с использованием программ needle и water из пакета EMBOSS. Далее эти выравнивания были выравненны с помощью muscle. Результаты выравниваний приведены ниже.
- muscle вставил гэп в 7 позиции, тогда как needle и water этого не сделали
- muscle не вставил гэп в 73 позиции, а вставил его в 75
- needle и water вставили индель со 183 по 189 позицию. muscle этого не сделал.
- Локальные и глобальные выравнивания не различаются на участках с 9 позиции.