Учебный сайт Якушева Александра


Практикум 11. Алгоритмы выравнивания. Программы. Множественные выравнивания

Выравнивания гомологичных и негомологичных белков

В ходе работы были произведены выравнивания гомологичных и негомологичных белков. В кажестве организмов были предложены Кишечная палочка(Escherichia coli strain K12) и Сенная палочка (Bacillus subtilis strain 168). В качестве гомологичных белков были выбраны ГТФ-связывающий белок TypA/BipA, префенат дегидрогеназа, ксилозоизомераза, ксилулозокиназа, ксилозный репрессор. Белки выбирались по общей мнемотике.
Негомологичные белки:
У сенной палочки [Аминофосфорибозилтрансфераза, фосфорибозиламин--глицин лигаза, фосфорибозилглицинамид формилтрансфераза, фосфорибозилформилглицинамидин цикло-лигаза, фосфорибозиламиноимидазол-сукцинокарбоксамид синтаза]
У кишечной палочки [АТФ фосфорибозилтрансфераза, биофункциональный протеин биосинтеза гистидина, 1-(5-фосфорибозил)-5-[(5-фосфорибозиламино)метилдиенамино] имидазол-4-карбоксамид изомераза, субъединицы HisH и HisF имидазол глицерол фосфат синтазы].
Выравнивания белков были получены при помощи алгоритмов Нидельмана-Вунша (глобальное выравнивание) и Смита-Вотермана (локальное выравнивание). Была использована реализация этих алгоритмов через программы needle и water из пакета Emboss.

Скачать таблицу

Гомологичные белки

Глобальное выравнивание
Имя белка Программа ID 1 ID 2 Score % идентичности % схожести Количество гэпов Количество инделей Покрытие 1 белка Покрытие 2 белка
GTP-biding protein TypA/BipA needle TYPA_ECOLI TYPA_BACSU 1746 53,9 74 5 2 100,0 100,0
Prephenate dehydrogenase needle TYRA_ECOLI TYRA_BACSU 84 14,9 28,9 212 22 100,0 100,0
Xylose isomerase needle XYLA_ECOLI XYLA_BACSU 1187 50,1 66,2 9 3 100,0 100,0
Xylulose kinase needle XYLB_ECOLI XYLB_BACSU 791 34,7 52,2 37 9 100,0 100,0
Xylose repressor needle XYLR_ECOLI XYLR_BACSU 26 11,5 21,6 318 25 100,0 100,0

Для гомологичных белков в глобальном выравнивании процент идентичности колеблется между 11,5(для ксилозного репрессора) и 53,9(для ГТФ-связывающего белка TypA/BipA). Процент схожести для этих белков также был крайним(21,6 и 74 соответственно). В целом если сравнивать с выравниваниями для заведомо непохожих белков, процент схожести будет выше.

Локальные выравнивания
Имя белка Программа ID 1 ID 2 Score % идентичности % схожести Количество гэпов Количество инделей Покрытие 1 белка Покрытие 2 белка
GTP-biding protein TypA/BipA water TYPA_ECOLI TYPA_BACSU 1751 54,9 75,2 0 0 99,0 98,2
Prephenate dehydrogenase water TYRA_ECOLI TYRA_BACSU 95,5 20,2 39,7 65 14 56,3 67,1
Xylose isomerase water XYLA_ECOLI XYLA_BACSU 1195 51,4 67,9 2 2 99,1 97,5
Xylulose kinase water XYLB_ECOLI XYLB_BACSU 796 35,9 54,1 27 7 97,3 96,0
Xylose repressor water XYLR_ECOLI XYLR_BACSU 44,5 20,3 35,1 71 12 51,3 49,5

Для гомологичных белков в локальном выравнивании процент идентичности колеблется между 20,2(для префенат дегидрогеназы) и 54,9(для ГТФ-связывающего белка TypA/BipA). Процент схожести же был минималным у ксилозного репрессора(35,1) и максимальным у все того-же ГТФ-связывающего белка TypA/BipA(75,2). В целом если сравнивать с выравниваниями для заведомо непохожих белков, процент схожести будет выше. Также стоит заметить, что все характеристики локальных выравниваний выросли, по сравнению с глобальными. Интересно, что в данном случае белки с минимальной идентичностью и схожестью разные.

Негомологичные белки

Глобальные выравнивания
Имя белка Программа ID 1 ID 2 Score % идентичности % схожести Количество гэпов Количество инделей Покрытие 1 белка Покрытие 2 белка
Amidophosphoribosyltransferase, ATP phosphoribosyltransferase needle PUR1_BACSU HIS1_ECOLI 64 11,6 20,5 359 22 100,0 100,0
Phosphoribosylamine--glycine ligase, Histidine biosynthesis bifunctional protein needle PUR2_BACSU HIS2_ECOLI 38,5 9,0 16,8 329 15 100,0 100,0
Phosphoribosylglycinamide formyltransferase, 1-(5-phosphoribosyl)-5-[(5-phosphoribosylamino)methylideneamino] imidazole-4-carboxamide isomerase needle PUR3_BACSU HIS4_ECOLI 13,5 4,0 7,5 310 5 100,0 100,0
Phosphoribosylformylglycinamidine cyclo-ligase, Imidazole glycerol phosphate synthase subunit HisH needle PUR5_BACSU HIS5_ECOLI 33 8,8 15,1 278 10 100,0 100,0
Phosphoribosylaminoimidazole-succinocarboxamide synthase, Imidazole glycerol phosphate synthase subunit HisF needle PUR7_BACSU HIS6_ECOLI 27 10,8 17,0 243 13 100,0 100,0

Для негомологичных белков в глобальном выравнивании процент идентичности колеблется между 4(для фосфорибозилглицинамид формилтрансферазы) и 11,6(для аминофосфорибозилтрансферазы). Процент схожести для этих белков также был крайним(7,5 и 20,5 соответственно). В целом о гомологии не может идти и речи.

Локальные выравнивания
Имя белка Программа ID 1 ID 2 Score % идентичности % схожести Количество гэпов Количество инделей Покрытие 1 белка Покрытие 2 белка
Amidophosphoribosyltransferase, ATP phosphoribosyltransferase water PUR1_BACSU HIS1_ECOLI 73 24,5 45,7 27 9 27,1 48,8
Phosphoribosylamine--glycine ligase, Histidine biosynthesis bifunctional protein water PUR2_BACSU HIS2_ECOLI 51 32,8 46,3 18 4 13,5 29,0
Phosphoribosylglycinamide formyltransferase, 1-(5-phosphoribosyl)-5-[(5-phosphoribosylamino)methylideneamino] imidazole-4-carboxamide isomerase water PUR3_BACSU HIS4_ECOLI 27 16,8 31,7 48 6 65,6 59,6
Phosphoribosylformylglycinamidine cyclo-ligase, Imidazole glycerol phosphate synthase subunit HisH water PUR5_BACSU HIS5_ECOLI 46 20,7 32,9 43 7 38,7 77,0
Phosphoribosylaminoimidazole-succinocarboxamide synthase, Imidazole glycerol phosphate synthase subunit HisF water PUR7_BACSU HIS6_ECOLI 39 21,4 37,8 28 4 30,7 43,0

Для негомологичных белков в локальном выравнивании процент идентичности колеблется между 16,8(для фосфорибозилглицинамид формилтрансферазы) и 32,8(для фосфорибозиламин--глицин лигазы). Процент схожести для этих белков также был крайним(31,7 и 46,3 соответственно). Белок с наибольшим сходством сменился, но целом все так же о гомологии не может идти и речи.

Выводы по выравниваниям гомологичных и негомологичных белков

Итак, с помощью выравниваний можно установить гомологичность белков. Для гомологичных белков процент идентичности в идеале должен быть больше 50%. В крайнем случае больше 30%. У взятых мною белков не всегда такое получалось, но я все же оставил эти неудачные примеры, чтобы показать, что даже функционально идентичные белки не всегда будут гомологичными. Также отметим, что гомологичные белки набирают 700 и более "попугаев" счета. Для негомологичных белков этот показатель не превосходит 70 очков.
Если для казалось бы гомологичных белков глобальное выравнивание показывает низкий процент гомологии, стоит посмотреть на локальное(там прирост схожести в процентах может достигать двух раз по сравнению с глобальным).

Поиск отличий в парных выравниваниях последовательностей одних и тех же белков, построенных разными программами

Для выполнения задания 2 мною был выбран σ-фактор инициации транскрипции(мнемоника RPOD). Это белок, необходимый для инициации транскрипции у бактерий. Это бактериальный фактор инициации транскрипции, который обеспечивает специфическое связывание РНК-полимеразы (RNAP) с промоторами генов. Так как этот белок очень важен для жизнедеятельности бактерии, было выдвинуто предположение о его высокой консервативности у разных групп.

Были выбраны белки RPOD_BUCAI, RPOD_ECOLI, RPOD_PSEPU, RPOD_SALTI, RPOD_SHEVD, RPOD_XYLFA.

Результаты выравнивания

Aligment

По выравниванию видно высокий процент сходства у разных организмов. Заметна вставка после 73 позиции у XYLFA, а также вставка аланина в 7 позиции у него же.

Сравнение множественного и парных выравниваний.

Из 6 белков было выбранно два, которые по субъективной оценке были наиболее далекими друг от друга: RPOD_ECOLI и RPOD_XYLFA. Для них были получены выравнивания с использованием программ needle и water из пакета EMBOSS. Далее эти выравнивания были выравненны с помощью muscle. Результаты выравниваний приведены ниже.

Aligment