Практикум 9. Выравнивание последовательностей

Чтобы отобрать белки с одинаковыми мнемониками для парного выравнивания, были использованы возможности гугл-таблиц.

Глобальное парное выравнивание гомологичных белков

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
6-phosphogluconate dehydrogenase 6PGD_ECOLI 6PGD_BASCU 1718 70.0% 83.4% 3 3
Ribonucleoside-dinophosphate reductase RIR1_ECOLI RIR1_BASCU 465.0 21.3% 36.7% 233 32
Elongation factor LEPA_ECOLI LEPA_BASCU 1901 56,9% 77.0% 13 3

Локальное парное выравнивание гомологичных белков

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage1 Coverage2
6-phosphogluconate dehydrogenase 6PGD_ECOLI 6PGD_BASCU 1719 70.1% 83.6% 3 3 99.8% 99.8%
Ribonucleoside-dinophosphate reductase RIR1_ECOLI RIR1_BASCU 475.0 23.5% 40.9% 148 28 85.8% 96.7%
Elongation factor LEPA_ECOLI LEPA_BASCU 1901 56,9% 77.0% 1 1 100% 99.7%

Выводы по выравниваниям

Я думаю, что белки с мнемоникой LEPA скорее всего гомологичны, поскольку у их последовательностей довольно большой процент совпадающих и похожих частей, судя по полученным данным. Также в их выравнивании довольно мало гэпов, а в локальном выравнивании очень высокие показатели покрытия выравнивания. То же можно сказать и про белки с мнемоникой 6PGD. Но гомологичность белков с мнемоникой RIR1 под сомнением. Я сделала такой вывод, потому что в их выравниваниях очень много гэпов (148), 28 инделей, в то время как у белков с мнемониками RIR1, 6PGD в выравниваниях всего 3 и 1 инделей соответственно. Но, возможно, они просто сильно эволюционно разошлись и являются гомологами, ведь у их локального выравнивания очнь высокий процент покрытия. Я бы сказала, что всё же они гомологи, просто сильно разошедшиеся в результате эволюции.

Результат применения программ выравнивания к неродственным белкам

ATP6_ECOLI и RIR1_BASCU — глобальное выравнивание

Ожидаемо низкое сходство, большая разница по длине. Белки не гомологичны.
Protein NameID 1ID 2Score% Identity% SimilarityGapsIndels
ATP synthase subunit a и Ribonucleoside-diphosphate reductase 1ATP6_ECOLIRIR1_BASCU13.58.5%14.0%56324

ATP6_ECOLI и RIR1_BASCU — локальное выравнивание

Выравнивание имеет очень низкий процент покрытия, что согласуется с тем, что мы выбирали белки с разными мнемониками случайно. Думаю, белки не гомологичны.
Protein NameID 1ID 2Score% Identity% SimilarityGapsIndelsCoverage 1Coverage 2
ATP synthase subunit a и Ribonucleoside-diphosphate reductase 1ATP6_ECOLIRIR1_BASCU13.521.5%40.0%14319.5%9.3%

Множественное выравнивание белков и импорт в Jalview

Для составления выравнивания я выбрала мнемонику 6PGD, рекомендованное полное имя белка из ECOLI -- 6-phosphogluconate dehydrogenase. Для поиска всех белков с такой мнемоникой в UniprotKB я использовала поиск (id:6PGD_*), нашлось 56 белков. Были выбраны белки 6PGD_SHEEP, 6PGD_HUMAN, 6PGD_RAT, 6PGD_MOUSE, 6PGD_CAEEL. Выравнивание было сделано с помощью программы MUSCLE, далее я покрасила последовательности по проценту идентичности.

  • Проект Jalview
  • Все белки хорошо выравнялись, у них у всех примерно равная длина. По-моему, все эти белки гомологичны, в выравнивании мало гэпов. Я бы не сказала, что у выравнивания есть выраженная структура, так как в нём сопоставлено очень много идентичных и похожих аминокислот, менее консервативные участков почти нет, но я бы сказала, что есть такой между столбцами 295 и 320.