Написана программа на Python ~/term2/indels/indels.py, которая анализирует файл выравнивания и считает количество инделей в каждой последовательности.
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | |
|---|---|---|---|---|---|---|---|---|
| Chaperonin GroEL | CH60_ECOLI | CH60_BACSU | 1694.5 | 61.5% | 77.3% | 8 | 5 | |
| Chaperone protein DnaK | DNAK_ECOLI | DNAK_BACSU | 1767.0 | 55.4% | 72.9% | 33 | 5 | |
| RNA polymerase subunit beta | RPOB_ECOLI | RPOB_BACSU | 3034.0 | 42.5% | 55.5% | 433 | 17 |
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| Chaperonin GroEL | CH60_ECOLI | CH60_BACSU | 1695.5 | 61.7% | 77.6% | 7 | 4 | 99.6% | 99.8% |
| Chaperone protein DnaK | DNAK_ECOLI | DNAK_BACSU | 1767.0 | 55.8% | 73.3% | 30 | 4 | 99.7% | 99.2% |
| RNA polymerase subunit beta | RPOB_ECOLI | RPOB_BACSU | 3039.0 | 43.7% | 57.0% | 396 | 14 | 60.1% | 61.7% |
Гомологичны ли белки по всей длине? Да. Процент идентичности (61.5% для глобального и 61.7% для локального выравнивания). Белки имеют одинаковую длину (548 и 544 а.о.) и выравниваются практически по всей длине.
Информативно ли локальное выравнивание по сравнению с глобальным? Оба выравнивания дали схожие результаты. Локальное выравнивание показало немного более высокий процент идентичности (61.7% против 61.5%) и меньшее количество гэпов, и инделей . Это связано с тем, что локальное выравнивание игнорирует небольшие негомологичные участки по краям.
Различия в выравнивании: Отличий практически нет, кроме небольшого сдвига в начале выравнивания .
Гомологичны ли белки по всей длине? Да. Процент идентичности (55.4% и 55.8%) также значительно выше порога гомологии. Полные длины белков различаются (638 и 611 а.о.), что объясняется вставками/делециями.
Информативно ли локальное выравнивание по сравнению с глобальным? Оба выравнивания близки по результатам. Локальное выравнивание показало немного более высокий процент идентичности (55.8% против 55.4%) и меньшее количество гэпов, и инделей . Покрытие составило 99.7% для DNAK_ECOLI и 99.2% для DNAK_BACSU.
Различия в выравнивании: Основные различия связаны с C-концевым участком, где у DNAK_BACSU есть дополнительные аминокислоты, которые не попали в локальное выравнивание.
Гомологичны ли белки по всей длине? Да, но не полностью. Процент идентичности (42.5% и 43.7%) выше порога гомологии, но белки имеют разную длину (1342 и 1157 а.о.). В глобальном выравнивании много гэпов , что указывает на наличие вставок/делеций.
Информативно ли локальное выравнивание по сравнению с глобальным? Локальное выравнивание показало более высокий процент идентичности (43.7% против 42.5%) и значительно меньшее количество гэпов и инделей. Покрытие составило 60.1% для RPOB_ECOLI и 61.7% для RPOB_BACSU. Это говорит о том, что часть белка не гомологична.
Различия в выравнивании: В глобальном выравнивании многие участки выровнены с большим количеством гэпов, тогда как локальное выравнивание выделяет наиболее консервативные домены (например, активный сайт РНК-полимеразы).
Взяты белки с разными функциями: EFTS_ECOL6 и DNAK_BACSU
| Выравнивание | Score | % Identity | % Similarity | Gaps | Indels |
|---|---|---|---|---|---|
| Глобальное (needle) | 48.5 | 10.8% | 16.7% | 384 | 16 |
| Локальное (water) | 56.5 | 25.9% | 36.2% | 61 | 10 |
Мнемоника: CH60 (шаперонин GroEL)
Полное имя белка из E. coli: Chaperonin GroEL
Количество найденных белков в Swiss-Prot: 791 (по запросу id:CH60_* AND reviewed:true)
Выбранные 5 белков (помимо CH60_ECOLI и CH60_BACSU):
Проект Jalview: Скачать проект Jalview