Выравнивание последовательностей
Для анализа были выбраны белки с мнемониками: PABA (Aminodeoxychorismate/anthranilate synthase component 2), 6PGD (6-phosphogluconate dehydrogenase), ILVH (Acetolactate synthase small subunit). Ниже в таблицах 1,2 представлены хакартеристики двух выраниваний: локальное (алгоритм Смит-Ватерман, программа в EMBOSS: water) и глобальное (алгоритм Нидлмана – Вунша, программа в EMBOSS: needle).
Глобальное парное выравнивание гомологичных белков
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
Aminodeoxychorismate/anthranilate synthase component 2 | PABA_ECOLI | PABA_BACSU | 640.0 | 58.2 | 77.8 | 7 | 1 |
6-phosphogluconate dehydrogenase | 6PGD_ECOLI | 6PGD_BACSU | 1718.0 | 70.0 | 83.4 | 3 | 3 |
Acetolactate synthase small subunit | ILVH_ECOLI | ILVH_BACSU | 278.0 | 34.7 | 59.5 | 11 | 3 |
Видно, что все три белка имеют процент идентичности > 25%, что говорит о гомологии.
Локальное парное выравнивание гомологичных белков
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Aminodeoxychorismate/anthranilate synthase component 2 | PABA_ECOLI | PABA_BACSU | 641.0 | 61.1 | 81.6 | 0 | 0 | 98.9% | 95.3% |
6-phosphogluconate dehydrogenase | 6PGD_ECOLI | 6PGD_BACSU | 1719.0 | 70.1 | 83.6 | 3 | 3 | 99.78% | 99.79% |
Acetolactate synthase small subunit | ILVH_ECOLI | ILVH_BACSU | 283.0 | 37.7 | 64.2 | 2 | 2 | 96.9% | 91.9% |
Выравнивание неродственных белков
Таблица 3. Выравнивание не гомологичных белков
Algoritm | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
needle | SYM_ECOLI | MCCB_BACSU | 43.0 | 11.9 | 20.4 | 444 | 30 | - | - |
water | SYM_ECOLI | MCCB_BACSU | 53.5 | 21.1 | 38.3 | 104 | 23 | 38.7% | 78.6% |
В таблице показаны данные выравнивания неродственных белков, действительно, значения это подтверждают: большое количество гэпов и инделей, низкий уровень идентичности говорят нам о том, что выбранные белки с большой вероятностью имеют разное происхождение, т.е. они не являются гомологичными. Такой разброс в процентах выравнивания может быть обусловлен с наличием участков с простыми аминокислотными повторами, которые могут искусственно увеличивать процент покрытия, но при этом не отражая настоящей гомологии.
Множественное выравнивание белков
Выбранная мнемоника:ILVH. Полное имя белка - Acetolactate synthase small subunit. Результаты поиска в UniProt выдали 39 результатов. Помимо белков из ECOLI и BACSU было выбрано еще 5 белков с такой же мнемоникой из бактерий: Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720), Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv), Neopyropia yezoensis (Susabi-nori) (Pyropia yezoensis), Cyanidium caldarium (Red alga), Mycobacterium bovis (strain ATCC BAA-935 / AF2122/97)
Далее было построено множественное выравнивание 7 белков: ILVH_SALTY, ILVH_MYCTU, ILVH_NEOYE, ILVH_CYACA, ILVH_MYCBO, ILVH_ECOLI, ILVH_BACSU.
Для выравнивания была использована программа множественного выравнивания muscle. Далее выравнивание импортировали в Jalview и раскрасили колонки по проценту идентичности (Выравнивание в Jalview). Белки имеют много консервативных участков и, скорее всего, выбранные белки гомологичны. Но имеются также не консервативные участки в колонках 158-172.