Выравнивание последовательностей

Для анализа были выбраны белки с мнемониками: PABA (Aminodeoxychorismate/anthranilate synthase component 2), 6PGD (6-phosphogluconate dehydrogenase), ILVH (Acetolactate synthase small subunit). Ниже в таблицах 1,2 представлены хакартеристики двух выраниваний: локальное (алгоритм Смит-Ватерман, программа в EMBOSS: water) и глобальное (алгоритм Нидлмана – Вунша, программа в EMBOSS: needle).

Глобальное парное выравнивание гомологичных белков

Таблица 1. Глобальное выравнивание
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Aminodeoxychorismate/anthranilate synthase component 2 PABA_ECOLI PABA_BACSU 640.0 58.2 77.8 7 1
6-phosphogluconate dehydrogenase 6PGD_ECOLI 6PGD_BACSU 1718.0 70.0 83.4 3 3
Acetolactate synthase small subunit ILVH_ECOLI ILVH_BACSU 278.0 34.7 59.5 11 3

Видно, что все три белка имеют процент идентичности > 25%, что говорит о гомологии.

Локальное парное выравнивание гомологичных белков

Таблица 2. Локальне выравнивание
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Aminodeoxychorismate/anthranilate synthase component 2 PABA_ECOLI PABA_BACSU 641.0 61.1 81.6 0 0 98.9% 95.3%
6-phosphogluconate dehydrogenase 6PGD_ECOLI 6PGD_BACSU 1719.0 70.1 83.6 3 3 99.78% 99.79%
Acetolactate synthase small subunit ILVH_ECOLI ILVH_BACSU 283.0 37.7 64.2 2 2 96.9% 91.9%

Выравнивание неродственных белков

Таблица 3. Выравнивание не гомологичных белков

Algoritm ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
needle SYM_ECOLI MCCB_BACSU 43.0 11.9 20.4 444 30 - -
water SYM_ECOLI MCCB_BACSU 53.5 21.1 38.3 104 23 38.7% 78.6%

В таблице показаны данные выравнивания неродственных белков, действительно, значения это подтверждают: большое количество гэпов и инделей, низкий уровень идентичности говорят нам о том, что выбранные белки с большой вероятностью имеют разное происхождение, т.е. они не являются гомологичными. Такой разброс в процентах выравнивания может быть обусловлен с наличием участков с простыми аминокислотными повторами, которые могут искусственно увеличивать процент покрытия, но при этом не отражая настоящей гомологии.

Множественное выравнивание белков

Выбранная мнемоника:ILVH. Полное имя белка - Acetolactate synthase small subunit. Результаты поиска в UniProt выдали 39 результатов. Помимо белков из ECOLI и BACSU было выбрано еще 5 белков с такой же мнемоникой из бактерий: Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720), Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv), Neopyropia yezoensis (Susabi-nori) (Pyropia yezoensis), Cyanidium caldarium (Red alga), Mycobacterium bovis (strain ATCC BAA-935 / AF2122/97)

Далее было построено множественное выравнивание 7 белков: ILVH_SALTY, ILVH_MYCTU, ILVH_NEOYE, ILVH_CYACA, ILVH_MYCBO, ILVH_ECOLI, ILVH_BACSU.

Для выравнивания была использована программа множественного выравнивания muscle. Далее выравнивание импортировали в Jalview и раскрасили колонки по проценту идентичности (Выравнивание в Jalview). Белки имеют много консервативных участков и, скорее всего, выбранные белки гомологичны. Но имеются также не консервативные участки в колонках 158-172.