Выравнивание последовательностей

Глобальное парное выравнивание гомологичных белков

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Chemotaxis protein CHEY_ECOLI CHEY_BACSU 189.5 34.9% 54.3% 9 3
Cytidine deaminase CDD_ECOLI CDD_BACSU 101.0 13.9% 20.5% 176 8
tRNA(Ile)-lysidine synthase TILS_ECOLI TILS_BACSU 304.5 26.2% 38.1% 126 25

Локальное парное выравнивание гомологичных белков

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Chemotaxis protein CHEY_ECOLI CHEY_BACSU 193.5 37.1% 58.6% 2 1 89.9% 95.0%
Cytidine deaminase CDD_ECOLI CDD_BACSU 108.0 32.8% 47.4% 11 5 36.4% 83.8
tRNA(Ile)-lysidine synthase TILS_ECOLI TILS_BACSU 314.5 29.0% 42.5% 71 20 91,0% 89.0%

Результат применения программ выравнивания к неродственным белкам

Alignment ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Global CHEY_ECOLI CDD_BACSU 16.0 4.4% 8.0% 187 4 - -
Local CHEY_ECOLI CDD_BACSU 22.0 26.3% 44.7% 6 2 26.4% 26.5%

Результаты глобального выравнивания негомологичных последовательностей, как и следовало ожидать, показывают очень небольшую схожесть последовательностей.

В локальном выравнивании процент идентичности и схожести оказался довольно высоким, но такой результат был получен благодаря вырезанию очень большого участка последовательности, и как следствие, очень маленьким покрытием.

Множественное выравнивание белков и импорт в Jalview

Для множественного выравнивания я выбрал белок Chemotaxis protein(cheY). Всего нашлось 22 аннотированых белка с этой мнемоникой, из которых были выбраны CHEY_ECOLI, CHEY_BACSU, CHEY_SALTY, CHEY_THEMA, CHEY_PSEAE, CHEY_ENTCL, CHEY_YEREN.

Выравнивание выполнялось с помощью программы "muscle" с предварительным созданием списочного файла с идентификаторами сравниваемых последовательностей. Проект Jalview с выравниванием можно скачать по ссылке.

По результатам выравнивания можно сказать, что CHEY_ECOLI и CHEY_BACSU имеют меньше схожих мест, что может значить их некоторую удалённость от других выбранных белков. Тем не менее для всех белков сохраняется большое количество консервативных столбцов(9, 11-13, 17-18, 29, 35-36, 39, 42, 57, 60-61, 63-65, 100-103, 108-111, 118), что может служить доказательством их гомологии

Выравнивание своего белка с его гомологом

Alignment ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Global HIPA_ECOLI HIPA_SHEON 366.5 28.0% 41.3% 91 20 - -
Local HIPA_ECOLI HIPA_SHEON 375.5 29.2% 42.6% 78/td> 17 96.8% 93.8%

Результат выравнивания белка, рассмотренного ранее в другом практикуме (см. UniProt) с белком E.coli, имеющим то же название (Serine/threonine-protein kinase toxin HipA) показывает, что эти белки с большой долью вероятности являются гомологичными, так как и глобальное, и локальное выравнивания имеют большой вес, довольно большой процент идентичных (более 25%) и схожих букв.

Параметры программ needle и water

При запуске программы needle (water) без опции -auto программа запрашивает следующие параметры: Gap opening penalty(штраф за первый гэп в инделе, по умолчанию - 10.0), Gap extension penalty(штраф за удлинение гэпа, по умолчанию - 0.5). Если кроме -auto не ввести название выходного файла, то програма также предложит, куда вывести выравнивание(Output alignment, по умолчанию - mnemonics_organism.needle(.water)).