Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
Chemotaxis protein | CHEY_ECOLI | CHEY_BACSU | 189.5 | 34.9% | 54.3% | 9 | 3 |
Cytidine deaminase | CDD_ECOLI | CDD_BACSU | 101.0 | 13.9% | 20.5% | 176 | 8 |
tRNA(Ile)-lysidine synthase | TILS_ECOLI | TILS_BACSU | 304.5 | 26.2% | 38.1% | 126 | 25 |
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
Chemotaxis protein | CHEY_ECOLI | CHEY_BACSU | 193.5 | 37.1% | 58.6% | 2 | 1 | 89.9% | 95.0% |
Cytidine deaminase | CDD_ECOLI | CDD_BACSU | 108.0 | 32.8% | 47.4% | 11 | 5 | 36.4% | 83.8 |
tRNA(Ile)-lysidine synthase | TILS_ECOLI | TILS_BACSU | 314.5 | 29.0% | 42.5% | 71 | 20 | 91,0% | 89.0% |
Alignment | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
Global | CHEY_ECOLI | CDD_BACSU | 16.0 | 4.4% | 8.0% | 187 | 4 | - | - |
Local | CHEY_ECOLI | CDD_BACSU | 22.0 | 26.3% | 44.7% | 6 | 2 | 26.4% | 26.5% |
Результаты глобального выравнивания негомологичных последовательностей, как и следовало ожидать, показывают очень небольшую схожесть последовательностей.
В локальном выравнивании процент идентичности и схожести оказался довольно высоким, но такой результат был получен благодаря вырезанию очень большого участка последовательности, и как следствие, очень маленьким покрытием.
Для множественного выравнивания я выбрал белок Chemotaxis protein(cheY). Всего нашлось 22 аннотированых белка с этой мнемоникой, из которых были выбраны CHEY_ECOLI, CHEY_BACSU, CHEY_SALTY, CHEY_THEMA, CHEY_PSEAE, CHEY_ENTCL, CHEY_YEREN.
Выравнивание выполнялось с помощью программы "muscle" с предварительным созданием списочного файла с идентификаторами сравниваемых последовательностей. Проект Jalview с выравниванием можно скачать по ссылке.
По результатам выравнивания можно сказать, что CHEY_ECOLI и CHEY_BACSU имеют меньше схожих мест, что может значить их некоторую удалённость от других выбранных белков. Тем не менее для всех белков сохраняется большое количество консервативных столбцов(9, 11-13, 17-18, 29, 35-36, 39, 42, 57, 60-61, 63-65, 100-103, 108-111, 118), что может служить доказательством их гомологии
Alignment | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
Global | HIPA_ECOLI | HIPA_SHEON | 366.5 | 28.0% | 41.3% | 91 | 20 | - | - |
Local | HIPA_ECOLI | HIPA_SHEON | 375.5 | 29.2% | 42.6% | 78/td> | 17 | 96.8% | 93.8% |
Результат выравнивания белка, рассмотренного ранее в другом практикуме (см. UniProt) с белком E.coli, имеющим то же название (Serine/threonine-protein kinase toxin HipA) показывает, что эти белки с большой долью вероятности являются гомологичными, так как и глобальное, и локальное выравнивания имеют большой вес, довольно большой процент идентичных (более 25%) и схожих букв.
При запуске программы needle (water) без опции -auto программа запрашивает следующие параметры: Gap opening penalty(штраф за первый гэп в инделе, по умолчанию - 10.0), Gap extension penalty(штраф за удлинение гэпа, по умолчанию - 0.5). Если кроме -auto не ввести название выходного файла, то програма также предложит, куда вывести выравнивание(Output alignment, по умолчанию - mnemonics_organism.needle(.water)).