Таблица 1. Глобальное парное выравнивание гомологичных белков
Protein name | ID 1 | ID 2 | Score | Identity, % | Similarity, % | Gaps | Indels |
DNA gyrase subunit A | GYRA_ECOLI | GYRA_BACSU | 2227.0 | 50.7 | 68.6 | 72 | 5 |
Orotate phosphoribosyltransferase | PYRE_ECOLI | PYRE_BACSU | 123.0 | 23.1 | 38.9 | 65 | 10 |
Cytochrome bd-I ubiquinol oxidase subunit 1 | CYDA_ECOLI | CYDA_BACSU | 900.0 | 36.3 | 52.4 | 78 | 8 |
Таблица 2. Локальное парное выравнивание гомологичных белков
Protein name | ID 1 | ID 2 | Score | Identity, % | Similarity, % | Gaps | Indels | Coverage 1, % | Coverage 2, % |
DNA gyrase subunit A | GYRA_ECOLI | GYRA_BACSU | 2228.0 | 52.6 | 71.3 | 38 | 3 | 96.1 | 98.1 |
Orotate phosphoribosyltransferase | PYRE_ECOLI | PYRE_BACSU | 143.0 | 30.1 | 48.3 | 32 | 5 | 60.6 | 57.9 |
Cytochrome bd-I ubiquinol oxidase subunit 1 | CYDA_ECOLI | CYDA_BACSU | 904.5 | 37.6 | 54.2 | 67 | 6 | 97.7 | 95.1 |
Таблица 3. Глобальное парное выравнивание негомологичных белков
ID 1/Protein name | GLYA_ECOLI Serine hydroxymethyltransferase |
ID 2/Protein name | SYN_BACSU Asparagine--tRNA ligase |
Score | 35.0 |
Identity, % | 7.3 |
Similarity, % | 14.2 |
Gaps | 473 |
Indels | 16 |
Таблица 4. Локальное парное выравнивание негомологичных белков
ID 1/Protein name | GLYA_ECOLI Serine hydroxymethyltransferase |
ID 2/Protein name | SYN_BACSU Asparagine--tRNA ligase |
Score | 46.0 |
Identity, % | 22.1 |
Similarity, % | 40.9 |
Gaps | 43 |
Indels | 11 |
Coverage 1, % | 35.3 |
Coverage 2, % | 40.0 |
Для множественного выравнивания была выбрана функциональная мнемоника GYRA (в E.coli это белок под названием "DNA gyrase subunit A"), в Swiss-Prot таких белков было найдено 87, из которых были выбраны белки со следующими мнемониками организмов: ECOLI, BACSU, MYCSM, MYCS2, RICCN, HELPY, GRABC, NEIGO. Выравнивание проводилось с помощью соответствующего сервиса на сайте UniProt (алгоритм Clustal Omega). С вырвниванием можн ознакомиться по этой ссылке. В выравнивании присутствует несколько крупных консервативных участков, например 46-55 и 181-188, также очень распространены небольшие консервативные аминокислотные последовательности, вплоть до одного остатка, например 134, 671, 674, 681, 684, 687. присутствуют и менее консервативные участки (535-542, 899-916). На мой взгляд данные последовательности гомолоичны, так как мы можем наблюдать некоторые консервативные участки во всех последовательностях.
В данном случае выравнивание сведетельствует о гомологии, так как у данных последовательностей в результате глобального и локального выравниваний выявлен высокий процент идентичности,также на гомологию этих белков может указывать малое количество инделей и высокий процент покрытия в локальном выравнивании.
Таблица 5. Глобальное парное выравнивание RBL1_HALNC и RBL_NOSS1
ID 1/Protein name | RBL1_HALNC Ribulose bisphosphate carboxylase large chain |
ID 2/Protein name | RBL_NOSS1 Ribulose bisphosphate carboxylase large chain |
Score | 1976.0 |
Identity, % | 74.4 |
Similarity, % | 84.8 |
Gaps | 13 |
Indels | 2 |
Таблица 6. Локальное парное выравнивание негомологичных белков
ID 1/Protein name | RBL1_HALNC Ribulose bisphosphate carboxylase large chain |
ID 2/Protein name | RBL_NOSS1 Ribulose bisphosphate carboxylase large chain |
Score | 1980.0 |
Identity, % | 77.7 |
Similarity, % | 88.3 |
Gaps | 0 |
Indels | 0 |
Coverage 1, % | 97.5 |
Coverage 2, % | 96.8 |
При запуске программ needle и water предлагается ввести значение штрафа за гэп (п умолчанию это 10.0) и штрафа за последующие рядом стоящие гэпы (по умолчанию 0.5). При увеличении значений этх двух видов штрафов (Табл.7, Табл.8), парамеитры выравнивания меняются незнаительно или не меняются вовсе. Если же сильно уменьшить эти штрафы или установить равными нулю, то неизбежно появляется множество гэпов и инделей, а также уменьшатся проценты идентичности и схожести.
Таблица 7. Глобальное парное выравнивание с различными параметрами гомологичных белков RBL1_HALNC и RBL_NOSS1
Gap penalty | Extend penalty | Score | Identity, % | Similarity, % | Gaps | Indels |
10.0 | 0.5 | 1976.0 | 74.4 | 84.8 | 13 | 2 |
5.0 | 1.0 | 1978.0 | 74.6 | 85.0 | 13 | 2 |
15.0 | 1.0 | 1976.0 | 74.4 | 84.8 | 13 | 2 |
50.0 | 0.1 | 1976.0 | 74.4 | 84.8 | 13 | 2 |
0.5 | 0.5 | 2027.5 | 73.1 | 82.4 | 53 | 36 |
0.0 | 0.0 | 2068.0 | 70.2 | 79.3 | 93 | 61 |
Таблица 8. Локальное парное выравнивание с различными параметрами гомологичных белков RBL1_HALNC и RBL_NOSS1
Gap penalty | Extend penalty | Score | Identity, % | Similarity, % | Gaps | Indels | Coverage 1, % | Coverage 2, % |
10.0 | 0.5 | 1980.0 | 77.7 | 88.3 | 0 | 0 | 97.5 | 96.8 |
5.0 | 1.0 | 1980.0 | 77.7 | 88.3 | 0 | 0 | 97.5 | 96.8 |
15.0 | 1.0 | 1980.0 | 77.7 | 88.3 | 0 | 0 | 97.5 | 96.8 |
50.0 | 0.1 | 1980.0 | 77.7 | 88.3 | 0 | 0 | 97.5 | 96.8 |
0.5 | 0.5 | 2027.5 | 74.2 | 83.8 | 45 | 35 | 98.3 | 100.0 |
0.0 | 0.0 | 2068.0 | 71.5 | 80.7 | 83 | 45 | 98.3 | 100.0 |