Выравнивание последовательностей

Глобальное парное выравнивание гомологичных белков

Таблица 1. Глобальное парное выравнивание гомологичных белков

Protein name ID 1 ID 2 Score Identity, % Similarity, % Gaps Indels
DNA gyrase subunit A GYRA_ECOLI GYRA_BACSU 2227.0 50.7 68.6 72 5
Orotate phosphoribosyltransferase PYRE_ECOLI PYRE_BACSU 123.0 23.1 38.9 65 10
Cytochrome bd-I ubiquinol oxidase subunit 1 CYDA_ECOLI CYDA_BACSU 900.0 36.3 52.4 78 8

Локальное парное выравнивание гомологичных белков

Таблица 2. Локальное парное выравнивание гомологичных белков

Protein name ID 1 ID 2 Score Identity, % Similarity, % Gaps Indels Coverage 1, % Coverage 2, %
DNA gyrase subunit A GYRA_ECOLI GYRA_BACSU 2228.0 52.6 71.3 38 3 96.1 98.1
Orotate phosphoribosyltransferase PYRE_ECOLI PYRE_BACSU 143.0 30.1 48.3 32 5 60.6 57.9
Cytochrome bd-I ubiquinol oxidase subunit 1 CYDA_ECOLI CYDA_BACSU 904.5 37.6 54.2 67 6 97.7 95.1

Результат применения программ выравнивания к неродственным белкам

Таблица 3. Глобальное парное выравнивание негомологичных белков

ID 1/Protein name GLYA_ECOLI
Serine hydroxymethyltransferase
ID 2/Protein name SYN_BACSU
Asparagine--tRNA ligase
Score 35.0
Identity, % 7.3
Similarity, % 14.2
Gaps 473
Indels 16

Таблица 4. Локальное парное выравнивание негомологичных белков

ID 1/Protein name GLYA_ECOLI
Serine hydroxymethyltransferase
ID 2/Protein name SYN_BACSU
Asparagine--tRNA ligase
Score 46.0
Identity, % 22.1
Similarity, % 40.9
Gaps 43
Indels 11
Coverage 1, % 35.3
Coverage 2, % 40.0

Множественное выравнивание белков и импорт в Jalview

Для множественного выравнивания была выбрана функциональная мнемоника GYRA (в E.coli это белок под названием "DNA gyrase subunit A"), в Swiss-Prot таких белков было найдено 87, из которых были выбраны белки со следующими мнемониками организмов: ECOLI, BACSU, MYCSM, MYCS2, RICCN, HELPY, GRABC, NEIGO. Выравнивание проводилось с помощью соответствующего сервиса на сайте UniProt (алгоритм Clustal Omega). С вырвниванием можн ознакомиться по этой ссылке. В выравнивании присутствует несколько крупных консервативных участков, например 46-55 и 181-188, также очень распространены небольшие консервативные аминокислотные последовательности, вплоть до одного остатка, например 134, 671, 674, 681, 684, 687. присутствуют и менее консервативные участки (535-542, 899-916). На мой взгляд данные последовательности гомолоичны, так как мы можем наблюдать некоторые консервативные участки во всех последовательностях.

Выравнивание своего белка с его гомологом

В данном случае выравнивание сведетельствует о гомологии, так как у данных последовательностей в результате глобального и локального выравниваний выявлен высокий процент идентичности,также на гомологию этих белков может указывать малое количество инделей и высокий процент покрытия в локальном выравнивании.

Таблица 5. Глобальное парное выравнивание RBL1_HALNC и RBL_NOSS1

ID 1/Protein name RBL1_HALNC
Ribulose bisphosphate carboxylase large chain
ID 2/Protein name RBL_NOSS1
Ribulose bisphosphate carboxylase large chain
Score 1976.0
Identity, % 74.4
Similarity, % 84.8
Gaps 13
Indels 2

Таблица 6. Локальное парное выравнивание негомологичных белков

ID 1/Protein name RBL1_HALNC
Ribulose bisphosphate carboxylase large chain
ID 2/Protein name RBL_NOSS1
Ribulose bisphosphate carboxylase large chain
Score 1980.0
Identity, % 77.7
Similarity, % 88.3
Gaps 0
Indels 0
Coverage 1, % 97.5
Coverage 2, % 96.8

Параметры программ needle и water

При запуске программ needle и water предлагается ввести значение штрафа за гэп (п умолчанию это 10.0) и штрафа за последующие рядом стоящие гэпы (по умолчанию 0.5). При увеличении значений этх двух видов штрафов (Табл.7, Табл.8), парамеитры выравнивания меняются незнаительно или не меняются вовсе. Если же сильно уменьшить эти штрафы или установить равными нулю, то неизбежно появляется множество гэпов и инделей, а также уменьшатся проценты идентичности и схожести.

Таблица 7. Глобальное парное выравнивание с различными параметрами гомологичных белков RBL1_HALNC и RBL_NOSS1

Gap penalty Extend penalty Score Identity, % Similarity, % Gaps Indels
10.0 0.5 1976.0 74.4 84.8 13 2
5.0 1.0 1978.0 74.6 85.0 13 2
15.0 1.0 1976.0 74.4 84.8 13 2
50.0 0.1 1976.0 74.4 84.8 13 2
0.5 0.5 2027.5 73.1 82.4 53 36
0.0 0.0 2068.0 70.2 79.3 93 61

Таблица 8. Локальное парное выравнивание с различными параметрами гомологичных белков RBL1_HALNC и RBL_NOSS1

Gap penalty Extend penalty Score Identity, % Similarity, % Gaps Indels Coverage 1, % Coverage 2, %
10.0 0.5 1980.0 77.7 88.3 0 0 97.5 96.8
5.0 1.0 1980.0 77.7 88.3 0 0 97.5 96.8
15.0 1.0 1980.0 77.7 88.3 0 0 97.5 96.8
50.0 0.1 1980.0 77.7 88.3 0 0 97.5 96.8
0.5 0.5 2027.5 74.2 83.8 45 35 98.3 100.0
0.0 0.0 2068.0 71.5 80.7 83 45 98.3 100.0