Выравниывание последовательностей белков

Глобальное парное выравнивание

Табл. 1. Результаты программы needle
Protein name ID1 ID2 Score Identity, % Similarity, % Gaps Indels
Ribose-phosphate pyrophosphokinase KPRS_ECOLI KPRS_BACSU 794.0 49.8 69.8 10 1
Transcription termination/antitermination protein NusA NUSA_ECOLI NUSA_BACSU 703.5 28.7 48.3 124 3
N5-carboxyaminoimidazole ribonucleotide mutase PURE_ECOLI PURE_BACSU 476.0 57.4 72.2 7 2

Локальное парное выравнивание

Табл. 2. Результат программы water
Protein name ID1 ID2 Score Identity, % Similarity, % Gaps Indels Coverage 1 Coverage 2
Ribose-phosphate pyrophosphokinase KPRS_ECOLI KPRS_BACSU 798.0 51.4 72.0 3 0 98.7% 97.2%
Transcription termination/antitermination protein NusA NUSA_ECOLI NUSA_BACSU 707.0 40.2 65.6 1 0 69.3% 92.2%
N5-carboxyaminoimidazole ribonucleotide mutase PURE_ECOLI PURE_BACSU 488.0 62.6 78.7 0 0 91.7% 95.7%

Выравнивание неродственных белков

Для выравнивания было необходимо взять пару белков с разными мнемониками функций. Чтобы далеко не уходить от предыдущих частей работы были выбраны белки NUSA_ECOLI и PURE_BACSU. Результаты выравнивания (табл. 3) подтверждают то, что белки имеют мало общего друг с другом (различное строение => различные функции), а сравнение результатов глобального и локального выравнивания подтверждает особенности этих выравниваний: глобальное выравнивание ищет выравнивание с наибольшим весом, при этом перекрывая максимально большую часть белка, а локальное выравнивание ищет наиболее похожие участки в белках и выравнивает их (это следует из низкого % перекрывания).

Табл. 3.
ID1 ID2 Score Identity, % Similarity, % Gaps Indels Coverage 1 Coverage 2
Глобальное выравнивание (needle)
NUSA_ECOLI PURE_ECOLI 23.5 8.2 12.5 160 9 100% 100%
Локальное выравнивание (water)
NUSA_ECOLI PURE_ECOLI 40.5 25.6 32.9 62 10 32.3% 62.7%

Множественное выравнивание белков

Для множественного выравнивания был выбран белок, не задействованный в предыдущем задании - Ribose-phosphate pyrophosphokinase (KPRS). По запросу infoseq 'sw:kprs_*' -only -name -nohead -out kprs.txt | wc -l kprs.txt нашлось 129 белков. Из них, помимо KPRS_ECOLI (Escherichia coli) и KPRS_BACSU (Bacillus subtilis) были выбран еще 5: KPRS_CLOPE (Clostridium perfringens), KPRS_NITEU (Nitrosomonas europaea), KPRS_HELPY (Helicobacter pylori), KPRS_PYRHO (Pyrococcus horikoshii) и KPRS_AQUAE (Aquifex aeolicus).

Выравнивание проводилось на kodomo программой muscle. Для этого выбранные белки были сохранены в один файл формата .fasta и командой muscle -in kprs.fasta -out kprs_alingment.fasta в другой файл былло сохранено множественное выравнивание. Далее выравнивание было загружено в программу JalView и раскрашено по проценту идентичности. Результат представлен на рис. 1, а также его можно посмотреть тут.

kprs_alignment
Рис. 1. JalView

По проекту JalView видно, что белки выровнялись хорошо - "хвосты" инделей вначале и в конце выравнивания не очень длинные. Белки гомологичные, но консервативных участков немного, некоторые участки почти консервативны - аминокислотные остатки KPRS_PYRHO довольно часто выбиваются из консервативных участков, что говорит о наибольшей девиргенции этого белка. Например, довольно длинный участок (колонки 44-48) не является полностью консервативным, так как из него выбиваются остатки KPRS_PYRHO. Больше всего консервативных участков сосредоточено в колонках 44-148. Возможно, в этом промежутке находятся активные центры белков. Также встречаются участки выравнивания, в которых аминокислотные остатки в столбцах функционально близки (например, в колонках 229-231, 234 и 241). В сумме с почти консервативными участками рядом они образуют большой блок (229-241), который также может являться активным центром.

Выравнивание своего белка с его гомологом

В предыдущем блоке был исследован белок, транспортирующий лактат - L-lactate transporter у бактерии Syntrophobacter fumaroxidans (ID: SFMCT_SYNFM).Этот белок относится к семейству монокарбоксилатных переносчиков (MCT), поэтому, для выбора гомологичного белка был проведен поиск в UniProt: family:"monocarboxylate porter", который выдал 67 рецензированных записей. Выбранный мной предположительно гомологичный белок - Monocarboxylate transporter 1, пренадлежащий человеку Homo sapiens (ID: MOT1_HUMAN). Для определения гомологии было проведено 2 выравнивания - глобальное (needle) и локальное (water). Результаты выравниваний представлены в табл. 4.

Табл. 4. Выравнивание предположительно гомологичных белков
ID1 ID2 Score Identity, % Similarity, % Gaps Indels Coverage 1 Coverage 2
Глобальное выравнивание (needle)
SFMCT_SYNFM MOT1_HUMAN 226.5 22.6 34.1 150 23 100% 100%
Локальное выравнивание (water)
SFMCT_SYNFM MOT1_HUMAN 234.5 26.1 39.1 74 17 89.6% 80.2%

По результатам выравнивания можно сказать, что белки действительно гомологичны (процент идентичности локального выравнивания больше 25%, высокий процент покрытия последовательностей). Это объясняет отнесение их к одному семейству и подтверждает функциональное сходство, описанное во вступлении 9 практикума.