Protein name | ID1 | ID2 | Score | Identity, % | Similarity, % | Gaps | Indels |
Ribose-phosphate pyrophosphokinase | KPRS_ECOLI | KPRS_BACSU | 794.0 | 49.8 | 69.8 | 10 | 1 |
Transcription termination/antitermination protein NusA | NUSA_ECOLI | NUSA_BACSU | 703.5 | 28.7 | 48.3 | 124 | 3 |
N5-carboxyaminoimidazole ribonucleotide mutase | PURE_ECOLI | PURE_BACSU | 476.0 | 57.4 | 72.2 | 7 | 2 |
Protein name | ID1 | ID2 | Score | Identity, % | Similarity, % | Gaps | Indels | Coverage 1 | Coverage 2 |
Ribose-phosphate pyrophosphokinase | KPRS_ECOLI | KPRS_BACSU | 798.0 | 51.4 | 72.0 | 3 | 0 | 98.7% | 97.2% |
Transcription termination/antitermination protein NusA | NUSA_ECOLI | NUSA_BACSU | 707.0 | 40.2 | 65.6 | 1 | 0 | 69.3% | 92.2% |
N5-carboxyaminoimidazole ribonucleotide mutase | PURE_ECOLI | PURE_BACSU | 488.0 | 62.6 | 78.7 | 0 | 0 | 91.7% | 95.7% |
Для выравнивания было необходимо взять пару белков с разными мнемониками функций. Чтобы далеко не уходить от предыдущих частей работы были выбраны белки NUSA_ECOLI и PURE_BACSU. Результаты выравнивания (табл. 3) подтверждают то, что белки имеют мало общего друг с другом (различное строение => различные функции), а сравнение результатов глобального и локального выравнивания подтверждает особенности этих выравниваний: глобальное выравнивание ищет выравнивание с наибольшим весом, при этом перекрывая максимально большую часть белка, а локальное выравнивание ищет наиболее похожие участки в белках и выравнивает их (это следует из низкого % перекрывания).
ID1 | ID2 | Score | Identity, % | Similarity, % | Gaps | Indels | Coverage 1 | Coverage 2 |
Глобальное выравнивание (needle) | ||||||||
NUSA_ECOLI | PURE_ECOLI | 23.5 | 8.2 | 12.5 | 160 | 9 | 100% | 100% |
Локальное выравнивание (water) | ||||||||
NUSA_ECOLI | PURE_ECOLI | 40.5 | 25.6 | 32.9 | 62 | 10 | 32.3% | 62.7% |
Для множественного выравнивания был выбран белок, не задействованный в предыдущем задании - Ribose-phosphate pyrophosphokinase (KPRS). По запросу infoseq 'sw:kprs_*' -only -name -nohead -out kprs.txt | wc -l kprs.txt нашлось 129 белков. Из них, помимо KPRS_ECOLI (Escherichia coli) и KPRS_BACSU (Bacillus subtilis) были выбран еще 5: KPRS_CLOPE (Clostridium perfringens), KPRS_NITEU (Nitrosomonas europaea), KPRS_HELPY (Helicobacter pylori), KPRS_PYRHO (Pyrococcus horikoshii) и KPRS_AQUAE (Aquifex aeolicus).
Выравнивание проводилось на kodomo программой muscle. Для этого выбранные белки были сохранены в один файл формата .fasta и командой muscle -in kprs.fasta -out kprs_alingment.fasta в другой файл былло сохранено множественное выравнивание. Далее выравнивание было загружено в программу JalView и раскрашено по проценту идентичности. Результат представлен на рис. 1, а также его можно посмотреть тут.
По проекту JalView видно, что белки выровнялись хорошо - "хвосты" инделей вначале и в конце выравнивания не очень длинные. Белки гомологичные, но консервативных участков немного, некоторые участки почти консервативны - аминокислотные остатки KPRS_PYRHO довольно часто выбиваются из консервативных участков, что говорит о наибольшей девиргенции этого белка. Например, довольно длинный участок (колонки 44-48) не является полностью консервативным, так как из него выбиваются остатки KPRS_PYRHO. Больше всего консервативных участков сосредоточено в колонках 44-148. Возможно, в этом промежутке находятся активные центры белков. Также встречаются участки выравнивания, в которых аминокислотные остатки в столбцах функционально близки (например, в колонках 229-231, 234 и 241). В сумме с почти консервативными участками рядом они образуют большой блок (229-241), который также может являться активным центром.
В предыдущем блоке был исследован белок, транспортирующий лактат - L-lactate transporter у бактерии Syntrophobacter fumaroxidans (ID: SFMCT_SYNFM).Этот белок относится к семейству монокарбоксилатных переносчиков (MCT), поэтому, для выбора гомологичного белка был проведен поиск в UniProt: family:"monocarboxylate porter", который выдал 67 рецензированных записей. Выбранный мной предположительно гомологичный белок - Monocarboxylate transporter 1, пренадлежащий человеку Homo sapiens (ID: MOT1_HUMAN). Для определения гомологии было проведено 2 выравнивания - глобальное (needle) и локальное (water). Результаты выравниваний представлены в табл. 4.
ID1 | ID2 | Score | Identity, % | Similarity, % | Gaps | Indels | Coverage 1 | Coverage 2 |
Глобальное выравнивание (needle) | ||||||||
SFMCT_SYNFM | MOT1_HUMAN | 226.5 | 22.6 | 34.1 | 150 | 23 | 100% | 100% |
Локальное выравнивание (water) | ||||||||
SFMCT_SYNFM | MOT1_HUMAN | 234.5 | 26.1 | 39.1 | 74 | 17 | 89.6% | 80.2% |
По результатам выравнивания можно сказать, что белки действительно гомологичны (процент идентичности локального выравнивания больше 25%, высокий процент покрытия последовательностей). Это объясняет отнесение их к одному семейству и подтверждает функциональное сходство, описанное во вступлении 9 практикума.