1. Глобальное парное выравнивание гомологичных белков
Protein Name ID 1 ID 2 Score Identity Similarity Gaps Indels Acyl-coenzyme A dehydrogenase(*) FADE_ECOLI FADE_BACSU 261.5 15.5% 26.5% 454 24 Biotin synthase BIOB_ECOLI BIOB_BACSU 470.0 28.5% 49.1% 69 5 Flavodoxin 2 FLAW_ECOLI FLAW_BACSU 102.5 20.9% 38.5% 50 6 (*)Для FADE_BACSU рекомендуемое полное имя белка - Probable acyl-CoA dehydrogenase.
Для начала были найдены пары белков с идентификаторами '_ECOLI' и '_BACSU', для них были определены пары белков с одинаковой мнемоникой функции. Это было сделано с помощью следующих команд Linux:
infoseq 'sw:*_ecoli' -only -name -nohead -out ecoli.txt
infoseq 'sw:*_bacsu' -only -name -nohead -out bacsu.txt
Из всех пар были выбраны следующие: FADE BIOB и FLAW. Далее эти последовательности были выравнены с помощью программы needle (при параметрах по умолчанию):
needle sw:fade_ecoli sw:fade_bacsu fade.needle -auto
needle sw:biob_ecoli sw:biob_bacsu biob.needle -auto
needle sw:flaw_ecoli sw:flaw_bacsu flaw.needle -auto
2. Локальное парное выравнивание гомологичных белков
Protein Name | ID 1 | ID 2 | Score | Identity | Similarity | Gaps | Indels | Coverage1 | Coverage2 |
Acyl-coenzyme A dehydrogenase | FADE_ECOLI | FADE_BACSU | 278.5 | 24.3% | 42.3% | 107 | 17 | 60.4% | 79.0% |
Biotin synthase | BIOB_ECOLI | BIOB_BACSU | 477.5 | 35.0% | 59.9% | 6 | 0 | 84.7% | 86.3% |
Flavodoxin 2 | FLAW_ECOLI | FLAW_BACSU | 112.0 | 26.1% | 50.5% | 5 | 1 | 62.4% | 72.2% |
Те же белковые пары были выравнены с помощью программы water:
water sw:fade_ecoli sw:fade_bacsu fade.water -auto
water sw:biob_ecoli sw:biob_bacsu biob.water -auto
water sw:flaw_ecoli sw:flaw_bacsu flaw.water -auto
3. Результат применения программ выравнивания к неродственным белкам
Здесь были выбраны белки с разными мнемониками функций, а именно: ARAD и GSPA, также с помощью аналогичных команд Linux проводилось их глобальное и локальное выравнивания.
Глобальное парное выравнивание негомологичных белков
ID 1 | ID 2 | Score | Identity | Similarity | Gaps | Indels |
ARAD_ECOLI | GSPA_BACSU | 12.5 | 5.5% | 8.5% | 357 | 8 |
Локальное парное выравнивание негомологичных белков
ID 1 | ID 2 | Score | Identity | Similarity | Gaps | Indels | Coverage1 | Coverage2 |
ARAD_ECOLI | GSPA_BACSU | 35.5 | 28.6% | 42.9% | 2 | 1 | 17.3% | 14.7% |
По глобальному выравниванию хорошо видно, что данные белки не имеют общего происхождения.
4. Множественное выравнивание белков
Для множественного выравнивания были выбраны белки с мнемоникой BIOB(Biotin synthase). С помощью команды infoseq sw:biob_* -only -name -nohead -auto | wc -l обнаружено, что всего таких белков 580 штук.
Помимо уже упомянутых выше BIOB_ECOLI и BIOB_BACSU, были выбраны белки: BIOB_BACNA; BIOB_RHOJR; BIOB_CUPMC; BIOB_AROAE; BIOB_METVS; BIOB_ECOLI; BIOB_BACSU.
С помощью программы Jalview было проведено множественное выравнивание, которое можно скачать здесь. Посмотреть изображение полученного выравнивания можно здесь.
Некоторые части последовательностей выравнялись относительно неплохо, например столбцы 54-94, 163-229, 289-340, однако встречается достаточное количество гэпов, есть участки, где совпадения невелики (например столбцы 95-109), что ставит под сомнение гомологичность данных белков.