Выравнивание последовательностей

1. Глобальное парное выравнивание гомологичных белков

Protein Name ID 1 ID 2 Score Identity Similarity Gaps Indels
Acyl-coenzyme A dehydrogenase(*) FADE_ECOLI FADE_BACSU 261.5 15.5% 26.5% 454 24
Biotin synthase BIOB_ECOLI BIOB_BACSU 470.0 28.5% 49.1% 69 5
Flavodoxin 2 FLAW_ECOLI FLAW_BACSU 102.5 20.9% 38.5% 50 6

(*)Для FADE_BACSU рекомендуемое полное имя белка - Probable acyl-CoA dehydrogenase.


Для начала были найдены пары белков с идентификаторами '_ECOLI' и '_BACSU', для них были определены пары белков с одинаковой мнемоникой функции. Это было сделано с помощью следующих команд Linux:

infoseq 'sw:*_ecoli' -only -name -nohead -out ecoli.txt

infoseq 'sw:*_bacsu' -only -name -nohead -out bacsu.txt


Из всех пар были выбраны следующие: FADE BIOB и FLAW. Далее эти последовательности были выравнены с помощью программы needle (при параметрах по умолчанию):

needle sw:fade_ecoli sw:fade_bacsu fade.needle -auto

needle sw:biob_ecoli sw:biob_bacsu biob.needle -auto

needle sw:flaw_ecoli sw:flaw_bacsu flaw.needle -auto



2. Локальное парное выравнивание гомологичных белков

Protein Name ID 1 ID 2 Score Identity Similarity Gaps Indels Coverage1 Coverage2
Acyl-coenzyme A dehydrogenase FADE_ECOLI FADE_BACSU 278.5 24.3% 42.3% 107 17 60.4% 79.0%
Biotin synthase BIOB_ECOLI BIOB_BACSU 477.5 35.0% 59.9% 6 0 84.7% 86.3%
Flavodoxin 2 FLAW_ECOLI FLAW_BACSU 112.0 26.1% 50.5% 5 1 62.4% 72.2%

Те же белковые пары были выравнены с помощью программы water:

water sw:fade_ecoli sw:fade_bacsu fade.water -auto

water sw:biob_ecoli sw:biob_bacsu biob.water -auto

water sw:flaw_ecoli sw:flaw_bacsu flaw.water -auto



3. Результат применения программ выравнивания к неродственным белкам

Здесь были выбраны белки с разными мнемониками функций, а именно: ARAD и GSPA, также с помощью аналогичных команд Linux проводилось их глобальное и локальное выравнивания.


Глобальное парное выравнивание негомологичных белков

ID 1 ID 2 Score Identity Similarity Gaps Indels
ARAD_ECOLI GSPA_BACSU 12.5 5.5% 8.5% 357 8

Локальное парное выравнивание негомологичных белков

ID 1 ID 2 Score Identity Similarity Gaps Indels Coverage1 Coverage2
ARAD_ECOLI GSPA_BACSU 35.5 28.6% 42.9% 2 1 17.3% 14.7%

По глобальному выравниванию хорошо видно, что данные белки не имеют общего происхождения.



4. Множественное выравнивание белков

Для множественного выравнивания были выбраны белки с мнемоникой BIOB(Biotin synthase). С помощью команды infoseq sw:biob_* -only -name -nohead -auto | wc -l обнаружено, что всего таких белков 580 штук.

Помимо уже упомянутых выше BIOB_ECOLI и BIOB_BACSU, были выбраны белки: BIOB_BACNA; BIOB_RHOJR; BIOB_CUPMC; BIOB_AROAE; BIOB_METVS; BIOB_ECOLI; BIOB_BACSU.

С помощью программы Jalview было проведено множественное выравнивание, которое можно скачать здесь. Посмотреть изображение полученного выравнивания можно здесь.

Некоторые части последовательностей выравнялись относительно неплохо, например столбцы 54-94, 163-229, 289-340, однако встречается достаточное количество гэпов, есть участки, где совпадения невелики (например столбцы 95-109), что ставит под сомнение гомологичность данных белков.