Выравнивание последовательностей белка

1. Глобальное парное выравнивание гомологичных белков
Из Uniprot были загружены два списка идентификаторов (ID) записей: всех аннотированных записей белков штамма K12 E.coli и записей белков штамма 168 B.subtilis с помощью команд:
1. infoseq 'sw:*_ECOLI' -only -name -out ecoli.txt
2. infoseq 'sw:*_BACSU' -only -name -out bacsu.txt.
Объединение списка и его сортировка по алфавиту позволили обнаружить пары белков с одинаковой мнемоникой функции. Были выбраны пары идентификаторов белков с мнемониками функции CISY, FER и MRAY. Рекомендуемые полные названия белков были определены в результате выполнения следующих команд:
1. entret sw:CISY_ECOLI stdout -auto | grep ^DE
2. entret sw:FER_ECOLI stdout -auto | grep ^DE
3. entret sw:MRAY_ECOLI stdout -auto | grep ^DE
Далее было выполнено глобальное выравнивание этих пар белков с помощью команд:
1. needle sw:cisy_ecoli sw:cisy_bacsu cisy.needle -auto
2. needle sw:fer_ecoli sw:fer_bacsu fer.needle -auto
3. needle sw:mray_ecoli sw:mray_bacsu mray.needle -auto.
Результаты выравнивания представлены в Таблице 1.

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein NameID 1ID 2Score% Identity% SimilarityGapsIndels
Citrate synthase*CISY_ECOLICISY_BACSU489.028.447.66510
2Fe-2S ferredoxin**FER_ECOLIFER_BACSU24.014.625.4676
Phospho-N-acetylmuramoyl-pentapeptide-transferaseMRAY_ECOLIMRAY_BACSU707.042.659.6449
*Название белка с такой же мнемоникой функции у B.subtilis – Citrate synthase 1.
**Название белка с такой же мнемоникой функции у B.subtilis – Ferredoxin.

2. Локальное парное выравнивание гомологичных белков
Те же пары белков были подвергнуты локальному выравниванию программой water:
1. water sw:cisy_ecoli sw:cisy_bacsu cisy.water -auto
2. water sw:fer_ecoli sw:fer_bacsu fer.water -auto
3. water sw:mray_ecoli sw:mray_bacsu mray.water -auto
В Таблице 2 приведены результаты локального выравнивания.

Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein NameID 1ID 2Score% Identity% SimilarityGapsIndelsCoverage 1Coverage 2
Citrate synthaseCISY_ECOLICISY_BACSU497.031.752.630988.896.4
2Fe-2S ferredoxinFER_ECOLIFER_BACSU35.022.733.325342.370.7
Phospho-N-acetylmuramoyl-pentapeptide-transferaseMRAY_ECOLIMRAY_BACSU720.046.264.422690.896.0

3. Результат применения программ выравнивания к неродственным белкам
Для выравнивания неродственных белков были выбраны два белка с разными мнемониками функций: CISY_ECOLI и MRAY_ECOLI. Глобальное выравнивание данных белков было проведено с помощью команды needle sw:cisy_ecoli sw:mray_ecoli cisymray.needle -auto, а локальное – water sw:cisy_ecoli sw:mray_ecoli cisymray.water -auto. Результаты глобального выравнивания представлены в Таблице 3, а результаты локального - в Таблице 4.

Таблица 3. Характеристики глобального выравнивания пары неродственных белков
ID 1ID 2Score% Identity% SimilarityGapsIndels
CISY_ECOLIMRAY_ECOLI11.00.30.57732
Таблица 4. Характеристики локального выравнивания пары неродственных белков
ID 1ID 2Score% Identity% SimilarityGapsIndelsCoverage 1Coverage 2
CISY_ECOLIMRAY_ECOLI35.519.638.125420.122.5
Выравнивание неродственных белков отличается от выравнивания предположительно родственных довольно низким весом, процентами идентичности и сходства.Число инделей может быть небольшим, гэпов огромное количество. В локальном выравнивании наблюдается маленький процент покрытия. Все эти признаки и свидетельствуют о том, что белки не являются родственными.

4. Множественное выравнивание белков и импорт в Jalview
При выполнении поискового запроса mnemonic:mray_* для нахождения Phospho-N-acetylmuramoyl-pentapeptide-transferase у разных организмов в UniProt было обнаружено 726 записей, 717 из них в Swiss-Prot. Помимо белков MRAY_ECOLI и MRAY_BACSU, были выбраны белки MRAY_STAAM, MRAY_RHIME, MRAY_RICM5, MRAY_BACTN, MRAY_DEIRA. Для построения выравнивания использовалась программа muscle. Выравнивание было раскрашено в Jalview по проценту идентичности. Белки выровнялись неплохо, и есть основания предполагать, что они гомологичны. Однако один из белков – MRAY_BACTN – сильно отличается от остальных, хотя и имеет с ними некоторое количество общих участков. Наиболее консервативными являются участки 49, 63, 74, 76, 78, 81, 82, 114, 121, 124, 127, 128, 139, 239, 246, 239, 252, 253, 255, 256, 309-311, 314, 317, 318, 321-324, 326, 327, 331, 360, 361, 364, 383, 387, 391, 416, 423, 424.
Ссылка на проект Jalview