Практикум 9. Выравнивание последовательностей

Глобальное парное выравнивание гомологичных белков

Выравнивание последовательностей белков Escherichia coli K12 и Bacillus subtilis 168 выполнено программой needle (глобальное парное выравнивание), параметры по умолчанию.

:
Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Flagellar motor switch protein FLIM_ECOLI FLIM_BACSU 369.0 28.8% 50.9% 14 8
Acetylglutamate kinase PROB_ECOLI PROB_BACSU 661.5 39.1% 57.1% 10 6
Translation initiation factor IF-1 IF1_ECOLI IF1_BACSU 272.0 68.1% 88.9% 0 0

Локальное парное выравнивание гомологичных белков

Выравнивание последовательностей белков E. coli K12 и B. subtilis 168 выполнено программой water (локальное парное выравнивание), параметры по умолчанию.

Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Flagellar motor switch protein FLIM_ECOLI FLIM_BACSU 374.5 29.4% 52.0% 9 6 94.9% 96.9%
Acetylglutamate kinase PROB_ECOLI PROB_BACSU 666.5 39.9% 58.4% 7 4 98.4% 98.1%
Translation initiation factor IF-1 IF1_ECOLI IF1_BACSU 272.0 70.0% 90.0% 0 0 97.22% 97.22%

Комментарии к выравниваниям

Глобальное выравнивание. Исходя из результатов глобального выравнивания последовательностей выбранных белков E. coli K12 и B. subtilis 168, можно сделать вывод, что они все гомологичны, так как процент их идентичности больше 25% (28.8%, 39.1%, 68.1%). У Translation initiation factor IF-1 (IF1) процент идентичности более чем в 2 раза выше чем у Flagellar motor switch protein (FMSP) и Acetylglutamate kinase (AK) и в отличие от них (14 и 8, 10 и 6) полностью отсутствуют гэпы и индели, что свидетельствует о его значительной консервативности, связанной с участием IF1 в трансляции. Вес выравнивания IF1 (272.0) ниже чем у FMSP (369.0) и AK (661.5) в связи с его меньшими размерами.

Локальное выравнивание. Для всех трех белков (FMSP, AK и IF1) локальное выравнивание показало схожий процент идентичности (29.4%, 94.9% и 70.0%) и большой процент покрытия обоих белков (94.9% и 96.9%, 98.4% и 98.1%, 97.22% и 97.22%), что свидетельствует о том, что данные белки гомологичны почти по всей длине.

Выводы. FMSP гомологичен по всей длине, локальное выравнивание в его случае немного более информативно по сравнению с глобальным, так как дало лучший процент идентичности, обрезав концевые гэпы. AK также гомологичен по всей длине и его локальное выравние более информативно, так как дало больший процент идентичности, удалив концевые гэпы. IF1 гомологичен по всей длине, локальное выравнивание в его случае немного более информативно по сравнению с глобальным, так как дало незначительно лучший процент идентичности.

Результат применения программ выравнивания к
неродственным белкам

Были выбраны белки AAT_ECOLI и DHA_BACSU.

Таблица 3. Характеристики глобального парного выравнивания неродственных белков
Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels
N-acetyl-gamma-glutamyl-phosphate reductase Tryptophan synthase alpha chain ARGC_ECOLI TRPA_BACSU 36.0 13.9% 24.2% 217 20

Таблица 4. Характеристики локального парного выравнивания неродственных белков
Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
N-acetyl-gamma-glutamyl-phosphate reductase Tryptophan synthase alpha chain ARGC_ECOLI TRPA_BACSU 43.5 22.5% 40.5% 28 7 28.14% 37.45%

Белки не являются гомологичными в связи с их низким процентом идентичности (глобальное: 13,9%, локальное: 22,5%) и большим количество гэпов (глобальное: 217, локальное: 28) и инделей (глобальное: 20, локальное: 7). Оба типа выравнивания не выявили значимого эволюционного сходства между последовательностями, также в данном случае они оба не будут информативными.

Множественное выравнивание белков и импорт в Jalview

Выбор. Для множественного выравнивания с помощью команды muscle были выбраны белки с мнемоникой IF1_, рекомендованное полное имя - Translation initiation factor IF-1.
В результате выполнения команды infoseq 'sw:IF1*' -only -name -nohead -auto | wc -l было найдено 477 белков с мнемоникой IF1_. Использованы следующие белки: IF1_NOSS1, IF1_UREPA, IF1_DESPS, IF1_FRATT, IF1_PSEF5, IF1_ECOLI, IF1_BACSU.

Выполнение. Сначала с помощью команды seqret были загружены последовательности из Swiss-Prot: seqret @178.txt FASTA::file.fasta -auto, 178.txt - название файла с идентификаторами данных белков. Затем выполнено выравнивание командой muscle: muscle -align file.fasta -output align.fasta. Дальше множественное выравнивание было открыто с помощью программы Jalview, где колонки выравнивания были раскрашены по проценту идентичности, файл.

Обсуждение. Последовательности являются гомологичными по всей длине за исключением C-концевой инсерции IF1_DESPS (72-77 столбцы). Качество выравниваний можно оценить как хорошее в связи с маленьким числом инделей, примерно равной длиной большинства последовательностей и большим процентом идентичности. Большая часть последовательности белков является консервативной, однако присутствуют полиморфные позиции, где у большинства разные аминокислоты (6, 30, 31, 42, 54, 71 и др.)