Практикум 9. Выравнивание последовательностей

Глобальное парное выравнивание гомологичных белков

Выравнивание последовательностей белков Escherichia coli K12 и Bacillus subtilis 168 выполнено программой needle (глобальное парное выравнивание), параметры по умолчанию.

:
Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Flagellar motor switch protein FLIM_ECOLI FLIM_BACSU 490.0 31.9% 56.4% 15 4
Acetylglutamate kinase PROB_ECOLI PROB_BACSU 337.0 33.8% 52.8% 22 9
Translation initiation factor IF-1 IF1_ECOLI IF1_BACSU 272.0 68.1% 88.9% 0 0

Локальное парное выравнивание гомологичных белков

Выравнивание последовательностей белков E. coli K12 и B. subtilis 168 выполнено программой water (локальное парное выравнивание), параметры по умолчанию.

Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Flagellar motor switch protein FLIM_ECOLI FLIM_BACSU 490.0 32.6% 57.8% 10 4 99.09% 97.63%
Acetylglutamate kinase PROB_ECOLI PROB_BACSU 339.5 36.3% 57.1% 6 5 86.82% 86.05%
Translation initiation factor IF-1 IF1_ECOLI IF1_BACSU 272.0 70.0% 90.0% 0 0 97.22% 97.22%

Комментарии к выравниваниям

Глобальное выравнивание. Исходя из результатов глобального выравнивания последовательностей выбранных белков E. coli K12 и B. subtilis 168, можно сделать вывод, что они все гомологичны, так как процент их идентичности больше 25% (31.9%, 33.8%, 68.1%). У Translation initiation factor IF-1 (IF1) процент идентичности более чем в 2 раза выше чем у Flagellar motor switch protein (FMSP) и Acetylglutamate kinase (AK) и в отличие от них (15 и 4, 22 и 9) полностью отсутствуют гэпы и индели, что свидетельствует о его значительной консервативности, связанной с участием IF1 в трансляции. Вес выравнивания IF1 (272.0) ниже чем у FMSP (490.0) и AK (337.0) в связи с его меньшими размерами.

Локальное выравнивание. Для FMSP и IF1 локальное выравнивание показало схожий процент идентичности (32.6%, 70.0%) и большой процент покрытия обоих белков (99.09% и 97.63%, 97.22% и 97.22%), что свидетельствует о том, что данные белки гомологичны почти по всей длине. Покрытие AK меньше чему у 2 других белков (86.82%, 86.05%), а количество гэпов и инделей в локальном выравнивании (6, 5) значительно меньше чем в глобальном (22, 9), что показывает, что у данного белка присутствуют большие негомологичные части на концах.

Выводы. FMSP гомологичен по всей длине, локальное выравнивание в его случае немного более информативно по сравнению с глобальным, так как дало незначительно лучший процент идентичности.AK гомологичен почти по всей длине за исключением длинных негомологичных концевых частей, локальное выравние более информативно в его случае, так как обрезало негомологичные концевые части. IF1 гомологичен по всей длине, локальное выравнивание в его случае немного более информативно по сравнению с глобальным, так как дало незначительно лучший процент идентичности.

Результат применения программ выравнивания к
неродственным белкам

Были выбраны белки AAT_ECOLI и DHA_BACSU.

Таблица 3. Характеристики глобального парного выравнивания неродственных белков
Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels
N-acetyl-gamma-glutamyl-phosphate reductase Tryptophan synthase alpha chain ARGC_ECOLI TRPA_BACSU 36.0 13.9% 24.2% 217 19

Таблица 4. Характеристики локального парного выравнивания неродственных белков
Protein Name 1 Protein Name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
N-acetyl-gamma-glutamyl-phosphate reductase Tryptophan synthase alpha chain ARGC_ECOLI TRPA_BACSU 43.5 22.5% 40.5% 28 7 28.14% 37.45%

Белки не являются гомологичными в связи с их низким процентом идентичности (глобальное: 13,9%, локальное: 22,5%) и большим количество гэпов (глобальное: 217, локальное: 28) и инделей (глобальное: 19, локальное: 7). Оба типа выравнивания не выявили значимого эволюционного сходства между последовательностями, также в данном случае они оба не будут информативными.

Множественное выравнивание белков и импорт в Jalview

Выбор. Для множественного выравнивания с помощью команды muscle были выбраны белки с мнемоникой IF1_, рекомендованное полное имя - Translation initiation factor IF-1.
В результате выполнения команды infoseq 'sw:IF1*' -only -name -nohead -auto | wc -l было найдено 477 белков с мнемоникой IF1_. Использованы следующие белки: IF1_NOSS1, IF1_UREPA, IF1_DESPS, IF1_FRATT, IF1_PSEF5, IF1_ECOLI, IF1_BACSU.

Выполнение. Сначала с помощью команды seqret были загружены последовательности из Swiss-Prot: seqret @178.txt FASTA::file.fasta -auto, 178.txt - название файла с идентификаторами данных белков. Затем выполнено выравнивание командой muscle: muscle -align file.fasta -output align.fasta. Дальше множественное выравнивание было открыто с помощью программы Jalview, где колонки выравнивания были раскрашены по проценту идентичности, файл.

Обсуждение. Последовательности являются гомологичными по всей длине за исключением C-концевой инсерции IF1_DESPS (72-77 столбцы). Качество выравниваний можно оценить как хорошее в связи с маленьким числом инделей, примерно равной длиной большинства последовательностей и большим процентом идентичности. Большая часть последовательности белков является консервативной, однако присутствуют полиморфные позиции, где у большинства разные аминокислоты (6, 30, 31, 42, 54, 71 и др.)