Алгоритмы выравнивания

1. Сравнение выравниваний гомологичных и негомологичных белков

Ход работы:

На сайте UniProt с помощью расширенного поиска(protein name[DE], organism) были найдены интересующие меня гомологичные и негомологичные белки.

Были использованы следующие команды EMBOSS(и для гомологичных, и для негомологичных, несмотря на то, что обычно в теории к гомологичным применяется глобальное выравнивание, а к негомологичным - локальное):

needle sw:XXX_ORGANIZM sw:YYY_ORGANISM ZZZ.needle -auto (глобальное выравнивание)

water sw:XXX_ORGANIZM sw:YYY_ORGANISM ZZZ.water -auto (локальное выравнивание)

needle sw:XXX_ORGANIZM sw:YYY_ORGANISM ZZZ.needle.msf -aformat msf -auto (в таком формате выравнивания будут открывться в Jalview)

water sw:XXX_ORGANIZM sw:YYY_ORGANISM ZZZ.water.msf -aformat msf -auto

Для заполнения отчётной таблицы из выдачи needle и water я получила следующие характеристики: процент колонок с идентичными буквами,процент колонок с близкими буквами (для них значение матрицы замен положительно), число гэпов, вес выравнивания. Число инделей[1] мне пришлось посчитать "глазами" по выравниванию. Их было удобно считать не из выдачи needle, а из выравнивания в Jalview.

Отчётная таблица

С помощью таблицы легко провести сравнительную характеристику парных выравниваний.

Отличия гомологичных белков (введу для них сокращение гб) от негомологичных(пусть они будут нгб), выявленные в ходе выравнивания и заполнения таблицы:

2.Сравнение выравниваний

Немного теории:

Парное выравнивание подразделяется на глобальное и локальное. Глобальное выравнивание обычно применяют для последовательностей, гомологичных по всей длине. В глобальное выравнивание включаются обе входные последовательности целиком. Локальное выравнивание чаще всего применяется, если последовательности содержат как родственные (гомологичные), так и неродственные участки. Результатом локального выравнивания является выбор участка в каждой из последовательностей и выравнивание между этими участками.[2]

Ход работы:

Для множественого выравнивания я выбрала белок RECA.

Были использованы следующие команды EMBOSS:

infoseq 'sw:RECA_*' -only -name -out RECA.txt

seqret @SACA.txt RECA.fasta

muscle -in RECA3.fasta -out RECA_alignment.fasta

Множественное выравнивание по мнемонике RECA

Картиночка Рис.1 Ссылка [5] поможет разобраться в значении окрашивания выравнивания.

Далее из этих шести гомологичных белков я выбрала два наиболее удаленных друг от друга:RECA_MYCLE и RECA_ECOLI.

В то же окно Jalview я добавила глобальное и локальное выравнивание этих двух белков. Затем покрасила их по группам.

Сравнение выравниваний

Картиночка

Рис.2

Картиночка

Рис.3

Картиночка

Рис.4

Отличия между парами выравниваний:

Здесь представлены ссылки, которыми я пользовалась при изучении темы: