Множественные выравнивания
Множественные выравнивания
Главная

Выбор последовательностей для выравнивания

Для анализа было выбрано выравнивание последовательностей, гомологичных белку AHBA synthase организма A. Mediteranei (идентификатор UniProt D8HZ92 ), полученных с помощью Blast. Оно включает 7 белков, не считая сам белок, со значениями E-value 2*10-162-2*10-80, идентичностью порядка 41-71% и покрытием 76-94%. Для поиска гомологов была использована база данных RefSeq.

Выравнивание с помощью muscle

С помощью клиента Putty был получен доступ к программе muscle на сервере kodomo. Для построения выравнивания была введена следующая команда:

muscle-in seqdump.txt -out pr13_muscle.fasta.

Полученное выравнивание в формате fasta можно скачать по следующей ссылке: pr13_muscle.fasta.

Выравнивание с помощью mafft

Второе выравнивание было получено с помощью программы mafft на сервере kodomo. Скачать его можно по ссылке.

Сравнение полученных выравниваний

Для построения выравнивания двух выравниваний была опять же использована программа muscle сервера kodomo. Была введена команда:

muscle -profile -in1 pr13_mafft.fasta -in2 pr13_muscle.fasta -out pr13_aligment.fasta

Выравнивания практически не отличаются друг от друга, за исключением конца выравниваний, где количество совпадающих позиций невелико. Крупные блоки выделены одинаково в обоих выравниваниях (выравнивания совпадают в 1-350, 371-378, 383-419 позициях). При уровне консервативности 70% выделенные блоки абсолютно совпадают для обоих выравниваний. Ознакомиться с выравниваниями можно на рис. 1.

Рис. 1. Сравнение множественных выравниваний гомологов белка AHBA synthase оранизма A. meditrranei. Раскраска ClustalX. Сверху - полученное с помощью mafft, снизу - с помощью muscle

Полученное выравнивание в формате fasta можно скачать по следующей ссылке: pr13_muscle.fasta.

Поиск доменов в Pfam

С помощью сервиса Pfam в белке AHBA synthase организма A. mediterranei быы найден домен DegT_DnrJ_EryC1 (14-382 аминокислотные остатки в данном белке). Всего в базе данных существует 8204 последовательности с доменом DegT_DnrJ_EryC1. Seed-выравнивание десяти из них доступно по следующей ссылке.

Проект с выравниваниями можно скачать по следующей ссылке.

Обо мне
Ссылки


Valid HTML 4.01 Transitional