Учебный сайт Саши Якушевой

Второй семестр

Главная

Семестры

Обо мне

Ссылки

Построение множественного выравнивания. Pfam

Скачать проект задания

При помощи программы BLAST было выбрано 7 гомологов белка Stage II sporulation E family protein бактерии Thermanaerovibrio acidaminovorans, поиск выполнялся в базе данных Refseq, однако и в этой базе данных не нашлось белков, полностью удовлетворяющих рекомендациям, поэтому пришлось взять белки с более низким ID, чем требовалось (основная масса выбранных белков идентичны с исходным на 30-40%). Файл с последовательностями выбранных белков можно скачать здесь.

Далее было построено 2 выравнивания данных последовательностей. Одно - с помощью программы muscle на kodomo (была использована команда: "muscle -in sequences.fasta -out al_muscle.fasta"). Полученный файл можно скачать здесь. Второе - с помощью программы mafft (команда: "mafft sequences.fasta > al_mafft.fasta"). Файл с mafft-выравниванием можно скачать здесь. Выравнивания получились довольно различными, они даже не совпали по длине (muscle - 366, mafft - 378). Чтобы выравнить их относительно друг друга, была использована команда:"muscle -profile -in1 al_muscle.fasta -in2 al_mafft.fasta -out compare.fasta". Изображение со сравнением полученных выравниваний можно увидеть на рис. 1.

Рис. 1 Сравнение множественных выравниваний гомологов белка Stage II sporulation E family protein бактерии Thermanaerovibrio acidaminovorans. Сверху выравнивание, полученное с помощью muscle, снизу - с помощью mafft. Раскраска ClustalX.

Данные выравнивания совпадают по следующим позициям: 14-21, 60-61, 87-111, 133, 135-145, 162-206, 229-240, 258-289, 308-314, 319-340, 345-380. Видно, что данные выравнивания достаточно различаются, хотя имеется несколько больших совпадающих блоков.

Pfam

Последовательность исходного белка была найдена на сайте pfam с помощью идентификатора D1B7C2_THEAS. По данным этого сайта, в последовательности белка имеется домен Stage II sporulation protein E pfam-семейства SpoIIE (PF07228), который находится на участке 4-206. Было сохранено seed-выравнивание этого семейства. Файл с выравниванием можно скачать здесь.

© Саша Якушева, 2013
sashayakusheva@fbb.msu.ru
Last modification date: 27.12.2013