Учебный сайт Светланы Яровенко
» Семестры » Второй семестр » Множественные выравнивания. Pfam

Множественные выравнивания. Pfam

Для построения выравнивания было отобрано 7 белков-гомологов дегидратазы (идентификатор YP_001633816.1 в базе RefSeq). Выборка была составлена из находок в базе данных Refseq, которые были получены с помощью программы BLAST.

Условия на подходящии белки были следующие: Coverage 70-90%, Identity 50-60%, E-value < 10-5. У большинства белков, подходящих по остальным параметрам, Coverage было больше 90%, поэтому в выборку я старалась включать подходящие последовательности, наиболее отдалённые друг от друга по Score.

Последовательности находок в fasta-формате можно скачать отсюда. Проект JalView со всеми полученными выравниваниями скачивается по данной ссылке.


Построение множественного выравнивания

Для построения множественного выравнивания использовалась программа muscle на сервере kodomo. Была введена следующая команда:

muscle -in seq.fasta -out muscle.fasta

В результате был получен файл с варавниванием, который можно скачать отсюда. Наглядное изображение выравнивания представлено на Рисунке 1.

Множественное выравнивание, полученное с помощью программы muscle

Рисунок 1. "Множественное выравнивание, полученное с помощью программы muscle.
Изображение получено с помощью программы JalView. Окрашивание Clustalx, Conservation 70%.


Также выравнивание было построено с помощью другой программы на сервере kodomo — mafft. Команда была следующая:

mafft seq.fasta > mafft.fasta
Полученное выравнивание изображено на Рисунке 2. Скачать результат можно по данной ссылке.
Множественное выравнивание, полученное с помощью программы mafft

Рисунок 2. "Множественное выравнивание, полученное с помощью программы mafft.
Изображение получено с помощью программы JalView. Окрашивание Clustalx, Conservation 70%.


Просто сравнив Рисунок 1 и 2, можно заметить некоторые различия в выравниваниях, особенно в их начале.

Чтобы лучше сравнить полученные выравнивания, с помощью программы muscle было построено выравнивание данных выравниваний. Команда выглядела так:

muscle -profile -in1 muscle.fasta -in2 mafft.fasta -out both.fatsa

Скачать выравнивание можно отсюда. Из Рисунка 3 видно, что выравнивания различаются с 1 по 9 позицию, 140 по 144; в 181, 182, 189, 190, 318, 319 позициях; с 336 по 340 и в 342 позиции. На остальных участках они идентичны.

Выравнивание выравниваний

Рисунок 3. Сравнение полученных выравниваний.
Выравнивание выравниваний получено с помощью программы muscle, изображение — программы JalView. Окрашивание Clustalx, Conservation 70%.


Pfam

Чтобы определить, домены каких Pfam-семейств встречаются в данном мне белке, я воспользовалась поиском по последовательностям на сайте Pfam.

Результат поиска показал, что белок содержит в себе один домен MaoC like domain семейства MaoC_dehydratas (PF01575). Координаты данного домена: 11-133.

Seed-выравнивание данного семейства представлено на Рисунке 4. Скачать fasta-файл можно отсюда.

Seed-выравнивание

Рисунок 4. Seed-выравнивание pfam-семейства MaoC_dehydratas (PF01575).
Изображение получено с помощью программы JalView. Окрашивание Clustalx, Above Identity Threshold 70%.


Наверх