PSI-BLAST. Множественное выравнивание

На данной странице представлены результаты по использованию PSI-BLAST.
Решалась задача: построить множественное выравнивание последовательностей гомологов моего белка (thymidylate synthase, идентификатор ADV68687.1).
»Проект Jalview

Составление семейства гомологов

Чтобы проверить, зависит ли список находок PSI-BLAST от белка, с которого начали поиск, я взяла последовательность из списка найденных (наименее похожую на исходную - худшую из тех, чьё E-value выше порога). Это последовательность с идентефикатором Q9HIB2.1. Я провела поиск по новой последовательности и сравнила списки находок по двум белкам в Excel с помощью функции VLOOKUP. Как оказалось, списки находок абсолютно совпадают (за исключением 1 находки, т.к. при поиске по новому белку было найдено на 1 последовательность больше). Отсюда можно сделать вывод, что PSI-BLAST определяет семейство гомологов независимо от белка, в которого начали поиск.
»Excel файл

Ниже приведена статистика поиска по белкам. Я проводила итерации, если находились новые находки. Как только новых находок не находилось, я считала, что семейство гомологов сформировано.
В пользу того, что найдены все белки семейства говорило также то, что разница в E-value на момент конечной итерации составляла 3 порядка (4e-05 и 0.083) для первого белка и 10 порядков (4e-12 и 0.096) для второго.
    Результаты итераций
    Исходный белок№ итерациинаходок лучше
    порога
    новые находкидля лучшейдля худшей
    IDscoreE-valueIDscoreE-value
    ADV68687.1149-C5CHB8.11508e-43P36630.242,36e-04
    273даB7IF44.12743e-91P36630.242,30.002
    373нетB7IF44.12542e-83P36630.247,44e-05
    Q9HIB2.1110-Q9HIB2.110180Q980H6.146,62e-04
    273даQ9HIB2.16930Q5LTY7.249,14e-05
    374даBQ9HIB2.14981e-170P36630.244,40,002
    474нетQ9HIB2.14223e-141P36630.271,44e-12

Построение выравниваний представителей семейства

По найденным последовательностям я построила выравнивание с помощью программы muscle. Я использовала команду:
muscle -in <файл с последовательностями> -out <файл, куда будет записано выравнивание>.
»Множественное выравнивание

Далее с помощью Jalview я выбрала типичных представителей семейства и построила их множественное выравнивание с помощью программ muscle и mafft.
»Выравнивание muscle
»Выравнивание mafft

Я провела сравнение этих выравниваний в Jalview. Как оказалось, полностью идентичных колонок в них почти нет. Всё, что я нашла, это один участок с большим количеством гомологичных колонок, который обе программы определили одинаково (Рис.1). В остальном же выравнивания отличаются. Однако и muscle, и mafft нашли совпадающие мотивы в последовательностях белков этого семейства. Во многих участках с большим процентом гомологии между аминокислотами выравнивания отличаются только в одном белке, а в остальных являются идентичными.
Поэтому можно сделать вывод, что такие мотивы можно найти у всех белков этого семейства, независимо от программы, с помощью которой строится выравнивание.
Рис.1
«Назад
Дальше»

© Колупаева А.Л. 2014