На данной странице представлены результаты по использованию PSI-BLAST.
Решалась задача: построить множественное выравнивание последовательностей гомологов моего белка (thymidylate synthase, идентификатор ADV68687.1). »Проект Jalview Составление семейства гомологовЧтобы проверить, зависит ли список находок PSI-BLAST от белка, с которого начали поиск, я взяла последовательность из списка найденных (наименее похожую на исходную - худшую из тех, чьё E-value выше порога). Это последовательность с идентефикатором Q9HIB2.1. Я провела поиск по новой последовательности и сравнила списки находок по двум белкам в Excel с помощью функции VLOOKUP. Как оказалось, списки находок абсолютно совпадают (за исключением 1 находки, т.к. при поиске по новому белку было найдено на 1 последовательность больше). Отсюда можно сделать вывод, что PSI-BLAST определяет семейство гомологов независимо от белка, в которого начали поиск.»Excel файл Ниже приведена статистика поиска по белкам. Я проводила итерации, если находились новые находки. Как только новых находок не находилось, я считала, что семейство гомологов сформировано. В пользу того, что найдены все белки семейства говорило также то, что разница в E-value на момент конечной итерации составляла 3 порядка (4e-05 и 0.083) для первого белка и 10 порядков (4e-12 и 0.096) для второго.
Построение выравниваний представителей семействаПо найденным последовательностям я построила выравнивание с помощью программы muscle. Я использовала команду:muscle -in <файл с последовательностями> -out <файл, куда будет записано выравнивание>. »Множественное выравнивание Далее с помощью Jalview я выбрала типичных представителей семейства и построила их множественное выравнивание с помощью программ muscle и mafft. »Выравнивание muscle »Выравнивание mafft Я провела сравнение этих выравниваний в Jalview. Как оказалось, полностью идентичных колонок в них почти нет. Всё, что я нашла, это один участок с большим количеством гомологичных колонок, который обе программы определили одинаково (Рис.1). В остальном же выравнивания отличаются. Однако и muscle, и mafft нашли совпадающие мотивы в последовательностях белков этого семейства. Во многих участках с большим процентом гомологии между аминокислотами выравнивания отличаются только в одном белке, а в остальных являются идентичными. Поэтому можно сделать вывод, что такие мотивы можно найти у всех белков этого семейства, независимо от программы, с помощью которой строится выравнивание. |
«Назад Дальше» |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
© Колупаева А.Л. 2014 |