Учебный сайт Ксении Березиной

Работа с Psi-BLAST

В этом практикуме необходимо использовать Position Specific Interated BLAST (PsiBLAST) для нахождения гомологов последовательности Q8RL96.

Таблица 1. Информация о поиске гомологов в PsiBLAST.

Номер итерацииЧисло находок выше порога (0,005)Идентификатор худшей находки выше порогаE-value этой находкиИдентификатор лучшей находки ниже порогаE-value этой находки
135YP_006013322.10.004WP_002307514.10.020
259WP_002310952.10.003WP_010725475.10.005
372WP_016632801.10.001WP_005723822.10.005
472YP_008497336.10.003YP_002561856.10.006

При каждой итерации PSI-BLAST получается две выходные таблицы: с находками, E-value которых меньше чем порог 0,005 (то есть лучше), и соответственно с находками, E-value которых больше. Необходимо использовать результаты из первой таблицы.

В каждой итерации (см. таблицу 1) я не использовала для следующего шага программы белки, E-value которых слишком большое, Identity меньше 20-30%, Query cover меньше 40-60%. Почти все найденные белки принадлежат родам Enterococcus, Streptococcus, и это белки бактериоцины (особые белки, вырабатываемые некоторыми бактериями для подавления жизнедеятельности клеток близких видов или других штаммов). Соотвественно, я не использовала белки, сильно отличающиеся по таксономии хозяина и иногда названию. Шаг E-value особенно не различался (все отличались на один порядок), поэтому этот принцип отбора не удалось применить, к сожалению.

В итоге, после третьей итерации стабилизировалось количество находок. Выравнивание 72-ух последовательностей-гомологов можно посмотреть на рисунке 1.

Рис.1. Множественное выравнивание найденных гомологов. В других форматах: fasta, jar

Назад к второму семестру