Работа с Psi-BLAST
В этом практикуме необходимо использовать Position Specific Interated BLAST (PsiBLAST) для нахождения гомологов последовательности Q8RL96.
Таблица 1. Информация о поиске гомологов в PsiBLAST.
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки |
1 | 35 | YP_006013322.1 | 0.004 | WP_002307514.1 | 0.020 |
2 | 59 | WP_002310952.1 | 0.003 | WP_010725475.1 | 0.005 |
3 | 72 | WP_016632801.1 | 0.001 | WP_005723822.1 | 0.005 |
4 | 72 | YP_008497336.1 | 0.003 | YP_002561856.1 | 0.006 |
При каждой итерации PSI-BLAST получается две выходные таблицы: с находками, E-value которых меньше чем порог 0,005 (то есть лучше), и соответственно с находками, E-value которых больше. Необходимо использовать результаты из первой таблицы.
В каждой итерации (см. таблицу 1) я не использовала для следующего шага программы белки, E-value которых слишком большое, Identity меньше 20-30%, Query cover меньше 40-60%. Почти все найденные белки принадлежат родам Enterococcus, Streptococcus, и это белки бактериоцины (особые белки, вырабатываемые некоторыми бактериями для подавления жизнедеятельности клеток близких видов или других штаммов). Соотвественно, я не использовала белки, сильно отличающиеся по таксономии хозяина и иногда названию. Шаг E-value особенно не различался (все отличались на один порядок), поэтому этот принцип отбора не удалось применить, к сожалению.
В итоге, после третьей итерации стабилизировалось количество находок. Выравнивание 72-ух последовательностей-гомологов можно посмотреть на рисунке 1.