С помощью psiBlast cоставить семейство гомологичных белков, стартуя с данной последовательности
Задача найти все белки из Swissprot гомологичные данному.
Белки считаем гомологичными если, на языке Blast, Сoverage больше порога при приемлемом E-value. Предлагаю начинать с coverage > 70% При таком подходе, можно ожидать, что гомологичны все домены белков, включая известные и неизвестные.
Успех - стабилизация итераций при заданных фильтрах по Coverage и E-value. Пороги можно изменять по ходу итераций. Для выбора порога по Coverage полезно смотреть Graphic Summary. В этой задаче Coverage важнее, при приемлемом E-value.
В моем тренировочном примере на второй итерации пришлось снизить порог coverage до 50% из-за того, что только одна находка имела coverage>70%. psiBlast отказывается работать с одной находкой на итерацию. На следующих итерация поднял Coverage, т.к. появились новые находки с высоким Coverage. PSI-BLAST incl. threshold (порог на E-value) уменьшил до 0.0001 (по умолчанию стоит 0.005)
В других примерах поднимал порог Coverage до 95%. Если в последовательности 800 остатков, то 5% - это 40 остатков, достаточно для маленького домена.
Ответы введите в форму Сразу заполните время начала, свой логин и вариант. Остальные вопросы касаются результата, полученного после стабилизации.
V4JGU3
W0PBK6
R0GZG1
U3JD23