Учебная страничка Васюткиной Ольги

Работа в PSI-BLAST

PSI-BLAST (Position Specific Iterative BLAST) - программа для поиска удаленных гомологов белков.
Вначале проводится поиск последовательностей, сходной с данной, то есть обычный BLAST. Далее на основе множественного выравнивания находок с достаточно малым E-value строится PSSM (Position-Specific Scoring Matrix). Пороговое значение E-value по умолчанию - 0.005, впрочем, его можно менять. На следующей итерации последовательности выравниваются уже относительно множественного выравнивания, при этом вес выравнивания считается по профилю PSSM. Строится новое множественное выравнивание и новый профиль PSSM. Проводят несколько итераций до тех пор, пока число последовательностей, поданных на вход, не совпадет с результатом. Это будет означать, что найдены все сходные последовательности.

Для поиска гомологов была выбрана последовательность с AC Q3SXS7. Это запись последовательности белка из суперсемейства рецепторов факторов некроза опухоли (tumor necrosis factor receptor superfamily). Организм, которому принадлежит белок, - домовая мышь (Mus musculus). Таким образом, цель - найти другие белки этого суперсемейства.
Входные данные: АС белка и база данных, в которой будет проводиться поиск. В данном случае я выбрала базу RefSeq. Пороговое значение E-value 0.005.
Результаты итераций PSI-BLAST сведены в таблицу 1.

Таблица 1. Результаты итераций PSI-BLAST (query AC Q3SXS7)

Номер итерацииЧисло находок выше порога (0,005)Идентификатор худшей находки выше порогаE-value этой находкиИдентификатор лучшей находки ниже порогаE-value этой находки
179XP_005422009.10.002XP_004481317.10.016
283XP_005598965.10.003WP_017613328.15.9
3146XP_004604389.14e-05XP_005871793.10.011
4176XP_003221050.14e-05XP_005054102.10.013
5182XP_005947083.10.003XP_004576101.10.011
6183XP_005054102.19e-05XP_007910632.10.018
7183XP_005054102.11e-04XP_007910632.10.011

После седьмой итерации появилось сообщение: No new sequences were found above the 0.005 threshold. Значит, на этом поиск окончен. Всего найдено 183 последовательности.
Множественное выравнивание всех находок: загрузить.


Valid HTML 4.01 Transitional